KR101884726B1 - 데이터베이스 시스템에서 블록을 판독하기 위한 방법, 장치 및 컴퓨터 판독가능 매채에 저장된 컴퓨터-프로그램 - Google Patents

데이터베이스 시스템에서 블록을 판독하기 위한 방법, 장치 및 컴퓨터 판독가능 매채에 저장된 컴퓨터-프로그램 Download PDF

Info

Publication number
KR101884726B1
KR101884726B1 KR1020160077188A KR20160077188A KR101884726B1 KR 101884726 B1 KR101884726 B1 KR 101884726B1 KR 1020160077188 A KR1020160077188 A KR 1020160077188A KR 20160077188 A KR20160077188 A KR 20160077188A KR 101884726 B1 KR101884726 B1 KR 101884726B1
Authority
KR
South Korea
Prior art keywords
blocks
lock
master node
node
data
Prior art date
Application number
KR1020160077188A
Other languages
English (en)
Other versions
KR20180000023A (ko
Inventor
안재석
주정인
Original Assignee
주식회사 티맥스데이터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 티맥스데이터 filed Critical 주식회사 티맥스데이터
Priority to KR1020160077188A priority Critical patent/KR101884726B1/ko
Priority to US15/215,929 priority patent/US20170364454A1/en
Publication of KR20180000023A publication Critical patent/KR20180000023A/ko
Application granted granted Critical
Publication of KR101884726B1 publication Critical patent/KR101884726B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/14Protection against unauthorised use of memory or access to memory
    • G06F12/1458Protection against unauthorised use of memory or access to memory by checking the subject access rights
    • G06F12/1466Key-lock mechanism
    • G06F12/1475Key-lock mechanism in a virtual system, e.g. with translation means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/176Support for shared access to files; File sharing support
    • G06F16/1767Concurrency control, e.g. optimistic or pessimistic approaches
    • G06F16/1774Locking methods, e.g. locking methods for file systems allowing shared and concurrent access to files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0611Improving I/O performance in relation to response time
    • G06F17/30171
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2308Concurrency control
    • G06F16/2336Pessimistic concurrency control approaches, e.g. locking or multiple versions without time stamps
    • G06F16/2343Locking methods, e.g. distributed locking or locking implementation details
    • G06F17/30194
    • G06F17/30362
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0635Configuration or reconfiguration of storage systems by changing the path, e.g. traffic rerouting, path reconfiguration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/10Providing a specific technical effect
    • G06F2212/1052Security improvement

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

데이터베이스 시스템에서 블록을 판독하는 방법이 제공 된다. 복수의 노드중 제 1 노드가 영구저장매체에 기록된 데이터를 판독(read)하는 방법에 있어서, 영구저장매체에 기록된 블록들 중 복수의 블록들에 대한 판독 요청을 수신하는 단계; 상기 복수의 블록들 각각의 마스터 노드를 결정하는 단계; 상기 복수의 블록들 각각의 마스터 노드에게, 상기 복수의 블록들 각각에 기록된 데이터를 판독하기 위한 락(lock)의 필요성 여부를 문의하는 단계; 상기 문의 결과에 기초하여, 상기 복수의 블록들 중 락이 필요하지 않은 적어도 일부의 블록들에 대해, 락을 획득하는 동작을 생략하고 데이터를 판독하는 단계; 및 상기 문의 결과에 기초하여, 상기 복수의 블록들 중 락이 필요한 적어도 일부의 블록들에 대해, 락을 획득한 이후 데이터를 판독하는 단계; 를 포함하는, 영구저장매체에 기록된 데이터 판독 방법이 제공된다.

Description

데이터베이스 시스템에서 블록을 판독하기 위한 방법, 장치 및 컴퓨터 판독가능 매채에 저장된 컴퓨터-프로그램{METHOD, APPARATUS, AND COMPUTER PROGRAM STORED IN COMPUTER READABLE MEDIUM FOR READING BLOCK IN DATABASE SYSTEM}
본 발명은 데이터베이스 시스템에서의 데이터 판독 방법에 대한 것으로, 특히 영구 저장 매체에 기록된 데이터를 효율적으로 판독하기 위한 것이다.
데이터베이스 시스템은 데이터를 수집, 저장, 관리, 분석할 수 있다. 최근에는 대량의 정형 또는 비정형 데이터 집합 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 빅데이터 처리 등 대용량 데이터베이스 시스템에 대한 기술이 발전하고 있다.
최근에, 데이터베이스 시스템은 복수의 노드들에 의해 구성된다. 복수의 노드들은 데이터를 영구저장매체에 기록하며, 임의의 노드는 사용자의 요청에 따라 영구저장매체에 기록된 데이터를 판독(read)할 수 있다.
노드가 영구저장매체에 기록된 블록들을 판독하기 위해서는, 데이터의 정합성을 유지하기 위해 블록들에 대한 락을 허가 받는 동작이 필요하다. 락은 영구저장매체의 블록에 대한 다른 노드들의 접근을 제한할 수 있다. 데이터베이스 시스템은 데이터가 판독되는 동안, 블록에 대해 다른 노드들의 접근을 제한함으로써, 데이터의 정합성을 유지할 수 있다.
영구 저장 매체에 기록된 다량의 블록들에 대한 판독을 수행하는 경우, 노드는 다량의 블록들에 대해 락을 허가 받아야 한다. 다량의 락을 관리하게 되면 동시작업 수행이 어렵고 성능 저하를 초래할 수 있다.
따라서, 노드가 다량의 블록들을 판독하는 효율적인 방법에 대한 연구가 진행되고 있다.
미국 등록특허공보 US6965893호
본 발명은 전술한 배경기술에 대응하여 안출된 것으로, 데이터베이스 시스템에서 데이터의 판독(read)을 효율적으로 수행하기 위한 것이다.
전술한 과제를 해결하기 위한 본 발명의 실시예들 중 제 1 측면은, 복수의 노드중 제 1 노드가 영구저장매체에 기록된 데이터를 판독하는 방법에 있어서, 영구저장매체에 기록된 블록들 중 복수의 블록들에 대한 판독 요청을 수신하는 단계; 상기 복수의 블록들 각각의 마스터 노드를 결정하는 단계; 상기 복수의 블록들 각각의 마스터 노드에게, 상기 복수의 블록들 각각에 기록된 데이터를 판독하기 위한 락(lock)의 필요성 여부를 문의하는 단계; 상기 문의 결과에 기초하여, 상기 복수의 블록들 중 락이 필요하지 않은 적어도 일부의 블록들에 대해, 락을 획득하는 동작을 생략하고 데이터를 판독하는 단계; 및 상기 문의 결과에 기초하여, 상기 복수의 블록들 중 락이 필요한 적어도 일부의 블록들에 대해, 락을 획득한 이후 데이터를 판독하는 단계; 를 포함하는, 영구저장매체에 기록된 데이터 판독 방법을 제공할 수 있다.
제 2 측면은, 컴퓨터-판독가능 매체에 저장되어 노드들로 하여금 이하의 동작들을 수행하도록 하는 명령들을 포함하는 데이터베이스 복구 프로그램으로서, 상기 동작들은: 영구저장매체에 기록된 블록들 중 복수의 블록들에 대한 판독 요청을 수신하는 동작; 상기 복수의 블록들 각각의 마스터 노드를 결정하도록 하는 동작; 상기 복수의 블록들 각각의 마스터 노드에게, 상기 복수의 블록들 각각에 기록된 데이터를 판독하기 위한 락(lock)의 필요성 여부를 문의하도록 하는 동작; 상기 문의 결과에 기초하여, 상기 복수의 블록들 중 락이 필요하지 않은 적어도 일부의 블록들에 대해, 락을 획득하는 동작을 생략하고 데이터를 판독하도록 하는 동작; 및 상기 문의 결과에 기초하여, 상기 복수의 블록들 중 락이 필요한 적어도 일부의 블록들에 대해, 락을 획득한 이후 데이터를 판독하도록 하는 동작; 을 포함하는, 컴퓨터-판독가능 매체에 저장된 데이터 판독 프로그램을 제공할 수 있다.
제 3 측면은, 영구저장매체에 기록된 복수의 블록들 각각의 마스터 노드를 결정하는 마스터 노드 결정부; 상기 복수의 블록들 각각의 마스터 노드에게, 상기 복수의 블록들 각각에 기록된 데이터를 판독하기 위한 락(lock)의 필요성 여부를 문의하는 락 필요성 문의부; 및 상기 문의 결과에 기초하여, 상기 복수의 블록들 중 락이 필요하지 않은 적어도 일부의 블록들에 대해 락을 획득하는 동작을 생략하고 데이터를 판독하고, 상기 복수의 블록들 중 락이 필요한 적어도 일부의 블록들에 대해 락을 획득한 이후 데이터를 판독하는 데이터 판독부; 를 포함하는, 데이터베이스 서버를 제공할 수 있다.
제 4 측면은, 복수의 노드들을 포함하는 데이터 베이스 시스템에 있어서, 제 1 노드는: 영구저장매체에 기록된 복수의 블록들 각각의 마스터 노드를 결정하는 마스터 노드 결정부; 상기 복수의 블록들 각각의 마스터 노드에게, 상기 복수의 블록들 각각에 기록된 데이터를 판독하기 위한 락(lock)의 필요성 여부를 문의하는 락 필요성 문의부; 상기 제 1 노드가 마스터 노드인 블록들에 대해, 락 필요성 여부를 판단하는 락 필요성 판단부; 상기 문의 결과에 기초하여, 상기 복수의 블록들 중 락이 필요하지 않은 적어도 일부의 블록들에 대해 락을 획득하는 동작을 생략하고 데이터를 판독하고, 상기 복수의 블록들 중 락이 필요한 적어도 일부의 블록들에 대해 락을 획득한 이후 데이터를 판독하는 데이터 판독부; 를 포함하고, 상기 블록들 각각의 마스터 노드는: 상기 제 1 노드의 락 필요성 판단 요청에 기초하여, 블록들에 대한 락 필요성 여부를 판단하는 락 필요성 판단부; 를 포함하는, 데이터 베이스 시스템을 제공할 수 있다.
본 발명은 전술한 배경기술에 대응하여 안출된 것으로, 영구 저장 매체에 기록된 데이터를 효율적으로 판독(read)하는 방법을 제공한다.
다양한 양상들이 이제 도면들을 참조로 기재되며, 여기서 유사한 참조 번호들은 총괄적으로 유사한 구성요소들을 지칭하는데 이용된다. 이하의 실시예에서, 설명 목적을 위해, 다수의 특정 세부사항들이 하나 이상의 양상들의 총체적 이해를 제공하기 위해 제시된다. 그러나, 그러한 양상(들)이 이러한 구체적인 세부사항들 없이 실시될 수 있음은 명백할 것이다. 다른 예시들에서, 공지의 구조들 및 장치들이 하나 이상의 양상들의 기재를 용이하게 하기 위해 블록도 형태로 도시된다.
도 1 은 본 발명의 일 실시예와 관련된 데이터베이스 시스템을 예시적으로 도시한다.
도 2 는 본 발명의 일 실시예와 관련된 데이터베이스 시스템의 컴포넌트들을 예시적으로 도시한다.
도 3 은 본 발명의 일 실시예와 관련된 데이터베이스 서버에서 블록들을 판독하는 방법을 예시적으로 도시한다.
도 4 는 본 발명의 일 실시예와 관련된 데이터베이스 서버가 블록들을 판독하는 방법의 순서도를 예시적으로 도시한다.
다양한 실시예들이 이제 도면을 참조하여 설명되며, 전체 도면에서 걸쳐 유사한 도면번호는 유사한 구성요소를 나타내기 위해서 사용된다. 본 명세서에서, 다양한 설명들이 본 발명의 이해를 제공하기 위해서 제시된다. 그러나 이러한 실시예들은 이러한 구체적인 설명 없이도 실행될 수 있음이 명백하다. 다른 예들에서, 공지된 구조 및 장치들은 실시예들의 설명을 용이하게 하기 위해서 블록 다이어그램 형태로 제공된다.
본 명세서에서 사용되는 용어 "컴포넌트", "모듈", "시스템" 등은 컴퓨터-관련 엔티티, 하드웨어, 펌웨어, 소프트웨어, 소프트웨어 및 하드웨어의 조합, 또는 소프트웨어의 실행을 지칭한다. 예를 들어, 컴포넌트는 프로세서상에서 실행되는 처리과정, 프로세서, 객체, 실행 스레드, 프로그램, 및/또는 컴퓨터일 수 있지만, 이들로 제한되는 것은 아니다. 예를 들어, 컴퓨팅 장치에서 실행되는 애플리케이션 및 컴퓨팅 장치 모두 컴포넌트일 수 있다. 하나 이상의 컴포넌트는 프로세서 및/또는 실행 스레드 내에 상주할 수 있고, 일 컴포넌트는 하나의 컴퓨터 내에 로컬화될 수 있고, 또는 2개 이상의 컴퓨터들 사이에 분배될 수 있다. 또한, 이러한 컴포넌트들은 그 내부에 저장된 다양한 데이터 구조들을 갖는 다양한 컴퓨터 판독가능한 매체로부터 실행할 수 있다. 컴포넌트들은 예를 들어 하나 이상의 데이터 패킷들을 갖는 신호(예를 들면, 로컬 시스템, 분산 시스템에서 다른 컴포넌트와 상호작용하는 하나의 컴포넌트로부터 데이터 및/또는 신호를 통해 다른 시스템과 인터넷과 같은 네트워크를 통한 데이터)에 따라 로컬 및/또는 원격 처리들을 통해 통신할 수 있다.
본 명세서에서, 데이터베이스는 서로 관련된 데이터들을 컴퓨터가 처리할 수 있는 형태로 저장하는 시스템을 의미한다. 데이터베이스는 데이터를 보관하고 사용자의 물음에 대답할 수 있고, 데이터베이스에 저장된 데이터는 변화될 수 있다. 데이터베이스는 새로운 데이터를 저장할 수 있고, 기존의 데이터를 삭제, 변경시키는 작업을 수행할 수 있다.
본 명세서에서, 트랜잭션이란, 정보의 교환이나 데이터베이스 업데이트 등 일련의 작업들에 대한 연속 처리단위를 의미한다. 이는 데이터베이스의 무결성이 보장되는 상태에서 요청된 작업을 완수하기 위한 작업의 기본단위로 정의될 수 있다.
본 명세서에서, 노드는 정보의 교환이나 데이터베이스 업데이트 등 일련의 작업들을 수행하는 디바이스를 의미한다. 예를 들어, 노드는 서버, 컴퓨터, CPU가 포함된 디바이스 등을 포함할 수 있으며, 이에 한정되지 않는다.
노드는 영구 저장 매체(3000)와 데이터를 주고 받을 수 있다. 예를 들어, 노드는 영구 저장 매체(3000)에 기록된 데이터를 판독하여 판독된 데이터를 캐시 모듈에 저장할 수 있다. 또한, 캐시 모듈에 저장된 데이터를 변경시키고, 변경된 데이터를 영구 저장 매체(3000)에 반영할 수 있다. 또한, 노드는 영구저장 매체에 기록된 데이터를 판독할 수 있다.
본 명세서에서, 블록이란 데이터의 덩어리를 의미할 수 있다. 예를 들어, 블록은 데이터가 저장된 하나의 테이블을 포함할 수 있고, 복수개의 테이블을 포함할 수 있다. 또한, 하나의 테이블에 포함된 데이터는 복수의 블록에 의해 나타내질 수 있다.
블록은 다양한 크기를 가질 수 있다. 예를 들어, 블록은 10kb, 100kb, 1메가 바이트, 2 메가 바이트, 3메가 바이트, 4메가 바이트 등의 크기를 가질 수 있으며, 이에 한정되지 않는다.
제시된 실시예들에 대한 설명은 본 발명의 기술 분야에서 통상의 지식을 가진 자가 본 발명을 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이며, 여기에 정의된 일반적인 원리들은 본 발명의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 발명은 여기에 제시된 실시예들로 한정되는 것이 아니라, 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다.
이하에서는, 첨부된 도면을 참조하여 본 발명에 따른 실시예들을 상세히 설명하도록 한다.
도 1 은 본 발명의 일 실시예와 관련된 데이터베이스 시스템을 예시적으로 도시한다.
본 발명의 일 실시예에 따르면, 데이터베이스 시스템(10000)은 복수개의 노드를 포함할 수 있고, 복수의 노드들은 클러스터(cluster)를 형성할 수 있다. 예를 들어, 복수의 노드들은 임의의 네트워크를 통해 서로 연결됨으로써, 클러스터(cluster)를 형성할 수 있다. 이 경우, 영구 저장 매체(3000)는 복수의 노드들에 의해 공유될 수 있다.
각각의 노드는 마이크로프로세서, 메인프레임 컴퓨터, 디지털 싱글 프로세서, 휴대용 디바이스 및 디바이스 제어기 등과 같은 임의의 타입의 컴퓨터 시스템 또는 컴퓨터 디바이스를 포함할 수 있다.
노드는 메모리(미도시)를 포함할 수 있다. 노드는 메모리를 이용하여 데이터베이스 작업을 수행할 수 있다. 예를 들어, 노드가 트랜잭션을 수행하는 경우, 노드는 영구 저장 매체(3000)로부터 데이터를 로드하여 메모리(미도시)중 적어도 일부에 저장할 수 있다.
메모리(미도시)는 동적 램(DRAM, dynamic random access memory), 정적 램(SRAM, static random access memory) 등의 랜덤 액세스 메모리(RAM)와 같은, 프로세서가 직접 접근하는 주된 저장 장치로서 전원이 꺼지면 저장된 정보가 순간적으로 지워지는 휘발성(volatile) 저장 장치를 의미할 수 있지만, 이들로 한정되는 것은 아니다. 이러한 메모리는 프로세서에 의하여 동작 될 수 있다.
노드와 영구 저장 매체(3000)는 네트워크로 연결될 수 있다. 네트워크는 유선 네트워크, 무선 네트워크를 포함할 수 있으며, 이에 한정되지 않는다.
영구 저장 매체(3000)는 임의의 데이터를 지속적으로 저장할 수 있는 비-휘발성(non-volatile) 저장 매체를 포함할 수 있다. 예를 들어, 영구 저장 매체(1400)는 디스크, 광학(optical) 디스크 및 광자기(magneto-optical) 저장 디바이스뿐만 아니라 플래시 메모리 및/또는 배터리-백업 메모리에 기초한 저장 디바이스를 포함할 수 있으며, 이에 한정되지 않는다.
복수개의 노드 중 제 1 노드(1000)는 사용자로부터 영구 저장 매체에 기록된 복수의 블록들에 대한 판독(read)요청을 수신할 수 있다. 이 경우, 사용자는 대량의 블록들에 대한 판독 요청을 입력할 수 있다.
제 1 노드(1000)는 판독 요청에 대응되는 블록들 각각의 마스터 노드(2000)를 결정할 수 있다. 또한, 마스터 노드(2000)에게 블록들을 판독하기 위하여 락이 필요한지 여부를 문의할 수 있다.
블록들의 마스터 노드(2000)는 제 1 노드(1000)의 요청에 기초하여, 락의 필요성 여부를 판단할 수 있다. 예를 들어, 마스터 노드(2000)는 락 정보의 존재 여부에 기초하여 락의 필요성 여부를 판단할 수 있다.
마스터 노드(2000)는 락의 필요성에 대한 판단 결과를 제 1 노드(1000)에게 전송할 수있다.
제 1 노드(1000)는 마스터 노드(2000)로부터 수신한 판단 결과에 기초하여, 락이 필요하지 않은 블록들에 대해 락을 허여 받는 동작을 생략하고 데이터를 판독할 수 있다. 또한, 제 1 노드(1000)는 마스터 노드(2000)로부터 수신한 판단 결과에 기초하여, 락이 필요한 블록들에 대해 락을 허여 받은 이후 데이터를 판독할 수 있다.
기존의 데이터 베이스 시스템에서, 제 1 노드(1000)가 판독 요청을 수행하는 경우, 제 1 노드(1000)는 판독 요청에 대응되는 블록들에 대한 락을 잡는 동작이 필수 조건이었다. 제 1 노드(1000)는 데이터 정합성을 유지하기 위하여, 락을 허여 받은 이후에 판독 동작을 수행하였다.
다만, 제 1 노드(1000)가 대량의 블록들에 대한 판독 요청을 수행하는 경우, 대량의 블록들에 대한 락을 모두 허여 받는 동작은 메모리의 낭비가 발생할 수 있고, 프로세서의 성능에 부정적인 영향을 발생시킬 수 있다.
본 발명의 일 실시예에 따라, 제 1 노드(1000)가 판독 요청을 수신한 블록들에 대해 락의 필요성 여부를 문의 하고, 락이 필요하지 않은 블록들에 대해서 락을 허용 받는 동작을 생략하고 블록들을 판독하는 경우, 낭비되는 메모리의 양을 감소시킬 수 있다. 또한, 프로세서의 성능을 개선시킬 수 있다.
도 2 는 본 발명의 일 실시예와 관련된 데이터베이스 시스템의 컴포넌트들을 예시적으로 도시한다.
본 발명의 일 실시예에 따르면, 데이터베이스 시스템(10000)은 영구 저장 매체(3000) 및 복수의 노드를 포함할 수 있다.
노드들은 송수신 모듈(1100), 캐시모듈(1200), 제어부(1300)를 포함할 수 있고, 제어부(1300)는 락 필요성 문의부(1320), 마스터 노드 결정부(1340), 데이터 판독부(1360) 및 락 필요성 판단부(1380)를 포함할 수 있다.
영구 저장 매체(persistent storage)(3000)는, 예를 들어 자기(magnetic) 디스크, 광학(optical) 디스크 및 광자기(magneto-optical) 저장 디바이스뿐만 아니라 플래시 메모리 및/또는 배터리-백업 메모리에 기초한 저장 디바이스와 같은, 임의의 데이터를 지속적으로 할 수 있는 비-휘발성(non-volatile) 저장 매체를 의미한다. 이러한 영구 저장 매체(3000)는 다양한 통신 수단을 통하여 노드들의 프로세서 및 메모리와 통신할 수 있다.
캐시 모듈(1200)은 데이터를 저장할 수 있다. 예를 들어, 캐시 모듈(1200)은 영구 저장 매체(3000)로부터 판독된 데이터를 저장할 수 있다. 캐시 모듈(1200)은 비 휘발성(non-volatile)저장 장치로 구성될 수 있으며, 이에 한정되지 않는다.
노드들은 메모리(미도시)를 포함할 수 있다. 여기서, 메모리는 동적 램(DRAM, dynamic random access memory), 정적 램(SRAM, static random access memory) 등의 랜덤 액세스 메모리(RAM)와 같은, 프로세서가 직접 접근하는 주된 저장 장치로서 전원이 꺼지면 저장된 정보가 순간적으로 지워지는 휘발성(volatile) 저장 장치를 의미할 수 있지만, 이들로 한정되는 것은 아니다. 이러한 메모리는 프로세서에 의하여 동작 될 수 있다.
송수신 모듈(1100)은 사용자로부터의 데이터 저장, 조회 및 인덱스 빌드, 조회 요청 등을 수신할 수 있다. 또한, 송수신 모듈(1100)은 데이터를 전송할 수 있고, 데이터를 수신할 수 있다.
또한, 송수신 모듈(1100)은 복수의 블록들에 대한 데이터의 판독 요청을 수신할 수 있다. 예를 들어, 송수신 모듈(1100)은 영구 저장 매체에 기록된 블록들 중 복수의 블록들에 대한 판독 요청을 수신할 수 있다.
이 경우, 송수신 모듈(1100)은 판독 시점 정보를 함께 수신할 수 있다. 판독 시점 정보는 판독 되는 데이터의 시점을 나타내는 정보를 의미한다. 예를 들어, 사용자가 제 1 시점의 데이터를 판독하기 원하는 경우, 판독 시점 정보는 제 1 시점을 나타낼 수 있다.
마스터 노드 결정부(1340)는 복수의 블록들 각각의 마스터 노드를 결정할 수 있다. 예를 들어, 마스터 노드 결정부(1340)는 복수의 블록들 중 판독 요청에 대응되는 블록들 각각의 마스터 노드를 결정할 수 있다.
마스터 노드(2000)란 영구 저장 매체에 포함된 블록을 관리하는 노드를 의미한다. 예를 들어, 마스터 노드(2000)는 영구 저장 매체(3000)에 포함된 특정 블록의 락(lock)을 관리할 수 있다. 또한, 마스터 노드(2000)는 특정 블록의 락(lock)에 대한 정보를 보유할 수 있다.
하나의 마스터 노드(2000)는 하나의 블록을 관리할 수 있고, 복수의 블록을 관리할 수 있으며, 이에 한정되지 않는다.
블록들의 마스터 노드(2000)는 미리 설정될 수 있다. 예를 들어, 블록들의 마스터 노드(2000)는 영구 저장 매체에 기록된 위치에 따라 미리 설정될 수 있고, 블록들 각각의 블록 주소 정보에 기초하여 미리 설정될 수 있으며, 이에 한정되지 않는다.
마스터 노드 결정부(1340)는 다양한 방법으로 복수의 블록들 각각의 마스터 노드를 결정할 수 있다. 예를 들어, 마스터 노드 결정부(1340)는 복수의 블록들 각각의 블록 주소 정보에 기초하여 판독 후보 블록의 마스터 노드(2000)를 결정할 수 있다.
예를 들어. 마스터 노드 결정부(1340)는 복수의 블록들 각각의 블록 주소 정보를 획득할 수 있고, 획득한 복수의 블록들 각각의 주소 정보를 소정의 함수에 입력하여, 그 결과값을 획득할 수 있으며, 결과값이 나타내는 노드를 블록의 마스터 노드(2000)로 결정할 수 있다. 이 경우, 결과값은 미리 설정된 마스터 노드(2000)를 나타낼 수 있다.
제 1 노드(1000)의 락 필요성 문의부(1320)는 복수의 블록들 각각의 마스터 노드에게, 복수의 블록들에 기록된 데이터를 판독하기 위한 락(lock)의 필요성 여부를 문의할 수 있다.
예를 들어, 락 필요성 문의부(1320)는 다양한 정보를 포함하는 락 필요성 판단 요청을 마스터 노드에게 전송할 수 있다. 다양한 정보는 블록의 식별 정보 및 판독 시점 정보를 포함할 수 있으며, 이에 한정되지 않는다. 이 경우, 제 1 노드(1000)의 락 필요성 문의부(1320)는 제 1 노드(1000)가 마스터 노드인 블록들에 대해서는 락 필요성 판단 요청을 전송하지 않을 수 있다.
마스터 노드(2000)는 송수신 모듈(2200), 캐시 모듈(2200), 및 제어부(2300)를 포함할 수 있고, 제어부(2300)는 락 필요성 판단부(2320)를 포함할 수 있다. 마스터 노드(2000)의 제어부(2300)는 하나의 프로세서로 구현될 수 있고, 복수의 프로세서로 구현될 수 있으며, 이에 한정되지 않는다.
마스터 노드(2000)의 송수신 모듈(2100)은 마스터 노드(2000)가 관리하는 적어도 하나의 블록들 중 적어도 일부의 블록들에 대한 락 필요성 판단 요청을 수신할 수 있다. 이 경우, 락 필요성 판단 요청은 다양한 정보를 포함할 수 있다.
다양한 정보는 블록의 식별 정보 및 판독 시점 정보를 포함할 수 있으며, 이에 한정되지 않는다.
마스터 노드(2000)의 락 필요성 판단부(2320)는 제 1 노드(1000)로부터 수신한 락 필요성 판단 요청에 기초하여, 제 1 노드(1000)가 블록들을 판독하기 위해 락이 필요한지 여부를 판단할 수 있다.
락 필요성 판단부(2320)는 수신한 블록의 식별 정보, 판독 시점 정보, 또는 이들의 조합에 기초하여, 제 1 노드(1000)가 블록들을 판독하기 위해 락이 필요한지 여부를 판단할 수 있다.
본 발명의 일 실시예에 따르면, 락 필요성 판단부(2320)는 블록에 대한 락 정보가 마스터 노드(2000)에 존재하는지 여부에 따라, 락이 필요한지 여부를 결정할 수 있다. 예를 들어, 마스터 노드(2000)에 블록의 락 정보가 마스터 노드(2000)에 존재하지 않는 경우, 제 1 노드(1000)가 블록을 판독하기 위한 락이 필요하지 않다고 결정할 수 있다. 또한, 마스터 노드(2000)에 블록의 락 정보가 존재하는 경우, 락 필요성 판단부(2320)는 제 1 노드(1000)가 블록을 판독하기 위한 락이 필요하다고 결정할 수 있다.
이 경우, 락 필요성 판단부(2320)는 판독 시점 정보를 더 고려하여 락의 필요성 여부를 결정할 수 있다. 예를 들어, 마스터 노드(2000)에 블록의 락 정보가 존재하더라도, 판독 시점 정보가 블록의 영구저장 매체상의 최근 업데이트 시점 보다 이전을 나타내는 경우, 락 필요성 판단부(2320)는 블록을 판독하기 위한 락이 필요하지 않다고 결정할 수 있다.
본 발명의 일 실시예에 따르면, 마스터 노드(2000)의 제어부(2300)는 락이 필요하다고 결정된 블록에 대해, 제 1 노드에게 락을 허여할 것인지 여부를 결정할 수 있다. 예를 들어, 마스터 노드(2000)의 제어부(2300)는 보유한 락 정보를 참조하여, 제 1 노드에게 락을 허여할 것인지 여부를 결정할 수 있다. 이 경우, 락 정보는 블록을 대표하는 리소스 정보 및 락 오너(owner) 정보를 포함할 수 있으며, 이에 한정되지 않는다.
마스터 노드(2000)의 락 필요성 판단부(2320)는 제 1 노드(1000)로부터 락 필요성 판단을 요청받은 모든 블록들에 대해 락 필요성 여부를 판단할 수 있다. 또한, 마스터 노드(2000)의 송수신 모듈(2100)은 락 필요성 판단에 대한 판단 결과를 제 1 노드(1000)에게 전송할 수 있다.
락 필요성 판단을 요청받은 마스터 노드(2000)가 복수개인 경우, 복수개의 마스터 노드(2000)는 락 필요성 판단을 병렬적으로 수행할 수 있다. 또한, 복수개의 마스터 노드(2000)의 송수신 모듈(2100)각각은 락 필요성 판단에 대한 판단 결과를 제 1 노드(1000)에게 전송할 수 있다.
제 1 노드(1000)의 송수신 모듈(1100)은 마스터 노드(2000)로부터 락의 필요성 여부에 대한 판단 결과를 수신할 수 있다. 마스터 노드(2000)가 복수인 경우, 제 1 노드(1000)는 복수개의 마스터 노드(2000)로부터 순차적으로 판단 결과를 수신할 수 있고, 병렬적으로 판단 결과를 수신할 수 있으며, 이에 한정되지 않는다.
이 경우, 제 1 노드(1000)는 각각의 마스터 노드(2000)로부터 락의 필요성 여부가 판단된 블록들에 대한 판단 결과를 블록 그룹 단위로 수신할 수 있다.
예를 들어, 제 1 마스터 노드(2000)가 32개의 블록들에 대한 락의 필요성 여부를 판단한 경우, 제 1 노드(1000)는 제 1 마스터 노드(2000)로부터 32개의 블록들 중 락의 필요성이 존재하는 적어도 하나의 블록들에 대한 정보를 수신할 수 있다.
또한, 제 1 마스터 노드(2000)가 32개의 블록들에 대한 락의 필요성 여부를 판단 한 경우, 제 1 노드(1000)는 제 1 마스터 노드(2000)로부터 16개의 블록들 중 락의 필요성이 존재하는 적어도 하나의 블록들에 대한 정보 및 다른 16개의 블록들 중 락의 필요성이 존재하는 적어도 하나의 블록들에 대한 정보를 개별적으로 수신할 수 있으며, 이에 한정되지 않는다.
제 1 노드(1000)는 전술한 예에 한정되지 않고, 다양한 방식으로 마스터 노드들(2000)로부터 락의 필요성 여부가 판단된 블록들에 대한 판단 결과를 수신할 수 있다.
제 1 노드(1000)의 데이터 판독부(1360)는 락의 필요성 여부에 대한 문의 결과에 기초하여, 복수의 블록의 데이터를 판독할 수 있다.
데이터 판독부(1360)는 복수의 블록들 중 락이 필요하지 않은 적어도 일부의 블록들에 대해, 락을 획득하는 동작을 생략하고 데이터를 판독할 수 있다.
이 경우, 데이터 판독부(1360)는 데이터를 캐시 모듈(1200)에 저장하지 않고, 메모리(미도시)를 이용하여 데이터를 판독할 수 있다.
이 경우, 데이터 판독부(1360)는 판독 시점 정보와 대응되는 데이터를 판독할 수 있다. 예를 들어, 데이터 판독부(1360)는 시점에 따라 다른 데이터를 포함할 수 있는 블록에 대해, 판독 시점 정보가 나타내는 시점의 데이터를 판독할 수 있다.
데이터 판독부(1360)는 복수의 블록들 중 락이 필요한 적어도 일부의 블록들에 대해, 락을 획득한 이후 데이터를 판독할 수 있다.
예를 들어, 데이터 판독부(1360)는 복수의 블록들 중 락이 필요한 적어도 일부의 블록들에 대해, 블록들의 마스터 노드(2000)가 락을 허여한 이후, 데이터를 판독할 수 있다.
도 3 은 본 발명의 일 실시예와 관련된 데이터베이스 서버에서 블록들을 판독하는 방법을 예시적으로 도시한다.
제 1 노드(1000)는 사용자로부터의 데이터 저장, 조회 및 인덱스 빌드, 조회 요청 등을 수신할 수 있다. 또한, 제 1 노드(1000)는 데이터를 전송할 수 있고, 데이터를 수신할 수 있다.
또한, 제 1 노드(1000)는 복수의 블록들에 대한 데이터의 판독 요청을 수신할 수 있다. 예를 들어, 제 1 노드(1000)는 영구 저장 매체에 기록된 블록들 중 복수의 블록들에 대한 판독 요청을 수신할 수 있다.
이 경우, 제 1 노드(1000)는 판독 시점 정보를 함께 수신할 수 있다. 판독 시점 정보는 판독 되는 데이터의 시점을 나타내는 정보를 의미한다. 예를 들어, 사용자가 제 1 시점의 데이터를 판독하기 원하는 경우, 판독 시점 정보는 제 1 시점을 나타낼 수 있다.
단계 S310에서, 제 1 노드(1000)는 복수의 블록들 각각의 마스터 노드(2000)를 결정할 수 있다.
예를 들어, 제 1 노드(1000)는 복수의 블록들 중 판독 요청에 대응되는 블록들 각각의 마스터 노드(2000)를 결정할 수 있다.
마스터 노드(2000)란 영구 저장 매체에 포함된 블록을 관리하는 노드를 의미한다. 예를 들어, 마스터 노드(2000)는 영구 저장 매체(3000)에 포함된 특정 블록의 락(lock)을 관리할 수 있다. 또한, 마스터 노드(2000)는 특정 블록의 락(lock)에 대한 정보를 보유할 수 있다.
하나의 마스터 노드(2000)는 하나의 블록을 관리할 수 있고, 복수의 블록을 관리할 수 있으며, 이에 한정되지 않는다.
블록들의 마스터 노드(2000)는 미리 설정될 수 있다. 예를 들어, 블록들의 마스터 노드(2000)는 영구 저장 매체에 기록된 위치에 따라 미리 설정될 수 있고, 블록들 각각의 블록 주소 정보에 기초하여 미리 설정될 수 있으며, 이에 한정되지 않는다.
제 1 노드(1000)는 다양한 방법으로 복수의 블록들 각각의 마스터 노드(2000)를 결정할 수 있다. 예를 들어, 제 1 노드(1000)는 복수의 블록들 각각의 블록 주소 정보에 기초하여 판독 후보 블록의 마스터 노드(2000)를 결정할 수 있다.
예를 들어. 제 1 노드(1000)는 복수의 블록들 각각의 블록 주소 정보를 획득할 수 있고, 획득한 복수의 블록들 각각의 주소 정보를 소정의 함수에 입력하여, 그 결과값을 획득할 수 있으며, 결과값이 나타내는 노드를 블록의 마스터 노드(2000)로 결정할 수 있다. 이 경우, 결과값은 미리 설정된 마스터 노드(2000)를 나타낼 수 있다.
단계 S320에서, 제 1 노드(1000)는 복수의 블록들 각각의 마스터 노드에게, 복수의 블록들에 기록된 데이터를 판독하기 위한 락(lock)의 필요성 여부를 문의할 수 있다.
예를 들어, 제 1 노드(1000)는 다양한 정보를 포함하는 락 필요성 판단 요청을 마스터 노드에게 전송할 수 있다. 다양한 정보는 블록의 식별 정보 및 판독 시점 정보를 포함할 수 있으며, 이에 한정되지 않는다.
마스터 노드(2000)는 마스터 노드(2000)가 관리하는 적어도 하나의 블록들 중 적어도 일부의 블록들에 대한 락 필요성 판단 요청을 수신할 수 있다. 이 경우, 락 필요성 판단 요청은 다양한 정보를 포함할 수 있다.
다양한 정보는 블록의 식별 정보 및 판독 시점 정보를 포함할 수 있으며, 이에 한정되지 않는다.
마스터 노드(2000)는 제 1 노드(1000)로부터 수신한 락 필요성 판단 요청에 기초하여, 제 1 노드(1000)가 블록들을 판독하기 위해 락이 필요한지 여부를 판단할 수 있다.
마스터 노드(2000)는 수신한 블록의 식별 정보, 판독 시점 정보, 또는 이들의 조합에 기초하여, 제 1 노드(1000)가 블록들을 판독하기 위해 락이 필요한지 여부를 판단할 수 있다.
본 발명의 일 실시예에 따르면, 마스터 노드(2000)는 블록에 대한 락 정보가 마스터 노드(2000)에 존재하는지 여부에 따라, 락이 필요한지 여부를 결정할 수 있다. 예를 들어, 마스터 노드(2000)에 블록의 락 정보가 존재하지 않는 경우, 마스터 노드(2000)는 제 1 노드(1000)가 블록을 판독하기 위한 락이 필요하지 않다고 결정할 수 있다. 또한, 마스터 노드(2000)에 락 정보가 존재하는 경우, 마스터 노드(2000)는 제 1 노드(1000)가 블록을 판독하기 위한 락이 필요하다고 결정할 수 있다.
이 경우, 마스터 노드(2000)는 판독 시점 정보를 더 고려하여 락의 필요성 여부를 결정할 수 있다. 예를 들어, 마스터 노드(2000)에 블록의 락 정보가 존재하더라도, 판독 시점 정보가 블록의 영구저장 매체상의 최근 업데이트 시점 보다 이전을 나타내는 경우, 락 필요성 판단부(2320)는 블록을 판독하기 위한 락이 필요하지 않다고 결정할 수 있다.
본 발명의 일 실시예에 따르면, 마스터 노드(2000)는 락이 필요하다고 결정된 블록에 대해, 제 1 노드(1000)에게 락을 허여할 것인지 여부를 결정할 수 있다. 예를 들어, 마스터 노드(2000)의 제어부(2300)는 보유한 락 정보를 참조하여, 제 1 노드에게 락을 허여할 것인지 여부를 결정할 수 있다. 이 경우, 락 정보는 블록을 대표하는 리소스 정보 및 락 오너(owner) 정보를 포함할 수 있으며, 이에 한정되지 않는다.
마스터 노드(2000)는 제 1 노드(1000)로부터 락 필요성 판단을 요청받은 모든 블록들에 대해 락 필요성 여부를 판단할 수 있다. 또한, 마스터 노드(2000)는 락 필요성 판단에 대한 판단 결과를 제 1 노드(1000)에게 전송할 수 있다.
락 필요성 판단을 요청받은 마스터 노드(2000)가 복수개인 경우, 복수개의 마스터 노드(2000)는 락 필요성 판단을 병렬적으로 수행할 수 있다. 또한, 복수개의 마스터 노드(2000)들 각각은 락 필요성 판단에 대한 판단 결과를 제 1 노드(1000)에게 전송할 수 있다.
제 1 노드(1000)는 마스터 노드(2000)로부터 락의 필요성 여부에 대한 판단 결과를 수신할 수 이 있다. 마스터 노드(2000)가 복수인 경우, 제 1 노드(1000)는 복수개의 마스터 노드(2000)들로부터 순차적으로 판단 결과를 수신할 수 있고, 병렬적으로 판단 결과를 수신할 수 있으며, 이에 한정되지 않는다.
이 경우, 제 1 노드(1000)는 각각의 마스터 노드(2000)로부터 락의 필요성 여부가 판단된 블록들에 대한 판단 결과를 블록 그룹 단위로 수신할 수 있다.
예를 들어, 제 1 마스터 노드(2000)가 32개의 블록들에 대한 락의 필요성 여부를 판단한 경우, 제 1 노드(1000)는 제 1 마스터 노드(2000)로부터 32개의 블록들 중 락의 필요성이 존재하는 적어도 하나의 블록들에 대한 정보를 수신할 수 있다.
또한, 제 1 마스터 노드(2000)가 32개의 블록들에 대한 락의 필요성 여부를 판단 한 경우, 제 1 노드(1000)는 제 1 마스터 노드(2000)로부터 16개의 블록들 중 락의 필요성이 존재하는 적어도 하나의 블록들에 대한 정보 및 다른 16개의 블록들 중 락의 필요성이 존재하는 적어도 하나의 블록들에 대한 정보를 개별적으로 수신할 수 있으며, 이에 한정되지 않는다.
제 1 노드(1000)는 전술한 예에 한정되지 않고, 다양한 방식으로 마스터 노드들(2000)로부터 락의 필요성 여부가 판단된 블록들에 대한 판단 결과를 수신할 수 있다.
단계 S330 및 단계 S340에서, 제 1 노드는 락의 필요성 여부에 대한 문의 결과에 기초하여, 복수의 블록의 데이터를 판독할 수 있다.
제 1 노드(1000)는 복수의 블록들 중 락이 필요하지 않은 적어도 일부의 블록들에 대해, 락을 획득하는 동작을 생략하고 데이터를 판독할 수 있다.
이 경우, 제 1 노드(1000)는 데이터를 캐시 모듈(1200)에 저장하지 않고, 메모리(미도시)를 이용하여 데이터를 판독할 수 있다.
이 경우, 제 1 노드(1000)는 판독 시점 정보와 대응되는 데이터를 판독할 수 있다. 예를 들어, 제 1 노드(1000)는 블록에 포함된 데이터의 업데이트 시점과 관계없이, 판독 시점 정보가 나타내는 시점의 데이터를 판독할 수 있다.
제 1 노드(1000)는 복수의 블록들 중 락이 필요한 적어도 일부의 블록들에 대해, 락을 획득한 이후 데이터를 판독할 수 있다.
예를 들어, 제 1 노드(1000)는 복수의 블록들 중 락이 필요한 적어도 일부의 블록들에 대해, 블록들의 마스터 노드(2000)가 락을 허여한 이후, 데이터를 판독할 수 있다.
도 4 는 본 발명의 일 실시예와 관련된 데이터베이스 서버가 블록들을 판독하는 방법의 순서도를 예시적으로 도시한다.
단계 S410에서, 제 1 노드(1000)는 사용자로부터의 데이터 저장, 조회 및 인덱스 빌드, 조회 요청 등을 수신할 수 있다. 또한, 제 1 노드(1000)는 데이터를 전송할 수 있고, 데이터를 수신할 수 있다.
또한, 제 1 노드(1000)는 복수의 블록들에 대한 데이터의 판독 요청을 수신할 수 있다. 예를 들어, 제 1 노드(1000)는 영구 저장 매체에 기록된 블록들 중 복수의 블록들에 대한 판독 요청을 수신할 수 있다.
이 경우, 제 1 노드(1000)는 판독 시점 정보를 함께 수신할 수 있다. 판독 시점 정보는 판독 되는 데이터의 시점을 나타내는 정보를 의미한다. 예를 들어, 사용자가 제 1 시점의 데이터를 판독하기 원하는 경우, 판독 시점 정보는 제 1 시점을 나타낼 수 있다.
단계 S420에서, 제 1 노드(1000)는 복수의 블록들 각각의 마스터 노드(2000)를 결정할 수 있다.
예를 들어, 제 1 노드(1000)는 복수의 블록들 중 판독 요청에 대응되는 블록들 각각의 마스터 노드(2000)를 결정할 수 있다.
하나의 마스터 노드(2000)는 하나의 블록을 관리할 수 있고, 복수의 블록을 관리할 수 있으며, 이에 한정되지 않는다.
블록들의 마스터 노드(2000)는 미리 설정될 수 있다. 예를 들어, 블록들의 마스터 노드(2000)는 영구 저장 매체에 기록된 위치에 따라 미리 설정될 수 있고, 블록들 각각의 블록 주소 정보에 기초하여 미리 설정될 수 있으며, 이에 한정되지 않는다.
제 1 노드(1000)는 다양한 방법으로 복수의 블록들 각각의 마스터 노드(2000)를 결정할 수 있다. 예를 들어, 제 1 노드(1000)는 복수의 블록들 각각의 블록 주소 정보에 기초하여 판독 후보 블록의 마스터 노드(2000)를 결정할 수 있다.
예를 들어. 제 1 노드(1000)는 복수의 블록들 각각의 블록 주소 정보를 획득할 수 있고, 획득한 복수의 블록들 각각의 주소 정보를 소정의 함수에 입력하여, 그 결과값을 획득할 수 있으며, 결과값이 나타내는 노드를 블록의 마스터 노드(2000)로 결정할 수 있다. 이 경우, 결과값은 미리 설정된 마스터 노드(2000)를 나타낼 수 있다.
단계 S430에서, 제 1 노드(1000)는 복수의 블록들 각각의 마스터 노드에게, 복수의 블록들에 기록된 데이터를 판독하기 위한 락(lock)의 필요성 판단 요청을 전송할 수 있다.
예를 들어, 제 1 노드(1000)는 다양한 정보를 포함하는 락 필요성 판단 요청을 블록들 각각의 마스터 노드(2000)에게 전송할 수 있다. 다양한 정보는 블록의 식별 정보 및 판독 시점 정보를 포함할 수 있으며, 이에 한정되지 않는다.
이 경우, 제 1 노드(1000)가 마스터 노드(2000)인 블록들에 대해서는, 락 필요성 판단 요청을 다른 노드들에게 전송하지 않을 수 있다.
락 필요성 판단 요청은 다양한 정보를 포함할 수 있다. 다양한 정보는 블록의 식별 정보 및 판독 시점 정보를 포함할 수 있으며, 이에 한정되지 않는다.
단계 S440에서, 마스터 노드(2000)는 마스터 노드(2000)가 관리하는 적어도 하나의 블록들 중 적어도 일부의 블록들에 대한 락 필요성 여부를 판단할 수 있다.
마스터 노드(2000)는 제 1 노드(1000)로부터 수신한 락 필요성 판단 요청에 기초하여, 제 1 노드(1000)가 블록들을 판독하기 위해 락(lock)이 필요한지 여부를 판단할 수 있다. 이 경우, 제 1 노드(1000)도 마스터 노드(2000)가 될 수 있으며, 제 1 노드(1000)는 제 1 노드(1000)가 마스터 노드(2000)인 블록들에 대해 락의 필요성 여부를 판단할 수 있다.
마스터 노드(2000)는 수신한 블록의 식별 정보, 판독 시점 정보, 또는 이들의 조합에 기초하여, 제 1 노드(1000)가 블록들을 판독하기 위해 락이 필요한지 여부를 판단할 수 있다.
본 발명의 일 실시예에 따르면, 마스터 노드(2000)는 블록에 대한 락 정보가 마스터 노드(2000)에 존재하는지 여부에 따라, 락이 필요한지 여부를 결정할 수 있다. 예를 들어, 마스터 노드(2000)에 블록의 락 정보가 존재하지 않는 경우, 마스터 노드(2000)는 제 1 노드(1000)가 블록을 판독하기 위한 락이 필요하지 않다고 결정할 수 있다. 또한, 마스터 노드(2000)에 락 정보가 존재하는 경우, 마스터 노드(2000)는 제 1 노드(1000)가 블록을 판독하기 위한 락이 필요하다고 결정할 수 있다.
이 경우, 마스터 노드(2000)는 판독 시점 정보를 더 고려하여 락의 필요성 여부를 결정할 수 있다. 예를 들어, 마스터 노드(2000)에 블록의 락 정보가 존재하더라도, 판독 시점 정보가 블록의 영구저장매체상의 최근 업데이트 시점 보다 이전을 나타내는 경우, 락 필요성 판단부(2320)는 블록을 판독하기 위한 락이 필요하지 않다고 결정할 수 있다.
본 발명의 일 실시예에 따르면, 마스터 노드(2000)는 락이 필요하다고 결정된 블록에 대해, 제 1 노드(1000)에게 락을 허여할 것인지 여부를 결정할 수 있다. 예를 들어, 마스터 노드(2000)의 제어부(2300)는 보유한 락 정보를 참조하여, 제 1 노드에게 락을 허여할 것인지 여부를 결정할 수 있다. 이 경우, 락 정보는 블록을 대표하는 리소스 정보 및 락 오너(owner) 정보를 포함할 수 있으며, 이에 한정되지 않는다.
마스터 노드(2000)는 제 1 노드(1000)로부터 락 필요성 판단을 요청받은 모든 블록들에 대해 락 필요성 여부를 판단할 수 있다. 또한, 마스터 노드(2000)는 락 필요성 판단에 대한 판단 결과를 제 1 노드(1000)에게 전송할 수 있다.
락 필요성 판단을 요청받은 마스터 노드(2000)가 복수개인 경우, 복수개의 마스터 노드(2000)는 락 필요성 판단을 병렬적으로 수행할 수 있다. 또한, 복수개의 마스터 노드(2000)들 각각은 락 필요성 판단에 대한 판단 결과를 제 1 노드(1000)에게 전송할 수 있다.
단계 S450에서, 제 1 노드(1000)는 마스터 노드(2000)로부터 락의 필요성 여부에 대한 판단 결과를 수신할 수 이 있다.
마스터 노드(2000)가 복수인 경우, 제 1 노드(1000)는 복수개의 마스터 노드(2000)들로부터 순차적으로 판단 결과를 수신할 수 있고, 병렬적으로 판단 결과를 수신할 수 있으며, 이에 한정되지 않는다.
이 경우, 제 1 노드(1000)는 각각의 마스터 노드(2000)로부터 락의 필요성 여부가 판단된 블록들에 대한 판단 결과를 블록 그룹 단위로 수신할 수 있다.
예를 들어, 제 1 마스터 노드(2000)가 32개의 블록들에 대한 락의 필요성 여부를 판단한 경우, 제 1 노드(1000)는 제 1 마스터 노드(2000)로부터 32개의 블록들 중 락의 필요성이 존재하는 적어도 하나의 블록들에 대한 정보를 수신할 수 있다.
또한, 제 1 마스터 노드(2000)가 32개의 블록들에 대한 락의 필요성 여부를 판단 한 경우, 제 1 노드(1000)는 제 1 마스터 노드(2000)로부터 16개의 블록들 중 락의 필요성이 존재하는 적어도 하나의 블록들에 대한 정보와 다른 16개의 블록들 중 락의 필요성이 존재하는 적어도 하나의 블록들에 대한 정보를 개별적으로 수신할 수 있으며, 이에 한정되지 않는다.
제 1 노드(1000)는 전술한 예에 한정되지 않고, 다양한 방식으로 마스터 노드들(2000)로부터 락의 필요성 여부가 판단된 블록들에 대한 판단 결과를 수신할 수 있다.
단계 S460에서, 제 1 노드는 락의 필요성 여부에 대한 문의 결과에 기초하여, 복수의 블록의 데이터를 판독할 수 있다.
제 1 노드(1000)는 복수의 블록들 중 락이 필요하지 않은 적어도 일부의 블록들에 대해, 락을 획득하는 동작을 생략하고 데이터를 판독할 수 있다.
이 경우, 제 1 노드(1000)는 데이터를 캐시 모듈(1200)에 저장하지 않고, 메모리(미도시)를 이용하여 데이터를 판독할 수 있다.
이 경우, 제 1 노드(1000)는 판독 시점 정보와 대응되는 데이터를 판독할 수 있다. 예를 들어, 제 1 노드(1000)는 블록에 포함된 데이터의 업데이트 시점과 관계없이, 판독 시점 정보가 나타내는 시점의 데이터를 판독할 수 있다.
제 1 노드(1000)는 복수의 블록들 중 락이 필요한 적어도 일부의 블록들에 대해, 락을 획득한 이후 데이터를 판독할 수 있다.
예를 들어, 제 1 노드(1000)는 복수의 블록들 중 락이 필요한 적어도 일부의 블록들에 대해, 블록들의 마스터 노드(2000)가 락을 허여한 이후, 데이터를 판독할 수 있다.
본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독 가능 기록매체는 일시적 기록매체 및 비-일시적 기록매체를 포함할 수 있다.
또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (9)

  1. 복수의 노드중 제 1 노드가 영구저장매체에 기록된 데이터를 판독하는 방법에 있어서,
    영구저장매체에 기록된 블록들 중 복수의 블록들에 대한 판독 요청을 수신하는 단계;
    상기 복수의 블록들 각각의 마스터 노드를 결정하는 단계;
    상기 복수의 블록들 각각의 마스터 노드에게, 상기 복수의 블록들 각각에 기록된 데이터를 판독하기 위한 락(lock)의 필요성 여부를 문의하는 단계;
    상기 문의 결과에 기초하여, 상기 복수의 블록들 중 락이 필요하지 않은 적어도 일부의 블록들에 대해, 락을 획득하는 동작을 생략하고 데이터를 판독하는 단계; 및
    상기 문의 결과에 기초하여, 상기 복수의 블록들 중 락이 필요한 적어도 일부의 블록들에 대해, 락을 획득한 이후 데이터를 판독하는 단계;
    를 포함하는,
    영구저장매체에 기록된 데이터 판독 방법.
  2. 제 1 항에 있어서,
    상기 문의 하는 단계는,
    블록의 식별 정보 및 판독 시점 정보를 포함하는 락(lock) 필요성 판단 요청을 상기 복수의 블록들 각각의 마스터 노드에게 전송하는 단계―상기 블록들 각각의 마스터 노드는 블록들에 대한 락 정보가 마스터 노드에 존재하는지 여부에 기초하여 락의 필요성 여부를 판단함―; 및
    상기 복수의 블록들 각각의 마스터 노드로부터 락의 필요성 여부에 대한 판단 결과를 수신하는 단계;
    를 포함하는,
    영구저장매체에 기록된 데이터 판독 방법.
  3. 제 2 항에 있어서 상기 복수의 블록들 각각의 마스터 노드는,
    블록들에 대한 락 정보가 마스터 노드에 존재하지 않는 경우, 블록들을 판독하기 위한 락이 필요하지 않다고 결정하고,
    블록들에 대한 락 정보가 마스터 노드에 존재하는 경우, 블록들을 판독하기 위한 락이 필요하다고 결정하는,
    영구저장매체에 기록된 데이터 판독 방법.
  4. 제 2 항에 있어서 상기 마스터 노드는,
    상기 판독 시점 정보가 블록의 상기 영구 저장 매체상의 최근 업데이트 시점 보다 이전을 나타내는지 여부를 더 고려하여 락의 필요성 여부를 판단하는,
    영구저장매체에 기록된 데이터 판독 방법.
  5. 제 2 항에 있어서 상기 마스터 노드는,
    상기 락의 필요성 여부에 대한 판단 결과에 기초하여, 상기 복수의 블록들 중 락이 필요한 적어도 일부의 블록에 대해서 상기 제 1 노드에게 락을 허여할지 여부를 판단하는,
    영구저장매체에 기록된 데이터 판독 방법.
  6. 제 1 항에 있어서,
    상기 락을 획득하는 동작을 생략하고 데이터를 판독하는 단계는, 판독 시점 정보가 나타내는 시점의 데이터를 판독 하는,
    영구저장매체에 기록된 데이터 판독 방법.
  7. 컴퓨터-판독가능 매체에 저장되어 노드들로 하여금 이하의 동작들을 수행하도록 하는 명령들을 포함하는 데이터베이스 복구 프로그램으로서, 상기 동작들은:
    영구저장매체에 기록된 블록들 중 복수의 블록들에 대한 판독 요청을 수신하는 동작;
    상기 복수의 블록들 각각의 마스터 노드를 결정하도록 하는 동작;
    상기 복수의 블록들 각각의 마스터 노드에게, 상기 복수의 블록들 각각에 기록된 데이터를 판독하기 위한 락(lock)의 필요성 여부를 문의하도록 하는 동작;
    상기 문의 결과에 기초하여, 상기 복수의 블록들 중 락이 필요하지 않은 적어도 일부의 블록들에 대해, 락을 획득하는 동작을 생략하고 데이터를 판독하도록 하는 동작; 및
    상기 문의 결과에 기초하여, 상기 복수의 블록들 중 락이 필요한 적어도 일부의 블록들에 대해, 락을 획득한 이후 데이터를 판독하도록 하는 동작;
    를 포함하는,
    컴퓨터-판독가능 매체에 저장된 데이터 판독 프로그램.
  8. 영구저장매체에 기록된 복수의 블록들 각각의 마스터 노드를 결정하는 마스터 노드 결정부;
    상기 복수의 블록들 각각의 마스터 노드에게, 상기 복수의 블록들 각각에 기록된 데이터를 판독하기 위한 락(lock)의 필요성 여부를 문의하는 락 필요성 문의부; 및
    상기 문의 결과에 기초하여, 상기 복수의 블록들 중 락이 필요하지 않은 적어도 일부의 블록들에 대해 락을 획득하는 동작을 생략하고 데이터를 판독하고, 상기 복수의 블록들 중 락이 필요한 적어도 일부의 블록들에 대해 락을 획득한 이후 데이터를 판독하는 데이터 판독부;
    를 포함하는,
    데이터베이스 서버.
  9. 복수의 노드들을 포함하는 데이터 베이스 시스템에 있어서,
    제 1 노드는:
    영구저장매체에 기록된 복수의 블록들 각각의 마스터 노드를 결정하는 마스터 노드 결정부;
    상기 복수의 블록들 각각의 마스터 노드에게, 상기 복수의 블록들 각각에 기록된 데이터를 판독하기 위한 락(lock)의 필요성 여부를 문의하는 락 필요성 문의부;
    상기 제 1 노드가 마스터 노드인 블록들에 대해, 락 필요성 여부를 판단하는 락 필요성 판단부;
    상기 문의 결과에 기초하여, 상기 복수의 블록들 중 락이 필요하지 않은 적어도 일부의 블록들에 대해 락을 획득하는 동작을 생략하고 데이터를 판독하고, 상기 복수의 블록들 중 락이 필요한 적어도 일부의 블록들에 대해 락을 획득한 이후 데이터를 판독하는 데이터 판독부;
    를 포함하고,
    상기 블록들 각각의 마스터 노드는:
    상기 제 1 노드의 락 필요성 판단 요청에 기초하여, 블록들에 대한 락 필요성 여부를 판단하는 락 필요성 판단부;
    를 포함하는,
    데이터 베이스 시스템.
KR1020160077188A 2016-06-21 2016-06-21 데이터베이스 시스템에서 블록을 판독하기 위한 방법, 장치 및 컴퓨터 판독가능 매채에 저장된 컴퓨터-프로그램 KR101884726B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020160077188A KR101884726B1 (ko) 2016-06-21 2016-06-21 데이터베이스 시스템에서 블록을 판독하기 위한 방법, 장치 및 컴퓨터 판독가능 매채에 저장된 컴퓨터-프로그램
US15/215,929 US20170364454A1 (en) 2016-06-21 2016-07-21 Method, apparatus, and computer program stored in computer readable medium for reading block in database system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160077188A KR101884726B1 (ko) 2016-06-21 2016-06-21 데이터베이스 시스템에서 블록을 판독하기 위한 방법, 장치 및 컴퓨터 판독가능 매채에 저장된 컴퓨터-프로그램

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020180064029A Division KR20180063029A (ko) 2018-06-04 2018-06-04 데이터베이스 시스템에서 블록을 판독하기 위한 방법, 장치 및 컴퓨터 판독가능 매채에 저장된 컴퓨터-프로그램

Publications (2)

Publication Number Publication Date
KR20180000023A KR20180000023A (ko) 2018-01-02
KR101884726B1 true KR101884726B1 (ko) 2018-08-03

Family

ID=60659598

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160077188A KR101884726B1 (ko) 2016-06-21 2016-06-21 데이터베이스 시스템에서 블록을 판독하기 위한 방법, 장치 및 컴퓨터 판독가능 매채에 저장된 컴퓨터-프로그램

Country Status (2)

Country Link
US (1) US20170364454A1 (ko)
KR (1) KR101884726B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110597868B (zh) * 2019-09-24 2023-08-15 腾讯科技(深圳)有限公司 基于区块链的信息查询方法、装置、终端及存储介质
CN112039970B (zh) * 2020-08-25 2023-04-18 北京思特奇信息技术股份有限公司 一种分布式业务锁服务方法、服务端、系统及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6965893B1 (en) 2000-12-20 2005-11-15 Oracle International Corporation Techniques for granting shared locks more efficiently
US7447786B2 (en) * 2003-05-09 2008-11-04 Oracle International Corporation Efficient locking of shared data that is accessed for reads in a cluster database
US8103642B2 (en) * 2006-02-03 2012-01-24 Oracle International Corporation Adaptive region locking
US8260816B1 (en) * 2010-05-20 2012-09-04 Vmware, Inc. Providing limited access to a file system on shared storage
KR101573112B1 (ko) * 2013-02-18 2015-12-01 단국대학교 산학협력단 데이터 분배 방법 및 장치

Also Published As

Publication number Publication date
KR20180000023A (ko) 2018-01-02
US20170364454A1 (en) 2017-12-21

Similar Documents

Publication Publication Date Title
US9424204B2 (en) Caching method for distributed storage system, a lock server node, and a lock client node
US11580162B2 (en) Key value append
CN107967122B (zh) 一种块设备的数据写入方法、装置及介质
CN104239575A (zh) 一种虚拟机镜像文件存储、分发方法及装置
WO2017113213A1 (zh) 访问请求处理方法、装置及计算机系统
US9514170B1 (en) Priority queue using two differently-indexed single-index tables
EP3944556B1 (en) Block data storage method and apparatus, and block data access method and apparatus
CN110489388A (zh) 一种用于分布式网络存储系统中scsi锁的实现方法及设备
KR101884726B1 (ko) 데이터베이스 시스템에서 블록을 판독하기 위한 방법, 장치 및 컴퓨터 판독가능 매채에 저장된 컴퓨터-프로그램
CN109254958B (zh) 分布式数据读写方法、设备及系统
CN105915595B (zh) 一种集群存储系统存取数据的方法以及集群存储系统
CN111399760A (zh) Nas集群元数据处理方法、装置、nas网关及介质
CN114416677A (zh) 一种冷存储数据的更新方法、装置、设备及存储介质
US11853229B2 (en) Method and apparatus for updating cached information, device, and medium
WO2016206070A1 (zh) 一种文件更新方法及存储设备
CN106354793B (zh) 监控热点对象的方法及装置
WO2017028721A1 (zh) 分布式文件系统的数据更新方法和装置
US10452492B2 (en) Method, apparatus, and computer program stored in computer readable medium for recovering block in database system
KR101643278B1 (ko) 데이터베이스 시스템에서 스토리지 서버 관리 방법, 장치 및 컴퓨터 판독가능 매체에 저장된 컴퓨터-프로그램
KR20180063029A (ko) 데이터베이스 시스템에서 블록을 판독하기 위한 방법, 장치 및 컴퓨터 판독가능 매채에 저장된 컴퓨터-프로그램
WO2019072088A1 (zh) 一种文件管理方法、文件管理装置、电子设备及存储介质
US9652393B1 (en) Managing shared memory in database server
CN107102898B (zh) 一种基于numa架构的内存管理、构建数据结构的方法及装置
CN106339385B (zh) 抓取网页的系统、网页抓取节点分配方法、抓取网页的方法
CN112748854B (zh) 对快速存储设备的优化访问

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent