KR20130118088A

KR20130118088A - 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템 및 이를 이용한 데이터 처리 방법

Info

Publication number: KR20130118088A
Application number: KR1020120040998A
Authority: KR
Inventors: 고삼일; 김신영; 김홍모; 남현우; 박수호; 이숙영; 임도형; 임승현; 조해공; 조해란; 하용호; 한준희; 홍윤정; 황지수
Original assignee: 케이티하이텔 주식회사
Priority date: 2012-04-19
Filing date: 2012-04-19
Publication date: 2013-10-29
Also published as: KR101371202B1

Abstract

본 발명은 복수개의 클라이언트들로부터 집중적인 접근이 이루어지는 경우에도 다수개의 메타데이터 서버(Metadata Server : MDS)를 구성하여 메타데이터에 대한 확장성과 가용성을 높일 수 있는 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템 및 이를 이용한 데이터 처리 방법을 제공하기 위한 것으로서, 파일 데이터를 저장하고 관리하며, 주기적으로 메타데이터 서버로 자신의 상태 정보를 보고하는 적어도 2개 이상의 데이터 서버와, 적어도 2개 이상으로 구성되어 DHT(Distributed Hash Table) 개념을 적용하여 각각 배치되며, 파일 시스템의 모든 파일에 대한 메타데이터를 저장하고, 상기 데이터 서버로부터 제공되는 상태 정보를 기반으로 데이터 서버에 대한 상태 정보를 관리하는 메타데이터 서버와, 클라이언트 응용을 수행하면서 상기 메타데이터 서버로부터 파일 메타데이터를 액세스하고 데이터 서버로부터 파일 데이터를 입출력하는 파일 시스템 클라이언트를 포함하여 구성되는데 있다.

Description

멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템 및 이를 이용한 데이터 처리 방법{Distributed file system having multi MDS architecture and method for processing data using the same}

본 발명은 클라이언트들로부터 집중적인 접근이 이루어지는 데이터에 대한 접근을 분산하는 분산 파일 시스템에 관한 것으로, 특히 다수개의 메타데이터 서버(Metadata Server : MDS)를 구성하여 메타데이터에 대한 확장성과 가용성을 높일 수 있는 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템 및 이를 이용한 데이터 처리 방법에 관한 것이다.

종래의 스토리지(storage) 환경에서 저장되는 데이터의 대부분은 기업이나 기관에서 생성한 업무 관련 데이터였으나, 최근 인터넷 기술의 비약적인 발전으로 블로그, 사진, 동영상과 같은 멀티미디어 데이터들의 저장 비율도 급속도로 증가하고 있다. 특히, 국내외에서 인터넷 서비스를 실시중인 대형 포탈 업체의 경우에는 매월 수 테라바이트(Tera Byte : TB)에서 수십 테라바이트의 데이터가 새롭게 생성되어 저장 및 관리되고 있다. 그러나 기존의 저장 구조 환경은 스토리지 확장성 및 관리의 용이성에서 많은 문제점이 있기 때문에 변화 무쌍한 서비스 환경에 대체하기에는 부족하다.

따라서, 최근 스토리지 시스템 혹은 파일 시스템의 근원적인 기술 발전은 스토리지 시스템의 확장성(scalability) 및 성능의 향상에 기인하고 있다. 상세하게는, 파일 시스템 구조 측면에서 몇몇 시스템들이 파일의 데이터 입출력 경로와 파일의 메타데이터 관리 경로를 분리시켜서 분산 스토리지 시스템의 확장성과 성능을 높인 것이다. 이러한 구조를 적용하여 파일 시스템 클라이언트가 저장 장치들에 직접 접근할 수 있게 하고, 메타데이터를 분산시켜서 빈번한 파일의 메타데이터 접근으로 인한 병목현상을 해소하여 스토리지의 확장성을 높인다.

이러한 구조를 기반으로 개발된 엔터프라이즈급 스토리지 솔루션으로 IBM의 StorageTank, Panasas의 ActiveScale Storage Cluster, 그리고 Cluster filesystems의 luster, Google의 Google Filesystem 등이 있다. 특히, Google Filesystem은 한 파일에 대한 블록 데이터를 다수의 데이터 서버에 복제하여 가용성을 더욱 높였다.

이와 같은 네트워크 기반 분산 파일 시스템 환경에서는 파일 시스템 클라이언트, 메타데이터 서버(Metadata Server : MDS) 및 데이터 서버(Data Server : DS)들이 네트워크를 통해 교신하면서 데이터의 입출력을 제공한다. 그리고 파일 시스템 클라이언트는 특정 파일에 접근하기 위해서 메타데이터 서버(MDS)로부터 파일의 실제 데이터가 저장된 블록의 위치 정보를 획득한 후, 블록이 위치한 데이터 서버에 접근하여 블록의 데이터를 읽어 이를 사용한다.

도 1 은 일반적인 분산 파일 시스템의 구성을 개략적으로 도시한 구성도이다.

도 1에 도시된 바와 같이, 분산 파일 시스템은 클라이언트 응용을 수행하면서 메타데이터 서버(20)로부터 파일 메타데이터를 액세스하고 데이터 서버(30)로부터 파일 데이터를 입출력하는 파일 시스템 클라이언트(10)와, 파일 시스템의 모든 파일에 대한 메타데이터를 저장하고 관리하며, 모든 데이터 서버(30)에 대한 상태 정보를 관리하는 메타데이터 서버(20)와, 파일 데이터를 저장하고 관리하며, 주기적으로 메타데이터 서버(20)에게 자신의 상태 정보를 보고하는 데이터 서버(30)를 포함한다. 이때, 상기 파일 시스템 클라이언트(10), 메타데이터 서버(20) 및 데이터 서버(30)들은 네트워크(40)로 상호 연결된다.

이러한 구성으로 이루어지는 분산 파일 시스템에서는 파일 데이터가 정해진 크기의 청크 단위로 나뉘어서 데이터 서버들(30)에 분산 저장된다.

그러면, 상기 메타데이터 서버(20)는 파일 데이터가 생성될 데이터 서버(30)를 선정하고, 복제본을 저장할 데이터 서버들(30)을 선정한다. 이때, 파일 데이터는 유일한 식별자에 의해 구별되며 생성된 파일 데이터에 대한 식별자 정보는 파일의 메타데이터 정보로 메타데이터 서버(20)에 저장된다. 또한 새로운 파일을 쓰려는 사용자의 요청이 오면 데이터 서버(30)에서 보고되는 자신의 상태 정보를 바탕으로 적합한 데이터 서버(30)를 선택한다.

또한 상기 메타데이터 서버(20)는 데이터 서버(30)의 상태를 관리하다가 문제가 발생하면, 문제가 발생된 데이터 서버(30)를 사용할 수 없는 상태로 변경하는 등을 작업을 수행한다. 따라서 파일을 쓰려는 사용자의 요청이 들어왔을 때, 현재 사용 가능한 데이터 서버(30)를 선택을 한다.

Phil Schwan이 2003년 7월에 리눅스 심포지움 2003에서 발표한 "Lustre: Building a file system for 1000-node clusters"에서는 클라이언트가 주어진 파일이나 디렉토리 경로에 대해 다수의 데이터 서버 중에 특정 데이터 서버를 매핑하기 위해 단일 메타데이터 서버와 해시 함수를 활용한 방법을 제안하였다. 이는 매핑을 위한 해시함수가 균등하게 클라이언트의 요청을 다수의 데이터 서버들에 분배한다면, 클라이언트는 해시 함수를 통해 얻은 값을 매핑하여 상응하는 데이터 서버에 곧바로 접근할 수 있으며, 균등한 서버의 선택으로 인해 다수의 클라이언트들이 데이터 서버들을 선택할 때 부하를 균등하게 분배할 수 있는 효과를 가진다.

그러나, 이와 같은 기존의 분산 파일 시스템의 경우는 다수 파일 시스템 클라이언트(10)의 요청에 의해 단일 메타데이터 서버(20)가 처리함에 따라, 단일 메타데이터 서버(20)가 처리할 수 있는 메타데이터 관련 연산의 수는 한정되게 된다. 따라서, 단일 메타데이터 서버(20)의 구성으로는 메타데이터에 대한 확장성과 가용성이 좋지 못한 문제점이 있다.

이러한 문제점을 해결하기 위해 최근 이러한 메타데이터 처리 성능을 향상시키기 위해 다수의 메타데이터 서버로 구성하기 위한 다양한 연구가 진행되고 있다. 특히, 이러한 다수의 메타데이터 서버(20)의 구성은 처리 성능 향상과 더불어 고장에 대처할 수 있는 가용성을 가진다는 점에서 커다란 장점을 가지고 있으므로, 이에 따른 도입이 더욱 필요하게 된다.

본 발명은 상기와 같은 문제점을 해결하기 위해 안출한 것으로서, 복수개의 클라이언트들로부터 집중적인 접근이 이루어지는 경우에도 다수개의 메타데이터 서버(Metadata Server : MDS)를 구성하여 메타데이터에 대한 확장성과 가용성을 높일 수 있는 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템 및 이를 이용한 데이터 처리 방법을 제공하는데 그 목적이 있다.

본 발명의 다른 목적은 다수개의 메타데이터 서버의 배치를 DHT(Distributed Hash Table) 개념을 적용하고, 해시 공간(hash space)에 존재하는 값 중 하나를 토큰(token) 값으로 정의하여 메타데이터 서버들의 고장이 발생하는 상황에서도 효과적으로 모든 데이터 서버에 대한 상태 정보를 관리할 수 있는 분산 파일 시스템 및 이를 이용한 데이터 처리 방법을 제공하는데 있다.

상기와 같은 목적을 달성하기 위한 본 발명에 따른 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템의 특징은 파일 데이터를 저장하고 관리하며, 주기적으로 메타데이터 서버로 자신의 상태 정보를 보고하는 적어도 2개 이상의 데이터 서버와, 적어도 2개 이상으로 구성되어 DHT(Distributed Hash Table) 개념을 적용하여 각각 배치되며, 파일 시스템의 모든 파일에 대한 메타데이터를 저장하고, 상기 데이터 서버로부터 제공되는 상태 정보를 기반으로 데이터 서버에 대한 상태 정보를 관리하는 메타데이터 서버와, 클라이언트 응용을 수행하면서 상기 메타데이터 서버로부터 파일 메타데이터를 액세스하고 데이터 서버로부터 파일 데이터를 입출력하는 파일 시스템 클라이언트를 포함하여 구성되는데 있다.

바람직하게 상기 데이터 서버는 입력되는 원 파일을 적어도 하나 이상의 데이터로 분할하고, 상기 분할된 원 파일 데이터에 각각 적어도 2개 이상의 패리티 데이터를 결합한 하나 이상의 분할 데이터를 생성한 후, 상기 생성된 각각의 분할 데이터를 다시 분할하여 저장하는 것을 특징으로 한다.

바람직하게 상기 생성된 분할 데이터는 인코딩을 통해 패리티 데이터를 포함하는 로컬 스토리지의 부호어 크기로 생성되는 것을 특징으로 한다.

바람직하게 상기 메타데이터 서버는 해시 공간(hash space)에 존재하는 값 중 하나를 토큰(token) 값으로 정의하고, 시계 방향 또는 반시계 방향으로 해시 링(hash ring)을 따라 가면서 존재하는 데이터 서버에 대한 상태 정보를 관리하며, 다른 메타데이터 서버를 만나게 되는 지점 전까지를 자신의 관리영역으로 정의하는 것을 특징으로 한다.

바람직하게 상기 메타데이터 서버는 해시 알고리즘(hash algorithm)을 사용하여 해시 공간 전체에 메타데이터 서버가 위치되도록 토큰 값을 생성하여 메타데이터 서버로 설정하는 토큰 생성 함수부를 포함하는 것을 특징으로 한다.

바람직하게 상기 해시 공간은 메타데이터 서버의 토큰 값 및 메타데이터 서버의 접속주소를 포함하는 분할맵으로 구성되는 것을 특징으로 한다.

상기와 같은 목적을 달성하기 위한 본 발명에 따른 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템을 이용한 데이터 처리 방법의 특징은 적어도 2개 이상의 데이터 서버와, 파일에 대한 메타데이터를 저장하고, 데이터 서버에 대한 상태 정보를 관리하는 메타데이터 서버와, 클라이언트 응용을 수행하면서 데이터 서버로부터 파일 데이터를 입출력하는 파일 시스템 클라이언트를 포함하여 구성되는 분산파일 시스템을 이용한 데이터 처리 방법에 있어서, 상기 메타데이터 서버는 적어도 2개 이상이 DHT(Distributed Hash Table) 개념을 적용하여 각각 배치되며, 해시 공간(hash space)에 존재하는 값 중 하나를 토큰(token) 값으로 정의되는데 있다.

바람직하게 상기 메타데이터 서버는 다른 메타데이터 서버를 만나게 되는 지점 전까지를 자신의 관리영역으로 정의하여, 시계 방향 또는 반시계 방향으로 해시 링(hash ring)을 따라 가면서 존재하는 데이터 서버에 대한 상태 정보를 관리하는 것을 특징으로 한다.

바람직하게 상기 데이터 서버에서 보고되는 상태 정보는 하나의 메타데이터 서버에만 전달되는 단계와, 상기 상태 정보를 보고 받은 메타데이터 서버는 보고된 상태 정보를 해시 링에 있는 다른 메타데이터 서버에게 공유하는 단계를 포함하는 것을 특징으로 한다.

바람직하게 상기 메타데이터 서버는 해시 알고리즘(hash algorithm)을 사용하여 해시 공간 전체에 메타데이터 서버가 위치되도록 생성된 토큰 값을 메타데이터 서버에 설정되는 단계와, 메타데이터 서버의 토큰 및 서버 접속 주소 정보를 갖는 분할맵을 시스템 공유 정보 저장부(iLock)나 Gossip 프로토콜을 이용해 공개하고, 상기 공개된 분할맵을 기반으로 데이터 서버 또는 파일 시스템 클라이언트가 해시 공간에서 메타데이터 서버를 검출하는 단계와, 레지스터(register)가 이루어지고 킵얼라이브(KeepAlive)가 유지되는 상기 데이터 서버로부터 데이터 서버가 관리하는 디스크 상태 정보를 포함하는 데이터 서버의 상태 정보(repoinfo)를 보고받는 단계를 포함하여 이루어지는 것을 특징으로 한다.

바람직하게 상기 해시 링에 새롭게 추가되는 제 2 메타데이터 서버(MDS#2)가 상기 분할맵을 읽은 후에, 해시 알고리즘을 통해 결정되어 있는 자신의 토큰 및 서버 접속 주소 정보를 상기 분할맵에 기록하는 단계와, 이런 절차의 결과로 당연하게 정의되는 해시 링 상의 관리권한을 이미 일부 또는 전부 소요하고 있던 제 1 메타데이터 서버(MDS#1)가 상기 제 2 메타데이터 서버(MDS#2)에서 확보한 권리영역을 포기하는 단계와, 상기 분할맵을 기반으로 관리권한이 변한 데이터 서버 또는 파일 시스템 클라이언트가 해시 공간에서 메타데이터 서버를 검출하는 단계와, 레지스터(Register)가 이루어지고 킵얼라이브(KeepAlive)가 유지되는 상기 데이터 서버로부터 데이터 서버가 관리하는 디스크 상태 정보를 포함하는 데이터 서버의 상태 정보(repoinfo)를 보고받는 단계를 포함하여 이루어지는 것을 특징으로 한다.

바람직하게 기존에 존재하는 메타데이터 서버의 정지 요청을 받으면, 정지 요청받은 메타데이터 서버는 분할맵에서 자신의 토큰을 삭제하고 이를 상기 시스템 공유 정보 저장부(iLock)나 Gossip 프로토콜을 이용해 공개하고 종료하는 단계와, 해시 링에 있던 이웃하는 메타데이터 서버가 상기 삭제된 메타데이터 서버의 해시 영역까지 그 담당 영역이 증가되는 단계를 포함하여 이루어지는 것을 특징으로 한다.

바람직하게 해시 공간에 위치하는 메타데이터 서버 중 어느 하나의 제 4 메타데이터 서버가 예상치 못한 상황으로 정상적인 동작이 이루어지지 못하는 경우에는 상기 시스템 공유 정보 저장부(iLock)나 Gossip 프로토콜을 이용해 고장으로 판명된 제 4 메타데이터 서버의 토큰 값이 제거되었다는 사실이 공개되는 단계와, 상기 고장으로 판정된 제 4 메타데이터 서버를 감시하고 있던 이웃하는 다른 제 3 메타데이터 서버에서 그 감시 대상을 상기 제 4 메타데이터 서버에서 감시하고 있었던 제 5 메타데이터 서버로 변경하여 정의하는 단계를 포함하여 이루어지는 것을 특징으로 한다.

바람직하게 상기 메타데이터 서버는 해시 링 구조에서 자신의 이웃하는 다른 노드에 해당하는 메타데이터 서버를 지속적으로 감시하는 것을 특징으로 한다.

이상에서 설명한 바와 같은 본 발명에 따른 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템 및 이를 이용한 데이터 처리 방법은 다음과 같은 효과가 있다.

첫째, 다수의 메타데이터 서버로 구성함에 따라 클라이언트가 메타데이터 서버의 메모리 캐시 효율을 고려하여 적절한 메타데이터 서버를 선택함으로써, 메타데이터 서버의 메타데이터 처리 성능과 응답 성능을 향상시킬 수 있다.

둘째, 다수개의 메타데이터 서버의 배치를 DHT(Distributed Hash Table) 개념을 적용하여 구성함으로써, 메타데이터 서버를 손쉽게 추가할 수 있으므로 서비스 용량의 증가에 능동적으로 대처할 수 있고 결과적으로 더 많은 클라이언트의 요청을 보다 빨리 처리할 수 있다.

셋째, 클라이언트가 고장이 발생한 메타데이터 서버에 대한 접근을 방지하며, 고장이 발생한 메타데이터 서버로의 접근을 다른 메타데이터 서버들로 손쉽게 대체할 수 있어 메타데이터 서버들의 고장이 발생하는 상황에서도 효과적으로 모든 데이터 서버에 대한 상태 정보를 관리할 수 있다.

도 1 은 일반적인 분산 파일 시스템의 구성을 개략적으로 도시한 구성도
도 2 는 본 발명의 실시예에 따른 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템을 나타낸 구성도
도 3 은 본 발명의 일 실시예에 따른 자료의 분산 저장 방법을 설명하기 위한 도면
도 4 는 본 발명의 분산파일 시스템에서 여러 개의 메타데이터 서버의 배치구조를 설명하기 위한 도면
도 5 는 본 발명의 분산파일 시스템에서 데이터 서버 및 클라이언트가 해시 공간에 위치하였을 때 해당 영역을 담당하는 메타데이터 서버를 검출하는 과정을 설명하기 위한 도면
도 6 은 도 4에서 도시하고 있는 원으로 표시한 해시 공간을 맵(map) 형태로 나타낸 도면
도 7 은 본 발명의 분산파일 시스템에서 새로운 메타데이터 서버가 추가되는 과정을 설명하기 위한 도면
도 8 은 본 발명의 분산파일 시스템에서 기존의 메타데이터 서버의 예상치 못한 상황에서의 복구 방법을 설명하기 위한 도면

본 발명의 다른 목적, 특성 및 이점들은 첨부한 도면을 참조한 실시예들의 상세한 설명을 통해 명백해질 것이다.

본 발명에 따른 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템 및 이를 이용한 데이터 처리 방법의 바람직한 실시예에 대하여 첨부한 도면을 참조하여 설명하면 다음과 같다. 그러나 본 발명은 이하에서 개시되는 실시예에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예는 본 발명의 개시가 완전하도록 하며 통상의 지식을 가진자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이다. 따라서 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.

도 2 는 본 발명의 실시예에 따른 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템을 나타낸 구성도이다.

도 2와 같이, 분산파일 시스템은 파일 데이터를 저장하고 관리하며, 주기적으로 메타데이터 서버(20)로 자신의 상태 정보를 보고하는 적어도 2개 이상의 데이터 서버(300)와, 적어도 2개 이상으로 구성되어 DHT(Distributed Hash Table) 개념을 적용하여 각각 배치되며, 파일 시스템의 모든 파일에 대한 메타데이터를 저장하고, 상기 데이터 서버(300)로부터 제공되는 보고 데이터를 기반으로 모든 데이터 서버(300)에 대한 상태 정보를 관리하는 메타데이터 서버(200)와, 클라이언트 응용을 수행하면서 상기 메타데이터 서버(200)로부터 파일 메타데이터를 액세스하고 데이터 서버(300)로부터 파일 데이터를 입출력하는 파일 시스템 클라이언트(100)를 포함한다. 이때, 상기 각각의 데이터 서버(300)는 자신의 로컬 스토리지를 구성하고, 각 데이터 서버(300) 내 로컬 스토리지의 한 프레임에 해당하는 부호어(codeword) 크기 단위로 분할되어 저장된다. 그리고 상기 파일 시스템 클라이언트(100), 메타데이터 서버(200) 및 데이터 서버(300)들은 네트워크(400)로 상호 연결된다.

도 3 은 본 발명의 일 실시예에 따른 자료의 분산 저장 방법을 설명하기 위한 도면이다.

도 3과 같이, 하나의 원 파일이 d개로 분할되어 d₁~d_d 분할 데이터가 순차적으로 나열된다. 그리고 이 분할 데이터 별로 p개의 패리티 데이터(설명을 용이하게 하기 위해 여기서는 3개(p1~p3) 패리티 데이터를 기재하였다.)를 생성한다. 이때, 상기 d+p는 데이터 서버(300)의 개수와 동일하거나 적은 수를 갖는 것이 바람직하다.

이처럼 상기 분할 데이터와 패리티 데이터로 분할된 분할 데이터들을 다수개의 데이터 서버(300)로 각각 전송하여 제 1 데이터 서버내의 제 1 로컬 스토리지에는 제 1 분할 데이터(d1)를 저장하고, 제 2 데이터 서버내의 제 2 로컬 스토리지에는 제 2 분할 데이터(d2)를 저장하고, 제 3 데이터 서버내의 제 3 로컬 스토리지에는 제 3 분할 데이터(d3)를 저장한다. 이러한 방식으로 마지막에는 제 n 데이터 서버내의 제 n 로컬 스토리지에는 제 n 분할 데이터(dn)를 저장하게 된다.

그리고 분산 파일 시스템은 데이터 서버들(30)의 로컬 스토리지에 각각 저장된 분할 데이터들의 위치정보를 포함하는 메타 정보를 별도의 메타데이터 서버(MDS)(200)에 저장한다.

이처럼, 하나의 원 파일이 d개로 분할되어 각각의 데이터 서버 내 로컬 스토리지에 각각 분할되어 저장되게 된다.

상기 메타데이터 서버(200)는 도 4에서 도시하고 있는 것과 같이, 적어도 2개 이상으로 구성되어 DHT(Distributed Hash Table) 개념을 적용하여 배치된다. 그리고 해시 공간(hash space)에 존재하는 값 중 하나를 토큰(token) 값으로 정의한다.

그리고 상기 메타데이터 서버(200)는 시계 방향 또는 반시계 방향으로 해시 링(hash ring)을 따라 가면서 존재하는 데이터 서버(300)에 대한 상태 정보를 관리하며, 다른 메타데이터 서버(200)를 만나게 되는 지점 전까지를 자신의 관리영역으로 정의한다. 도 4에 도시된 것을 예로 들면, 제 1 메타데이터 서버(MDS#1)의 담당영역이 4 ~ 8까지 이고, 제 2 메타데이터 서버(MDS#2)의 담당영역이 8 ~ 16, 0 ~ 4까지로 정의된다.

이러한 구성을 통해 데이터 서버(300)와 파일 시스템 클라이언트(100)는 메타데이터 서버(200)를 찾아갈 때, 도 5에서 도시하고 있는 것과 같이 토큰 생성 함수부(500)에서 고유의 토큰을 생성하고, 이렇게 생성된 토큰을 해시 공간에 위치시켰을 때, 그 영역을 담당하는 메타데이터 서버(200)로 설정되게 된다. 즉, 도 5와 같이, 데이터 서버(300)는 자신의 토큰이 위치한 영역을 담당하고 있는 제 2 메타데이터 서버(200b)에 레지스터(register)가 이루어지고 킵얼라이브(KeepAlive)를 유지한 상태에서 자신의 상태 정보(repoinfo)를 보고한다. 또한, 상기 파일 시스템 클라이언트(100)는 제 1 메타데이터 서버(200a)를 찾아가서 파일 데이터의 입출력을 수행한다.

이때, 상기 데이터 서버(300)에서 보고하는 상태 정보는 하나의 메타 데이터 서버에만 전달된다. 이에 따라, 제 2 메타데이터 서버(200b)는 상기 데이터 서버(300)로부터 보고되는 상태 정보를 해시 링에 있는 다른 MDS들에게 자신이 알게 된 정보를 공유하고 있다. 상기 공유 방법은 확률에 기반한 Gossip 프로토콜이나 시스템 공유 정보 저장부(ilock)를 이용한다.

한편, 상기 메타데이터 서버(200)에 해시 공간(hash space)에 존재하는 값 중 하나인 토큰(token) 값을 정의할 때에는, 해시 공간 전체에 메타데이터 서버(200)가 고르게 생성되도록 정의하여야 한다. 그리고 이를 위해 MD5 알고리즘(Message-Digest algorithm 5), SHA 알고리즘(Secure Hash algorithm)과 같은 해시 알고리즘(hash algorithm)을 사용한다.

즉, 상기 파일 시스템 클라이언트(or WebFront)(100)의 요청 메시지(user request)는 사용자(user), 디렉토리(bucket), 파일이름(object) 스트링을 조합하고 해시 알고리즘을 이용하여 해싱하여 토큰을 생성한다. 또한 상기 데이터 서버(300)는 자신의 고유 식별자(GUID)를 해시 알고리즘으로 해싱하여 토큰을 생성한다. 참고로, 상기 해시 알고리즘은 128비트 암호화 해시 함수로서, RFC 1321로 지정되어 있으며, 주로 프로그램이나 파일이 원본 그대로인지를 확인하는 무결성 검사 등에 이용되는 공지되어 있는 방식으로, 이에 따른 상세한 설명은 생략한다.

이처럼, 해시 알고리즘을 이용하여 메타데이터 서버(200)에 토큰을 정의함으로써, 별도의 로드 밸런스(load balancing)을 고려하지 않아도 해시 링(hash ring)에 존재하는 메타데이터 서버(200)들에게 부하가 해시 공간 전체에 고르게 나누어지게 된다.

도 4에서 도시하고 있는 원으로 표시한 해시 공간을 맵(map) 형태로 나타내면 도 6과 같이 나타낼 수 있다. 상기 도 6에서 나타내고 있는 분할맵에서의 SIOR은 메타데이터 서버(200)의 접속주소(IP, port)를 나타낸다.

그리고 도 6에서 도시하고 있는 토큰 및 서버 접속 주소 정보를 갖는 분할맵은 시스템 공유 정보 저장부(iLock)나 확률에 기반한 Gossip 프로토콜을 이용해 공개하고 있으며, 메타데이터 서버(200)만이 이 분할맵을 편집할 수 있다. 그리고 데이터 서버(300)나 파일 시스템 클라이언트(100)은 이 분할맵을 읽어와서 해시 공간에서 검색하여 해당 영역의 메타데이터 서버(200)를 찾아간다. 이때, 상기 공유 정보 저장부를 이용하는 방법은 중앙 집중식 정보 공유 방법이며, 상기 Gossip 프로토콜을 이용하는 방법은 비 집중식 정보 공유 방법의 일 실시예이다. 이처럼 상기 분할맵의 공개는 중앙 집중식 정보 공유 방법의 경우에는 시스템 공유 정보 저장부를 이용하고, 비 집중식 정보 공유 방법의 경우에는 확률에 기반해 정보를 다수의 서버에 효율적으로 전파할 수 있는 Gossip 프로토콜을 이용하는 방법의 이용이 가능하다. 아울러 전통적인 멀티캐스트(multicast) 방식의 사용도 가능하다.

본 발명에서 사용하고 있는 해시 공간은 2¹²⁸이기 때문에 0 ~ 2¹²⁸-1 사이의 값을 가지는 토큰을 사용한다. 참고로 분할맵에는 16진수(hex) 값으로 기록되어 있다.

도 7 은 새로운 메타데이터 서버가 추가되는 과정을 설명하기 위한 도면이다.

도 7에서 도시하고 있는 것과 같이, 현재 제 1 메타데이터 서버(MDS#1)만이 해시 공간(hash space)에 존재하고 있으며, 또한 분할맵에는 제 1 메타데이터 서버의 토큰 및 서버 접속 주소 정보만을 저장하고 있다.

이때 제 2 메타데이터 서버(MDS#2)가 해시 링에 추가되는 경우, 제 2 메타데이터 서버(MDS#2)는 분할맵을 읽은 후에, MD5 알고리즘(Message-Digest algorithm 5), SHA 알고리즘(Secure Hash algorithm)과 같은 해시 알고리즘(hash algorithm)을 통해 결정되어 있는 자신의 토큰 값 및 서버 접속 주소 값을 기록한다.

그러면 제 1 메타데이터 서버(MDS#1)는 상기 제 2 메타데이터 서버(MDS#2)에서 확보된 영역의 메모리 캐시를 자신의 영역에서 제공하고, 자신의 영역에서 벗어난 데이터 서버(300)가 제 2 메타데이터 서버(MDS#2)로 이동등록(moveRegistration)을 할 수 있도록 관리한다.

이처럼 기존에 존재하던 제 1 메타데이터 서버(MDS#1) 사이로 새로운 제 2 메타데이터 서버((MDS#2)가 들어오는 경우, 이미 존재하고 있던 제 1 메타데이터 서버(MDS#1)의 토큰 값은 바뀌지 않고, 관리하는 영역만 변화하게 된다.

반대로, 기존에 존재하는 메타데이터 서버의 정지 요청을 받으면, 정지 요청받은 메타데이터 서버는 분할맵에서 자신의 토큰을 삭제하고 종료하게 된다.

그리고 해시 링에 있던 이웃하는 메타데이터 서버는 삭제된 메타데이터 서버의 해시 영역까지 그 담당 영역이 증가하게 된다. 이때 영역이 늘어난 메타데이터 서버는 추가됐을 때와는 다르게 아무런 행동을 하지 않는다.

한편, 해시 공간에 위치하는 메타데이터 서버 중 예상치 못한 상황(고장 등)으로 정상적인 동작이 이루어지지 못하는 경우에는 이를 복구하기 위한 방법이 이루어져야 한다. 이를 위해, 메타데이터 서버(200)는 해시 링 구조에서 자신의 이웃하는 다른 노드에 해당하는 메타데이터 서버(200)를 지속적으로 감시하는 방법을 이용하여 메타데이터 서버의 예상치 못한 상황에 따른 정상적인 동작을 보상한다.

도 8을 참조하여, 메타데이터 서버의 예상치 못한 상황에서의 복구 방법을 설명하면 다음과 같다.

도 8과 같이, 해시 공간에 제 1, 2, 3 메타데이터 서버가 존재하고 있으며, 제 1 메타데이터 서버(MDS#1)는 토큰 값으로 4를 갖고, 제 2 메타데이터 서버(MDS#2)는 토큰 값으로 8을 갖고, 제 3 메타데이터 서버(MDS#3)는 토큰 값으로 14를 갖고 있다.

이때, 제 2 메타데이터 서버(MDS#2)가 예상치 못한 상황으로 인해 고장(failure)이라고 판정되면, 상기 시스템 공유 정보 저장부(iLock)이나 Gossip 프로토콜을 이용해 고장으로 판명된 제 2 메타데이터 서버(MDS#2)의 토큰 값이 제거되었다는 사실을 공개하고, 상기 제 2 메타데이터 서버(MDS#2)를 감시하고 있던 이웃하는 제 1 메타데이터 서버(MDS#1)에서는 그 감시 대상을 상기 제 2 메타데이터 서버(MDS#2)에서 감시하고 있던 제 3 메타데이터 서버(MDS#3)로 변경하여 정의한다.

이에 따라, 메타데이터 서버들의 고장이 발생하는 상황에서도 효과적으로 모든 데이터 서버에 대한 상태 정보를 효율적으로 관리할 수 있게 된다.

상기에서 설명한 본 발명의 기술적 사상은 바람직한 실시예에서 구체적으로 기술되었으나, 상기한 실시예는 그 설명을 위한 것이며 그 제한을 위한 것이 아님을 주의하여야 한다. 또한, 본 발명의 기술적 분야의 통상의 지식을 가진자라면 본 발명의 기술적 사상의 범위 내에서 다양한 실시예가 가능함을 이해할 수 있을 것이다. 따라서 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.

Claims

파일 데이터를 저장하고 관리하며, 주기적으로 메타데이터 서버로 자신의 상태 정보를 보고하는 적어도 2개 이상의 데이터 서버와,
적어도 2개 이상으로 구성되어 DHT(Distributed Hash Table) 개념을 적용하여 각각 배치되며, 파일 시스템의 모든 파일에 대한 메타데이터를 저장하고, 상기 데이터 서버로부터 제공되는 상태 정보를 기반으로 데이터 서버에 대한 상태 정보를 관리하는 메타데이터 서버와,
클라이언트 응용을 수행하면서 상기 메타데이터 서버로부터 파일 메타데이터를 액세스하고 데이터 서버로부터 파일 데이터를 입출력하는 파일 시스템 클라이언트를 포함하여 구성되는 것을 특징으로 하는 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템.
제 1 항에 있어서,
상기 데이터 서버는 입력되는 원 파일을 적어도 하나 이상의 데이터로 분할하고, 상기 분할된 원 파일 데이터에 각각 적어도 2개 이상의 패리티 데이터를 결합한 하나 이상의 분할 데이터를 생성한 후, 상기 생성된 각각의 분할 데이터를 다시 분할하여 저장하는 것을 특징으로 하는 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템.
제 2 항에 있어서,
상기 생성된 분할 데이터는 인코딩을 통해 패리티 데이터를 포함하는 로컬 스토리지의 부호어 크기로 생성되는 것을 특징으로 하는 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템.
제 1 항에 있어서,
상기 메타데이터 서버는 해시 공간(hash space)에 존재하는 값 중 하나를 토큰(token) 값으로 정의하고, 시계 방향 또는 반시계 방향으로 해시 링(hash ring)을 따라 가면서 존재하는 데이터 서버에 대한 상태 정보를 관리하며, 다른 메타데이터 서버를 만나게 되는 지점 전까지를 자신의 관리영역으로 정의하는 것을 특징으로 하는 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템.
제 4 항에 있어서,
상기 메타데이터 서버는 해시 알고리즘(hash algorithm)을 사용하여 해시 공간 전체에 메타데이터 서버가 위치되도록 토큰 값을 생성하여 메타데이터 서버로 설정하는 토큰 생성 함수부를 포함하는 것을 특징으로 하는 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템.
제 4 항에 있어서,
상기 해시 공간은 메타데이터 서버의 토큰 및 메타데이터 서버의 접속주소 정보를 포함하는 분할맵으로 구성되는 것을 특징으로 하는 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템.
적어도 2개 이상의 데이터 서버와, 파일에 대한 메타데이터를 저장하고, 데이터 서버에 대한 상태 정보를 관리하는 메타데이터 서버와, 클라이언트 응용을 수행하면서 데이터 서버로부터 파일 데이터를 입출력하는 파일 시스템 클라이언트를 포함하여 구성되는 분산파일 시스템을 이용한 데이터 처리 방법에 있어서,
상기 메타데이터 서버는 적어도 2개 이상이 DHT(Distributed Hash Table) 개념을 적용하여 각각 배치되며, 해시 공간(hash space)에 존재하는 값 중 하나를 토큰(token) 값으로 정의되는 것을 특징으로 하는 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템을 이용한 데이터 처리 방법.
제 7 항에 있어서,
상기 메타데이터 서버는 다른 메타데이터 서버를 만나게 되는 지점 전까지를 자신의 관리영역으로 정의하여, 시계 방향 또는 반시계 방향으로 해시 링(hash ring)을 따라 가면서 존재하는 데이터 서버에 대한 상태 정보를 관리하는 것을 특징으로 하는 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템을 이용한 데이터 처리 방법.
제 8 항에 있어서,
상기 데이터 서버에서 보고되는 상태 정보는 하나의 메타데이터 서버에만 전달되는 단계와,
상기 상태 정보를 보고 받은 메타데이터 서버는 보고된 상태 정보를 해시 링에 있는 다른 메타데이터 서버에게 공유하는 단계를 포함하는 것을 특징으로 하는 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템을 이용한 데이터 처리 방법.
제 8 항에 있어서, 상기 메타데이터 서버는
해시 알고리즘(hash algorithm)을 사용하여 해시 공간 전체에 메타데이터 서버가 위치되도록 생성된 토큰 값을 메타데이터 서버에 설정되는 단계와,
메타데이터 서버의 토큰 및 서버 접속 주소 정보를 갖는 분할맵을 시스템 공유 정보 저장부(iLock)나 Gossip 프로토콜을 이용해 공개하고, 상기 공개된 분할맵을 기반으로 데이터 서버 또는 파일 시스템 클라이언트가 해시 공간에서 메타데이터 서버를 검출하는 단계와,
레지스터(register)가 이루어지고 킵얼라이브(KeepAlive)가 유지되는 상기 데이터 서버로부터 데이터 서버가 관리하는 디스크 상태 정보를 포함하는 데이터 서버의 상태 정보(repoinfo)를 보고받는 단계를 포함하여 이루어지는 것을 특징으로 하는 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템을 이용한 데이터 처리 방법.
제 10 항에 있어서,
상기 해시 링에 새롭게 추가되는 제 2 메타데이터 서버(MDS#2)가 상기 분할맵을 읽은 후에, 해시 알고리즘을 통해 결정되어 있는 자신의 토큰 및 서버 접속 주소 정보를 기록한 분할맵을 시스템 공유 정보 저장부(iLock)나 Gossip 프로토콜을 이용해 공개하는 단계와,
상기 절차의 결과로 정의되는 해시 링 상의 관리권한을 이미 일부 또는 전부 소요하고 있던 제 1 메타데이터 서버(MDS#1)가 상기 제 2 메타데이터 서버(MDS#2)에서 확보한 권리영역을 포기하는 단계와,
상기 분할맵을 기반으로 관리권한이 변한 데이터 서버 또는 파일 시스템 클라이언트가 해시 공간에서 메타데이터 서버를 검출하는 단계와,
레지스터(Register)가 이루어지고 킵얼라이브(KeepAlive)가 유지되는 상기 데이터 서버로부터 데이터 서버가 관리하는 디스크 상태 정보를 포함하는 데이터 서버의 상태 정보(repoinfo)를 보고받는 단계를 포함하여 이루어지는 것을 특징으로 하는 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템을 이용한 데이터 처리 방법.
제 10 항에 있어서,
기존에 존재하는 메타데이터 서버의 정지 요청을 받으면, 정지 요청받은 메타데이터 서버는 자신의 토큰을 삭제한 분할맵을 상기 시스템 공유 정보 저장부(iLock)나 Gossip 프로토콜을 이용해 공개하고 종료하는 단계와,
해시 링에 있던 이웃하는 메타데이터 서버가 상기 삭제된 메타데이터 서버의 해시 영역까지 그 담당 영역이 증가되는 단계를 포함하여 이루어지는 것을 특징으로 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템을 이용한 데이터 처리 방법.
제 10 항에 있어서,
해시 공간에 위치하는 메타데이터 서버 중 어느 하나의 제 4 메타데이터 서버가 예상치 못한 상황으로 정상적인 동작이 이루어지지 못하는 경우에는 상기 시스템 공유 정보 저장부(iLock)나 Gossip 프로토콜을 이용해 고장으로 판명된 제 4 메타데이터 서버의 토큰 값이 제거되었다는 사실이 공개되는 단계와,
상기 고장으로 판정된 제 4 메타데이터 서버를 감시하고 있던 이웃하는 다른 제 3 메타데이터 서버에서 그 감시 대상을 상기 제 4 메타데이터 서버에서 감시하고 있었던 제 5 메타데이터 서버로 변경하여 정의하는 단계를 포함하여 이루어지는 것을 특징으로 하는 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템을 이용한 데이터 처리 방법.
제 10 항에 있어서,
상기 메타데이터 서버는 해시 링 구조에서 자신의 이웃하는 다른 노드에 해당하는 메타데이터 서버를 지속적으로 감시하는 것을 특징으로 하는 멀티 메타데이터 서버 구조를 갖는 분산 파일 시스템을 이용한 데이터 처리 방법.