KR100423701B1 - 가상적으로 통합된 분산파일그룹에 데이터를 백업하기위한 방법 및 시스템 - Google Patents

가상적으로 통합된 분산파일그룹에 데이터를 백업하기위한 방법 및 시스템 Download PDF

Info

Publication number
KR100423701B1
KR100423701B1 KR10-2001-0006116A KR20010006116A KR100423701B1 KR 100423701 B1 KR100423701 B1 KR 100423701B1 KR 20010006116 A KR20010006116 A KR 20010006116A KR 100423701 B1 KR100423701 B1 KR 100423701B1
Authority
KR
South Korea
Prior art keywords
file
data
file data
group
file group
Prior art date
Application number
KR10-2001-0006116A
Other languages
English (en)
Other versions
KR20020065977A (ko
Inventor
이시훈
이정환
Original Assignee
주식회사 클래러스
이시훈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 클래러스, 이시훈 filed Critical 주식회사 클래러스
Priority to KR10-2001-0006116A priority Critical patent/KR100423701B1/ko
Publication of KR20020065977A publication Critical patent/KR20020065977A/ko
Application granted granted Critical
Publication of KR100423701B1 publication Critical patent/KR100423701B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD

Abstract

본 발명은 복수의 시스템에 분산되어 존재하는 파일시스템의 파일그룹들을 상기 시스템에 별도의 프로그램 설치없이 가상적으로 통합한 가상파일그룹에 데이터를 백업하기 위한 방법 및 시스템에 관한 것이다.
본 발명의 가상적으로 통합된 분산파일그룹에 데이터를 백업하기 위한 방법은 파일그룹들 중 적어도 둘 이상을 가상적으로 통합한 가상파일그룹을 구비하는 단계; 상기 가상파일그룹으로의 파일데이터의 백업요청 및 백업용 파일데이터를 수신하는 단계; 상기 가상파일그룹을 구성하는 파일그룹중 상기 파일데이터를 백업할 적어도 하나 이상의 파일그룹을 선정하여, 상기 선정된 파일그룹에 저장하기에 적합한 형태로 상기 파일데이터를 가공하는 단계; 및 상기 선정된 파일그룹에 상기 가공된 파일데이터를 백업하고 가공정보를 기록하는 단계;를 포함한다.
본 발명에 의한 가상적으로 통합된 분산파일그룹에 데이터를 백업하기 위한 방법 및 시스템은 사용자로 하여금 자신이 저장할 데이터의 크기 및 개별 저장장치에 대한 정보를 파악하지 않고 손쉽게 백업을 수행하도록 하는 이점을 갖는다.

Description

가상적으로 통합된 분산파일그룹에 데이터를 백업하기 위한 방법 및 시스템{Method for data backup to distributed file group virtually aggregated}
본 발명은 복수의 시스템에 분산되어 존재하는 파일시스템의 파일그룹들에 파일데이터를 백업하는 방법 및 시스템에 관한 것으로, 보다 상세하게는, 복수의시스템에 분산되어 존재하는 파일시스템의 파일그룹들을 상기 시스템에 별도의 프로그램 설치없이 가상적으로 통합한 가상파일그룹에 데이터를 백업하기 위한 방법 및 시스템에 관한 것이다.
종래의 하드디스크를 이용한 백업에서 백업 디바이스로 하나의 폴더를 지정할 수 있게 되어있다. 그러나 하나의 폴더가 가질 수 있는 용량의 한계가 있어 이를 극복하기 위해서는 다수의 폴더를 각기 다른 백업 대상폴더로 지정해 주어야 한다. 이렇게 다수의 폴더에 데이터를 백업하기 위해서는 백업할 때마다 매번 각 폴더의 저장용량 및 여유공간 등의 정보를 파악하고 데이터를 백업할 가장 적절한 폴더를 선정하여 백업해야만 한다. 그러나, 이러한 방식은 상술된 정보의 파악 및 폴더선정등의 작업이 사용자에 의해 수동으로 수행되는 불편함이 있었다. 상기 작업을 소홀히 하여 파일데이터를 백업하는 도중에야 비로소 파일데이터의 크기가 폴더의 여유공간을 초과함이 발견되는 경우, 그때까지 수행한 파일백업 작업을 취소하고 다른 폴더를 선정하는 등의 조치를 취한 후 다시 백업해야 하는 상황이 발생할 우려가 있다. 이는 백업 데이터의 순결성에 치명적인 영향을 끼치게 되어 백업의 의미가 사라지게 된다. 또한 파일데이터는 단일 폴더에 저장되어야 하므로, 파일데이터의 크기가 비교적 큰 경우, 폴더의 선정에 어려움이 있을 수 있고, 만약 파일데이터를 작은 몇 개의 파일데이터로 분할하여 별개의 폴더에 저장할 수는 있지만, 이 역시 사용자에 의해 수동으로 수행되어야 하며, 분할된 각 파일데이터를 원래의 파일데이터로 복원하기 위해서는 여러가지 정보들을 별도로 기록하고 있어야 하는 단점이 있었다.
본 발명이 이루고자 하는 기술적 과제는 복수의 시스템에 분산되어 존재하는 파일시스템의 파일그룹들을 별도의 프로그램 설치없이 가상적으로 통합하여 형성된 가상파일그룹에 데이터를 백업하기 위한 방법 및 시스템을 제공하는 것이다.
본 발명이 이루고자 하는 다른 기술적 과제는 복수의 시스템에 분산되어 존재하는 파일시스템의 파일그룹들을 별도의 프로그램 설치없이 가상적으로 통합하여 형성된 가상파일그룹에 데이터를 백업하기 위한 절차를 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 것이다.
도 1은 본 발명의 가상적으로 통합된 분산파일그룹에 데이터를 백업하기 위한 시스템을 간략하게 설명하기 위한 간략도이다.
도 2는 본 발명의 가상적으로 통합된 분산파일그룹에 데이터를 백업하기 위한 방법을 설명하기 위한 순서도이다.
도 3은 본 발명의 백업 방법에 의해 파일데이터를 분할하는 과정을 설명하는 순서도이다.
도 4는 도 3에 따른 파일데이터의 분할과정을 상세히 설명하기 위해 예시된 도면이다.
도 5는 본 발명의 백업 방법에 의해 분할된 파일데이터를 분할 이전의 상태로 복원하는 과정을 설명하는 순서도이다.
본 발명은 상기한 기술적 과제를 달성하기 위하여, 서버와 데이터 저장부, 가공정보 저장부 및 임시 저장부를 포함하는 소정의 통합 백업 시스템을 통해 복수의 시스템에 분산되어 존재하는 파일시스템의 파일그룹들에 파일데이터를 백업하는 방법에 있어서, (a)상기 통합 백업 시스템에 의해 상기 파일그룹들 중 적어도 둘 이상을 가상적으로 통합한 가상파일그룹을 구비하는 단계와; (b)상기 통합 백업 시스템이 상기 복수의 시스템으로부터 상기 가상파일그룹으로의 파일데이터의 백업요청 및 백업용 파일데이터를 수신하는 단계와; (c)상기 통합 백업 시스템이 상기 가상파일그룹을 구성하는 파일그룹중 상기 파일데이터를 백업할 적어도 하나 이상의 파일그룹을 선정하여, 상기 선정된 파일그룹에 저장하기에 적합한 형태로 상기 파일데이터를 가공하는 단계; 및 (d)상기 통합 백업 시스템을 통해 상기 선정된 파일그룹에 상기 가공된 파일데이터를 백업하고 가공정보를 기록하는 단계;를 포함하고,상기 (b)단계는 상기 수신된 파일데이터를 임시로 저장하는 단계를 포함하여 상기 파일데이터에 대한 모든 정보는 상기 임시로 저장된 파일데이터에 의해 제공되게 하고,상기 (c)단계는 파일데이터를 가공함에 있어 상기 파일그룹의 비정상적 상태를 대비하여 상기 파일데이터의 복사본을 상기 파일그룹들에 분산하여 저장하는 저가 디스크의 중복 배열(RAID:Redundant Arrays of Inexpensive Disks)방식으로 백업하는 단계를 포함하고,백업과 관련한 정보는 가공된 데이터가 저장된 파일그룹의 식별자, 가공이전 파일데이터의 식별자, 및 가공이전 파일데이터에서의 자신의 위치정보 등을 포함하는 것을 특징으로 하는 가상적으로 통합된 분산파일그룹에 데이터를 백업하기 위한 방법을 제공한다.
본 발명은 상기한 기술적 과제를 달성하기 위하여 본 발명의 다른 형태에 의하면, 복수의 시스템에 분산되어 존재하는 파일시스템의 파일그룹들에 파일데이터를 백업하는 시스템에 있어서, 가공된 파일데이터에 대한 가공정보를 기록하기 위한 가공정보저장부; 및 상기 파일그룹들 중 적어도 둘 이상을 가상적으로 통합한 가상파일그룹을 구비하여, 상기 가상파일그룹으로의 파일데이터의 백업요청 및 백업용 파일데이터를 수신하고, 상기 가상파일그룹을 구성하는 파일그룹중 상기 파일데이터를 백업할 적어도 하나 이상의 파일그룹을 선정하여, 상기 선정된 파일그룹에 저장하기에 적합한 형태로 상기 파일데이터를 가공한 후, 상기 선정된 파일그룹에 상기 가공된 파일데이터를 백업하고 가공정보를 상기 가공정보저장부에 기록하는 서버부;를 구비하고,백업과 관련한 정보는 가공된 데이터가 저장될 파일그룹의 식별자, 가공이전 파일데이터의 식별자, 및 가공이전 파일데이터에서의 자신의 위치정보 등을 포함하고,상기 시스템에 분산되어 존재하는 파일시스템은 하드디스크 드라이브, 플로피디스크 드라이브, 테이프 드라이브, 플래시 메모리, 네트워크 부착형 저장장치 (NAS : Network Attached Storage)중 적어도 하나에 형성되는 것을 특징으로 하는 가상적으로 통합된 분산파일그룹에 데이터를 백업하기 위한 시스템을 제공한다.
본 발명의 상기한 다른 기술적 과제를 달성하기 위하여, 서버와 데이터 저장부, 데이터 가공정보 저장부 및 데이터 임시 저장부를 포함하는 소정의 통합 백업 시스템을 통해 복수의 시스템에 분산되어 존재하는 파일시스템의 파일그룹들에 파일데이터를 백업하는 방법을 기록한 컴퓨터로 읽을 수 있는 기록매체에 있어서,상기 통합 백업 시스템에 의해 상기 파일그룹들 중 적어도 둘 이상을 가상적으로 통합한 가상파일그룹을 구비하는 a) 단계; 상기 통합 백업 시스템이 상기 복수의 시스템으로부터 상기 가상파일그룹으로의 파일데이터의 백업요청 및 백업용 파일데이터를 수신하는 b) 단계; 상기 통합 백업 시스템이 상기 가상파일그룹을 구성하는 파일그룹중 상기 파일데이터를 백업할 적어도 하나 이상의 파일그룹을 선정하여, 상기 선정된 파일그룹에 저장하기에 적합한 형태로 상기 파일데이터를 가공하는 c) 단계; 및 상기 통합 백업 시스템을 통해 상기 선정된 파일그룹에 상기 가공된 파일데이터를 백업하고 각 가공데이터에 대한 백업정보를 기록하는 d) 단계를 포함하고,상기 (b)단계는 상기 수신된 파일데이터를 임시로 저장하는 단계를 포함하여 상기 파일데이터에 대한 모든 정보는 상기 임시로 저장된 파일데이터에 의해 제공되게 하고,상기 (c)단계는 파일데이터를 가공함에 있어 상기 파일그룹의 비정상적 상태를 대비하여 상기 파일데이터의 복사본을 상기 파일그룹들에 분산하여 저장하는 저가 디스크의 중복 배열(RAID:Redundant Arrays of Inexpensive Disks)방식으로 백업하는 단계를 포함하고,상기 백업정보는 가공된 데이터가 저장된 파일그룹의 식별자, 가공이전 파일데이터의 식별자, 및 가공이전 파일데이터에서의 자신의 위치정보 등을 포함하는 것을 특징으로 하는 컴퓨터에서 실행시키기 위한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
이하 첨부된 도면을 참조하여, 본 발명의 바람직한 실시예에 의한 분산 파일시스템을 통합한 가상파일시스템에 데이터를 백업하기 위한 방법 및 시스템에 대한 구성과 동작을 보다 상세히 설명하기로 한다.
도 1은 본 발명의 통합백업시스템(10)을 간략하게 설명하기 위한 간략도이다. 도 1을 참조하면, 통합백업시스템(10)은 가공된 파일데이터에 대한 가공정보를 기록하기 위한 가공정보저장부(102), 파일데이터를 수신하여 임시로 저장하는 임시저장부(103), 및 분산된 시스템(11, 13, 15, 17, ...)에 연결된 저장부(12, 14, 16, 18,...)의 작업영역에서 제공되는 파일데이터를 저장할 적어도 하나 이상의 파일그룹을 저장부(12, 14, 16, 18,...)의 백업영역에서 선정하여, 상기 선정된 파일그룹에 저장하기에 적합한 형태로 파일데이터를 가공한 후, 상기 가공된 파일데이터에 대한 가공정보를 상기 가공정보저장부(102)에 기록하고 가공된 데이터를 상기 가공정보에 따라 상기 선정된 파일그룹에 저장하는 서버부(101)를 구비한다.
통합백업시스템(10)은 네트워크로 연결되어 있는 복수의 시스템들(11, 13, 15, 17, ...)에 접속되어 각 시스템들(11, 13, 15, 17, ...)에 구비되어 있는 저장부(12, 14, 16, 18,...)로부터 백업을 위한 백업공간을 할당받는데, 백업공간은 상기 저장부에 형성되는 파일그룹의 형태로 제공된다. 본 명세서에서 파일그룹이라 함은 파일들의 체계적인 관리를 위해 복수개의 파일이 저장되는 저장공간을 총칭하는 것으로, 디렉토리 및 폴더등이 이에 해당된다. 통합백업시스템(10)은 각 시스템들(11, 13, 15, 17, ...)로부터 할당받은 다수의 상기 파일그룹들 내에 백업데이터를 저장한다. 이때, 할당받는 파일그룹의 크기는 시스템들에 따라 상이할 수 있다(단, 후술될 저가 디스크의 중복 배열(RAID:Redundant Arrays of InexpensiveDisks) 방식의 적용을 위해서는 각 파일그룹의 크기가 동일해야 한다). 예를 들어, 저장부#3(16)의 경우에는 모든 저장영역이 백업영역으로 할당되어 있으며, 반면 저장부#4(18)의 경우에는 백업을 위한 영역이 전혀 할당되어 있지 않다. 통합백업시스템(10)은 할당된 백업영역에 속한 파일그룹들을 가상적으로 통합하여 가상파일그룹으로 만들어, 각 시스템에 제공한다. 즉, 특정 시스템(11)의 경우, 자신이 구비하고 있는 저장부#1(12)의 일정영역을 백업영역으로 제공하고, 대신에 자신을 포함한 다른 시스템들에서 제공한 백업영역의 크기를 모두 합한 크기의 단일 가상파일그룹을 통합백업시스템(10)으로부터 네트워크를 통해 제공받게 된다. 상기 시스템(11)은 작업영역에서 생성되는 파일데이터를, 상기 가상파일그룹을 구성하는 파일폴더 각각의 크기를 고려하지 않고, 통합백업시스템(10)에서 제공되는 하나의 가상파일그룹에 백업할 수 있다. 상기 저장부들(12, 14, 16, 18,...)은 하드디스크 드라이브, 플로피디스크 드라이브, 테이프 드라이브, 플래시 메모리, 네트워크 부착형 저장장치 (NAS : Network Attached Storage) 등이 사용될 수 있으며 이 이외에도 저장능력을 구비한 모든 종류의 저장장치가 사용될 수 있다.
상술된 가상파일그룹을 통한 백업작업을 수행하기 위하여 상기 통합백업시스템(10)은 서버부(101), 가공정보저장부(102), 임시저장부(103), 및 데이터저장부(104)를 구비한다. 임시저장부(103)는 각 시스템들(11, 13, 15, 17,...)로부터 제공되는 파일데이터를 수신하여 임시로 저장해 두는 저장부로서, 통합백업시스템(10)내에서의 파일데이터에 대한 모든 정보는 상기 임시저장부(103)에 저장된 데이터를 참조하게 된다. 이로써 상기 파일데이터를 제공한 시스템(11,13, 15, 17,...)은 파일데이터를 한번만 제공하면 그 이후에는 상기 파일데이터를 더 이상 제공하지 않아도 되므로, 서버부(101)간의 네트워크 부하가 경감되고, 시스템 안정성이 향상된다. 임시저장부(103)는 하드디스크 드라이브, 플로피디스크 드라이브, 테이프 드라이브, 플래시 메모리, 네트워크 부착형 저장장치 (NAS : Network Attached Storage) 등이 사용될 수 있으나, 속도 및 효율성 측면에서 하드디스크 드라이브를 사용함이 바람직하다.
가공정보저장부(102)는 서버부(101)에 의해 가공되는 파일데이터에 관한 가공정보를 저장한다. 가공정보는 가공된 파일데이터가 저장될 파일그룹의 식별자, 가공이전 파일데이터의 식별자, 및 가공이전 파일데이터에서의 자신의 위치정보(오프셋)등을 포함한다. 가공정보저장부(102)로는 상기 임시저장부(103)와 마찬가지로 여러 저장장치가 사용될 수 있으나, 하드디스크 드라이브를 사용함이 바람직하고, 상기 임시저장부(103)와 하드디스크 드라이브를 공용할 수도 있다.
데이터저장부(104)는 통합백업시스템(10)에 직접 구비된 저장부로서, 그 작동은 상술된 저장부들(12, 14, 16, 18,...)과 동일하다. 다만, 백업을 목적으로 하는 통합백업시스템(10)의 특성상 백업기능을 수행하기 위한 작업영역을 제외하고는 대부분의 저장영역이 백업영역으로 할당됨이 바람직하다.
서버부(101)는 상기 임시저장부(103), 및 가공정보저장부(102)를 제어하고, 시스템들(11, 13, 15, 17,...)로부터 수신한 파일데이터를 가공한 후, 가상파일그룹에 저장한다. 상기 서버부(101)의 동작을 도 2를 참조하여, 상세히 설명하기로 한다.
도 2는 본 발명의 통합저장방법을 설명하기 위한 순서도이다. 먼저, 상기 서버부(101)는 시스템들(11, 13, 15, 17,...)로부터 제공되는 둘 이상의 파일그룹을 선택하여 이들을 가상적으로 통합한 가상파일그룹을 설정한다(S21). 이때, 한번 선택된 파일그룹은 사용자에 의해 다시 선택되더라도 경고를 표시하고 포함시키지 않도록 함이 바람직하다. 이후, 시스템들로부터 백업요청 및 이에따른 백업데이터를 수신하면(S22), 서버부(101)는 백업데이터를 저장할 파일그룹을 선정하고 파일데이터를 가공한다(S23). 파일데이터의 가공방법에 대해서는 도 3 내지 도 5를 참조하여 이후에 상세히 설명될 것이다. 서버부(101)는 상기 선정된 파일 그룹에 파일데이터를 백업하고 가공정보를 가공정보저장부에 저장한다(S24).
도 3은 상술된 S23 단계에서의 파일그룹 선정 및 파일데이터 가공 방법의 일 실시예이다. 도 3을 참조하면, 백업데이터가 수신되면 마지막으로 저장작업이 수행되었던 파일그룹을 검색하여 작업파일그룹으로 선정한다(S31). 다음에 상기 선정된 작업파일그룹의 여유공간 크기를 파일데이터의 크기와 비교하여(S32), 파일데이터의 크기보다 작지않은 경우 종료한다. 파일데이터의 크기가 큰 경우에는 파일그룹의 여유공간 크기만큼을 상기 파일데이터로부터 분할한다(S33). 다음에, 분할되고 남은 파일데이터를 백업할 다른 파일그룹을 작업파일그룹으로 선정한 후에 S32 단계로 되돌아간다. 이때, 분할되고 남은 파일데이터를 백업할 다른 파일그룹을 선정함에 있어, 파일그룹 중 가장 여유공간이 큰 파일그룹을 선정하는 것이 파일데이터의 분할을 최소화하는 면에서 바람직하다. 파일데이터는 S32 내지 S34 루프를 반복함으로써 분할되며, 분할된 각 파일데이터가 저장될 파일그룹이 선정된다.
도 4는 도 3에 따른 파일데이터의 분할과정을 상세히 설명하기 위해 예시된 도면이다. 도 4를 참조하면, 본 예에서는 두개의 파일그룹(각 10Mega byte 크기)이 사용되었고 저장할 파일데이터B(41)는 5Mb 으로 가정하였다. 통합백업시스템(10)은 먼저 파일데이터의 크기인 5Mb 가 현재 순차적으로 저장하고 있는 중인 파일그룹#1에 저장가능한지 여부를 판단한다. 본 예에서는 이미 파일그룹#1에는 데이터A(34)가 이미 백업되어 있는 상태로, 여유공간이 2Mb에 불과하므로, 파일데이터B(31)를 모두 파일그룹#1에 저장할 수는 없다. 그러므로 통합백업시스템(10)은 상기 파일데이터B(41)에서 상기 파일그룹#1의 여유공간 크기에 해당하는 2Mb 를 분할하고 나머지 3Mb를 저장할 파일그룹인 파일그룹#2를 선정한다. 파일그룹#2는 여유공간이 5Mb이므로 상기 나머지 파일데이터인 3Mb는 더 이상 분할되지 않고 파일그룹#2에 백업된다.
도 5는 도 3 내지 도 4에 설명된 방법에 의해 분할된 파일데이터를 분할 이전의 상태로 복원하는 과정을 설명하는 순서도이다. 가상파일그룹에 백업되어 있는 파일데이터를 요구받으면, 먼저 파일데이터가 분할되어 백업되었는지 유무를 확인한다(S51). 분할되어 백업되어 있는 경우, 가공정보저장부(102)에 저장된 가공정보, 즉 분할된 데이터가 저장된 파일그룹의 식별자, 가공이전 파일데이터의 식별자, 및 가공이전 파일데이터에서의 자신의 위치정보등을 참조하여 상기 분할된 파일데이터들을 단일 파일데이터로 복원한다(S52). S51 단계에서 파일데이터가 분할되어 백업되지 않은 경우, 파일데이터가 백업되어 있는 파일그룹을 찾아 별도의 복원작업 없이 제공한다.
상술된 도 2의 S23 단계에서의 파일그룹 선정 및 파일데이터 가공 방법의 다른 실시예로서 저가 디스크의 중복 배열(RAID:Redundant Arrays of Inexpensive Disks)식 저장기법을 사용하여 파일데이터를 분할하여 백업할 수 있다. RAID식 저장기법은 여러 드라이브에 데이터를 분산하여 중복 저장함으로써, 하나의 드라이브에 장애가 발생하더라도 데이터를 안전하게 복구할 수 있다. 본 실시예에서는 가상파일그룹을 구성하는 파일그룹들에 대해 파일데이터를 중복적으로 분산하여 백업한다. 이를 위해 각 구성 파일그룹들은 동일한 백업용량을 지니고 있어야 한다. 이제 구체적인 RAID 식 백업방법을 설명하기로 한다. 예를 들어, 가상파일그룹을 구성하는 파일그룹의 수를 N이라 하면, 각 파일그룹은 파일데이터를 같은 크기로 분배하고 또한 파일데이터는 중복되어 백업해야 하므로(즉 백업해야할 데이터의 양이 두배이므로) 각 파일그룹에 할당되는 파일데이터의 할당율은 CA = 2*100/N (%)이다. 그러므로 각 파일그룹에 실제로 백업되는 파일데이터의 크기는 CA * 파일데이터의 크기가 된다. 각 파일그룹에 대해 백업되는 파일데이터의 영역은 시작오프셋과 끝오프셋으로 결정된다. 예를 들어 파일의 전체크기가 100인 경우, 1 부터 N 번째 파일그룹에 백업되는 파일데이터의 시작 오프셋 값은 (CA/2) * (N-1) + 1 이 되며, N 번째 파일그룹에 백업되는 파일데이터의 끝 오프셋 값은 ((CA/2) * (N-1) + CA)%100 이 된다(여기서 %는 나머지연산을 의미한다). N = 4 라고 가정하면 위의 오프셋 결정식들에 의해 파일그룹#1은 1~50, 파일그룹#2는 26~75, 파일그룹#3는 51~100, 파일그룹#4는 76~25에 해당하는 파일데이터를 백업하게 된다. 즉, 각 파일그룹은 단일 파일데이터를 동등하게 분할하여 백업하고, 예를 들어 파일그룹#3에장애가 발생하더라도, 51~100 사이의 파일데이터는 파일그룹#2 및 파일그룹#4에 중복 백업되어 있으므로 파일데이터의 복구가 가능하게 된다.
상기 RAID식 백업방법에 의해 백업된 파일데이터들을 복원하는 방법에 대해 설명하기로 한다. (1) 복원할 파일데이터를 예를들어 FR이라고 설정하고 작업파일그룹을 첫번째 파일그룹으로 설정한다. (2) 작업파일그룹에서 복원할 파일데이터에 해당하는 데이터를 FR에 복사한 후, 작업파일그룹이 지니고 있는 파일데이터의 (끝 오프셋+1) 값이 시작 오프셋인 파일그룹(FS)를 가공정보저장부에서 검색하여 작업파일그룹으로 선정한다. (3) 상기 (2)의 과정을 FR이 모두 복원될때까지 반복한다. (4) 만약 상기 (2)의 과정에서 파일그룹의 장애로 인하여 FS에서 데이터를 독출하지 못하는 경우에는, FS가 M 번째 파일그룹이라면 M-1 번째 파일그룹을 작업파일그룹으로 선정하고 상기 (2), (3), (4)의 과정을 FR이 완전히 복구될 때까지 반복한다.
상기 실시예는 본 발명의 RAID 식 백업 방법을 설명하기 위해 기술된 것으로 본 발명이 상기 실시예에 한정되는 것은 아니다. 다양한 RAID 식 저장방법이 존재함은 당업자라면 잘 알 수 있을 것이다.
상술한 바와 같이 본 발명에 의한 가상적으로 통합된 분산파일그룹에 데이터를 백업하기 위한 방법 및 시스템은 복수의 시스템에 분산되어 존재하는 파일시스템의 파일그룹들을 상기 시스템에 별도의 프로그램 설치없이 가상적으로 통합한 가상파일그룹에 데이터를 백업함으로써, 사용자로 하여금 자신이 저장할 데이터의 크기 및 개별 저장장치에 대한 정보를 파악하지 않고 손쉽게 백업을 수행하도록 하는 이점을 갖는다.
또한 데이터의 백업시 파일데이터를 자동으로 분할하여 저장하고 분할된 파일데이터의 정보를 체계적으로 관리함으로써 폴더와 같은 개별 파일그룹을 수동으로 관리하는 것에 비해 백업데이터의 순결성을 향상시키는 이점을 갖는다.

Claims (11)

  1. 서버와 데이터 저장부, 가공정보 저장부 및 임시 저장부를 포함하는 소정의 통합 백업 시스템을 통해 복수의 시스템에 분산되어 존재하는 파일시스템의 파일그룹들에 파일데이터를 백업하는 방법에 있어서,
    (a)상기 통합 백업 시스템에 의해 상기 파일그룹들 중 적어도 둘 이상을 가상적으로 통합한 가상파일그룹을 구비하는 단계;
    (b)상기 통합 백업 시스템이 상기 복수의 시스템으로부터 상기 가상파일그룹으로의 파일데이터의 백업요청 및 백업용 파일데이터를 수신하는 단계;
    (c)상기 통합 백업 시스템이 상기 가상파일그룹을 구성하는 파일그룹중 상기 파일데이터를 백업할 적어도 하나 이상의 파일그룹을 선정하여, 상기 선정된 파일그룹에 저장하기에 적합한 형태로 상기 파일데이터를 가공하는 단계; 및
    (d)상기 통합 백업 시스템을 통해 상기 선정된 파일그룹에 상기 가공된 파일데이터를 백업하고 가공정보를 기록하는 단계;를 포함하고,
    상기 (b)단계는 상기 수신된 파일데이터를 임시로 저장하는 단계를 포함하여 상기 파일데이터에 대한 모든 정보는 상기 임시로 저장된 파일데이터에 의해 제공되게 하고,
    상기 (c)단계는 파일데이터를 가공함에 있어 상기 파일그룹의 비정상적 상태를 대비하여 상기 파일데이터의 복사본을 상기 파일그룹들에 분산하여 저장하는 저가 디스크의 중복 배열(RAID:Redundant Arrays of Inexpensive Disks)방식으로 백업하는 단계를 포함하고,
    백업과 관련한 정보는 가공된 데이터가 저장된 파일그룹의 식별자, 가공이전 파일데이터의 식별자, 및 가공이전 파일데이터에서의 자신의 위치정보 등을 포함하는 것을 특징으로 하는 가상적으로 통합된 분산파일그룹에 데이터를 백업하기 위한 방법.
  2. 삭제
  3. 제1항에 있어서, 상기 (c)단계는
    (c1)상기 가상파일그룹을 구성하는 파일그룹중 마지막으로 저장작업이 수행된 파일그룹을 검색하는 단계;
    (c2)상기 검색된 파일그룹의 여유공간 크기와 상기 백업할 파일데이터의 크기를 비교하는 단계;
    (c3)상기 파일그룹의 여유공간 크기가 파일데이터의 크기 이하인 경우 상기파일그룹의 여유공간 크기만큼을 상기 파일데이터로부터 분할하는 단계; 및
    (c4)상기 파일그룹 이외의 다른 파일그룹을 선정하여 분할되고 남은 파일데이터의 크기가 상기 다른 파일그룹의 여유공간 크기보다 큰 경우 상기 파일데이터를 상기 다른 파일그룹의 여유공간 크기만큼 상기 파일데이터로부터 분할하는 작업을 상기 파일데이터의 남은 크기가 파일그룹 이하가 될때까지 반복하는 단계;를 포함하는 것을 특징으로 하는 가상적으로 통합된 분산파일그룹에 데이터를 백업하기 위한 방법.
  4. 삭제
  5. 제1항에 있어서,
    (e)각 파일그룹에 분산되어 백업된 상기 파일데이터들을 가공정보를 참조하여 가공이전 파일데이터로 복원하는 단계를 더 포함하는 것을 특징으로 하는 가상적으로 통합된 분산파일그룹에 데이터를 백업하기 위한 방법.
  6. 삭제
  7. 복수의 시스템에 분산되어 존재하는 파일시스템의 파일그룹들에 파일데이터를 백업하는 시스템에 있어서,
    가공된 파일데이터에 대한 가공정보를 기록하기 위한 가공정보저장부; 및
    상기 파일그룹들 중 적어도 둘 이상을 가상적으로 통합한 가상파일그룹을 구비하여, 상기 가상파일그룹으로의 파일데이터의 백업요청 및 백업용 파일데이터를 수신하고, 상기 가상파일그룹을 구성하는 파일그룹중 상기 파일데이터를 백업할 적어도 하나 이상의 파일그룹을 선정하여, 상기 선정된 파일그룹에 저장하기에 적합한 형태로 상기 파일데이터를 가공한 후, 상기 선정된 파일그룹에 상기 가공된 파일데이터를 백업하고 가공정보를 상기 가공정보저장부에 기록하는 서버부;를 구비하고,
    백업과 관련한 정보는 가공된 데이터가 저장될 파일그룹의 식별자, 가공이전 파일데이터의 식별자, 및 가공이전 파일데이터에서의 자신의 위치정보 등을 포함하고,
    상기 시스템에 분산되어 존재하는 파일시스템은 하드디스크 드라이브, 플로피디스크 드라이브, 테이프 드라이브, 플래시 메모리, 네트워크 부착형 저장장치 (NAS : Network Attached Storage)중 적어도 하나에 형성되는 것을 특징으로 하는 가상적으로 통합된 분산파일그룹에 데이터를 백업하기 위한 시스템.
  8. 제7항에 있어서, 파일데이터를 수신하여 임시로 저장하는 임시저장부를 더 구비하여 상기 파일데이터에 대한 모든 정보는 상기 임시저장부에 저장된 데이터에 의해 제공됨을 특징으로 하는 가상적으로 통합된 분산파일그룹에 데이터를 백업하기 위한 시스템.
  9. 삭제
  10. 삭제
  11. 서버와 데이터 저장부, 데이터 가공정보 저장부 및 데이터 임시 저장부를 포함하는 소정의 통합 백업 시스템을 통해 복수의 시스템에 분산되어 존재하는 파일시스템의 파일그룹들에 파일데이터를 백업하는 방법을 기록한 컴퓨터로 읽을 수 있는 기록매체에 있어서,
    상기 통합 백업 시스템에 의해 상기 파일그룹들 중 적어도 둘 이상을 가상적으로 통합한 가상파일그룹을 구비하는 a) 단계;
    상기 통합 백업 시스템이 상기 복수의 시스템으로부터 상기 가상파일그룹으로의 파일데이터의 백업요청 및 백업용 파일데이터를 수신하는 b) 단계;
    상기 통합 백업 시스템이 상기 가상파일그룹을 구성하는 파일그룹중 상기 파일데이터를 백업할 적어도 하나 이상의 파일그룹을 선정하여, 상기 선정된 파일그룹에 저장하기에 적합한 형태로 상기 파일데이터를 가공하는 c) 단계; 및
    상기 통합 백업 시스템을 통해 상기 선정된 파일그룹에 상기 가공된 파일데이터를 백업하고 각 가공데이터에 대한 백업정보를 기록하는 d) 단계를 포함하고,
    상기 (b)단계는 상기 수신된 파일데이터를 임시로 저장하는 단계를 포함하여 상기 파일데이터에 대한 모든 정보는 상기 임시로 저장된 파일데이터에 의해 제공되게 하고,
    상기 (c)단계는 파일데이터를 가공함에 있어 상기 파일그룹의 비정상적 상태를 대비하여 상기 파일데이터의 복사본을 상기 파일그룹들에 분산하여 저장하는 저가 디스크의 중복 배열(RAID:Redundant Arrays of Inexpensive Disks)방식으로 백업하는 단계를 포함하고,
    상기 백업정보는 가공된 데이터가 저장된 파일그룹의 식별자, 가공이전 파일데이터의 식별자, 및 가공이전 파일데이터에서의 자신의 위치정보 등을 포함하는 것을 특징으로 하는 컴퓨터에서 실행시키기 위한 컴퓨터로 읽을 수 있는 기록매체.
KR10-2001-0006116A 2001-02-08 2001-02-08 가상적으로 통합된 분산파일그룹에 데이터를 백업하기위한 방법 및 시스템 KR100423701B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2001-0006116A KR100423701B1 (ko) 2001-02-08 2001-02-08 가상적으로 통합된 분산파일그룹에 데이터를 백업하기위한 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2001-0006116A KR100423701B1 (ko) 2001-02-08 2001-02-08 가상적으로 통합된 분산파일그룹에 데이터를 백업하기위한 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20020065977A KR20020065977A (ko) 2002-08-14
KR100423701B1 true KR100423701B1 (ko) 2004-03-18

Family

ID=27693706

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-0006116A KR100423701B1 (ko) 2001-02-08 2001-02-08 가상적으로 통합된 분산파일그룹에 데이터를 백업하기위한 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR100423701B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040047207A (ko) * 2002-11-29 2004-06-05 (주)소프트위드솔루션 과부하 조절 기능을 갖는 데이터 백업 시스템 및 이를이용한 데이터 백업 방법
KR101009149B1 (ko) * 2008-05-26 2011-01-18 엔에이치엔비즈니스플랫폼 주식회사 오너 단위의 파일 그룹화를 이용한 분산 파일 시스템 및파일 연산 방법
KR100988107B1 (ko) * 2008-06-04 2010-10-18 엔에이치엔비즈니스플랫폼 주식회사 분산 파일 시스템 및 복제본 상태 매칭을 이용한 파일일관성 관리 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07152631A (ja) * 1993-11-26 1995-06-16 Nec Corp データベース管理方式
JPH10333948A (ja) * 1997-04-01 1998-12-18 Kokusai Zunou Sangyo Kk 仮想データベース空間システムおよびデータベースプログラムを記録したコンピュータ読み取り可能な記録媒体
WO1999024898A2 (en) * 1997-11-10 1999-05-20 Koninklijke Philips Electronics N.V. Distributed database access via virtual environment browser
KR20000011835A (ko) * 1998-07-20 2000-02-25 보토스 알. 제이 네트워크의분산애플리케이션에대한고장검출및소정의복제스타일로복구하는방법및장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07152631A (ja) * 1993-11-26 1995-06-16 Nec Corp データベース管理方式
JPH10333948A (ja) * 1997-04-01 1998-12-18 Kokusai Zunou Sangyo Kk 仮想データベース空間システムおよびデータベースプログラムを記録したコンピュータ読み取り可能な記録媒体
WO1999024898A2 (en) * 1997-11-10 1999-05-20 Koninklijke Philips Electronics N.V. Distributed database access via virtual environment browser
KR20000011835A (ko) * 1998-07-20 2000-02-25 보토스 알. 제이 네트워크의분산애플리케이션에대한고장검출및소정의복제스타일로복구하는방법및장치

Also Published As

Publication number Publication date
KR20020065977A (ko) 2002-08-14

Similar Documents

Publication Publication Date Title
US9448886B2 (en) Flexible data storage system
US7337289B2 (en) Method and apparatus for computing file storage elements for backup and restore
US9940043B2 (en) Systems and methods for performing storage operations in a computer network
EP0733235B1 (en) Incremental backup system
US7406488B2 (en) Method and system for maintaining data in a continuous data protection system
JP3410899B2 (ja) 多重ボリューム・データ・セットを回復する方法
JP4426280B2 (ja) バックアップ/リストアシステム及び方法
US20130007392A1 (en) Incremental backup of source to target storage volume
US20040044705A1 (en) Optimized disk repository for the storage and retrieval of mostly sequential data
US20050165853A1 (en) Method and apparatus for localized protected imaging of a file system
KR20110022577A (ko) 저장 영역 네트워크 시스템 및 스냅샷 등급화 관리자 프로그램
US7941619B1 (en) Space-optimized backup set conversion
JP2011530746A (ja) 現在データ及び再生データに関して異なるraidデータ・ストレージの形式の間でデータを伝送するシステム及び方法
EP1204028A1 (en) Computer file storage and recovery method
EP1470484B1 (en) Method and system for providing direct access recovery using seekable tape device
KR100423701B1 (ko) 가상적으로 통합된 분산파일그룹에 데이터를 백업하기위한 방법 및 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121220

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20131224

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20150114

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20160128

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20170303

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20180626

Year of fee payment: 15

LAPS Lapse due to unpaid annual fee