KR101844528B1 - 통합 파일을 이용한 백업 방법 및 장치 - Google Patents

통합 파일을 이용한 백업 방법 및 장치 Download PDF

Info

Publication number
KR101844528B1
KR101844528B1 KR1020170139963A KR20170139963A KR101844528B1 KR 101844528 B1 KR101844528 B1 KR 101844528B1 KR 1020170139963 A KR1020170139963 A KR 1020170139963A KR 20170139963 A KR20170139963 A KR 20170139963A KR 101844528 B1 KR101844528 B1 KR 101844528B1
Authority
KR
South Korea
Prior art keywords
file
blocks
divided
integrated compressed
backup
Prior art date
Application number
KR1020170139963A
Other languages
English (en)
Inventor
조원희
박철우
Original Assignee
(주)지란지교소프트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)지란지교소프트 filed Critical (주)지란지교소프트
Priority to KR1020170139963A priority Critical patent/KR101844528B1/ko
Application granted granted Critical
Publication of KR101844528B1 publication Critical patent/KR101844528B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

분할을 이용한 파일 백업 방법 및 장치가 개시된다. 본 발명의 일측면에 따른 백업 서버에서 수행하는 파일 백업 방법은 백업하고자 하는 보호파일을 스캔하는 단계; 보호파일을 미리 설정된 분할기준에 따라 하나 이상의 분할블록으로 분할하고, 분할에 대응하는 블록정보를 저장하는 단계; 및 보호파일에 대한 백업용으로 관리되는 통합압축파일로서 기존에 저장된 블록들과 분할블록을 비교하고, 신규블록이 존재하면 통합압축파일에 추가하여 저장하는 단계를 포함한다.

Description

통합 파일을 이용한 백업 방법 및 장치{Method and device for backup using total file}
본 발명은 통합 파일을 이용하여 백업하는 방법 및 장치에 관한 것이다.
최근 개인용 컴퓨터 장치의 저장 공간이 대용량화되고 처리 속도 역시 현저히 향상됨에 따라, 개인 자료 뿐 아니라 기술 자료, 설계 도면, 영업 자료 등과 같이 공적인 업무 자료들이 다양하게 저장되어 관리되고 있다.
파일의 유실 또는 바이러스 등에 의한 파일 오염 등에 대비하여, 중요한 파일의 경우 자체 구비된 저장수단 또는 별도의 서버 등에 백업본을 저장 및 관리하고 있다. 그러나, 백업파일의 수가 증가함에 따라 저장용량이 증가할 뿐 아니라 관리의 어려움이 존재한다. 더욱이 최근에는 다양한 바이러스, 악성코드에 대비한 보안프로그램이 설치되는데, 백업프로세스와 보안프로그램의 충돌로 인해 백업프로세스가 강제 종료되는 문제가 발생하기도 한다.
대한민국 등록특허 제10-1628195 (등록일자 2016년06월01일) 클라우드 서비스를 이용한 2중 백업 시스템 및 데이터 관리 방법
따라서, 본 발명은 상술한 문제점을 해결하기 위해 안출된 것으로서, 다수 파일의 백업에 의한 용량 증대를 줄일 수 있도록 원본 파일을 분할하여 중복되는 영역을 제거하는 파일 백업 방법 및 장치를 제공하기 위한 것이다.
또한, 본 발명은 용이한 관리를 위해 백업파일의 수를 최소화할 수 있는 파일 백업 방법 및 장치를 제공하기 위한 것이다.
본 발명의 다른 목적들은 이하에 서술되는 바람직한 실시예를 통하여 보다 명확해질 것이다.
본 발명의 일 측면에 따르면, 백업 서버에서 수행하는 파일 백업 방법에 있어서, 백업하고자 하는 보호파일을 스캔하는 단계; 상기 보호파일을 미리 설정된 분할기준에 따라 하나 이상의 분할블록으로 분할하고, 분할에 대응하는 블록정보를 저장하는 단계; 및 보호파일에 대한 백업용으로 관리되는 통합압축파일로서 기존에 저장된 블록들과 상기 분할블록을 비교하고, 신규블록이 존재하면 상기 통합압축파일에 추가하여 저장하는 단계를 포함하는 파일 백업 방법 및 그 방법을 실행하는 프로그램이 기록된 기록매체가 제공된다.
여기서, 상기 분할기준은 파일 사이즈, 파일유형, 파일명, 파일생성자 중 적어도 어느 하나를 이용하여 설정될 수 있다.
또한, 상기 통합압축파일의 사이즈와 백업처리된 보호파일들의 원본사이즈 총량을 비교함으로써 압축률을 확인하고, 상기 분할기준을 상기 압축률에 상응하도록 설정할 수 있다.
또한, 상기 압축률이 미리 설정된 임계값 이하인 경우, 상기 통합압축파일을 파일유형에 따라 복수개로 분류하여 관리할 수 있다.
또한, 상기 분할블록이 모두 신규블록인 경우, 상기 보호파일 또는 상기 분할블록을 제2 분할기준으로 재분할하여 동일블록의 존재여부를 더 확인할 수 있다.
또한, 상기 통합압축파일이 미리 설정된 임계사이즈를 초과할 경우 통합압축파일을 분할하여 저장하고, 차후 새로운 보호파일에 대해서는 새로운 통합압축파일로서 백업처리할 수 있다.
본 발명의 다른 측면에 따르면, 백업하고자 하는 보호파일을 스캔하는 스캔부; 상기 보호파일을 미리 설정된 분할기준에 따라 하나 이상의 분할블록으로 분할하는 분할부; 복수개의 블록으로 구분되는 통합압축파일을 저장하기 위한 저장부; 및 상기 보호파일의 분할블록들을 상기 통합압축파일의 각 블록들과 비교하고, 신규블록이 존재하면 상기 통합압축파일에 추가하여 저장하는 파일 관리부를 포함하는 백업 장치가 제공된다.
여기서, 상기 분할부는 상기 통합압축파일의 사이즈와 백업처리된 보호파일들의 원본사이즈 총량을 비교함으로써 압축률을 확인하고, 상기 분할기준을 상기 압축률에 상응하도록 설정할 수 있다.
또한, 상기 파일 관리부는 상기 압축률이 미리 설정된 임계값 이하인 경우, 상기 통합압축파일을 파일유형에 따라 복수개로 분류하여 관리할 수 있다.
또한, 상기 파일 관리부는 상기 분할블록이 모두 신규블록인 경우, 상기 보호파일 또는 상기 분할블록을 제2 분할기준으로 재분할하여 동일블록의 존재여부를 더 확인할 수 있다.
또한, 상기 파일 관리부는 상기 통합압축파일이 미리 설정된 임계사이즈를 초과할 경우 통합압축파일을 분할하여 저장하고, 차후 새로운 보호파일에 대해서는 새로운 통합압축파일로서 백업처리할 수 있다.
본 발명에 따르면, 파일을 분할하고 중복되지 않는 부분만 저장함으로써 백업 용량을 줄일 수 있는 효과가 있다.
또한, 본 발명에 따르면 최소한의 파일 개수로 백업파일을 관리함으로써, 타 보안 프로그램과의 충돌을 예방할 수 있으며 관리가 용이한 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 백업 장치의 구성을 도시한 블록도.
도 2는 본 발명의 일 실시예에 따른 서버/클라이언트 방식의 백업 서비스 제공 과정을 도시한 흐름도.
도 3은 본 발명의 일 실시예에 따른 백업 장치가 분할기준을 설정하는 과정을 도시한 흐름도.
도 4는 본 발명의 일 실시예에 따른 보호파일의 백업을 위한 동일블록 확인 과정을 도시한 흐름도.
도 5는 본 발명의 일 실시예에 따른 보호파일의 백업되는 형태를 도시한 예시도.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 후술될 제1 임계값, 제2 임계값 등의 용어는 실질적으로는 각각 상이하거나 일부는 동일한 값인 임계값들로 미리 지정될 수 있으나, 임계값이라는 동일한 단어로 표현될 때 혼동의 여지가 있으므로 구분의 편의상 제1, 제2 등의 용어를 병기하기로 한다.
본 명세서에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
또한, 각 도면을 참조하여 설명하는 실시예의 구성 요소가 해당 실시예에만 제한적으로 적용되는 것은 아니며, 본 발명의 기술적 사상이 유지되는 범위 내에서 다른 실시예에 포함되도록 구현될 수 있으며, 또한 별도의 설명이 생략될지라도 복수의 실시예가 통합된 하나의 실시예로 다시 구현될 수도 있음은 당연하다.
또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일하거나 관련된 참조부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
도 1은 본 발명의 일 실시예에 따른 백업 장치의 구성을 도시한 블록도이고, 도 5는 본 발명의 일 실시예에 따른 보호파일의 백업되는 형태를 도시한 예시도이다.
도 1을 참조하면, 백업 장치(100)는 스캔부(10), 분할부(20), 파일 관리부(30) 및 저장부(40)를 포함한다.
스캔부(10)는 백업하고자 하는 보호파일을 스캔(즉 복사)하는 기능을 수행하며, 분할부(20)는 스캔된 보호파일을 미리 설정된 분할기준에 의한 블록단위로 분할한다. 스캔부(10)에 의해 스캔된 보호파일은 임시적으로 저장부(40)에 저장될 수 있으며, 또는 스캔부(10) 또는 분할부(20)에 자체 구비된 저장수단(미도시)에 의해 임시 저장될 수도 있을 것이다. 이하에서는 설명의 편의상 임시저장은 저장부(40)에서 수행되는 것을 예로 들어 설명하기로 한다.
파일 관리부(30)는 보호파일이 분할된 각 블록(이하 분할블록이라 칭함)을 병합하여 생성하는 통합압축파일(42)을 생성하여 저장부(40)에 저장한다. 특히, 중복되는 블록은 통합압축파일(42)로서 병합하지 않는데, 다시 말해 새로운 신규블록에 대해서만 통합압축파일(42)에 병합되어 저장 및 관리되는 것이다.
다시 말해, 보호파일은 그대로 백업되는 것이 아니라, 블록단위로 분할되어 새로운 신규블록만이 저장되는 것이며, 저장 시에도 하나의 파일인 통합압축파일(42)에 덧붙혀진 형태로 저장되는 것이다.
이해의 편의를 위해 도면을 참조하여 설명하자면, 도 5에 도시된 바와 같이 보호파일이 3개의 분할블록으로 분할되면, 각 분할블록 중 신규블록(즉, 통합압축파일(42)을 구성하는 각 블록들과의 비교결과 동일하여 중복되는 블록이 아닌 새로운 블록)인 분할블록3(510-3)만이 추가되도록 통합압축파일(42)이 갱신되는 것이다. 나머지 분할블록1 및 분할블록2는 동일한 블록이 통합압축파일(42) 내에 존재하므로, 중복되지 않도록 통합압축파일(42)에 추가되지 않고 삭제 처리된다. 다만, 차후 보호파일의 복구를 위해서는 보호파일의 모든 분할블록에 대한 블록정보(예를 들어, 식별정보로서 해쉬(hash), 인덱스 등)는 저장한다.
백업 장치(100)는 개인PC와 같은 일반 컴퓨팅장치일 수 있으며, 또는 서버 형태로 구현되어 클라이언트 단말로부터의 파일을 백업하여 관리하는 백업 서비스를 제공할 수도 있다.
도 2는 본 발명의 일 실시예에 따른 서버/클라이언트 방식의 백업 서비스 제공 과정을 도시한 흐름도이다.
도 2를 참조하면, 컴퓨팅 장치는 새로운 파일을 생성하거나 변경하는 경우 백업을 요청할 수 있다(S210, S220).
본 실시예에 따른 백업 장치(100)는 서버 형태로 구현될 수 있으며, 이 경우 컴퓨팅 장치와 백업 장치(100)는 네트워크를 통해 데이터통신을 수행할 수 있을 것이다.
백업요청을 수신한 백업 장치(100)는 백업하고자 하는 보호파일을 스캔한다(S230). 일례에 따르면, 모든 백업파일을 도 5를 참조하여 설명한 바와 같이 통합압축파일로서 저장할 수도 있으나, 다른 일례에 따르면 일반 백업파일을 파일 그대로 백업하고 보안이 필요하여 지정된 파일만을 보호파일로서 상술한 바와 같이 통합압축파일로서 백업할 수도 있다.
백업 장치(100)는 보호파일을 분할하고, 신규블록이 존재하면 통합압축파일에 추가하는 병합을 수행하고, 각 분할파일의 블록정보를 저장한다(S240).
백업이 정상적으로 완료되면 백업 장치(100)는 컴퓨팅 장치로 백업이 완료되었음을 보고할 수 있다(S250).
본 실시예는 서버/클라이언트 간의 백업 서비스를 예시한 것이나, 반드시 이에 한정되는 것은 아니며 상술한 바와 같이 일반 개인용PC와 같은 컴퓨팅 장치 자체가 백업 장치(100)로서 자체 파일을 별도의 저장영역(논리적 또는 물리적으로 구분된 영역)에 백업하여 통합압축파일을 생성 및 저장 관리하는 방식으로 구현될 수도 있다.
이하에서는 다양한 실시예에 따라 백업 장치(100)가 보호파일을 분할하는 기준이 되는 분할기준을 설정하는 방식 등에 대해 설명하기로 한다.
도 3은 본 발명의 일 실시예에 따른 백업 장치가 분할기준을 설정하는 과정을 도시한 흐름도이다.
도 3을 참조하면, 백업 장치(100)는 압축률을 산출한다(S310). 다시 말해 백업 장치(100)는 백업이 요청된 보호파일들의 총 사이즈에 대비한 통합압축파일의 사이즈에 따른 압축률을 산출하는 것이다. 예를 들어, 1메가바이트(1Mbyte)의 보호파일 10개(따라서 총량은 10메가바이트)를 백업하여 생성한 통합압축파일의 사이즈가 5메가바이트인 경우, 압축률은 50%로 산출되는 것이다.
백업 장치(100)는 산출된 압축률이 미리 설정된 임계값을 초과하는지 여부를 판단하고, 임계값을 초과하는 경우 분할기준을 유지하며(S330), 이와 달리 압축률이 임계값 이하인 경우 분할기준을 변경한다(S340). 변경된 분할기준은 차후 백업요청된 보호파일의 백업시에 적용될 수 있으며, 또는 통합압축파일을 구성하는 각 블록에도 적용되어 재분할 될 수도 있을 것이다.
분할기준은 파일 사이즈, 파일유형, 파일명, 파일생성자 중 적어도 어느 하나를 이용하여 설정될 수 있다. 파일 사이즈의 경우 예를 들어 100Kbyte 단위로 설정된 경우 1Mbye의 보호파일은 100Kbyte의 사이즈를 갖는 10개의 분할블록으로 분할되는 것이다.
파일 유형을 이용하는 경우, 파일 유형마다 저마다의 파일 사이즈로 분할될 수 있는데, 예를 들어 동영상파일의 경우 500Kbyte, 문서파일은 100Kbyte, 이미지파일은 300Kbyte의 파일 사이즈의 블록으로 분할된다.
파일명을 이용하는 경우를 예로 들자면, 기존 백업된 보호파일 중 파일명이 동일 또는 유사한 파일명이 존재하는 경우에는 블록의 사이즈를 보다 줄이는 방식이다. 이해의 편의를 위해 하나의 예를 들자면, 기본적으로 100Kbyte의 블록단위라 하더라도 미리 백업된 보호파일A의 파일명이 [프로젝트A_ver1]이고, 백업할 보호파일B의 파일명이 [프로젝트A-ver2]인 경우, 서로 파일명이 유사하므로 이 경우에는 둘다 50Kbyte의 블록단위를 적용하여 백업하는 것이다. 파일명이 유사하다는 것은 동일한 블록이 존재할 가능성이 높으므로 보다 많은 개수로 분할하여 신규블록의 사이즈를 줄이기 위한 것이다.
파일생성자를 이용하는 경우는 보호파일을 생성한 생성자(사용자일 수 있고 또는 컴퓨팅 장치일 수 있음) 별로 백업량(총량 또는 시간에 대비한 량)에 따라 블록의 사이즈를 달리 적용하는 것이다. 예를 들어, 백업량이 많은 사용자일 수록 블록의 사이즈를 작게 설정할 수 있다.
이러한 분할기준을 이용하여 보호파일의 복수개의 분할블록으로 분할할 수 있으며, 압축률에 따라 분할기준을 수시로 변경할 수 있는 것이다.
도 3을 참조하여 설명한 실시예의 경우 분할기준에 대한 변경기준을 압축률의 임계값을 이용하는 것인데, 다른 실시예에 따르면 보호파일의 분할을 수행할 때마다 현재까지의 압축률을 확인하고, 그 압축률에 상응하도록 분할기준을 설정할 수도 있다. 이해의 편의를 위해 하나의 예를 들자면, 현재 압축률이 50%라면 분할기준을 블록사이즈 100Kbyte로 설정하고, 현재 압축률이 30%라면 분할기준의 블록사이즈를 더욱 낮춰 80Kbyte로 설정한다.
그리고, 다른 일례에 따르면, 압축률이 미리 설정된 제2 임계값 이하인 경우, 통합압축파일을 파일유형에 따라 복수개로 분류하여 관리할 수도 있다. 다시 말해, 기본적으로는 하나의 통합압축파일을 생성 및 관리하는데, 압축률이 기대 이상 높지 않게 되는 경우에는 보호파일의 파일 유형에 따라 복수개의 통합압축파일을 생성 및 관리하는 것이다. 예를 들어, 압축률이 10% 이하가 되면, 문서파일에 따른 통합압축파일과 나머지 파일 유형에 따른 통합압축파일 두 개로 구분하여 생성 및 관리하는 방식으로 전환한다.
도 4는 본 발명의 일 실시예에 따른 보호파일의 백업을 위한 동일블록 확인 과정을 도시한 흐름도이다.
보호파일을 분할하여 신규블록에 대해서만 통합압축파일로서 추가하는데, 만일 모든 분할블록이 신규블록으로써 통합압축파일이 추가된다면, 보호파일에 대한 압축이 전혀 이루어지지 않는 결과가 된다. 본 발명의 다른 실시예에 따르면, 상술한 경우에는 제2 분할기준을 적용하여 재분할 후 통합압축파일을 구성하는 각 블록과의 중복 여부를 다시 확인하는 절차를 추가할 수 있다.
이에 대한 실시예를 도시한 도 4를 참조하면, 백업 장치(100)는 보호파일의 각 분할블록 중 통합압축파일에 따른 블록들과 동일한 것이 존재하는지 여부를 판단한다(S410). 다른 표현으로서 모든 분할블록이 신규블록인지 여부를 판단하는 것과 동일하다.
동일블록이 존재한다면, 동일블록은 저장되지 않아 보호파일에 대한 압축이 수행된 것이므로, 이 경우에는 신규블록만을 통합압축파일에 추가하는 방식으로 일반처리한다(S420).
만일 동일블록이 존재하지 않는 경우, 백업 장치(100)는 제2 분할기준으로 분할블록 또는 보호파일 자체를 재분할한 이후 다시 통합압축파일과의 비교에 의한 동일블록의 존재여부를 추가 확인한다(S430). 물론 제2 분할기준은 기본적으로 설정된 분할기준에 비해 블록의 사이즈가 작게 설정될 것이다.
일례에 따르면 모든 보호파일에 대해 본 실시예에 따른 절차가 수행될 수도 있으나, 다른 일례에 따르면 특정한 조건 하에서만 제2 분할기준에 의한 재분할 및 동일블록의 존재여부 확인 절차가 진행될 수도 있다.
그 특정한 조건으로서, 백업하고자 하는 보호파일과 동일 또는 유사한 파일명을 갖거나 또는 동일한 생성자 또는 동일한 파일 사이즈를 갖는 백업된 파일이 기존에 존재하는지 여부가 이용될 수 있다. 예를 들어, 동일한 파일명이 이전에 백업된 경우, 동일한 파일 사이즈를 갖는 동일 유형의 백업파일이 존재하는 경우, 또는 동일한 생성자에 의한 백업된 파일이 존재하는 경우에만 제2 분할기준을 적용하여 재분할을 수행하는 것이다.
그리고, 도면에는 도시되지 않았으나 일례에 따르면 통합압축파일이 미리 설정된 임계사이즈를 초과할 경우 통합압축파일을 분할하여 저장하고, 차후 새로운 보호파일에 대해서는 새로운 통합압축파일로서 백업처리할 수 있다. 즉, 통합압축파일도 미리 설정된 사이즈의 단위로 분할하여 저장 및 관리하며, 이후의 백업 처리에는 새로운 통합압축파일을 생성하는 방식이다. 이에 따른 추가적인 일례에 따르면, 백업할 보호파일의 분할블록과 비교하는 통합압축파일은 새로이 생성된 통합압축파일(신규압축파일이라 칭함)만을 이용하고, 분할되어 저장된 통합압축파일(기존압축파일이라 칭함)과의 비교는 생략하는 방식이 이용될 수 있다. 추가적으로는, 만일 신규압축파일과의 비교 결과 신규블록만이 존재하는 경우에만 기존압축파일과의 비교를 더 수행할 수도 있을 것이다.
다른 일례에 따르면 백업 장치(100)는 CPU처리 부하를 체크하고, 그 부하에 따라 통합압축파일의 개수를 설정할 수도 있다. 예를 들어, 만일 CPU처리 부하가 90%의 자원을 사용하고 있는 것으로 확인되면, 현재의 통합압축파일을 기존압축파일로서 처리하고, 신규압축파일을 생성하여 백업처리에 이용한다.
상술한 본 발명에 따른 분할 파일 백업 방법은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터 시스템에 의하여 해독될 수 있는 데이터가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
또한, 상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
10 : 스캔부
20 : 분할부
30 : 파일 관리부
40 : 저장부
50 : 통합압축파일
100 : 백업 장치

Claims (12)

  1. 백업 서버에서 수행하는 파일 백업 방법에 있어서,
    백업하고자 하는 보호파일을 스캔하는 단계;
    상기 보호파일을 미리 설정된 사이즈의 분할단위인 분할블록으로 분할하고, 분할에 대응하는 블록정보를 저장하는 단계; 및
    보호파일에 대한 백업용으로 관리되는 통합압축파일로서 구성되는 각 블록들과 상기 분할블록을 서로 비교하고, 신규블록에 대해서만 상기 통합압축파일에 추가하여 저장하는 단계를 포함하되,
    상기 통합압축파일의 사이즈와 백업처리된 보호파일들의 원본사이즈 총량을 비교함으로써 압축률을 확인하고, 상기 압축률이 제1 임계값 이하인 경우 상기 분할단위의 사이즈를 낮추며, 상기 압축률이 제2 임계값 이하인 경우에는 상기 통합압축파일을 파일유형에 따라 복수개로 분류하여 관리하는, 파일 백업 방법.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 청구항 1에 있어서,
    상기 분할블록이 모두 신규블록인 경우, 상기 보호파일 또는 상기 분할블록을 제2 분할기준으로 재분할하여 동일블록의 존재여부를 더 확인하는, 파일 백업 방법.
  6. 청구항 1에 있어서,
    상기 통합압축파일이 미리 설정된 임계사이즈를 초과할 경우 통합압축파일을 분할하여 저장하고, 차후 새로운 보호파일에 대해서는 새로운 통합압축파일로서 백업처리하는, 파일 백업 방법.
  7. 제 1항, 제 5항 내지 제 6항 중 어느 한 항의 방법을 수행하기 위한 프로그램이 컴퓨터가 읽을 수 있도록 기록된 기록 매체.
  8. 백업하고자 하는 보호파일을 스캔하는 스캔부;
    상기 보호파일을 미리 설정된 사이즈의 분할단위인 분할블록으로 분할하는 분할부;
    복수개의 블록으로 구분되는 통합압축파일을 저장하기 위한 저장부; 및
    상기 보호파일의 분할블록들을 상기 통합압축파일의 각 블록들과 비교하고, 상기 분할블록들 중 신규블록이 존재하면 상기 통합압축파일에 추가하여 저장하는 파일 관리부를 포함하되,
    상기 분할부는 상기 통합압축파일의 사이즈와 백업처리된 보호파일들의 원본사이즈 총량을 비교함으로써 압축률을 확인하고, 상기 압축률이 제1 임계값 이하이면 상기 분할단위의 사이즈를 낮추고, 상기 파일 관리부는 상기 압축률이 제2 임계값 이하인 경우에는 상기 통합압축파일을 파일유형에 따라 복수개로 분류하여 관리하는, 백업 장치.
  9. 삭제
  10. 삭제
  11. 청구항 8에 있어서,
    상기 파일 관리부는 상기 분할블록이 모두 신규블록인 경우, 상기 보호파일 또는 상기 분할블록을 제2 분할기준으로 재분할하여 동일블록의 존재여부를 더 확인하는, 백업 장치.
  12. 청구항 8에 있어서,
    상기 파일 관리부는 상기 통합압축파일이 미리 설정된 임계사이즈를 초과할 경우 통합압축파일을 분할하여 저장하고, 차후 새로운 보호파일에 대해서는 새로운 통합압축파일로서 백업처리하는, 백업 장치.
KR1020170139963A 2017-10-26 2017-10-26 통합 파일을 이용한 백업 방법 및 장치 KR101844528B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170139963A KR101844528B1 (ko) 2017-10-26 2017-10-26 통합 파일을 이용한 백업 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170139963A KR101844528B1 (ko) 2017-10-26 2017-10-26 통합 파일을 이용한 백업 방법 및 장치

Publications (1)

Publication Number Publication Date
KR101844528B1 true KR101844528B1 (ko) 2018-04-02

Family

ID=61976296

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170139963A KR101844528B1 (ko) 2017-10-26 2017-10-26 통합 파일을 이용한 백업 방법 및 장치

Country Status (1)

Country Link
KR (1) KR101844528B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102067630B1 (ko) * 2019-02-01 2020-01-17 배용대 접근 제어 기반 데이터 분산 저장 시스템 및 방법
KR20210056636A (ko) * 2019-11-11 2021-05-20 한국전자기술연구원 정책기반 멀티레벨 PreChecker에 의한 고속 블록 중복 제거 및 전송 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005293224A (ja) * 2004-03-31 2005-10-20 Hitachi Computer Peripherals Co Ltd バックアップシステム及びバックアップ方法
JP2012519345A (ja) * 2009-03-06 2012-08-23 ブルアーク ユーケー リミテッド ファイル格納システムにおけるデータ圧縮

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005293224A (ja) * 2004-03-31 2005-10-20 Hitachi Computer Peripherals Co Ltd バックアップシステム及びバックアップ方法
JP2012519345A (ja) * 2009-03-06 2012-08-23 ブルアーク ユーケー リミテッド ファイル格納システムにおけるデータ圧縮

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102067630B1 (ko) * 2019-02-01 2020-01-17 배용대 접근 제어 기반 데이터 분산 저장 시스템 및 방법
KR20210056636A (ko) * 2019-11-11 2021-05-20 한국전자기술연구원 정책기반 멀티레벨 PreChecker에 의한 고속 블록 중복 제거 및 전송 방법
KR102367733B1 (ko) * 2019-11-11 2022-02-25 한국전자기술연구원 정책기반 멀티레벨 PreChecker에 의한 고속 블록 중복 제거 및 전송 방법

Similar Documents

Publication Publication Date Title
AU2014218837B2 (en) Deduplication storage system with efficient reference updating and space reclamation
US11176102B2 (en) Incremental virtual machine metadata extraction
US8332600B2 (en) Storage system and method for operating storage system
US7681001B2 (en) Storage system
US10013312B2 (en) Method and system for a safe archiving of data
US9477670B2 (en) Information management policy based on relative importance of a file
US10241870B1 (en) Discovery operations using backup data
CN109194711B (zh) 一种组织架构的同步方法、客户端、服务端及介质
JP2020047107A (ja) データ重複排除装置、データ重複排除方法、及びデータ重複排除プログラム
CN108268344B (zh) 一种数据处理方法和装置
US10827205B2 (en) Video data storage system, operation method thereof, and retrieval server
US10572335B2 (en) Metadata recovery method and apparatus
US11409766B2 (en) Container reclamation using probabilistic data structures
US20230112332A1 (en) Multiple data labels within a backup system
KR101844528B1 (ko) 통합 파일을 이용한 백업 방법 및 장치
US10133757B2 (en) Method for managing data using in-memory database and apparatus thereof
CN110618974A (zh) 一种数据存储方法、装置、设备及存储介质
CN110597453A (zh) 一种云存储系统中的视频数据存储方法及装置
RU2665272C1 (ru) Способ и устройство для восстановления дедуплицированных данных
EP3477462B1 (en) Tenant aware, variable length, deduplication of stored data
CN108363727B (zh) 一种基于zfs文件系统的数据存储方法及装置
US20210216657A1 (en) Distributing data amongst storage components using data sensitivity classifications
US11392546B1 (en) Method to use previously-occupied inodes and associated data structures to improve file creation performance
US9904602B1 (en) Secure search
US20170337213A1 (en) Metadata regeneration

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant