KR102365970B1 - 아카이브 관리 시스템 - Google Patents

아카이브 관리 시스템 Download PDF

Info

Publication number
KR102365970B1
KR102365970B1 KR1020210114418A KR20210114418A KR102365970B1 KR 102365970 B1 KR102365970 B1 KR 102365970B1 KR 1020210114418 A KR1020210114418 A KR 1020210114418A KR 20210114418 A KR20210114418 A KR 20210114418A KR 102365970 B1 KR102365970 B1 KR 102365970B1
Authority
KR
South Korea
Prior art keywords
data
archiving
stored
threshold
storage
Prior art date
Application number
KR1020210114418A
Other languages
English (en)
Inventor
서광원
Original Assignee
주식회사 펠릭스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 펠릭스 filed Critical 주식회사 펠릭스
Priority to KR1020210114418A priority Critical patent/KR102365970B1/ko
Application granted granted Critical
Publication of KR102365970B1 publication Critical patent/KR102365970B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/122File system administration, e.g. details of archiving or snapshots using management policies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/113Details of archiving
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/119Details of migration of file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/1727Details of free space management performed by the file system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/185Hierarchical storage management [HSM] systems, e.g. file migration or policies thereof

Abstract

본 발명은 아카이브 관리 시스템에 관한 것으로서 더욱 상세하게는 복수의 클라이언트 단말기 내 저장 데이터의 효율적인 사용을 위해 아카이빙이 수행되도록 하되 구축비용이 저렴한 테이프 스토리지를 디스크 캐시와 계층화하여 접근 및 복구가 신속, 용이하면서도 구축 비용 및 데이터 보안이 우수한 아카이브 관리 시스템에 관한 것이다.
이를 위해 본 발명은 아카이빙 선별조건에 따라 저장된 데이터 중 아카이빙을 수행할 아카이빙 데이터를 선별하는 복수의 클라이언트 단말기와; 상기 아카이빙 데이터가 저장되되 설정 시기 내에 엑세스가 수행된 아카이빙 데이터가 저장되는 디스크 캐시와; 상기 아카이빙 데이터가 저장되되 설정 시기 내 엑세스가 되지 않은 아카이빙 데이터가 저장되는 테이프 스토리지와; 상기 복수의 클라이언트 단말기와 데이터 통신 가능하도록 연결되어 상기 클라이언트 단말기로부터 아카이빙 데이터를 전달받으며 연결된 클라이언트 단말기의 데이터 사용패턴을 분석하여 해당 아카이빙 데이터를 디스크 캐시 또는 테이프 스토리지에 선별 저장하며, 상기 디스크 캐시에 설정 용량 이상의 아카이빙 데이터가 저장되거나 특정 아카이빙 데이터가 설정 시기 내에 엑세스가 되지 않는 경우 해당 아카이빙 데이터를 인덱스정보를 생성한 후 상기 테이프 스토리지에 이동 저장시키는 AMS 서버;를 포함하여 구성된다.

Description

아카이브 관리 시스템{Archive Management System}
본 발명은 아카이브 관리 시스템에 관한 것으로서 더욱 상세하게는 복수의 클라이언트 단말기 내 저장 데이터의 효율적인 사용을 위해 아카이빙이 수행되도록 하되 구축비용이 저렴한 테이프 스토리지를 디스크 캐시와 계층화하여 접근 및 복구가 신속, 용이하면서도 구축 비용 및 데이터 보안이 우수한 아카이브 관리 시스템에 관한 것이다.
최근 데이터관련 규제의 강화, 의료산업의 성장과 환자의 데이터 저장 관리의 중요성 증대, 기업 내 데이터 관리에 대한 관심이 높아지면서 데이터 아카이빙에 대한 연구의 필요성이 증대되고 있다.
예를 들어, 데이터 관련 규제의 관점에서 금융 거래 데이터, 의료 정보와 같은 데이터들은 소비자 권리 보호를 위하여 수년에서 수십년 동안 데이터를 보관하도록 법으로 규정되어 있는바, 각종 데이터 관련 규제로 인해 장기간 데이터 저장이 필요하다.
또한, 의료 산업 분야에서 영상진단 의존도 상승에 따라 의료 영상 데이터량이 증가함에 따라, 데이터의 보관, 관리를 위한 스토리지 및 백업 수요를 포함하여, 증가한 데이터 관리를 위한 아카이빙 시스템 필요성이 높아지고 있다.
또한, 기업 내 데이터 관리의 관점에서 기업에서 송수신되는 방대한 양의 데이터를 서버에 보관하고, 서버에 저장된 데이터를 실시간 복구, 백업하는 작업뿐만 아니라, 보안상 중요한 데이터를 보안, 관리하는 기능이 중요해지고 있다. 한편, 제조업의 자동화의 관점에서 전통적으로 노동집약적인 제조업체들이 중국, 인도 등 저임금 국가로 공장을 이전하였으나 로봇 기술의 발전으로 생산의 효율성과 품질이 향상된 융합형 로봇 공장을 구축하여 공정 자동화를 가속화 하고 있다.
4차 산업혁명 시대가 도래하면서 빅데이터 분야가 주목받고 있으나, 현재 국내 빅데이터 분야는 서버, 스토리지, 네트워크 등의 인프라 투자에 집중되어 있는 양상인바, 향후 아카이빙 기술 개발을 통하여 인프라에 대한 투자를 분산시켜 소프트웨어 및 서비스 분야로의 발전 기회의 확대가 필요하다.
더욱이 아카이빙이 수행되는 데이터 용량의 현격한 증가에 따라 아카이빙 스토리지의 구축 비용 또한 현저히 증가되어 사용자의 아카이빙 만족도가 낮아지고 있는 실정이다.
따라서 기존 대비 아카이빙 데이터의 검색 및 복구가 용이하면서도 구축비용이 기존보다 저렴한 아카이빙 관리 시스템의 개발이 절실하다.
대한민국 공개특허 제2014-0072929호(발명의 명칭: 아카이빙 작업수행 자동화 방법, 공개일자: 2014년 6월 16일)
본 발명은 상기의 문제점을 해결하기 위해 안출된 것으로서 클라이언트 단말기 내 저장디스크에 저장된 데이터가 효율적으로 아카이빙 가능하도록 사용자 패턴 분석, 실시간 감지 및 임계 용량관리를 통해 아카이빙을 수행하며 독립 테이프 복수 배열방식을 통한 테이프 스토리지를 아카이빙 저장 수단으로 구성하여 보관 및 관리 비용이 저렴하면서 데이터의 검색 및 보안이 보장되는 아카이브 관리 시스템을 제공함에 그 목적이 있다.
본 발명은 상기의 목적을 달성하기 위해 아래와 같은 특징을 갖는다.
본 발명은 아카이빙 선별조건에 따라 저장된 데이터 중 아카이빙을 수행할 아카이빙 데이터를 선별하는 복수의 클라이언트 단말기와; 상기 아카이빙 데이터가 저장되되 설정 시기 내에 엑세스가 수행된 아카이빙 데이터가 저장되는 디스크 캐시와; 상기 아카이빙 데이터가 저장되되 설정 시기 내 엑세스가 되지 않은 아카이빙 데이터가 저장되는 테이프 스토리지와; 상기 복수의 클라이언트 단말기와 데이터 통신 가능하도록 연결되어 상기 클라이언트 단말기로부터 아카이빙 데이터를 전달받으며 연결된 클라이언트 단말기의 데이터 사용패턴을 분석하여 해당 아카이빙 데이터를 디스크 캐시 또는 테이프 스토리지에 선별 저장하며, 상기 디스크 캐시에 설정 용량 이상의 아카이빙 데이터가 저장되거나 특정 아카이빙 데이터가 설정 시기 내에 엑세스가 되지 않는 경우 해당 아카이빙 데이터를 인덱스정보를 생성한 후 상기 테이프 스토리지에 이동 저장시키는 AMS 서버;를 포함하여 구성된다.
여기서 상기 테이프 스토리지는 독립된 복수개로 구성되고 상기 AMS 서버는 아카이빙 데이터를 저장할 시에 독립 테이프의 복수 배열(RAIT; Redundant Array of Independent Tape) 형태로 저장한다.
아울러 상기 AMS 서버는 상기 아카이빙 데이터의 인덱스정보를 AMS 서버 내 서버디스크에 데이터베이스화하여 저장하며 빈도수가 설정치 보다 많은 인덱스키값은 AMS 서버 내 메모리에 저장함에 따라 인덱스정보의 신속한 검색이 용이하도록 구성된다.
또한 상기 복수의 클라이언트 단말기는 해당 클라이언트 단말기 내 저장디스크의 아카이빙 데이터를 B-tree 구조의 인덱싱을 수행하고, 아카이빙을 수행할 아카이빙 데이터의 선별 및 AMS 서버를 통한 아카이빙된 데이터의 복구를 수행하는 아카이브 에이전트가 포함된다.
또한 상기 아카이브 에이전트는 현재 해당 클라이언트 단말기의 저장디스크 내 파일데이터와 이전 아카이빙이 수행된 파일데이터의 목록 및 컨텐츠를 트리구조의 단일뷰로 구성하여 사용자에게 제공하도록 구성된다.
아울러 상기 아카이브 에이전트는 해당 클라이언트 단말기의 저장디스크 내 저장가능한 데이터 용량이 설정치보다 낮은 용량인 제1임계치(Hi-watermark)에 도달한 경우 저장가능한 데이터 용량이 안정적으로 판단되는 설정 용량인 제2임계치(Low-watermark)에 도달할 때까지 직전 엑세스 시간 또는 데이터 수정시간을 기준으로 아카이빙 데이터를 선별하여 AMS 서버로 아카이빙이 수행되도록 구성된다.
또한 상기 아카이브 에이전트는 사용자 입력정보에 따라 상기 제1임계치와 제2임계치는 설정 또는 변경될 수 있으며 해당 클라이언트 단말기의 저장디스크 내 저장가능한 데이터 용량이 상기 제1임계치에 도달하지 않더라도 설정 시간 경과 후 주기적으로 제2임계치에 도달시까지 상기 AMS 서버로 아카이빙을 수행한다.
아울러 상기 아카이브 에이전트는 해당 클라이언트 단말기의 저장디스크 내 저장가능한 데이터 용량이 상기 제1임계치에 도달할 경우 AMS 서버와의 아카이빙 수행이 중단되지 않도록 Thin Provisioning 방식을 통해 아카이빙 스토리지 추가 자동할당 및 자동 복구를 수행한다.
본 발명에 따르면 사용자 패턴 분석, 실시간 감지 및 임계 용량관리를 통해 아카이빙을 수행함에 따라 클라이언트 단말기 내 저장디스크에 저장된 데이터가 효율적으로 아카이빙 가능하게 되는 효과가 있다.
아울러 독립 테이프 복수 배열방식을 통한 테이프 스토리지를 아카이빙 저장 수단으로 구성하여 보관 및 관리 비용이 저렴하면서 데이터의 검색 및 보안이 보장되는 효과가 있다.
도 1은 본 발명의 일실시예에 따른 아카이브 관리 시스템의 개략적인 구성을 나타내는 도면이다.
도 2는 본 발명의 일실시예에 따른 아카이브 관리 시스템의 아카이빙 동작 수행을 개략적으로 나타낸 도면이다.
도 3은 본 발명의 일실시에에 따른 클라이언트 단말기의 아카이브 에이전트의 구성을 나타내는 블럭도이다.
본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 설명하기 위하여 이하에서는 본 발명의 바람직한 실시예를 예시하고 이를 참조하여 살펴본다.
먼저, 본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로서, 본 발명을 한정하려는 의도가 아니며, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다. 또한 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 발명을 설명함에 있어서, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
도 1은 본 발명의 일실시예에 따른 아카이브 관리 시스템의 개략적인 구성을 나타내는 도면이다.
도면을 참조하면 본 발명의 일실시예에 따른 아카이브 관리 시스템(1000)은 크게 아카이빙 선별조건에 따라 저장된 데이터 중 아카이빙을 수행할 아카이빙 데이터를 선별하는 복수의 클라이언트 단말기(100)와, 상기 아카이빙 데이터가 저장되되 설정 시기 내에 엑세스가 수행된 아카이빙 데이터가 저장되는 디스크 캐시(300)와, 상기 아카이빙 데이터가 저장되되 설정 시기 내 엑세스가 되지 않은 아카이빙 데이터가 저장되는 테이프 스토리지(400)와, 상기 복수의 클라이언트 단말기(100)와 데이터 통신 가능하도록 연결되어 상기 클라이언트 단말기(100)로부터 아카이빙 데이터를 전달받으며 연결된 클라이언트 단말기(100)의 데이터 사용패턴을 분석하여 해당 아카이빙 데이터를 디스크 캐시(300) 및 테이프 스토리지(400) 중 어느 하나에 선별 저장하며, 상기 디스크 캐시(300)에 설정 용량 이상의 아카이빙 데이터가 저장되거나 특정 아카이빙 데이터가 설정 시기 내에 엑세스가 되지 않는 경우 해당 아카이빙 데이터의 인덱스정보를 생성한 후 해당 아카이빙 데이터를 상기 테이프 스토리지(400)에 이동 저장시키는 AMS 서버(200)로 구성된다.
여기서 상기 복수의 클라이언트 단말기(100)는 아카이빙을 수행하기 위한 감시 대상 단말기로서 해당 클라이언트 단말기(100)에는 아카이빙을 수행할 데이터를 선별하고 데이터베이스 인덱싱을 수행하며 사용자의 요청에 따라 AMS 서버(200)를 통해 디스크 캐시(300) 또는 테이프 스토리지(400)에 저장된 아카이빙 데이터를 검색 및 복구시키도록 제반 동작을 수행하는 아카이브 에이전트(110)가 포함된다.
또한 상기 아카이브 에이전트(110)는 아카이빙 데이터를 B-tree(Balanced Tree) 구조로 인덱싱을 수행하여 AMS 서버(200)로 전달하는 인덱싱수행부(111)를 포함하는데, 이러한 인덱싱수행부(111)를 통한 아카이빙 데이터 인덱싱은 데이터를 가져올 때, 시간이 많이 소모되기 때문에 자주 사용되는 칼럼들의 값을 해당 주소값과 같이 보관하는 것으로 인덱스로 저장된 칼럼값들은 순차적으로 저장(Sorted List)된다.
B-tree 구조의 인덱싱은 기존 다른 인덱싱 방식인 링크트 리스트(Linked List) 및 바이너리 서치 트리(Binary Search Tree)와 달리 검색 시간을 최소화하기 위해 데이터 높이(층)을 자동으로 바로 잡아주는 방식이다.
따라서 본 발명에서는 클라이언트 단말기(100) 내 데이터베이스의 인덱싱을 B-tree 방식으로 채택함에 따라 데이터의 삽입(Insert), 삭제(Delete) 등의 시간은 증가하더라도 검색 시간을 극대화할 수 있게 된다.
또한 상기 아카이브 에이전트(110)는 현재 해당 클라이언트 단말기(100)의 저장디스크 내 파일데이터와 이전 아카이빙이 수행된 파일데이터의 목록 및 컨텐츠를 트리구조의 단일뷰로 구성하여 사용자에게 제공하는 UI제공부(112)를 포함한다.
이러한 UI제공부(112)를 통해 단일뷰의 사용자 인터페이스(UI; User Interface)가 제공되며, 이에 따라 파일 검색을 수행하는 클라이언트 단말기 사용자는 디스크 캐시(300) 또는 테이프 스토리지(400)에 위치하는 아카이빙 데이터가 현재 단말기 내에 위치하는 것과 같이 편리하게 UI를 제공받고 아카이빙 수행 및 복구가 이루어지도록 할 수 있다.
아울러 상기 아카이브 에이전트(110)는 해당 클라이언트 단말기(100)의 저장디스크(120)의 용량을 관리하는 용량관리부(113)가 포함되는데, 이러한 용량관리부(1130)는 저장디스크(120) 내 데이터 용량이 설정치보다 낮은 용량인 제1임계치(Hi-watermark)에 도달한 경우 저장가능한 데이터 용량이 안정적으로 판단되는 설정 용량인 제2임계치(Low-watermark)에 도달할 때까지 엑세스 시간 또는 데이터 수정시간을 기준으로 아카이빙 데이터를 선별하고 선별된 아카이빙 데이터는 AMS 서버(200)를 통한 아카이빙이 수행되도록 한다.
여기서 상기 제1임계치는 저장디스크(120) 전체 용량의 95% 내지 80% 정도가 바람직하고, 상기 제2임계치는 저장디스크(120) 전체 용량의 80% 내지 60% 정도가 바람직하다.
이와 같은 제1임계치와 제2임계치는 특정 수치로 정량화됨은 물론이고, 사용자의 요구에 따라 특정 수치로 설정될 수 있다.
한편 상기 용량관리부(113)는 제1임계치와 제2임계치를 통한 용량 관리 외에 시간을 기준으로 한 주기적 관리를 수행하는데, 즉, 해당 클라이언트 단말기의 저장디스크 내 저장가능한 데이터 용량이 상기 제1임계치에 도달하지 않더라도 설정 시간 경과 후 제2임계치에 도달시까지 상기 AMS 서버(200)를 통해 아카이빙을 수행할 수 있다.
물론 이러한 설정 시간을 통한 주기 관리의 경우 용량관리부(113)는 주기적 관리를 위한 설정 시간이 도달하였을 때 저장디스크(120)의 용량을 확인하고, 제2임계치보다 저장 용량이 낮을 경우 주기적 관리를 위한 동작 수행을 중단한다.
이와 같은 주기적 관리에 필요한 설정 시간 또한 사용자의 요구에 따라 설정 시간이 변경될 수 있음은 물론이다.
아울러 본 발명에 따른 용량관리부(113)는 용량 관리 시 아카이빙 데이터의 선별 우선도를 산출하여 우선 순위별로 용량 관리를 수행할 수 있는데, 이러한 선별 우선도는 저장디스크(120) 내 데이터의 엑세스 시간, 엑세스 빈도 및 엑세스 주기를 수치화하여 아래 식 (1)과 같이 산출한다.
선별 우선도 = EDay - 0.1ENum + 0.2EFre 식(1)
여기서 EDay는 현재 날짜(단위: day)와 직전 엑세스 날짜의 간격이며, ENum은 현재까지 엑세스 빈도이고, EFre는 현재까지 엑세스 된 시간 간의 시간 간격 평균 값(단, 엑세스 회수가 3회 이하인 경우 EFre = 0)을 말한다.
이와 같은 선별 우선도는 음수 또는 양수로 나타날 수 있으며 그 수치가 클수록 선별 우선도가 높으며 용량관리부(113)에서 아카이빙 데이터를 선별할 시에 저장디스크(120) 내 전체 데이터 중 선별 우선도가 높은 순서로 아카이빙 데이터를 선별하게 된다.
즉, 직전 엑세스 시간(단위: day)과 현재와의 간격이 클수록, 엑세스 빈도는 적을수록, 엑세스 주기가 클수록 선별 우선도는 증가하고 아카이빙 데이터로 선별될 확률은 증가하게 되는 것이다.
다만, 가중치를 엑세스 빈도 및 엑세스 주기에 각각 0.1, 0.2로 두어 가장 중요한 팩터로 직전 엑세스 시간을 선택하였다.
이에 따라 본 발명에 따른 용량관리부(113)에서 저장디스크(120)가 상기 제1임계치에 도달함에 따라 아카이빙을 수행할 시에 상기와 같은 방식으로 선별 우선도를 각 데이터별로 수치화하여 선별 우선도가 높은 순서로 아카이빙 데이터를 선별, 아카이빙을 수행하여 저장디스크 내 데이터가 제2임계치에 도달할때까지 아카이빙을 계속하게 되는 것이다.
이와 같은 선별 우선도의 정량화를 통해 잦은 아카이빙 수행 및 복구를 감소시킬 수 있으며 아카이빙 수행의 효율을 증대시킬 수 있다.
한편 상기 아카이브 에이전트(110)는 해당 클라이언트 단말기(100)의 저장디스크(120) 내 저장가능한 데이터 용량이 상기 제1임계치에 도달할 경우 AMS 서버(200)와의 아카이빙 수행이 중단되지 않도록 씬프로비저닝(Thin Provisioning) 방식을 통해 아카이빙 스토리지 추가 자동할당 및 자동 복구를 수행하는 씬프로비저닝부(114)가 포함된다.
여기서 Thin Provisioning 방식은 클라이언트 단말기(100)에서 인지하는 디스크 용량과 실제 저장디스크(120)에 할당된 용량이 다르도록 하는 기술로서, 이 기술을 사용하면 스토리지 사용률을 대폭 증대시킬 수 있다.
일반적으로 스토리지 사용 현황을 조사해 보면 실제 스토리지 용량의 약 40% 내외만을 사용하고 있는데, 이는 디스크 사용에 있어 필요한 여유치, 이른바 보정치를 적용하고도 남는 수치다. 쉽게 말해서 100GB를 호스트가 할당 받았지만 실제로 사용하는 것은 고작 40GB라는 것이다.
데이터 요구 수준이 매우 유동적임에 따라 정확한 디스크 사용량 예측은 보다 어려워지고, 이에 따라 시스템의 스토리지 용량은 거의 대부분 과투자되게 됨으로써 이와 같은 씬 프로비저닝 방식이 도입되게 되었다.
이에 따라 본 발명은 Thin Provisioning 방식을 채택함에 따라 디스크 저장 효율을 보다 증대시켜 저장디스크의 여유 용량의 과예측으로 인한 데이터 저장효율의 저하와 아카이빙 수행 중의 동작 중단을 방지할 수 있게 된다.
한편 상기 AMS 서버(200)는 상기 복수의 클라이언트 단말기(100)와 데이터 통신 가능하도록 연결되어 상기 클라이언트 단말기(100)로부터 아카이빙 데이터를 전달받으며 연결된 클라이언트 단말기(100)의 데이터 사용패턴을 분석하여 해당 아카이빙 데이터를 디스크 캐시(300) 및 테이프 스토리지(400) 중 어느 하나에 선별 저장하며, 상기 디스크 캐시(300)에 설정 용량 이상의 아카이빙 데이터가 저장되거나 특정 아카이빙 데이터가 설정 시기 내에 엑세스가 되지 않는 경우 해당 아카이빙 데이터의 인덱스정보를 생성한 후 해당 아카이빙 데이터를 상기 테이프 스토리지(400)에 이동 저장시키도록 구성된다 .
여기서 상기 클라이언트 단말기(100)의 데이터 사용패턴은 해당 아카이빙 데이터의 엑세스 회수, 엑세스 시간 또는 엑세스 주기 등이 해당될 수 있으며, 상대적으로 엑세스 회수가 적고 엑세스 시간이 오래 되고 엑세스 주기가 없거나 오래된 데이터가 아카이빙 데이터로 선별되어야 할 것이다.
또한 상기 AMS 서버(200)는 상기 아카이빙 데이터의 인덱스정보를 AMS 서버(200) 내 서버디스크(210)에 데이터베이스화하여 저장하며 빈도수가 설정치 보다 많은 파일키값은 AMS 서버 내 메모리에 저장함에 따라 인덱스정보의 신속한 검색과 파일 데이터의 엑세스가 용이하도록 구성된다.
한편 상기 디스크 캐시(300)는 AMS 서버(200)를 통해 클라이언트 단말기(100)의 아카이빙 데이터를 전달받아 저장하는데, 이때 저장되는 아카이빙 데이터는 AMS 서버(200)의 판단에 따라 설정 시기 내에 엑세스가 수행된 아카이빙 데이터가 저장되게 된다.
아울러 AMS 서버(200)에 의해 디스크 캐시(300) 내 저장된 아카이빙 데이터는 용량 관리 및 주기적 관리를 통해 테이프 스토리지(400)로 데이터 오프로드가 수행될 수 있다.
또한 상기 테이프 스토리지(400)는 AMS 서버(200)를 통해 클라이언트 단말기(100)의 아카이빙 데이터를 전달받아 저장하는데, 여기서 저장되는 아카이빙 데이터는 AMS 서버(200)의 판단에 따라 설정 시기 내 엑세스가 되지 않은 아카이빙 데이터가 저장되게 된다.
또한 본 발명의 일실시예에 따른 상기 테이프 스토리지(400)는 독립된 복수개로 구성되고 상기 AMS 서버는 아카이빙 데이터를 저장할 시에 독립 테이프의 복수 배열(RAIT; Redundant Array of Independent Tape) 형태로 저장한다.
이러한 RAIT 형태의 테이프 스토리지(400) 구성을 통해 안정적인 데이터 보관이 가능해지고 암호화를 구현할 수 있게 된다.
아울러 상기 테이프 스토리지(400)는 테이프 라이브러리(410), 단 암호화가 수행됨에 따라 암호화가 요구되는 데이터가 저장되는 테이프 드라이브(420) 및 용량이 큰 미디어 형태의 데이터가 저장되는 테이프 미디어(430)로 구성될 수 있다.
이와 같이 본 발명은 도면에 도시된 일실시예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다.
따라서, 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.
100 : 클라이언트 단말기 110 : 아카이브 에이전트
111 : 인덱싱수행부 112 : UI제공부
113 : 용량관리부 114 : 씬프로비저닝부
200 : AMS 서버 210 : 서버디스크
300 : 디스크 캐시 400 : 테이프 스토리지
410 : 테이프 라이브러리 420 : 테이프 드라이브
430 : 테이프 미디어 1000 : 아카이브 관리 시스템

Claims (8)

  1. 아카이빙 선별조건에 따라 저장된 데이터 중 아카이빙을 수행할 아카이빙 데이터를 선별하는 복수의 클라이언트 단말기와;
    상기 아카이빙 데이터가 저장되되 설정 시기 내에 엑세스가 수행된 아카이빙 데이터가 저장되는 디스크 캐시와;
    상기 아카이빙 데이터가 저장되되 설정 시기 내 엑세스가 되지 않은 아카이빙 데이터가 저장되는 테이프 스토리지와;
    상기 복수의 클라이언트 단말기와 데이터 통신 가능하도록 연결되어 상기 클라이언트 단말기로부터 아카이빙 데이터를 전달받으며 연결된 클라이언트 단말기의 데이터 사용패턴을 분석하여 해당 아카이빙 데이터를 디스크 캐시 또는 테이프 스토리지에 선별 저장하며, 상기 디스크 캐시에 설정 용량 이상의 아카이빙 데이터가 저장되거나 특정 아카이빙 데이터가 설정 시기 내에 엑세스가 되지 않는 경우 해당 아카이빙 데이터를 인덱스정보를 생성한 후 상기 테이프 스토리지에 이동 저장시키는 AMS 서버;를 포함하여 구성되되,
    상기 복수의 클라이언트 단말기는
    해당 클라이언트 단말기 내 아카이빙 데이터를 B-tree 구조의 인덱싱을 수행하고, 아카이빙을 수행할 아카이빙 데이터의 선별 및 AMS 서버를 통한 아카이빙된 데이터의 복구를 수행하는 아카이브 에이전트가 포함되고,
    상기 아카이브 에이전트는
    현재 해당 클라이언트 단말기의 저장디스크 내 파일데이터와 이전 아카이빙이 수행된 파일데이터의 목록 및 컨텐츠를 트리구조의 단일뷰로 구성하여 사용자에게 제공하도록 구성되고,
    상기 아카이브 에이전트는
    해당 클라이언트 단말기의 저장디스크 내 저장가능한 데이터 용량이 설정치보다 낮은 용량인 제1임계치(Hi-watermark)에 도달한 경우 저장가능한 데이터 용량이 안정적으로 판단되는 설정 용량인 제2임계치(Low-watermark)에 도달할 때까지 직전 엑세스 시간 또는 데이터 수정시간을 기준으로 아카이빙 데이터를 선별하여 AMS 서버로 아카이빙이 수행되도록 구성되고,
    상기 아카이브 에이전트는
    사용자 입력정보에 따라 상기 제1임계치와 제2임계치는 설정 또는 변경될 수 있으며 해당 클라이언트 단말기의 저장디스크 내 저장가능한 데이터 용량이 상기 제1임계치에 도달하지 않더라도 설정 시간 경과 후 주기적으로 제2임계치에 도달시까지 상기 AMS 서버로 아카이빙을 수행하고,
    상기 아카이브 에이전트는
    해당 클라이언트 단말기의 저장디스크 내 저장가능한 데이터 용량이 상기 제1임계치에 도달할 경우 AMS 서버와의 아카이빙 수행이 중단되지 않도록 씬프로비저닝(Thin Provisioning) 방식을 통해 아카이빙 스토리지 추가 자동할당 및 자동 복구를 수행하는 것을 특징으로 하는 아카이브 관리 시스템.
  2. 제1항에 있어서,
    상기 테이프 스토리지는
    독립된 복수개로 구성되고 상기 AMS 서버는 아카이빙 데이터를 저장할 시에 독립 테이프의 복수 배열(RAIT; Redundant Array of Independent Tape) 형태로 저장하는 것을 특징으로 하는 아카이브 관리 시스템.
  3. 제1항에 있어서,
    상기 AMS 서버는
    상기 아카이빙 데이터의 인덱스정보를 AMS 서버 내 서버디스크에 데이터베이스화하여 저장하며 빈도수가 설정치 보다 많은 인덱스키값은 AMS 서버 내 메모리에 저장함에 따라 인덱스정보의 신속한 검색이 용이하도록 구성되는 것을 특징으로 하는 아카이브 관리 시스템.
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
KR1020210114418A 2021-08-30 2021-08-30 아카이브 관리 시스템 KR102365970B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210114418A KR102365970B1 (ko) 2021-08-30 2021-08-30 아카이브 관리 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210114418A KR102365970B1 (ko) 2021-08-30 2021-08-30 아카이브 관리 시스템

Publications (1)

Publication Number Publication Date
KR102365970B1 true KR102365970B1 (ko) 2022-02-23

Family

ID=80495525

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210114418A KR102365970B1 (ko) 2021-08-30 2021-08-30 아카이브 관리 시스템

Country Status (1)

Country Link
KR (1) KR102365970B1 (ko)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050075772A (ko) * 2004-01-17 2005-07-21 삼성전자주식회사 감시 시스템의 아카이브 장치 및 그 방법
KR100979750B1 (ko) * 2009-11-06 2010-09-03 (주)피스페이스 분산 저장 시스템에서 파일을 관리하는 장치 및 방법
US20130179405A1 (en) * 2006-11-28 2013-07-11 Commvault Systems, Inc. Systems and methods for creating copies of data, such as archive copies
KR20140072929A (ko) 2012-11-16 2014-06-16 현대중공업 주식회사 아카이빙 작업수행 자동화 방법
US20140250129A1 (en) * 2010-09-29 2014-09-04 International Business Machines Corporation Managing ownership of redundant data
US9223661B1 (en) * 2008-08-14 2015-12-29 Symantec Corporation Method and apparatus for automatically archiving data items from backup storage
KR101715039B1 (ko) * 2016-03-30 2017-03-13 한국과학기술정보연구원 파일처리장치 및 그 동작 방법
US9898224B1 (en) * 2012-09-12 2018-02-20 EMC IP Holding Company LLC Automatic adjustment of capacity usage by data storage optimizer for data migration
KR102267441B1 (ko) * 2020-01-06 2021-06-22 주식회사 아미크 데이터의 하이브리드 저장을 이용한 데이터 아카이빙 방법 및 시스템

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050075772A (ko) * 2004-01-17 2005-07-21 삼성전자주식회사 감시 시스템의 아카이브 장치 및 그 방법
US20130179405A1 (en) * 2006-11-28 2013-07-11 Commvault Systems, Inc. Systems and methods for creating copies of data, such as archive copies
US9223661B1 (en) * 2008-08-14 2015-12-29 Symantec Corporation Method and apparatus for automatically archiving data items from backup storage
KR100979750B1 (ko) * 2009-11-06 2010-09-03 (주)피스페이스 분산 저장 시스템에서 파일을 관리하는 장치 및 방법
US20140250129A1 (en) * 2010-09-29 2014-09-04 International Business Machines Corporation Managing ownership of redundant data
US9898224B1 (en) * 2012-09-12 2018-02-20 EMC IP Holding Company LLC Automatic adjustment of capacity usage by data storage optimizer for data migration
KR20140072929A (ko) 2012-11-16 2014-06-16 현대중공업 주식회사 아카이빙 작업수행 자동화 방법
KR101715039B1 (ko) * 2016-03-30 2017-03-13 한국과학기술정보연구원 파일처리장치 및 그 동작 방법
KR102267441B1 (ko) * 2020-01-06 2021-06-22 주식회사 아미크 데이터의 하이브리드 저장을 이용한 데이터 아카이빙 방법 및 시스템

Similar Documents

Publication Publication Date Title
US9355112B1 (en) Optimizing compression based on data activity
CA2910211C (en) Object storage using multiple dimensions of object information
US9632707B2 (en) Enhancing tiering storage performance
US8285964B2 (en) Systems and methods for classifying and transferring information in a storage network
CN101673192B (zh) 时序化的数据处理方法、装置及系统
US20090228669A1 (en) Storage Device Optimization Using File Characteristics
US20070185917A1 (en) Systems and methods for classifying and transferring information in a storage network
GB2529669A (en) Storage system
WO2011159322A1 (en) Data deduplication
US11151030B1 (en) Method for prediction of the duration of garbage collection for backup storage systems
CN110888837B (zh) 对象存储小文件归并方法及装置
CN104462389A (zh) 基于分级存储的分布式文件系统实现方法
US20100174878A1 (en) Systems and Methods for Monitoring Archive Storage Condition and Preventing the Loss of Archived Data
US10891266B2 (en) File handling in a hierarchical storage system
CN110147203A (zh) 一种文件管理方法、装置、电子设备及存储介质
CN115840543A (zh) 一种数据分层存储方法、装置、设备及存储介质
Cherubini et al. Cognitive storage for big data
US11210183B2 (en) Memory health tracking for differentiated data recovery configurations
KR102365970B1 (ko) 아카이브 관리 시스템
CN110413237A (zh) 分布式存储方法、装置、终端设备及存储介质
CN103259828B (zh) 一种消息中间件的消息存储管理方法和系统
CN117608477A (zh) 存储系统的管理方法及装置、电子设备、存储介质

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant