KR20090073099A - 전역 핫 스패어 디스크를 이용한 고장난 드라이브의 재구성및 카피백 방법 - Google Patents

전역 핫 스패어 디스크를 이용한 고장난 드라이브의 재구성및 카피백 방법 Download PDF

Info

Publication number
KR20090073099A
KR20090073099A KR1020097005277A KR20097005277A KR20090073099A KR 20090073099 A KR20090073099 A KR 20090073099A KR 1020097005277 A KR1020097005277 A KR 1020097005277A KR 20097005277 A KR20097005277 A KR 20097005277A KR 20090073099 A KR20090073099 A KR 20090073099A
Authority
KR
South Korea
Prior art keywords
disk
raid
failed
hot spare
volume
Prior art date
Application number
KR1020097005277A
Other languages
English (en)
Inventor
새티쉬 생어푸
케빈 키드니
커트 덴튼
다이애나 버터
Original Assignee
엘에스아이 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘에스아이 코포레이션 filed Critical 엘에스아이 코포레이션
Publication of KR20090073099A publication Critical patent/KR20090073099A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1092Rebuilding, e.g. when physically replacing a failing disk
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1008Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Hardware Redundancy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 멀티-디스크 대용량 기억 시스템에서 고장난 디스크 상에 포함된 데이터의 재구성 및 카피백을 최적화시키는 시스템을 개시한다. 본 발명에 따른 시스템은, 대용량 기억을 필요로하는 처리 유닛과, RAID(Redundant Array of Inexpensive Disks) 시스템으로 구성되는 한개 이상의 디스크와, 전역 핫 스패어 디스크와, 그리고, 상기 처리 유닛, RAID, 그리고 상기 전역 핫 스패어 디스크를 연결하는 인터커넥션을 포함한다. 본 발명의 또다른 일형태에 따르면, 연결이 단절된 RAID 디스크를 전역 핫 스패어 디스크를 이용하여 재구성하고 카피백하는 방법이 공개된다. 이 방법은, RAID 컴포넌트 디스크를 연결단절시키는 단계와, 연결단절된 RAID 디스크로부터 전역 핫 스패어 디스크로 데이터를 재구성시키는 단계와, 연결단절된 RAID 컴포넌트 디스크를 재연결하는 단계와, 전역 핫 스패어 디스크로부터 재구성된 데이터를 재연결된 RAID 컴포넌트 디스크로 카피하는 단계를 포함한다.

Description

전역 핫 스패어 디스크를 이용한 고장난 드라이브의 재구성 및 카피백 방법{OPTIMIZED RECONSTRUCTION AND COPYBACK METHODOLOGY FOR A FAILED DRIVE IN THE PRESENCE OF A GLOBAL HOT SPARE DISK}
본 발명은 RAID(Redundant Arrays of Inexpensive Disks) 기억 시스템 분야에 관한 발명으로서, 특히, 컴포넌트 드라이브의 고장(failure)에 이어 컴포넌트 드라이브의 콘텐트 재구성을 최적화하는 것에 관한 발명이다.
RAID는 현재의 컴퓨터 시스템 구조 내에서 데이터를 관리하기 위한 효과적인 툴로 기여하고 있다. RAID 시스템은 다양한 드라이브들 가운데 데이터를 복제하거나 공유할 수 있는 소형의 저렴한 하드디스크들의 어레이를 이용한다. 여러가지 타입의 RAID 레벨에 관한 상세한 설명은 Patterson 을 주저자로 하는 "A Case for Redundant Arrays of Inexpensive Disks (RAID)" - ACM SIGMOD Conference, 1988년 8월 - 에 소개되어 있고, 그 내용은 본원에서 참고로 인용된다.
여러가지 레벨의 RAID 구현예가 존재한다. 가장 간단한 어레이인 RAID 레벨 1은 데이터 기억을 위한 한개 이상의 프라이머리 디스크와, 데이터 디스크에 내장된 모든 정보의 사본을 저장하기 위해 프라이머리 디스크와 동일한 수의 추가적인 "미러" 디스크를 포함한다. 나머지 RAID 레벨 2, 3, 4, 5, 6 모두는 연속적인 데이 터를 다양한 디스크들 사이에 저장하기 위해 조각들로 나눈다.
RAID 레벨 2, 3, 4, 5, 6 시스템은 다양한 디스크들 사이에서 데이터를 블록으로 분배한다. 한개의 블록은 여러개의 연속적인 섹터들로 구성되며, 한개의 섹터는 디스크 드라이브의 물리적 섹션이며, 바이트들의 집합을 포함한다. 한개의 섹터는 디스크 드라이브의 최소 데이터 전송 단위에 해당한다. 한개의 데이터 블록이 디스크에 기록될 때, 디스크 블록 번호(DBN: Disk Block Number)가 할당된다. 모든 RAID 디스크들은 동일한 DBN 시스템을 유지하여, 각 디스크 상의 한개의 블록은 주어진 DBN을 가지게 될 것이다. 동일한 DBN을 가진 다양한 디스크 상의 블록들의 집합은 "스트라이프"로 불려진다.
추가적으로, 오늘날의 많은 운영 체제들이 대용량 기억 장치 상의 공간을 볼륨별로 파티션화함으로서 그 공간의 할당을 관리하고 있다. 볼륨이란 표현은 RAID 시스템에서처럼 여러개의 디스크와 관련 디스크 드라이브 사이에 분포되어 있는 물리적 기억 공간 요소들의 논리적 그룹을 의미한다. 볼륨은 기억 장치의 물리적 관점에 비해 기억 장치의 논리적 관점을 허용하는 추상화된 부분이다. 이와 같이, 대부분의 운영 체제들은 마치 볼륨이 독립적인 디스크 드라이브인것처럼 취급한다. 볼륨은 볼륨 관리 소프트웨어에 의해 생성되고 관리된다. 한개의 볼륨 그룹은 드라이브들의 공통 세트를 포함하는 개별적 볼륨들의 집합이다.
RAID 시스템의 큰 장점들 중 한가지는 고장난 컴포넌트 디스크로부터의 데이터를 다른 디스크들에 포함된 정보로부터 재구성할 수 있는 능력에 있다. RAID 레벨 3, 4, 5, 6에서, 패리티 블록을 이용하여 리던던시(redundancy)를 얻는다. 주어 진 스트라이프의 패리티 블록에 포함된 데이터는 해당 스트라이프 내 데이터 블록에 기록이 이루어질때마다 수행되는 연산의 결과다. 다음의 수식은 주어진 패리티 블록의 다음 상태를 연산하는 데 주로 사용된다.
Figure 112009015397402-PCT00001
이 패리티 블록의 기억 위치는 RAID 레벨들 사이에서 변화한다. RAID 레벨 3과 4는 패리티 블록의 저장용으로 전용화된 특정 디스크를 이용한다. RAID 레벨 5와 6은 모든 다양한 디스크들 사이에서 이 패리티 블록들을 인터리빙한다. RAID 레벨 6은 스트라이프당 두개의 패리티 블록을 가지는 것으로 그 자체를 구분하여, 두개의 디스크의 동시적인 고장에 대비한다. 어레이 내 주어진 디스크가 고장일 경우, 나머지 디스크 상에 포함된 주어진 스트라이프에 대한 데이터 및 패리티 블록들이 조합을 이루어서 잃어버린 데이터를 재구성할 수 있다.
RAID 시스템 내 단일 디스크의 고장을 취급하는 한가지 메커니즘은 전역 핫 스패어 디스크를 일체화하여 이용하는 것이다. 전역 핫 스패어 디스크(global hot spare disk)는 RAID 구조에서 고장난 프라이머리 디스크를 대체하는 데 사용되는 디스크 또는 디스크 그룹이다. 이 장비는 "온" 또는 "핫"으로 설정되어도, 시스템에서 실제로 기능하지는 않는다. RAID 시스템 내의 한개의 디스크가 고장일 때, 전역 핫 스패어 디스크가 고장난 디스크를 위해 통합되어, 나머지 동작 디스크들로부터의 데이터 블록 및 패리티 블록들을 이용하여 고장난 디스크의 모든 볼륨 조각들을 재구성한다. 이 데이터가 재구성되면, 전역 핫 스패어 디스크는 고장난 RAID 디스크에 대한 대체 디스크가 RAID에 삽입될 때까지 RAID 시스템의 컴포넌트 디스크 로 기능한다. 고장난 프라이머리 디스크가 대체 디스크로 바뀌면, 전역 핫 스패어 디스크로부터 새 디스크까지 재구성된 데이터의 카피백이 발생할 수 있다.
현재, 컴포넌트 디스크가 논-RAID 0 시스템에서 고장난 상황에서, 고장난 디스크로부터 모든 볼륨 조각들의 재구성이 완료되기 전에 RAID에 이 컴포넌트 디스크에 대한 대체 디스크가 삽입될 경우, 전역 핫 스패어 디스크는 고장난 디스크를 위한 통합 상태를 유지하고, 고장난 디스크로부터의 모든 볼륨 조각들의 재구성이 전역 핫 스패어 디스크를 향하게 된다. 이러한 접근법에서는 대체 드라이브가 삽입되었을 때 재구성 과정을 아직 시작도 하지 않은 볼륨 조각들이 불필요하게 재구성되고 카피백되는 문제점이 있다.
따라서, 대체 디스크 삽입 이전에 재구성을 시작한 고장난 디스크의 볼륨 조각들만이 전역 핫 스패어 디스크로 재구성되고, 고장난 디스크가 대체된 경우에 재구성을 아직 시작도 하지 않은 볼륨 조각들은 대체 디스크로 직접 재구성되도록, RAID 시스템에서 고장난 디스크를 재구성하고 카피백하는 시스템 및 방법을 제공하는 것이 바람직하다.
따라서, 본 발명은 전역 핫 스패어 디스크를 이용하여 고장난 RAID 디스크를 최적화 방식으로 재구성 및 카피백을 수행하는 시스템 및 방법을 지향한다.
발명의 제 1 형태에 따르면, 전역 핫 스패어 디스크를 이용하여 고장난 RAID 디스크를 재구성 및 카피백하는 시스템이 제시된다. 이 시스템은 대용량 기억을 필요로하는 처리 유닛, RAID 시스템으로 구성되는 한개 이상의 디스크, 관련 전역 핫 스패어 디스크, 그리고, 상기 처리 유닛, RAID, 그리고 전역 핫 스패어 디스크를 연결하는 인터커넥션(interconnections)을 포함한다.
발명의 제 2 형태에 따르면, 전역 핫 스패어 디스크를 이용하여 고장난 RAID 디스크를 재구성 및 카피백하는 방법이 제시된다. 이 방법은, RAID 컴포넌트 디스크의 고장을 검출하는 단계, 고장난 RAID 디스크 컴포넌트 디스크 상에 포함된 데이터의 일부분을 전역 핫 스패어 디스크로 재구성하는 단계, 고장난 RAID 컴포넌트 디스크를 대체 디스크로 대체하는 단계, 전역 핫 스패어 디스크로 아직 재구성되지 않은 고장난 RAID 디스크 상의 임의의 데이터를 대체 디스크로 재구성시키는 단계, 그리고, 전역 핫 스패어 디스크로부터 재구성된 데이터를 대체 디스크로 카피백하는 단계를 포함한다.
도 1은 n-디스크 RAID 시스템과 추가적인 스탠바이 전역 핫 스패어 디스크의 개략적 도면으로서, n개의 디스크를 포함하는 한개의 볼륨 그룹은 m개의 개별 볼륨들을 가지며, 각각의 볼륨은 n개의 디스크 사이에서 n개의 조각으로 세그먼트화되어 있다.
도 2는 n-디스크 RAID 시스템 및 추가적인 스탠바이 전역 핫 스패어 디스크의 개략적 도면으로서, n개의 디스크 중 한개가 고장난 상태다.
도 3은 한개의 볼륨 그룹 내 한개 이상의 볼륨에 발급된 I/O 요청에 대한 개략적 도면으로서, 이에 따라, 모든 볼륨들이 최적 상태로부터 비정상 상태(또는 '저하 상태': Degraded States)로 전이하게 된다.
도 4는 전역 핫 스패어 디스크의 통합과, RAID에 여전히 연결되어 있는 나머지 n-1개의 동작 디스크들의 볼륨 조각들로부터의 데이터 및 패리티 정보를 이용하여 고장난 디스크로부터 저하 상태 볼륨의 볼륨 조각을 재구성하는 것에 관한 개략적 도면.
도 5는 RAID에 여전히 연결되어 있는 n-1개의 동작 디스크의 데이터 및 패리티 정보를 이용하여 고장난 디스크의 저하 상태 볼륨 조각들을 대체 디스크로 재구성시키는 것에 관한 개략적 도면.
도 6은 전역 핫 스패어 디스크로부터 재구성된 볼륨 조각을 고장난 디스크에 대한 대체 디스크로 카피백하는 과정의 개략도.
도 7은 전역 핫 스패어 디스크를 이용하여 RAID 시스템 내 고장난 디스크의 재구성 및 카피백을 수행하는 방법의 순서도.
RAID의 컴포넌트 디스크가 고장일 경우, 전역 핫 스패어 디스크가 이 고장난 디스크를 위해 통합될 것이다. 디스크 고장에 이어, 처리 유닛이 RAID의 한개 이상의 볼륨에 I/O 요청을 행할 때(즉, 볼륨이 "저하"될 때), 이 디스크 상에 위치한 개별적인 볼륨 조각들을 가진 볼륨들은 저하 상태로 전이될 것이다. 한개 이상의 볼륨이 저하될 때, 시스템은 고장난 디스크 상의 저하 볼륨 조각들을 전역 핫 스패어 디스크로 재구성하기 시작하여, 데이터의 일관성을 유지시킬 것이다. 이러한 재구성은 나머지 드라이브들 상에 유지되고 있는 데이터 및 패리티 정보를 이용하여 구현된다. 저하된 볼륨들의 재구성에 이어, 전역 핫 스패어 디스크는 저하 볼륨과 관련하여 고장난 디스크 대신에 RAID의 컴포넌트 드라이브로 동작한다. 고장난 디스크에 대한 대체 디스크가 RAID에 다시 삽입되면, 전역 핫 스패어 디스크 상에서 이미 재구성된 저하 볼륨 조각들이 대체 디스크로 다시 카피백된다.
그러나, 복수개의 저하 볼륨 조각들이 전역 핫 스패어 디스크로 재구성되는 중에, 고장난 디스크 대신에 대체 디스크가 삽입될 수 있다. 이러한 상황이 발생할 경우, 시스템은 전역 핫 스패어 디스크로 아직 재구성되지 않은 고장난 디스크의 저하 볼륨 조각들을 대체 디스크로 직접 재구성하기 시작한다.
이 방법은 전체적으로 보았을 때 재구성/카피백에 필요한 시간을 단축시킨다. 따라서, 전체 시스템 다운 시간을 단축시킨다. 재구성의 일부분이 대체 디스크 상에서 직접 수행될 수 있고, 따라서, 전역 핫 스패어 디스크로부터 대체 디스크로 데이터를 카피백하는 데 필요한 시간을 절감할 수 있는 것이다.
이 방법은 주어진 볼륨 그룹에 전역 핫 스패어 디스크가 전용화되는 시간도 또한 감소시킨다. 전역 핫 스패어 디스크가 한번에 한개의 고장난 RAID 컴포넌트 디스크에 대해 통합될 수 있기 때문에, 복수개의 RAID 디스크들의 동시적 고장은 처리될 수 없다. 이와 같이, 전역 핫 스패어 디스크가 RAID 컴포넌트 디스크로 사용되는 시간을 최소화시키는 것이 바람직하다.
보 발명에 따른 시스템은 대용량 기억을 필요로하는 처리 유닛의 볼륨 관리 소프트웨어에, RAID 시스템용 컨트롤러의 펌웨어로, 또는, RAID 시스템과 인터페이싱하는 독립형 하드웨어 컴포넌트로 통합됨으로서 구현될 수 있다.
도 1은 n-디스크 RAID 0 시스템(110)과 추가적인 스탠바이 전역 핫 스패어 디스크(120)를 포함하는 대용량 기억 시스템(100)의 개략적 도해다. 한개의 볼륨 그룹은 m개의 개별적 볼륨(130, 140, 150, 160)들을 포함한다. 각각의 볼륨(130, 140, 150, 160)은 n개의 개별적 조각들로 구성되며, 각각의 조각은 n-디스크 RAID 시스템의 n개의 디스크들 중 하나씩에 대응한다. I/O 요청을 송신할 수 있는 외부 장치의 볼륨 관리 소프트웨어에 의해, 이 외부 장치는 각각의 볼륨을 독립적인 디스크 드라이브로 취급할 수 있다.
도 2에서는 n-디스크 RAID 시스템(210)과 추가적인 스탠바이 전역 핫 스패어 디스크(220)를 포함하는 대용량 기억 시스템(200)이 도시되며, 이때, n개의 디스크 중 한개(230)가 고장난 상태다.
도 3과 관련하여, n-디스크 RAID 시스템(310)과 함께 추가적인 한개의 스탠바이 전역 핫 스패어 디스크(320)를 포함하는 대용량 기억 시스템(300)이 제시된다. 이때, n개의 디스크 중 한개의 디스크(330)가 고장난 상태다. CPU(360)에 의해 볼륨(350)들 중 한개 이상에 I/O 요청(340)이 이루어진다. 이 요청이 진행되면, 개별 볼륨(350)들은 최적 상태에서 저하 상태로 전이된다. 이러한 전이는 고장난 디스크(330)에 위치한 저하 상태 볼륨 조각들을 전역 핫 스패어 디스크(320)로 재구성시키기 시작한다.
도 4와 관련하여, n-디스크 RAID 시스템(410)과 함께 추가적인 한개의 스탠바이 전역 핫 스패어 디스크(420)를 포함하는 대용량 기억 시스템(400)이 제시된다. 이때, n개의 디스크 중 한개(430)는 고장난 상태다. 전역 핫 스패어 디스크(420)는 n-디스크 RAID 시스템(410)의 컴포넌트 디스크로 통합된 상태다. 고장난 디스크(430) 상에 위치한 저하 상태 볼륨(460)의 볼륨 조각(440)은 동작 디스크들의 저하 볼륨(460)의 나머지들에 있는 기존 데이터 블록 및 패리티 블록(450)들을 이용하여 전역 핫 스패어 디스크(420)로 재구성된다.
도 5와 관련하여, n-디스크 RAID 시스템(510)과 함께 한개의 추가적인 스탠바이 전역 핫 스패어 디스크(520)를 포함하는 대용량 기억 시스템(500)이 제시된다. 이때, 앞서 고장난 디스크는 대체 디스크(530)로 대체된 상태다. 고장난 디스크에 포함된 저하 상태 볼륨 조각들에 대응하는 볼륨 조각(540)들이, 동작 디스크들의 저하 볼륨(560)들 중 나머지로부터 기존 데이터 블록 및 패리티 블록(550)들을 이용하여 대체 디스크로 재구성된다.
도 6과 관련하여, n-디스크 RAID 시스템(610)과 함께 추가적인 스탠바이 전역 핫 스패어 디스크(620)를 포함하는 대용량 기억 시스템(600)이 제시된다. 이때, 고장난 디스크는 대체 디스크(630)로 대체된 상태다. 전역 핫 스패어 디스크(620) 상에 미리 재구성된 저하 볼륨(650)의 볼륨 조각(640)은 전역 핫 스패어 디스크(620)로부터 대체 RAID 디스크(630)의 대응하는 볼륨 조각(660)으로 카피백된다.
도 7과 관련하여, 전역 핫 스패어 디스크를 이용하여 RAID 시스템의 고장난 디스크를 재구성 및 카피백하는 방법을 설명하는 순서도가 제시된다. RAID 디스크의 고장이 검출되면(단계 700), 고장난 RAID 디스크에 대해 스탠바이 전역 핫 스패어 드라이브가 통합될 수 있다. CPU처럼 I/O 요청을 송신할 수 있는 외부 장치가 고장난 디스크(710) 상에 위치한 볼륨 조각을 가진 볼륨에 I/O 요청을 발급할 경우, 고장난 디스크 상에 볼륨 조각들을 가진 모든 볼륨들이 저하 상태로 전이된다 (단계 720). 이러한 전이는 고장난 디스크의 볼륨 조각들의 재구성을 개시하게 한다. 재구성된 데이터의 목적지는 고장난 디스크 대신에 대체 디스크가 삽입되었는 지 여부에 따라 결정된다(단계 730). 대체 디스크가 아직 없을 경우, i번째 저하된 보륨 조각은 전역 핫 스패어 디스크로 재구성된다(단계 740). 모든 저하된 볼륨들이 전역 핫 스패어 디스크로 재구성되고 고장난 RAID 디스크가 대체 디스크로 대체되지 않은 경우, 고장난 디스크가 대체 디스크로 대체될 때까지 전역 핫 스패어 디스크는 저하 볼륨들과 관련하여 고장난 디스크 대신에 동작을 계속한다. 그러나, 단계 730에서 재구성 과정 중 임의의 시점에서 대체 디스크가 삽입된 경우, 나머지 저하된 볼륨들은 대체 디스크로 재구성되고(단계 750), 전역 핫 스패어 디스크로는 재구성되지 않는다. 이러한 재구성 프로세스는 m개의 볼륨들 각각이 전역 핫 스패어 디스크나 대체 디스크로 재구성될때까지(단계 770) 계속된다(단계 760). 모든 저하 볼륨 조각들의 재구성 및 고장난 디스크의 대체에 이어, 전역 핫 스패어 디스크로 재구성된 볼륨 조각들이 대체 디스크(780)로 카피백된다.

Claims (25)

  1. 데이터 기억 시스템에 있어서, 상기 시스템은,
    - 대용량 기억을 필요로하는 외부 장치,
    - n-디스크 RAID(Redundant Array of Inexpensive Disks),
    - 전역 핫 스패어 디스크, 그리고,
    - 상기 외부 장치, 상기 RAID, 그리고 상기 전역 핫 스패어 디스크를 연결하는 인터커넥션
    을 포함하며, 이때, n-디스크 RAID의 물리적 기억 공간의 m개의 로직 볼륨으로 파티션화되어 있고, m개의 로직 볼륨들 각각을 포함하는 데이터는 n개의 디스크 사이에서 개별적인 조각들로 분포되며, n개의 디스크 각각은 고장시 대체가능한 것을 특징으로 하는 데이터 기억 시스템.
  2. 제 1 항에 있어서, 상기 n개의 디스크 중 한개가 고장난 상태인 것을 특징으로 하는 데이터 기억 시스템.
  3. 제 2 항에 있어서, 외부 장치로부터의 입력 또는 출력(I/O) 요청이 n-디스크 RAID의 한개 이상의 로직 볼륨에 액세스하거나 이 로직 볼륨을 수정하는 것을 특징으로 하는 데이터 기억 시스템.
  4. 제 3 항에 있어서, 연결단절된 디스크 상에 위치한 액세스되거나 수정된 로직 볼륨의 볼륨 조각들이 재구성되는 것을 특징으로 하는 데이터 기억 시스템.
  5. 제 4 항에 있어서, 고장난 디스크에 대한 대체 디스크가 RAID에 삽입되지 않은 경우, 재구성의 목적지가 전역 핫 스패어 디스크인 것을 특징으로 하는 데이터 기억 시스템.
  6. 제 5 항에 있어서, 고장난 디스크가 대체 디스크로 대체될 때까지, 상기 전역 핫 스패어 디스크가 재구성되는 로직 볼륨과 관련하여 n-디스크 RAID 내의 컴포넌트 디스크로 동작하는 것을 특징으로 하는 데이터 기억 시스템.
  7. 제 6 항에 있어서, 연결단절된 디스크가 재연결될 때, 재구성된 로직 볼륨 조각들이 연결단절된 디스크로 카피백되는 것을 특징으로 하는 데이터 기억 시스템.
  8. 제 4 항에 있어서, 고장난 디스크에 대한 대체 디스크가 RAID에 삽입될 경우, 재구성의 목적지가 대체 디스크인 것을 특징으로 하는 데이터 기억 시스템.
  9. 제 4 항에 있어서, n-디스크 RAID의 나머지 n-1개의 동작 디스크들로부터 기존의 데이터 블록 및 패리티 블록들을 이용하여 재구성이 이루어지는 것을 특징으 로 하는 데이터 기억 시스템.
  10. n-디스크 RAID(Redundant Array of Inexpensive Disks) 내 고장난 디스크의 콘텐트를 재구성하는 방법에 있어서, 상기 방법은,
    - n-디스크 RAID의 n개의 디스크들 중 한개의 고장을 검출하는 단계,
    - 외부 장치로부터 한개 이상의 입력 신호를 수신하는 단계,
    - 모든 볼륨을 저하 상태로 전이시키는 단계,
    - 고장난 디스크의 저하 상태 볼륨 조각들을 전역 핫 스패어 디스크나 고장난 디스크에 대한 대체 디스크로 재구성시키는 단계,
    - n-디스크 RAID에서 고장난 디스크를 대체하는 단계,
    - 전역 핫 스패어 디스크 상에서 재구성된 볼륨 조각들을 대체 디스크로 카피백시키는 단계
    를 포함하는 것을 특징으로 하는 고장난 디스크의 콘텐트 재구성 방법.
  11. 제 10 항에 있어서,
    상기 입력 신호는 한개 이상의 로직 볼륨에 위치한 데이터에 액세스하거나 이 데이터를 수정하기 위한 요청인 것을 특징으로 하는 고장난 디스크의 콘텐트 재구성 방법.
  12. 제 11 항에 있어서,
    로직 볼륨을 최적 상태로부터 저하 상태로 전이시키는 단계는, 로직 볼륨의 콘텐트들에 액세스가 이루어지거나 로직 볼륨의 콘텐트들이 수정될 때 구현되는 것을 특징으로 하는 고장난 디스크의 콘텐트 재구성 방법.
  13. 제 10 항에 있어서, 고장난 디스크가 대체 디스크로 대체되지 않은 경우, 재구성된 저하 상태 볼륨 조각들의 목적지가 전역 핫 스패어 디스크인 것을 특징으로 하는 고장난 디스크의 콘텐트 재구성 방법.
  14. 제 13 항에 있어서, 고장난 디스크가 대체 디스크로 아직 대체되지 않은 경우, 재구성된 저하 상태 로직 볼륨 조각들과 관련하여, 전역 핫 스패어 디스크가 n-디스크 RAID 내 한개의 컴포넌트 디스크로 동작하는 것을 특징으로 하는 고장난 디스크의 콘텐트 재구성 방법.
  15. 제 14 항에 있어서, 재구성된 저하 상태 볼륨 조각들이 재연결된 디스크로 카피되는 것을 특징으로 하는 고장난 디스크의 콘텐트 재구성 방법.
  16. 제 10 항에 있어서, 고장난 디스크가 대체 디스크로 대체된 경우, 재구성된 저하 상태 볼륨 조각들의 목적지가 전역 핫 스패어 디스크인 것을 특징으로 하는 고장난 디스크의 콘텐트 재구성 방법.
  17. 제 10 항에 있어서, n-디스크 RAID 내 나머지 n-1개의 연결된 디스크들로부터 기존의 데이터 블록 및 패리티 블록들을 이용하여 재구성이 이루어지는 것을 특징으로 하는 고장난 디스크의 콘텐트 재구성 방법.
  18. n-디스크 RAID(Redundant Array of Inexpensive Disks) 내 연결이 단절된 디스크의 콘텐트를 재구성하는 방법을 프로세서로 하여금 수행하게 하는 명령들을 기록한 컴퓨터로 읽을 수 있는 기록 매체에 있어서, 상기 방법은,
    - n-디스크 RAID의 n개의 디스크들 중 한개의 연결 단절을 검출하는 단계,
    - 외부 장치로부터 한개 이상의 입력 신호를 수신하는 단계,
    - 한개 이상의 로직 볼륨들을 최적 상태로부터 저하 상태로 전이시키는 단계,
    - 연결이 단절된 디스크의 저하 상태 로직 볼륨 조각을 전역 핫 스패어 디스크 상에서 재구성하는 단계,
    - 연결이 단절된 디스크를 재연결시키는 단계, 그리고,
    - 전역 핫 스패어 디스크 상에서 재구성된 저하 상태 볼륨 조각들을 n-디스크 RAID 내 재연결된 디스크에 카피하는 단계
    를 포함하는 것을 특징으로 하는 컴퓨터로 읽을 수 있는 기록 매체.
  19. 제 18 항에 있어서,
    상기 입력 신호는 한개 이상의 로직 볼륨에 위치한 데이터에 액세스하거나 이 데이터를 수정하기 위한 요청인 것을 특징으로 하는 컴퓨터로 읽을 수 있는 기록 매체.
  20. 제 19 항에 있어서,
    로직 볼륨을 최적 상태로부터 저하 상태로 전이시키는 단계는, 로직 볼륨의 콘텐트들에 액세스가 이루어지거나 로직 볼륨의 콘텐트들이 수정될 때 구현되는 것을 특징으로 하는 컴퓨터로 읽을 수 있는 기록 매체.
  21. 제 18 항에 있어서, 고장난 디스크가 대체 디스크로 아직 대체되지 않은 경우, 재구성된 저하 상태 볼륨 조각들의 목적지가 전역 핫 스패어 디스크인 것을 특징으로 하는 컴퓨터로 읽을 수 있는 기록 매체.
  22. 제 21 항에 있어서, 고장난 디스크가 대체 디스크로 아직 대체되지 않은 경우, 재구성된 저하 상태 로직 볼륨 조각들과 관련하여 전역 핫 스패어 디스크가 n-디스크 RAID 내의 한개의 컴포넌트로 기능하는 것을 특징으로 하는 컴퓨터로 읽을 수 있는 기록 매체.
  23. 제 22 항에 있어서, 재구성된 저하 상태 볼륨 조각들이 재연결된 디스크에 카피되는 것을 특징으로 하는 컴퓨터로 읽을 수 있는 기록 매체.
  24. 제 18 항에 있어서, 고장난 디스크가 대체 디스크로 대체된 경우, 재구성된 저하 상태 볼륨 조각들의 목적지가 전역 핫 스패어 디스크인 것을 특징으로 하는 컴퓨터로 읽을 수 있는 기록 매체.
  25. 제 18 항에 있어서, n-디스크 RAID 내 나머지 n-1개의 동작 디스크들로부터 기존의 데이터 블록 및 패리티 블록들을 이용하여 재구성이 이루어지는 것을 특징으로 하는 컴퓨터로 읽을 수 있는 기록 매체.
KR1020097005277A 2006-09-19 2007-09-18 전역 핫 스패어 디스크를 이용한 고장난 드라이브의 재구성및 카피백 방법 KR20090073099A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/523,452 2006-09-19
US11/523,452 US20080126839A1 (en) 2006-09-19 2006-09-19 Optimized reconstruction and copyback methodology for a failed drive in the presence of a global hot spare disc

Publications (1)

Publication Number Publication Date
KR20090073099A true KR20090073099A (ko) 2009-07-02

Family

ID=39201074

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097005277A KR20090073099A (ko) 2006-09-19 2007-09-18 전역 핫 스패어 디스크를 이용한 고장난 드라이브의 재구성및 카피백 방법

Country Status (7)

Country Link
US (1) US20080126839A1 (ko)
JP (1) JP5285610B2 (ko)
KR (1) KR20090073099A (ko)
CN (1) CN101523353B (ko)
DE (1) DE112007002175T5 (ko)
GB (1) GB2456081B (ko)
WO (1) WO2008036318A2 (ko)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5052193B2 (ja) * 2007-04-17 2012-10-17 株式会社日立製作所 記憶制御装置および記憶制御方法
US8707076B2 (en) 2007-04-18 2014-04-22 Dell Products L.P. System and method for power management of storage resources
US7941697B2 (en) * 2008-12-30 2011-05-10 Symantec Operating Corporation Failure handling using overlay objects on a file system using object based storage devices
US8065558B2 (en) * 2009-03-24 2011-11-22 Lsi Corporation Data volume rebuilder and methods for arranging data volumes for improved RAID reconstruction performance
US8370688B2 (en) * 2009-04-23 2013-02-05 Hewlett-Packard Development Company, L.P. Identifying a storage device as faulty for a first storage volume without identifying the storage device as faulty for a second storage volume
US8086893B1 (en) * 2009-07-31 2011-12-27 Netapp, Inc. High performance pooled hot spares
JP5532982B2 (ja) * 2010-02-03 2014-06-25 富士通株式会社 ストレージ装置、ストレージ装置のコントローラおよびストレージ装置の記憶領域割当方法
CN103348330B (zh) * 2010-12-01 2017-05-24 希捷科技有限公司 采用独立硅元件的动态较高级冗余模式管理
KR101564569B1 (ko) 2011-01-18 2015-11-03 엘에스아이 코포레이션 상위-레벨 리던던시 정보 계산
TW201239612A (en) * 2011-03-31 2012-10-01 Hon Hai Prec Ind Co Ltd Multimedia storage device
TW201301020A (zh) * 2011-06-29 2013-01-01 Giga Byte Tech Co Ltd 磁碟陣列之偵測及資料轉移方法及其系統
US8959389B2 (en) * 2011-11-23 2015-02-17 International Business Machines Corporation Use of a virtual drive as a hot spare for a raid group
US8856431B2 (en) 2012-08-02 2014-10-07 Lsi Corporation Mixed granularity higher-level redundancy for non-volatile memory
US20140149787A1 (en) * 2012-11-29 2014-05-29 Lsi Corporation Method and system for copyback completion with a failed drive
CN103970481B (zh) * 2013-01-29 2017-03-01 国际商业机器公司 重建存储器阵列的方法和装置
CN103389918A (zh) * 2013-07-24 2013-11-13 北京鲸鲨软件科技有限公司 一种适用于raid系统中假性故障的修复方法
JP6233086B2 (ja) * 2014-02-20 2017-11-22 富士通株式会社 ストレージ制御装置,ストレージシステム及び制御プログラム
CN103955412A (zh) * 2014-04-02 2014-07-30 江门市未来之星网络科技有限公司 一种电脑硬盘数据恢复设备及其方法
US10042730B2 (en) 2014-08-19 2018-08-07 Western Digital Technologies, Inc. Mass storage chassis assembly configured to accommodate predetermined number of storage drive failures
CN106796491A (zh) * 2014-10-03 2017-05-31 新加坡科技研究局 优化混合对象存储装置的数据重建的方法
CN104268038B (zh) * 2014-10-09 2017-03-08 浪潮(北京)电子信息产业有限公司 磁盘阵列的高可用系统
US9823876B2 (en) * 2015-09-29 2017-11-21 Seagate Technology Llc Nondisruptive device replacement using progressive background copyback operation
US10007432B2 (en) * 2015-10-13 2018-06-26 Dell Products, L.P. System and method for replacing storage devices
JP6957845B2 (ja) * 2016-09-13 2021-11-02 富士通株式会社 ストレージ制御装置及びストレージ装置
CN109739436A (zh) * 2018-12-19 2019-05-10 河南创新科信息技术有限公司 Raid重构方法、存储介质和装置
CN111858189A (zh) * 2019-04-29 2020-10-30 伊姆西Ip控股有限责任公司 对存储盘离线的处理
CN110908607B (zh) * 2019-11-21 2022-07-22 苏州浪潮智能科技有限公司 板载raid数据重建方法、装置、设备及可读存储介质
CN113448499A (zh) * 2020-03-25 2021-09-28 华为技术有限公司 存储系统、数据处理方法、装置、节点以及存储介质
CN114443368B (zh) * 2021-12-31 2023-11-14 苏州浪潮智能科技有限公司 raid系统的冗余数据处理方法、装置、系统及介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5210866A (en) * 1990-09-12 1993-05-11 Storage Technology Corporation Incremental disk backup system for a dynamically mapped data storage subsystem
JP2603757B2 (ja) * 1990-11-30 1997-04-23 富士通株式会社 アレ−ディスク装置の制御方法
US5371882A (en) * 1992-01-14 1994-12-06 Storage Technology Corporation Spare disk drive replacement scheduling system for a disk drive array data storage subsystem
JPH07141120A (ja) * 1993-11-16 1995-06-02 Nippon Telegr & Teleph Corp <Ntt> 情報記憶媒体障害処理方法
US5941994A (en) * 1995-12-22 1999-08-24 Lsi Logic Corporation Technique for sharing hot spare drives among multiple subsystems
JPH09251353A (ja) * 1996-03-14 1997-09-22 Toshiba Corp ディスク・アレイ・システム
JPH103360A (ja) * 1996-06-14 1998-01-06 Fujitsu Ltd 二重化記憶管理装置
US6341333B1 (en) * 1997-10-06 2002-01-22 Emc Corporation Method for transparent exchange of logical volumes in a disk array storage device
AU6337701A (en) * 2000-05-19 2002-03-22 Self Repairing Computers Inc A computer with switchable components
ATE480822T1 (de) * 2001-02-13 2010-09-15 Candera Inc Failover-verarbeitung in einem speicherungssystem
US6880101B2 (en) * 2001-10-12 2005-04-12 Dell Products L.P. System and method for providing automatic data restoration after a storage device failure
US20030217305A1 (en) * 2002-05-14 2003-11-20 Krehbiel Stanley E. System, method, and computer program product within a data processing system for assigning an unused, unassigned storage device as a replacement device
US7058762B2 (en) * 2003-06-09 2006-06-06 Hewlett-Packard Development Company, L.P. Method and apparatus for selecting among multiple data reconstruction techniques
US20050283654A1 (en) * 2004-05-24 2005-12-22 Sun Microsystems, Inc. Method and apparatus for decreasing failed disk reconstruction time in a raid data storage system
US20070088990A1 (en) * 2005-10-18 2007-04-19 Schmitz Thomas A System and method for reduction of rebuild time in raid systems through implementation of striped hot spare drives
US7661012B2 (en) * 2005-12-01 2010-02-09 International Business Machines Corporation Spare device management
US7805633B2 (en) * 2006-09-18 2010-09-28 Lsi Corporation Optimized reconstruction and copyback methodology for a disconnected drive in the presence of a global hot spare disk

Also Published As

Publication number Publication date
GB2456081B (en) 2011-07-13
DE112007002175T5 (de) 2009-07-09
JP2010504589A (ja) 2010-02-12
JP5285610B2 (ja) 2013-09-11
WO2008036318A8 (en) 2011-12-15
US20080126839A1 (en) 2008-05-29
GB0905000D0 (en) 2009-05-06
CN101523353B (zh) 2014-09-17
CN101523353A (zh) 2009-09-02
WO2008036318A3 (en) 2008-08-28
GB2456081A (en) 2009-07-08
WO2008036318A2 (en) 2008-03-27

Similar Documents

Publication Publication Date Title
KR20090073099A (ko) 전역 핫 스패어 디스크를 이용한 고장난 드라이브의 재구성및 카피백 방법
KR101251245B1 (ko) 연결 단절된 디스크의 콘텐츠 재구성 방법 및 시스템, 컴퓨터 판독가능한 매체
US9652343B2 (en) Raid hot spare system and method
US8839028B1 (en) Managing data availability in storage systems
US8464094B2 (en) Disk array system and control method thereof
US20080178040A1 (en) Disk failure restoration method and disk array apparatus
US9383940B1 (en) Techniques for performing data migration
KR100690429B1 (ko) 디스크 어레이 내에 다중 종속 디스크 장해 또는 임의의이중 디스크 장해를 허용하는 방법 및 수단
US8984241B2 (en) Heterogeneous redundant storage array
US7418623B2 (en) Apparatus and method to reconfigure a storage array
JP2912802B2 (ja) ディスクアレイ装置の故障対処方法および装置
GB2513377A (en) Controlling data storage in an array of storage devices
US20060236149A1 (en) System and method for rebuilding a storage disk
JP2000099282A (ja) ファイル管理システム
US7404104B2 (en) Apparatus and method to assign network addresses in a storage array
US20100023715A1 (en) System for improving start of day time availability and/or performance of an array controller
US11507287B1 (en) Adding single disks to an array by relocating raid members
US11256447B1 (en) Multi-BCRC raid protection for CKD
JP2005099995A (ja) 磁気ディスク装置のディスク共有方法及びシステム
US8832370B2 (en) Redundant array of independent storage
JP2010267037A (ja) ディスクアレイ装置
US20130019122A1 (en) Storage device and alternative storage medium selection method
CN114415968A (zh) 存储系统及其数据写入方法
JP2015166958A (ja) ストレージ制御装置、ストレージ制御方法及びストレージ制御プログラム
JP7056874B2 (ja) 制御装置、ディスクアレイ装置、制御方法、及びプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right