JP6233086B2 - ストレージ制御装置,ストレージシステム及び制御プログラム - Google Patents

ストレージ制御装置,ストレージシステム及び制御プログラム Download PDF

Info

Publication number
JP6233086B2
JP6233086B2 JP2014030390A JP2014030390A JP6233086B2 JP 6233086 B2 JP6233086 B2 JP 6233086B2 JP 2014030390 A JP2014030390 A JP 2014030390A JP 2014030390 A JP2014030390 A JP 2014030390A JP 6233086 B2 JP6233086 B2 JP 6233086B2
Authority
JP
Japan
Prior art keywords
storage device
disk
spare
redundant
raid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014030390A
Other languages
English (en)
Other versions
JP2015156081A (ja
Inventor
弘 小嵐
弘 小嵐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014030390A priority Critical patent/JP6233086B2/ja
Priority to US14/559,389 priority patent/US9697087B2/en
Publication of JP2015156081A publication Critical patent/JP2015156081A/ja
Application granted granted Critical
Publication of JP6233086B2 publication Critical patent/JP6233086B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1092Rebuilding, e.g. when physically replacing a failing disk
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1088Reconstruction on already foreseen single or plurality of spare disks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2069Management of state, configuration or failover
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2082Data synchronisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2087Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring with a common controller
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/84Using snapshots, i.e. a logical point-in-time copy of the data

Description

本発明は、ストレージ制御装置,ストレージシステム及び制御プログラムに関する。
情報通信技術(Information and Communication Technology;ICT)システムの普及に伴い、近年、Hard Disk Drive(HDD)に代表される記憶装置(以下、「ディスク」
と総称する)を複数使用するディスクアレイ装置が広く用いられるようになっている。このようなディスクアレイ装置では、一般に、Redundant Arrays of Inexpensive Disks(RAID)技術を用いて、データが2台以上のディスクに冗長化されて記録されることにより、データの安全性が担保されている。
ここで、RAIDとは、複数のディスクを組合せて、仮想的な1台のディスク(RAIDグループ)として管理する技術を指す。RAIDには、各ディスクへのデータ配置及び冗長性に応じて、RAID0〜RAID6のレベルが存在する。
RAID装置では、RAIDを構成する複数ディスクにまたがるストライプ内にパリティデータを入れてRAIDを構成するディスクの故障に対してデータを保護する。そして、このRAID構成上にLUN(Logical Unit Number)を割り当ててサーバにディスク領域として見せて使用させている。
データが冗長化されたディスクアレイ装置において、ディスクが故障すると、故障したディスクに記憶されていたデータが再構築されて、予備ディスクなどの代替ディスクに格納される。このような処理は、一般にリビルド処理と呼ばれる。リビルド処理が実行されることで、データの冗長性が回復する。
特開平10−293658号公報 特開2005−78430号公報
しかしながら、このような従来のディスクアレイ装置において、例えば、RAID上に複数のLUNがある場合に、リビルド処理により一部のLUNの復元が完了していても、RAID内で更にもう1本ディスクが故障した場合には、RAID内の全データがロストし、復元されていたLUNのデータも失われてしまう。
また、RAID装置上に複数のLUNがある場合に、復元が完了しているLUNであっても、リビルドの全処理が終わるまでは、このリビルド処理による性能劣化の影響を受ける。
1つの側面では、本発明は、記憶装置の故障時における信頼性を向上させることを目的とする。
なお、前記目的に限らず、後述する発明を実施するための形態に示す各構成により導かれる作用効果であって、従来の技術によっては得られない作用効果を奏することも本発明の他の目的の1つとして位置付けることができる。
このため、このストレージ制御装置は、冗長構成がなされた複数の記憶装置及び複数の
予備記憶装置と通信路を介して通信可能に接続されるストレージ制御装置であって、前記複数の記憶装置のうち復元対象記憶装置以外の冗長用記憶装置から読み出した冗長データを用いて、前記復元対象記憶装置のデータを、前記複数の予備記憶装置のうちの第1の予備記憶装置に再構成する再構成処理部と、前記再構成処理部による再構成を行なう際に、前記再構成処理部が前記冗長用記憶装置から読み出したデータを利用して、前記複数の予備記憶装置における、当該データを読み出した前記冗長用記憶装置に対応する第2の予備記憶装置に格納することで、前記冗長用記憶装置の複製を行なう複製処理部とを備える。
一実施形態によれば、記憶装置の故障時における信頼性を向上させることができる。
実施形態の一例としてのストレージ装置を備えるストレージシステムのハードウェア構成を模式的に示す図である。 実施形態の一例としてのストレージ装置の機能構成を示す図である。 実施形態の一例としてのストレージ装置におけるLUN管理テーブルの構成を例示する図である。 実施形態の一例としてのストレージ装置におけるリビルド処理を説明する図である。 実施形態の一例としてのストレージ装置におけるリビルド処理を説明する図である。 実施形態の一例としてのストレージ装置におけるリビルド処理を説明する図である。 実施形態の一例としてのストレージ装置におけるRAID構成変更部によるRAID構成変更方法を示す図である。 実施形態の一例としてのストレージ装置におけるリビルド処理の概要を説明するフローチャートである。 実施形態の一例としてのストレージ装置におけるストレージ構成の決定方法をフローチャートである。 実施形態の一例としてのストレージ装置におけるリビルド処理を説明するフローチャートである。 実施形態の一例としてのストレージ装置における予備ディスクの解放要求の有無の確認処理の詳細を説明するフローチャートである。 実施形態の一例としてのストレージ装置におけるリビルド処理後の処理を説明するフローチャートである。 実施形態の一例としてのストレージ装置におけるリード受信時の処理を説明するフローチャートである。 実施形態の一例としてのストレージ装置におけるライト受信時の処理を説明するフローチャートである。
以下、図面を参照して本ストレージ制御装置,ストレージシステム及び制御プログラムに係る実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形して実施することができる。又、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。
図1は実施形態の一例としてのストレージ装置1を備えるストレージシステム4のハードウェア構成を模式的に示す図である。
ストレージシステム4においては、ストレージ装置1と1つ以上(図1に示す例では2つ)のホスト装置2a,2bとが冗長化された複数のパスを介して接続されている。
ストレージ装置1は、ドライブエンクロージャ(DE:Drive Enclosure)30に格納された記憶装置31を仮想化して、仮想ストレージ環境を形成する。そしてストレージ装置1は、仮想ボリュームを上位装置であるホスト装置2a,2bに提供する。
ホスト装置2a,2bは、例えば、サーバ機能をそなえた情報処理装置であり、本ストレージ装置1との間において、NAS(Network Attached Storage)やSAN(Storage Area Network)のコマンドを送受信する。これらのホスト装置2a,2bは、同様の構成を有している。
以下、ホスト装置を示す符号としては、複数のホスト装置のうち1つを特定する必要があるときには符号2a,2bを用いるが、任意のホスト装置を指すときには符号2を用いる。
ホスト装置2は、図示しないCPU(Central Processing Unit)やメモリを備え、CPUがメモリ等に格納されたOS(Operating System)やプログラムを実行することで、種々の機能を実行する。
ホスト装置2は、例えば、ストレージ装置1に対してNASにおけるリード/ライト等のディスクアクセスコマンドを送信することにより、ストレージ装置1が提供するボリュームにデータの書き込みや読み出しを行なう。
そして、本ストレージ装置1は、ホスト装置2からボリュームに対して行なわれる入出力要求(例えば、リードコマンドやライトコマンド)に応じて、このボリュームに対応する実ストレージに対して、データの読み出しや書き込み等の処理を行なう。なお、ホスト装置2からの入出力要求のことをIOコマンドという場合がある。
スイッチ3a,3bは、ホスト装置2a,2bとストレージ装置1のコントローラ100との通信を中継する中継装置である。各スイッチ3a,3bは、それぞれホスト装置2a,2bに接続されるとともに、コントローラ100に接続されている。
図1に示す例においては、コントローラ100に2つのポート101a,101bが備えられている。そして、ポート101aにスイッチ3aが、又、ポート101bにスイッチ3bが、それぞれ接続され、更に、各スイッチ3a,3bにそれぞれホスト装置2a,2bが接続されている。
ストレージ装置1は、図1に示すように、1つ以上(本実施形態では1つ)のコントローラ100及び1つ以上(図1に示す例では1つ)のドライブエンクロージャ(Drive Enclosure:DE)30をそなえる。
ドライブエンクロージャ30には、1以上(図1に示す例では8つ)の記憶装置(物理ディスク)31a−1〜31a−4,31b−1〜31b−4が搭載され、これらの記憶装置31a−1〜31a−4,31b−1〜31b−4の記憶領域(実ボリューム,実ストレージ)を、本ストレージ装置1に対して提供する。
以下、記憶装置を示す符号としては、複数の記憶装置のうち1つを特定する必要があるときには符号31a−1〜31a−4,31b−1〜31b−4を用いるが、任意の記憶装置を指すときには符号31を用いる。又、記憶装置31をディスク31という場合がある。
また、以下、記憶装置31a−1,31a−2,31a−3,31a−4を、disk1,disk2,disk3,disk4とそれぞれ表す場合がある。更に、以下、記憶装置31b−1,31b−2,31b−3,31b−4を、disk1’,disk2’,disk3’,disk4’とそれぞれ表す場合がある。
記憶装置31は、ハードディスクドライブ(Hard disk drive:HDD)、SSD(Solid State Drive)等の記憶装置であって、種々のデータを格納するものである。
ドライブエンクロージャ30は、例えば複数段のスロット(図示省略)を備えて構成され、これらのスロットに記憶装置31を挿入することにより、実ボリューム容量を随時変更することができる。
また、ドライブエンクロージャ30に備えられた複数の記憶装置31を用いてRAID(Redundant Arrays of Inexpensive Disks)が構成される。図1に示す例においては、記憶装置31a−1〜31a−4を用いてRAIDが構成されており、これらの記憶装置31a−1〜31a−4がRAIDグループ30aを構成している。
このRAIDグループ30aを構成する記憶装置31a−1〜31a−4をRAID構成ディスク31aという場合がある。
記憶装置31b−1〜31b−4は、RAIDディスクグループ内のディスク故障にそなえて予備的に設けられた予備ディスクであり、ホットスペア(Hot spare;HS)として用いられる。これらの記憶装置31b−1〜31b−4が予備ディスクグループ30bを構成している。以下、記憶装置31bを予備ディスク31bという場合がある。
ドライブエンクロージャ30は、コントローラ100のデバイスアダプタ(Device Adapter:DA)103,103とそれぞれ接続されている。
コントローラエンクロージャ40は、1以上(図1に示す例では1つ)のコントローラ100を備える。
コントローラ100は、ストレージ装置1内の動作を制御するストレージ制御装置であり、ホスト装置2から送信されるIOコマンドに従って、ドライブエンクロージャ30の記憶装置31へのアクセス制御等、各種制御を行なう。
なお、図1に示す例においては、ストレージ装置1に1つのコントローラ100が備えられているが、これに限定されるものではなく、2つ以上のコントローラ100を備えてもよい。すなわち、複数のコントローラ100により冗長化を行ない、通常は、いずれかのコントローラ100がプライマリとして各種制御を行ない、このプライマリコントローラ100の故障時には、セカンダリのコントローラ100がプライマリとしての動作を引き継いでもよい。
コントローラ100はポート101a,101bを介してホスト装置2に接続される。そして、コントローラ100は、ホスト装置2から送信されるリード/ライト等のIOコマンドを受信し、DA103等を介して記憶装置31の制御を行なう。
コントローラ100は、図1に示すように、ポート101a,101bと複数(図1に示す例では2つ)のDA103,103とをそなえるとともに、CPU110,メモリ106,SSD107及びIOC(Input Output Controller)108をそなえる。
以下、ポートを示す符号としては、複数のポートのうち1つを特定する必要があるときには符号101a,101bを用いるが、任意のポートを指すときには符号101を用いる。
ポート101は、ホスト装置2等から送信されたデータを受信したり、コントローラ100から出力するデータをホスト装置2等に送信する。すなわち、ポート101は、ホスト装置等の外部装置との間でのデータの入出力(I/O)を制御する。
ポート101aは、SANを介してホスト装置2と通信可能に接続され、例えば、FC(Fibre Channel)インタフェース等のネットワークアダプタに備えられるFCポートである。
ポート101bは、NASを介してホスト装置2と通信可能に接続され、例えば、LAN(Local Area Network)インタフェースのNICポートである。コントローラ100は、これらのポート101により通信回線を介してホスト装置2等と接続され、I/Oコマンドの受信やデータの送受信等を行なう。
そして、ポート101aにスイッチ3aが、又、ポート101bにスイッチ3bが、それぞれ接続され、更に、各スイッチ3a,3bにそれぞれホスト装置2a,2bが接続されている。
すなわち、ホスト装置2a,2bは、それぞれスイッチ3aを介してポート101aに接続されるとともに、スイッチ3bを介してポート101bに接続されている。
なお、図1に示す例においてはコントローラ100に2つのポート101a,101bが備えられているが、これに限定されるものではなく、1つもしくは3つ以上のポートを備えてもよい。
DA103は、ドライブエンクロージャ30や記憶装置31等と通信可能に接続するためのインタフェースである。DA103にはドライブエンクロージャ30の記憶装置31が接続され、コントローラ100は、ホスト装置2から受信したIOコマンドに基づき、これらの記憶装置31に対するアクセス制御を行なう。
コントローラ100は、これらのDA103を介して、記憶装置31に対するデータの書き込みや読み出しを行なう。又、図1に示す例においては、コントローラ100に2つのDA103がそなえられている。そして、コントローラ100において、各DA103にドライブエンクロージャ30が接続されている。これにより、ドライブエンクロージャ30の記憶装置31には、コントローラ100からデータの書き込みや読み出しを行なうことができる。
SSD107は、CPU110が実行するプログラムや種々のデータ等を格納する記憶装置である。
メモリ106は、種々のデータやプログラムを一時的に格納する記憶装置であり、図示しないメモリ領域とキャッシュ領域とをそなえる。キャッシュ領域は、ホスト装置2から受信したデータや、ホスト装置2に対して送信するデータを一時的に格納する。メモリ領域には、CPU110がプログラムを実行する際に、データやプログラムを一時的に格納・展開して用いる。
このメモリ106には、後述するRAID制御部12によるRAID制御に用いられる、仮/実ボリューム変換テーブル62やディスク構成情報63,RAID構成テーブル64等が格納される。仮/実ボリューム変換テーブル62は、ホスト装置2に提供する仮想ボリュームのアドレスを、記憶装置31の物理アドレス(実アドレス)にマッピングしているテーブルである。
ディスク構成情報63は、本ストレージ装置1に備えられる記憶装置31を管理する情報である。ディスク構成情報63において、例えば、各記憶装置31のディスク種別や、各記憶装置31がライブエンクロージャ30のどのスロットに取り付けられているか、又、どの記憶装置31が予備ディスク31であるか等の情報が管理される。
RAID構成テーブル64は、後述するRAID制御部12がRAIDの管理を行なうために用いる情報であり、例えば、RAID種別や、RAIDグループ30aを構成する記憶装置31aを特定する情報等が格納される。
なお、これらの仮/実ボリューム変換テーブル62やディスク構成情報63,RAID構成テーブル64は既知であるので、その詳細な説明は省略する。
また、メモリ106には、後述するリビルド処理部13がリビルド処理を行なう際に、各リビルド元ディスク31aから読み出されたデータが一時的に格納される。
さらに、メモリ106には、後述する、LUN管理テーブル61が格納される。LUN管理テーブル61の詳細は後述する。
IOC108は、コントローラ100内におけるデータ転送を制御する制御装置であり、例えば、メモリ106に格納されたデータをCPU110を介することなく転送させるDMA転送(Direct Memory Access)を実現する。
CPU110は、種々の制御や演算を行なう処理装置であり、例えばマルチコアプロセッサ(マルチCPU)である。CPU110は、SSD107等に格納されたOSやプログラムを実行することにより、種々の機能を実現する。
図2は実施形態の一例としてのストレージ装置1の機能構成を示す図である。
この図2に示すように、ストレージ装置1は、IO制御部11,RAID制御部12,リビルド処理部13,割当処理部14,ミラーリング処理部15及びRAID構成変更部16として機能する。
そして、コントローラ100のCPU110が、制御プログラムを実行することにより、これらのIO制御部11,RAID制御部12,リビルド処理部13,割当処理部14,ミラーリング処理部15及びRAID構成変更部16として機能する。
なお、これらのIO制御部11,RAID制御部12,リビルド処理部13,割当処理部14,ミラーリング処理部15及びRAID構成変更部16としての機能を実現するためのプログラム(制御プログラム)は、例えばフレキシブルディスク,CD(CD−ROM,CD−R,CD−RW等),DVD(DVD−ROM,DVD−RAM,DVD−R,DVD+R,DVD−RW,DVD+RW,HD DVD等),ブルーレイディスク,磁気ディスク,光ディスク,光磁気ディスク等の、コンピュータ読取可能な記録媒体に記録された形態で提供される。そして、コンピュータはその記録媒体からプログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。又、そのプログラムを、例えば磁気ディスク,光ディスク,光磁気ディスク等の記憶装置(記録媒体)に記録しておき、その記憶装置から通信経路を介してコンピュータに提供するようにしてもよい。
IO制御部11,RAID制御部12,リビルド処理部13,割当処理部14,ミラーリング処理部15及びRAID構成変更部16としての機能を実現する際には、内部記憶装置(本実施形態ではSSD107やメモリ106)に格納されたプログラムがコンピュータのマイクロプロセッサ(本実施形態ではCPU110)によって実行される。このとき、記録媒体に記録されたプログラムをコンピュータが読み取って実行するようにしてもよい。
RAID制御部12は、記憶装置31aを用いてRAIDを実現し、RAIDを構成する記憶装置31の制御を行なう。すなわち、RAID制御部12は、複数の記憶装置31aを用いた冗長構成を設定する。
このRAID制御部12は、上述したRAID構成テーブル64を作成・管理して、RAID構成ディスク31aを用いてRAIDグループ30aを設定し、各種RAID制御を行なう。なお、RAID制御部12によるRAIDの管理は既知の手法で実現することができ、その説明は省略する。
また、RAID制御部12は、記憶装置31を用いてLUNの設定・管理を行ない、ホスト装置2はこの設定されたLUNに対してデータアクセスを行なう。RAID制御部12は、LUN管理テーブル61を用いて、LUNの管理を行なう。
図3は実施形態の一例としてのストレージ装置1におけるLUN管理テーブル61の構成を例示する図である。
LUN管理テーブル61はLUN毎に備えられる管理情報であり、この図3に例示するLUN管理テーブル61はLUN1についての情報を示す。
LUN管理テーブル61は、項目と内容と備考とを関連付けて構成されている。図3に示す例においては、LUN管理テーブル61に12個の項目が登録されており、これらの項目を特定するための項番1〜12が設定されている。
具体的には、項目として、LUN名,構成ディスク名リスト,各ディスク上の位置、サイズ,故障ディスク名,LUNの状態,利用予備ディスク名リスト,ディスクの安定度リスト,リビルド済サイズ,元ディスクのリード/ライト中カウンタ,予備ディスクのリード/ライト中カウンタ,元ディスクのIO禁止フラグ及び予備ディスクのIO禁止フラグが登録されており、これらに対して1〜12の項(項番)が設定されている。
項1のLUN名には、LUNを特定する識別情報が登録され、図3に示す例においては“LUN1”が登録されている。項2の構成ディスク名リストは、そのLUNを構成する記憶装置31を示す情報が登録される。すなわち、構成ディスク名リストには、RAID構成ディスク31aを示す情報が格納される。図3に示す例においては、構成ディスク名リストにdisk1,disk2,disk3,disk4が登録されている。
項3の各ディスク上の位置、サイズは、そのLUNを構成するRAID構成ディスク31a上における、当該LUNのデータの格納位置とサイズを示す情報が登録される。なお、位置としては、例えばオフセット(Offset)値が登録される。
項4の故障ディスク名は、そのLUNを構成するRAID構成ディスク31aにおいて、故障の発生が検知された記憶装置31aを示す情報が登録され、図3に示す例においては“disk2”が登録されている。
項5のLUNの状態は、そのLUNの状態を示す情報が格納され、図3に示す例においては、正常な状態であることを示す“正常”、リビルド中であることを示す“rebuild中”及び、リビルド済みであることを示す“rebuild済”のいずれかが格納される。
項6の利用予備ディスク名リストは、各RAID構成ディスク31aに対応付けられている予備ディスク31bを示す情報が格納される。なお、このRAID構成ディスク31aに対応づけられる予備ディスク31bは、後述する割当処理部14によって設定される。
図3に示す例においては、項2の構成ディスク名リストのdisk1,disk2,disk3及びdisk4に対して、disk1’,disk2’,disk3’及びdisk4’が対応付けられている。すなわち、disk1とdisk1’とが対をなし、同様に、disk2,disk3及びdisk4がdisk2’,disk3’及びdisk4’とそれぞれ対をなす。
また、RAID構成ディスク31aの数に対して割り当て可能な予備ディスク31bの数(本数)が少ない場合には、後述の如く、一部のRAID構成ディスク31aに対してのみ予備ディスク31bが割り当てられる。図3においては、このように予備ディスク31bの数が少ない場合の例も表示されており、割り当てられた予備ディスク31bのみが示され、割り当てられる予備ディスク31bがない部分には、横線(−)を記している。
項7のディスクの安定度リストには、そのLUNを構成するRAID構成ディスク31aを示す情報が、その安定度が高い順に登録される。図3に示す例においては、RAID構成ディスク31aが、disk1,disk4,disk3の順で登録されている。なお、disk2は故障中であるので、このディスクの安定度リストには登録されない。
項8のリビルド済サイズには、項2の故障ディスクに関するリビルド処理が実行された場合に、その復元されたデータの合計値(データサイズ)が進捗状況として登録される。このリビルド済みサイズの初期値は0であり、リビルド処理の進行に伴い、その値が大きくなる。
項9の元ディスクのリード/ライト中カウンタには、そのLUNを構成する各RAID構成ディスク(元ディスク)31aのそれぞれについて、実行中のリードアクセス及びライトアクセスの数が格納される。すなわち、各RAID構成ディスク31aへのIOアクセス状態をリアルタイム表す。
図3に示す例においては、各RAID構成ディスク31aのそれぞれに対して、リード中カウンタの値nとライト中カウンタの値nとを、(n,n)の形式で示している。
ホスト装置2からLUNに対するリード要求もしくはライト要求のIOコマンドを受信すると、例えば、後述するIO制御部11が、そのアクセス先のRAID構成ディスク31aについてのリード中カウンタもしくはライト中カウンタの値をインクリメントする。又、IO制御部11は、リードアクセスもしくはライトアクセスが完了すると、対応するカウンタの値をデクリメントする。
この元ディスクのリード/ライト中カウンタの値を参照することで、各RAID構成ディスク31aがIO処理を実行中であるか否かを判断することができる。
項10の予備ディスクのリード/ライト中カウンタには、各予備ディスク31bのそれぞれについて、実行中のリードアクセス及びライトアクセスの数が格納される。すなわち、各予備ディスク31bへのIOアクセス状態を示す。
図3に示す例においては、各予備ディスク31bのそれぞれに対して、リード中カウンタの値nとライト中カウンタの値nとを、(n,n)の形式で示している。
例えば、後述するミラーリング処理部15が、その予備ディスク31bに対してデータのライトを行なう際にライト中カウンタの値をインクリメントする。又、ミラーリング処理部15は、ライト処理が完了すると、対応するカウンタの値をデクリメントする。
この予備ディスクのリード/ライト中カウンタの値を参照することで、各予備ディスク31bがIO処理を実行中であるか否かを判断することができる。
項11の元ディスクのIO禁止フラグは、そのLUNを構成する各RAID構成ディスク31aのそれぞれについて、IO処理が禁止されているか否かを示す情報が格納される。図3に示す例においては、“0”もしくは“1”が格納され、“1”がフラグとして設定されている場合には、そのRAID構成ディスク31aへのIOが禁止されていることを示す。
項12の予備ディスクのIO禁止フラグは、予備ディスク31bのそれぞれについて、IO処理が禁止されているか否かを示す情報が格納される。図3に示す例においては、“0”もしくは“1”が格納され、“1”がフラグとして設定されている場合には、その予備ディスク31bへのIOが禁止されていることを示す。
リビルド処理部13は、例えば、いずれかのディスク31aの故障を検出した場合に、リビルド処理を実行制御する。以下、故障が検出されたディスク31aを故障ディスク31aという場合がある。この故障ディスク31aが復元対象記憶装置に相当する。なお、ディスク31aの故障は、例えば媒体エラー等の所定のエラーが閾値として設定された頻度以上で生じる場合に発生したと判断される。
リビルド処理は、RAIDグループの冗長性を自動回復する処理であり、RAIDグループに属する記憶装置31aが故障した際に、代理として用いられる予備ディスク(代理ディスク,第1の予備記憶装置)31bに対し、故障ディスク31aのデータを、同一RAIDグループにおける故障ディスク31a以外の記憶装置31aのデータを用いて再構築する処理である。以下、同一RAIDグループにおける故障ディスク31a以外の記憶装置(冗長用記憶装置)31aをリビルド元ディスク31aという場合がある。又、このリビルド元ディスクを単に元ディスクという場合もある。
つまり、リビルド処理部13は、故障ディスク31aの発生を検出すると、故障ディスク31a以外のリビルド元ディスク31aのデータを用いて、故障ディスク31aに代わる代理ディスク(リビルド先ディスク)31bに故障ディスク31aのデータを再構築する。
このように、リビルド処理部13は、複数のRAID構成ディスク31aのうち故障ディスク(復元対象記憶装置)31a以外のリビルド元ディスク(冗長用記憶装置)31aから読み出した冗長データを用いて、故障ディスク31aのデータを、予備ディスク(第1の予備記憶装置)に再構成する再構成処理部として機能する。
リビルド処理部(データ復元部)13による故障ディスク31aのデータの復元は、既知の手法で実現することができる。
同一のRAIDグループ30aを構成する複数の記憶装置31aは、各記憶装置31aのデータが他の複数の記憶装置(冗長用記憶装置)31aに分散してコピーされることにより、冗長化されている。
リビルド処理部13は、故障ディスク31aと同じRAIDグループを構成する複数の記憶装置(冗長用記憶装置)31aにそれぞれ格納されたデータを読み出して、代替ディスク31bに格納することで、故障ディスク31aのデータを代替ディスク31bに復元(データディスク構築)する。
例えば、メモリ106の所定の領域に、格納した故障ディスク31a以外の各リビルド元ディスク31aから読み出したデータを格納し、このデータに対してパリティを用いたXOR(排他的論理和)演算を行なうことで、故障ディスク31aのデータの復元を行なう。
図4は実施形態の一例としてのストレージ装置1におけるリビルド処理を説明する図である。この図4に示す例においては、RAIDグループ30aは、4本(3本+1本)のRAID構成ディスク31a−1〜31a−4によりRAID5を実現している。又、これらのRAID構成ディスク31a−1〜31a−4のうち、ディスク31a−2の故障が検知された場合を示す。
また、この図4に示す例においては、RAIDグループ30aのディスク31a−1〜31a−4を用いて3つのLUN1〜3が形成されており、これらのうちLUN1のデータ(Data1-2)を復元する例を示している。
リビルド処理部13は、ディスク31a−2の故障を検出すると、同一RAIDグループ30a内のリビルド元ディスク31a−1,31a−3,31a−4のデータ(Data1-1,1-3,1-4)を用いて、故障ディスク31a−2のデータ(復元Date1-2)を作成する(図4中の破線参照)。
そして、この作成した故障ディスク31a−2のデータ(復元Date1-2)を、故障ディスク31a−2に代わる代替ディスク(リビルド先ディスク)31b−2に格納することで、故障ディスク31a−2を再構築する。
RAIDグループ30aにおいて、複数のLUNが形成されている場合には、リビルド処理部13はLUN毎にリビルド処理を行なう。又、リビルド処理部13は、複数のLUNについてリビルドを行なう場合には、これらの複数のLUNの一覧(図示省略)と、当該一覧においてリビルド処理の進捗を示すポインタとを用いて、リビルド処理の進捗状況を管理する。
ミラーリング処理部(複製処理部)15は、リビルド処理部13によるリビルド処理中に、RAIDグループ30a内のリビルド元ディスク(冗長用記憶装置)31aからそれぞれ読み出したデータを、各リビルド元ディスク31aに割り当てられた予備ディスク(第2の予備記憶装置)31bに格納する。これにより、ミラーリング処理部15は、各リビルド元ディスク31aを予備ディスク31bに複製する。
図4に示す例においては、リビルド元ディスク31a−1に対して予備ディスク31b−1が対応付けられており、同様に、リビルド元ディスク31a−3に対して予備ディスク31b−3が、リビルド元ディスク31a−4に対して予備ディスク31b−4が、それぞれ対応付けられている。なお、このようなリビルド元ディスク31aへの予備ディスク31bの対応付けは、後述する割当処理部14が行なう。
ミラーリング処理部15は、リビルド処理部13によるリビルド処理中に、RAIDグループ30a内のリビルド元ディスク(冗長用記憶装置)31aから読み出されメモリ106に格納されたデータを、対応する予備ディスク31bに格納(デッドコピー)することで、予備ディスク31bへのリビルド元ディスク31aの複製を行なう。
すなわち、図4に示す例においては、リビルド元ディスク31a−1,31a−3,31a−4のLUN1の各データ(Data1-1,1-3,1-4)が、予備ディスク31b−1,31b−3,31b−4にそれぞれコピーされる(矢印P1〜P3参照)。
割当処理部14は、リビルド元ディスク31aに対して予備ディスク31bを対応付ける。以下、リビルド元ディスク31aに対して予備ディスク31bを対応付けることを、「割り当てる」と表現する場合がある。
また、予備ディスク31bのうち、RAID構成ディスク31aに対応付けられていないディスク31bを特に未割当予備ディスク31bという。
図4に示した例においては、リビルド元ディスク31aのそれぞれに予備ディスク31bが対応付けられている。
しかしながら、使用可能な予備ディスク31bの数がリビルド元ディスク31aの数に足りず、予備ディスク31bを全てのリビルド元ディスク31aに対応付けることができない場合もある。このような場合に、割当処理部14は、一部のリビルド元ディスク31aに対してだけ予備ディスク31bを割り当てる。
割当処理部14は、RAIDサイズ(P)とスペアdisk数(m)と制限値(L)とを参照することで、リビルド時に使用する予備ディスク31bの数を決定する。
ここで、RAIDサイズ(P)は、RAIDグループ30aにおいて実現されるRAIDを構成する記憶装置31aの数(本数)であり、RAID種類により決定される。例えば、RAID5の場合は4本(3本+1本)である(P=4)。このRAIDサイズは、RAID構成ディスク31aの数でもある。
スペアdisk数(m)は、使用可能な予備ディスク31bの数であり、例えば、ディスク構成情報63を参照することで確認することができる。制限値(L)は、例えば予備ディスク31bの数(m)がRAIDサイズ(P)未満の場合に、リビルド時に使用する最低限の予備ディスク31bの数である。例えば、制限値L=2の場合には、リビルド時に2本の予備ディスク31bが用いられることを示す。制限値(L)は、管理者等によって予め設定される。
また、割当処理部14は、予備ディスク数(m)がRAIDサイズ(P)に満たない場合に、リビルド元ディスク31aのうち、安定度が低い、すなわち、不安定なリビルド元ディスク31aに対して予備ディスク31bを優先して割り当てる。割当処理部14は、例えば、LUN管理テーブル61の項7のディスクの安定度リストを参照することで、安定度の低い、すなわち、最も不安定なリビルド元ディスク31aを知ることができる。
図5は実施形態の一例としてのストレージ装置1におけるリビルド処理を説明する図であり、予備ディスク31bが一部のリビルド元ディスク31aにだけ対応付けられた例を示す。
この図5に示す例においては、RAID構成ディスク31a−2が故障し、このRAID構成ディスク31a−2のデータがリビルド処理により代理ディスク31b−2に復元されている(図5中の破線参照)。
そして、リビルド元ディスク31a−1,31a−3,31a−4のうち、リビルド元ディスク31a−3に対してだけ予備ディスク31b−3が対応付けられており、他のリビルド元ディスク31a−1,31a−4に対しては予備ディスク31bが対応付けられていない。
全てのリビルド元ディスク31aに対して予備ディスク31bを割り当てることができない場合には、割当処理部14は安定度の低い一部のリビルド元ディスク31aに対してだけ予備ディスク31bが割り当てる。
このように、安定度の低い一部のリビルド元ディスク31aに対してだけ予備ディスク31bが割り当てられた場合には、ミラーリング処理部15は、この予備ディスク31bが割り当てられているリビルド元ディスク31aのデータを、当該リビルド元ディスク31aに対して割り当てられた予備ディスク31bにコピーする。
図5に示す例においては、リビルド元ディスク31a−3のLUN1のデータ(Data1-3)が、予備ディスク31b−3にコピーされる(矢印P4参照)。
すなわち、ミラーリング処理部15は、リビルド処理部13によるリビルド処理中に、リビルド元ディスク31a−3から読み出されメモリ106に格納されたデータを、対応する予備ディスク31b−3に格納(デッドコピー)する。これにより、予備ディスク31b−3にリビルド元ディスク31のデータの複製が行なわれる。
余分に割り当てた予備ディスク31bは、システム内で別のRAIDに故障が発生して予備ディスク31bが不足となった場合に、リビルド処理が完了していなくても、対をなすRAID構成ディスク31aが安定している予備ディスク31bから順番に、割り当てを解除することで未割当予備ディスク31bとして利用する。
IO制御部11はLUNに対するIO制御を行なう。このIO制御部11は、例えば、LUNに対してFCP(Fibre Channel Protocol)もしくはNASのIO制御を行なう。
IO制御部11は、上述した仮/実ボリューム変換テーブル62を用いて、ホスト装置2からのIO要求に応じて実ボリュームである記憶装置31に対するIO処理を行なう。IO制御部11は、ホスト装置2から送信されたIO要求に応じて、LUNを構成する記憶装置31に対して、データのリードやライトを行なう。
図6は実施形態の一例としてのストレージ装置1におけるリビルド処理を説明する図である。この図6に示す例においては、図4と同様に、RAIDグループ30aは4本のRAID構成ディスク31a−1〜31a−4によりRAID5を実現しており、又、代理ディスク31b−2に故障ディスク31a−2のデータを再構築している。特にこの図6においては、図4に示した状態の後、LUN1のリビルド処理が完了し、LUN2のリビルド処理中の状態を示す。
リビルド処理部13は、リビルド元ディスク31a−1,31a−3,31a−4のLUN2のデータ(Data2-1,2-3,2-4)を用いて、故障ディスク31a−2のLUN2のデータ(復元Date2-2)を作成する。そして、この作成した故障ディスク31a−2のLUN2のデータ(復元Date2-2)を、故障ディスク31a−2に代わる代替ディスク31b−2に格納している(図6中の破線参照)。
また、これに伴い、ミラーリング処理部15が、リビルド元ディスク(冗長用記憶装置)31a−1,31a−3,31a−4のLUN2の各データ(Data2-1,2-3,2-4)を、予備ディスク31b−1,31b−3,31b−4にそれぞれコピーしている。
この図6に示す状態において、リビルド済みのLUN1に対してホスト装置2からIO要求が行なわれると、IO制御部11は、RAIDグループ30aのRAID構成ディスク31aと、予備ディスクグループ30bの予備ディスク31bとの両方のディスクデータ域を用いてIO処理を行なう。
具体的には、LUN1のデータに対するリードアクセスが行なわれると、RAIDグループ30aのRAID構成ディスク31aと、予備ディスクグループ30bの予備ディスク31bとを併用してリード処理を行なう。例えば、IO制御部11は、RAIDグループ30aのRAID構成ディスク31aと、予備ディスクグループ30bの予備ディスク31bとをラウンドロビンで交互に選択してリード処理を行なう。
リビルド済みのLUN1のデータはRAIDグループ30aと予備ディスクグループ30bとの両方に存在し、二重化されている。
リード処理については、これらのデータはRAIDグループ30aのRAID構成ディスク31aと、予備ディスクグループ30bの予備ディスク31bとのいずれか一方から行なえばよい。本ストレージ装置1においては、ホスト装置2からのリード要求に対して、これらのRAIDグループ30aと予備ディスクグループ30bとの両方を用いてデータリードを行なう。すなわち、複数のデータリードを並列して実行できるようにすることでデータリードのパフォーマンスを向上させるとともに、ディスクアクセス負荷を分散させることで、記憶装置31の寿命を延ばすことができる。
具体的には、RAIDグループ30aのRAID構成ディスク31aと、予備ディスクグループ30bの予備ディスク31bとをラウンドロビンで交互に選択してリード処理を行なうことで、リビルド中であっても高いストレージアクセス性能を実現することができる。
一方、LUN1のデータに対するライトアクセスが行なわれると、RAIDグループ30aのRAID構成ディスク31aと、予備ディスクグループ30bの予備ディスク31bとの両方に対してライト処理を行なう。
このように、ライト処理については、RAIDグループ30aのRAID構成ディスク31aと、予備ディスクグループ30bの予備ディスク31bとで重複して行なう必要がある。しかしながら、一般に、ストレージ装置においては、ライト処理に比べてリード処理の割合が多く、リード:ライト=2:1程度であると言われているので、全体的にはライト処理を重複して行なうことによるストレージアクセス性能への影響は少ないと考えられる。
なお、図6に示す状態において、リビルドが完了していないLUN2,3に対してホスト装置2からIOコマンドが発行されると、IO制御部11は、RAIDグループ30aのRAID構成ディスク31aのディスクデータ域を用いてIO処理を行なう。
例えば、LUN2のデータに対するリードアクセスが行なわれると、IO制御部11は、RAIDグループ30aのRAID構成ディスク31aからリード処理を行なう。又、故障ディスク31a−2に対するリード処理は、この故障ディスク31a−2以外の各リビルド元ディスク(冗長用記憶装置)31a−1,31a−3,31a−4のデータに対して、パリティを用いたXOR演算を行なって故障ディスク31a−2のデータの復元を行なって対応する。
また、LUN2のデータに対するライトアクセスが行なわれると、IO制御部11は、RAIDグループ30aのRAID構成ディスク31aに対してライト処理を行なう。又、故障ディスク31a−2に対するライト処理は、この故障ディスク31a−2以外の各リビルド元ディスク(冗長用記憶装置)31a−1,31a−3,31a−4のデータに対して、パリティを用いたXOR演算を行なって故障ディスク31a−2のデータの復元を行ない、この復元したデータを用いて、予備ディスクグループ30bの代理ディスク31b−2に対してライト処理を行なう。
RAID構成変更部16は、リビルド処理部13によるリビルド処理の完了後に、RAIDグループ30aにおいて不安定なリビルド元ディスク31aがある場合には、その不安定なリビルド元ディスク31aに代えて予備ディスク31bを用いてRAID構成を組み直す。
すなわち、RAID構成変更部16は、リビルド処理部13によるリビルド処理の完了後に、安定度の低いリビルド元ディスク31aに代えて、当該リビルド元ディスク31aの複製がされた予備ディスク31bを用いて、RAID構成を変更する冗長構成変更部として機能する。
リビルド元ディスク31aが不安定であるか否かの判断は、例えば、ストレージ統計情報(ログ情報)に基づいて行なう。ストレージ統計情報において所定のエラーが閾値以上検知された場合に、不安定であると判断することができる。
ストレージ統計情報としては、例えば、各RAID構成ディスク31aにおける媒体エラーの発生数やシークエラーの発生数を用いることができる。このようなストレージ統計情報は、例えば、各ディスク31aのファーム等を参照することにより取得することができる。
RAID構成変更部16は、リビルド処理部13によりすべてのLUNのリビルド処理が完了したら、障害が検知された障害RAIDを構成するRAID構成ディスク31aと、それに対をなす予備ディスク31bの信頼性を確認して、より安定なRAID構成となるように構成を組みなおす。
なお、元のRAIDを構成するディスク群の各搭載位置を維持する必要がある場合には、元のRAIDのRAID構成ディスク31aを問題がなければ使用し続けてもよい。
図7は実施形態の一例としてのストレージ装置1におけるRAID構成変更部16によるRAID構成変更方法を示す図である。
この図7に示す例においても、図4と同様に、RAIDグループ30aは4本のRAID構成ディスク31a−1〜31a−4によりRAID5を実現しており、又、故障ディスク31a−2が代理ディスク31b−2に再構築されている。特にこの図7においては、図6に示した状態の後、LUN2,3のリビルド処理が完了した状態を示す。
すなわち、予備ディスク31b−1,31b−3,31b−4には、ミラーリング処理部15によりRAID構成ディスク31a−1,31a−3,31a−4のデータがそれぞれ複写されている。
そして、この図7に示す例においては、RAID構成ディスク31a−3が不安定であると判断された状態を示す。
リビルド処理の完了後に、RAID構成ディスク31a−3が不安定であると判断された場合に、RAID構成変更部16は、このRAID構成ディスク31a−3に代えて、RAID構成ディスク31a−3のデータが複製された予備ディスク31b−3を用いてRAIDを構成し直す。
なお、RAID構成ディスク31a−3から予備ディスク31b−3への切り替えは既知の種々の手法を用いて実現することができる。例えば、RAID構成変更部16は、不安定であると判断されたRAID構成ディスク31a−3をfail状態に設定するコマンドを発行することで、RAID構成ディスク31a−3を予備ディスク31b−3に切り替える。
また、不安定であると判断されたRAID構成ディスク31aが複数ある場合には、これらの複数のRAID構成ディスク31aについても同様に予備ディスク31bに切り替える。
また、RAID構成変更部16は、リビルド処理の完了後、不安定であると判断されていないRAID構成ディスク31aに対応する予備ディスク31bを未割当予備ディスク31bに戻す。これにより、ドライブエンクロージャ30のスロットに予備ディスク31bとして取り付けられた記憶装置31を、積極的に予備ディスク31bとして使用することができ、管理が容易になる。図7に示す例においては、予備ディスク31b−1,31b−4がフリーの未割当予備ディスク31bに戻され、RAID構成ディスク31aとの対応付けが解除される。
上述の如く構成された実施形態の一例としてのストレージ装置1におけるリビルド処理の概要を、図8に示すフローチャート(ステップA1〜A3)に従って説明する。
ステップA1において、割当処理部14は使用可能な予備ディスク31bの本数を確認して、ストレージ構成を決定する。なお、このストレージ構成の決定手法の詳細は、図9を用いて後述する。
ステップA2において、リビルド処理部13が故障ディスク31のリビルド処理を行なう。先ず、ステップA21において、RAIDグループ30aに構成されている全てのLUNについてのリビルドが完了したかを確認する。全LUNのリビルドが完了していない場合には(ステップA21のNOルート参照)、ステップA22において、リビルド処理部13が、故障ディスク31のデータを復元する。又、このリビルド処理中に、ミラーリング処理部15が、リビルド元ディスク31aから読み出されたデータを対応する予備ディスク31bにデッドコピーする。これにより、予備ディスク31bへのリビルド元ディスク31aの複製が行なわれる。
ステップA23において、処理中のLUNのリビルドが完了すると、対になるRAID構成ディスク31aと予備ディスク31bとを二重化して利用可能にする。例えば、ホスト装置2からリード要求を受信した場合には、対を形成するRAID構成ディスク31aと予備ディスク31bとからラウンドロビンで交互にリードされるようにする。又、ホスト装置2からライト処理を受信した場合には、対を形成するRAID構成ディスク31aと予備ディスク31bとの両方にライト処理が行なわれるようにする。その後、ステップA21に戻る。
なお、このリビルド処理の詳細は、図10及び図11を用いて後述する。
ステップA21において全てのLUNについての処理が完了すると(ステップA21のYESルート参照)、リビルド処理後の処理、すなわち後処理(ステップA3)に移行する。
この後処理においては、ステップA31において、RAID構成変更部16が、故障が検知されたRAID構成ディスク31aに代えて予備ディスク31bを用いてRAID構成を組み直す。
また、RAIDグループ30aにおいて不安定なRAID構成ディスク31aがある場合には、RAID構成変更部16は、その不安定なRAID構成ディスク31aに代えて、当該RAID構成ディスク31aに対応する予備ディスク31bを用いてRAID構成を組み直す。
その後、ステップA32において、ステップA31で使用されなかった予備ディスク31bを解放して、未割当予備ディスク31bに戻し、処理を終了する。
なお、故障ディスク31aや、ステップA32において不安定であると判断されたRAID構成ディスク31aは、保守作業により当該ストレージ装置1から取り外され、新しい記憶装置31と交換される。
なお、この後処理の詳細は、図12を用いて後述する。
次に、実施形態の一例としてのストレージ装置1におけるストレージ構成の決定方法を、図9に示すフローチャート(ステップB1〜B8)に従って説明する。
ステップB1において、割当処理部14が、RAIDサイズ(P),予備ディスク数(m)及び制限値(L)を確認する。
ステップB2において、割当処理部14は、“RAIDサイズP==2”,“予備ディスク数m≦1”及び“制限値L≦1”の3つの条件のうち、少なくともいずれか1つが満たされるか否かを確認する。
確認の結果、これらの3つの条件のうち、少なくともいずれか1つが満たされる場合には(ステップB2のYESルート参照)、リビルド処理部13は、従来手法によるリビルド処理を行なう。すなわち、故障ディスク31aのデータを、同一RAIDグループにおける故障ディスク31a以外のリビルド元ディスク31aのデータを用いて再構築する。又、この際、割当処理部14によるリビルド元ディスク31aに対する予備ディスク31bを割り当てや、ミラーリング処理部15によるリビルド元ディスク31aのデータの対応する代理ディスク31bへの複製は行なわれない。
ここでRAIDサイズPは、RAIDにより必要とされる記憶装置31の数を示す。従って、“RAIDサイズP==2”は、RAIDグループ30aのRAID種類がRAID1の二重化(ミラーリング)であり、リビルド処理が不要であることを意味する。又、“予備ディスク数m≦1”及び“制限値L≦1”は、いずれも予備ディスク31bが1つもしくは0であり、割当処理部14によりRAID構成ディスク31aに割り当て可能な予備ディスク31bがないことを意味する。
一方、確認の結果、上述した3つの条件のいずれも満たされない場合には(ステップB2のNOルート参照)、ステップB3において、“RAIDサイズP>制限値L”であるか否かが確認される。
RAIDサイズP>制限値Lである場合(ステップB3のYESルート参照)、ステップB4において、L(例えば、図5に示したようにL=2)本の予備ディスク31bがリビルド処理及びミラーリング処理に使用される。
一方、RAIDサイズP>制限値Lでない場合(ステップB3のNOルート参照)、ステップB5において、P(例えば、図4等に示したようにL=4)本の予備ディスク31bがリビルド処理及びミラーリング処理に使用される。
その後、ステップB6において、RAID制御部12は、記憶装置31aに故障が生じたRAIDグループ30a(故障RAID)において生き残っているRAID構成ディスク31aのストレージ統計情報を確認する。そしてRAID制御部12は、LUN管理テーブル61の項7のディスクの安定度リストとして格納する情報を作成し、LUN管理テーブル61に登録する。ストレージ統計情報として取得した各RAID構成ディスク31aのエラーの発生数に基づき、エラーの発生数に従ってRAID構成ディスク31aをソートすることで、ディスクの安定度リストを作成する。
また、ステップB7において、割当処理部14は、故障が検知されたRAID構成ディスク31aを含む不安定なRAID構成ディスク31aを優先して、RAID構成ディスク31aに予備ディスク31bを割り当てる。RAID制御部12は、LUN管理テーブル61の項6の利用予備ディスク名リストとして格納する情報を作成し、LUN管理テーブル61に登録する。
ステップB8において、RAID制御部12は、LUN管理テーブル61の項4〜12の各内容を初期化し、又、LUN管理テーブル61の項5のLUNの状態に“リビルド中”を登録して、処理を終了する。
次に、実施形態の一例としてのストレージ装置1におけるリビルド処理を、図10に示すフローチャート(ステップC1〜C10)に従って説明する。
ステップC1において、リビルド処理部13は、LUN管理テーブル61を参照することでLUN数を取得する。LUN管理テーブル61はLUN毎に作成されるので、例えばLUN管理テーブル61の数を参照することで、RAIDグループ30aに形成されているLUNの数を把握することができる。又、リビルド処理部13は、処理中のLUNを示す図示しない処理中ポインタに、最初のLUN(LUN域)を示す情報を記憶する。この処理中ポインタを参照することで、リビルド処理の進捗状況を把握することができる。
ステップC2において、リビルド処理部13は、処理中ポインタを参照して、未処理のLUN数を確認する。
未処理のLUN数が1つ以上ある場合には(ステップC2のNOルート参照)、ステップC3において、処理中LUNの情報に基づき、生き残っている各リビルド元ディスク31aを調べ、この生き残っているリビルド元ディスク31aから、RAIDストライプ分のデータを読み出し、メモリ106の所定の領域に格納する。
ステップC4において、リビルド処理部13は、各リビルド元ディスク31aから読み出したデータを用いて故障ディスク31aの復元を行なう(復元データ作成)。
ステップC5において、リビルド処理部13は、故障ディスク31に対してアサインされた予備ディスク31bの所定位置(元と同じ位置)へ復元データを書き出す。又、同時に、ミラーリング処理部15は、生き残っているリビルド元ディスク31から読み出したデータを、各リビルド元ディスク31に対応付けた(アサインした)予備ディスク31bの同じ位置へデッドコピーする。
ステップC6において、リビルド処理部13は、LUN管理テーブル61の項8のリビルド済サイズに、リビルドが完了したデータサイズ(リビルド済サイズ)を加算(up)する。
ステップC7において、リビルド処理部13は、他のRAIDの故障による予備ディスクの解放要求があるか否かを確認する。
ここで、このステップC7にかかる、予備ディスクの解放要求の有無の確認処理の詳細を、図11に示すフローチャート(ステップC71〜C77)に従って説明する。
ステップC71において、他RAIDの故障による予備ディスク31の解放要求があるか否かを確認する。他のRAIDから予備ディスク31bの解放要求がない場合には(ステップC71のNOルート参照)、処理を終了し、図10のステップC8に移行する。
他のRAIDから予備ディスク31bの解放要求がある場合には(ステップC71のYESルート参照)、ステップC72において、リビルド処理部13は、LUN管理テーブル61の項7のディスクの安定度リストを参照して、解放できる予備ディスク31bがあるか否かを確認する。対応するRAID構成ディスク31aが安定していれば予備ディスク31bが代理ディスク31bとして使用される可能性は低い。従って、LUN管理テーブル61の項7のディスクの安定度リストにおいて、安定度が高いRAID構成ディスク31aに対応付けられている予備ディスク31bは、解放して他の記憶装置31aの予備ディスク31bとして使用しても問題ないと考えられる。
そこで、例えば、LUN管理テーブル61の項7のディスクの安定度リストに、一つでもRAID構成ディスク31aが登録されていれば、解放できる予備ディスク31bがあると判断することができる。
確認の結果(ステップC73)、解放できる予備ディスク31bがある場合には(ステップC73のYESルート参照)、ステップC74において、リビルド処理部13は、LUN管理テーブル61の項12の予備ディスクのIO禁止フラグに、当該解放対象の予備ディスク31bのIOを禁止にするフラグを設定する。このIO禁止フラグが設定される予備ディスク31bは、LUN管理テーブル61の項7のディスクの安定度リストにおいて先頭に登録されているRAID構成ディスク31aに対応する予備ディスク31bであることが望ましい。
これにより、当該予備ディスク31bに対するIO処理が禁止され、最終的にIOアクセスが無くなるので、当該予備ディスク31bを使用することができるようになる。
その後、ステップC75において、リビルド処理部13は、LUN管理テーブル61の項10の予備ディスクのリード/ライト中カウンタにおいて、解放対象の予備ディスク31bのカウンタ値を確認する。
確認の結果(ステップC76)、解放予定の予備ディスク31bがリード中でなく、且つ、ライト中(RW中)でもない場合、すなわち、解放対象の予備ディスク31bに関してリード中カウンタもしくはライト中カウンタのいずれにおいても1以上の値が格納されていない場合には(ステップC76のNOルート参照)、ステップC77に移行する。
このステップC77において、リビルド処理部13は、LUN管理テーブル61の項6の利用予備ディスク名リストから、当該予備ディスク31bを削除してLUN管理テーブル61を更新する。これにより、リビルド処理部13は、その予備ディスク31bを割り当て可能な予備ディスク31bとしてシステムに返却して、処理を終了し、図10のステップC8に移行する。
また、ステップC73における確認の結果、解放できる予備ディスク31bがない場合(ステップC73のNOルート参照)や、ステップC76における確認の結果、解放予定の予備ディスク31bがリード中もしくはライト中(RW中)である場合にも(ステップC76のYESルート参照)、処理を終了し、図10のステップC8に移行する。
ステップC8において、リビルド処理部13は、処理中のLUNのリビルド処理が完了したか否かを確認する。この確認の結果(ステップC9)、リビルド処理が完了していない場合には(ステップC9のNOルート参照)、ステップC3に戻る。
一方、リビルド処理が完了した場合には(ステップC9のYESルート参照)、ステップC10に移行する。
ステップC10において、リビルド処理部13は、LUN管理テーブル61の項5のLUNの状態に“リビルド済”を設定する。又、リビルド処理部13は、未処理のLUN数をダウンして、次のLUN管理テーブル100を処理中ポインタに記憶する。その後、ステップC2に戻る。
ステップC2において、未処理のLUN数が0である場合には(ステップC2のYESルート参照)、処理を終了する。
次に、実施形態の一例としてのストレージ装置1におけるリビルド処理後の処理(後処理)を、図12に示すフローチャート(ステップD1〜D9)に従って説明する。
ステップD1において、RAID構成変更部16は、上述したリビルド処理を行なった故障ディスク31a以外のRAID構成ディスク31aについて、その統計情報を確認することで、これらのRAID構成ディスク31aに異常がないかを確認する。
ステップD2において、RAID構成変更部16は、RAID構成ディスク31aに問題の有無を確認する。この問題の有無の確認は、例えば、媒体エラーやシークエラー等の所定のエラーの発生数と閾値とを比較することで行なう。所定のエラーの発生数が閾値を越えている場合に問題があると判断することができる。
確認の結果、問題があると判断された場合には(ステップD2のNOルート参照)、ステップD3において、その問題があると判断されたRAID構成ディスク31aを、failさせるリビルド元ディスク(元ディスク)としてメモリ106等に記憶して、ステップD4に移行する。
また、ステップD2における確認の結果、問題がないと判断された場合には(ステップD2のYESルート参照)、ステップD3をスキップしてステップD4に移行する。
ステップD4において、RAID構成変更部16は、failさせるディスク31aと解放する予備ディスク31bとにIO禁止フラグを設定する。具体的には、LUN管理テーブル61の項11において、該当する記憶装置31aにIO禁止フラグを設定する。又、RAID構成変更部16は、LUN管理テーブル61の項12において、該当する予備ディスク31bにIO禁止フラグを設定する。
ステップD5において、RAID構成変更部16は、LUN管理テーブル61の項9及び項10を参照して、failさせる元ディスク及び解放する予備ディスクの各リード/ライト中カウンタの値を確認する。すなわち、これらのfailさせる元ディスク及び解放する予備ディスクが使用されておらずIOアクセスがないことを確認する。
確認の結果(ステップD6)、failさせる元ディスク及び解放する予備ディスクの各リード/ライト中カウンタの値が0でない場合には(ステップD6のNOルート参照)、ステップD7において所定の時間(例えば1秒)待った後、ステップD5に戻る。
ステップD4において、failさせる元ディスク及び解放する予備ディスクに対してIO禁止フラグを設定することにより、これらのディスク31への新規のディスクアクセスがなくなり、最終的には各リード/ライト中カウンタの値が0となる。
failさせる元ディスク及び解放する予備ディスクの各リード/ライト中カウンタの値が0である場合には(ステップD6のYESルート参照)、ステップD8に移行する。
ステップD8において、RAID構成変更部16は、RAID構成テーブル64及びLUN管理テーブル61を変更して、RAID構成を変更する。
例えば、RAID構成変更部16は、RAID構成テーブル64及びLUN管理テーブル61において、failさせる元ディスク31aに代えて、ミラーリング処理部15により、当該failさせる元ディスクのデータを複製した予備ディスク31bを登録する。これにより、RAID構成変更部16は、RAIDグループ30aにおいて不安定なリビルド元ディスク31aに代えて予備ディスク31bを用いてRAID構成を組み直す。
また、RAID構成変更部16は、LUN管理テーブル61の項6の利用予備ディスク名リストから、解放する予備ディスク31bを削除する。
ステップD9において、RAID構成変更部16は、failさせる元ディスク31aをfail状態に設定するコマンドを発行することでfailさせる。これにより、不要になった予備ディスク31bがシステムに返却(解放)されることになる。
なお、上述したステップD2において、RAID構成変更部16は、failさせる元ディスクがないと判断された場合には、ステップD4以降の処理において、failさせる元ディスクに対して行なわれる処理が省略される。
次に、実施形態の一例としてのストレージ装置1におけるリード受信時の処理を図13に示すフローチャート(ステップE1〜E13)に従って説明する。
ステップE1において、IO制御部11は、受信したリード要求がリビルド処理中のRAIDへのリードであるか否かを確認する。確認の結果(ステップE2)、リードの要求先のRAIDグループ30aがリビルド中である場合には(ステップE2のYESルート参照)、ステップE3において、IO制御部11は、受信したリード要求がリビルド処理が完了したLUN領域へのリードであるか否かを確認する。確認の結果(ステップE4)、リードの要求先が未リビルドのLUN領域である場合や(ステップE4のNOルート参照)、リードの要求先のRAIDグループ30aがリビルド中でない場合には(ステップE2のNOルート参照)、従来手法によるリード処理を行なう。
すなわち、IO制御部11は、リード要求先の記憶装置31aにアクセスして、要求されたデータを読み出し、ホスト装置2へ送信する。又、リード要求先が故障ディスク31aである場合には、この故障ディスク31a以外の各リビルド元ディスク31aのデータに対して、パリティを用いたXOR演算を行なって故障ディスク31aのデータの復元を行なってホスト装置2へ送信する。
一方、リードの要求先がリビルド済のLUN領域である場合には(ステップE4のYESルート参照)、ステップE5において、IO制御部11は、アクセス対象のRAID構成ディスク31aが二重化されているかを確認する。すなわち、アクセス対象のRAID構成ディスク31aに対して予備ディスク31bが割り当てられ、この予備ディスク31bにRAID構成ディスク31aのデータの複製が格納されているかを確認する。
確認の結果(ステップE6)、二重化されている場合には(ステップE6のYESルート参照)、ステップE7において、LUN管理テーブル61の項11及び項12のIO禁止フラグを確認する。すなわち、リード対象のRAID構成ディスク31a及びその対応する予備ディスク31bの両方のIO禁止フラグが“0(off)”であるかを確認する。
確認の結果(ステップE8)、リード対象のRAID構成ディスク31a及びその対応する予備ディスク31bの各IO禁止フラグが共にoffの場合には(ステップE8のYESルート参照)、ステップE9において、IO制御部11は、RAID構成ディスク31aと対応する予備ディスク31bとのうちの一方をラウンドロビンにより交互に選択して、リード対象ディスク31を選択する。このように、RAID構成ディスク31aのデータが予備ディスク31bにより二重化されている場合に、これらのRAID構成ディスク31aと予備ディスク31bとを交互に選択してリードを行なう。これにより、各ディスク31に対するアクセスを分散し、負荷を軽減することで寿命を延ばし、信頼性を向上させることができる。
一方、ステップE7における確認の結果、禁止フラグが共にoffではない場合、すなわち、RAID構成ディスク31a及び対応する予備ディスク31bの一方に、禁止フラグにonが設定されている場合には(ステップE8のNOルート参照)、ステップE10に移行する。
ステップE10において、IO制御部11は、RAID構成ディスク31a及び対応する予備ディスク31bのうち、IO禁止フラグにoffが設定されている方をリード対象ディスク31として選択する。
その後、ステップE11において、IO制御部11は、選択されたリード対象ディスク31について、LUN管理テーブル61の項9もしくは項10のリード/ライト中カウンタをカウントアップする。これにより、選択されたリード対象ディスク31がfailされたりフリーにされることを阻止することができ、信頼性が向上する。
また、ステップE5における確認の結果、二重化がされていない場合にも(ステップE6のNOルート参照)、このステップE11に移行する。
ステップE12において、IO制御部11は、リード対象ディスク31へリードを実行し、このリードが完了すると、ステップE13において、当該リード対象ディスク31について、LUN管理テーブル61の項9もしくは項10のリード/ライト中カウンタをカウントダウンして、処理を終了する。
次に、実施形態の実施形態の一例としてのストレージ装置1におけるライト受信時の処理を図14に示すフローチャート(ステップF1〜F14)に従って説明する。
ステップF1において、IO制御部11は、受信したライト要求がリビルド処理中のRAIDへのライトであるか否かを確認する。確認の結果(ステップF2)、ライトの要求先のRAIDグループ30aがリビルド中である場合には(ステップF2のYESルート参照)、ステップF3において、IO制御部11は、受信したライト要求がリビルド処理が完了したLUN領域へのライトであるか否かを確認する。確認の結果(ステップF4)、ライトの要求先が未リビルドのLUN領域である場合や(ステップF4のNOルート参照)、ライトの要求先のRAIDグループ30aがリビルド中でない場合には(ステップF2のNOルート参照)、従来手法によるライト処理を行なう。
すなわち、IO制御部11は、ライト要求先の記憶装置31aにアクセスして、要求されたデータを書き込む。又、ライト要求先が故障ディスク31aである場合には、この故障ディスク31a以外の各リビルド元ディスク31aのデータに対して、パリティを用いたXOR演算を行なって故障ディスク31aのデータの復元を行ない、この復元したデータとつき合わせをしながらデータのライトを行なう。
一方、ライトの要求先がリビルド済のLUN領域である場合には(ステップF4のYESルート参照)、ステップF5において、IO制御部11は、ライトデータとRAIDメンバディスクのデータからパリティデータを生成する。
その後、ステップF6において、IO制御部11は、書き出し対象のRAID構成ディスク31aが二重化されているかを確認する。すなわち、アクセス対象のRAID構成ディスク31aに対して予備ディスク31bが割り当てられ、この予備ディスク31bにRAID構成ディスク31aのデータの複製が格納されているかを確認する。
確認の結果(ステップF7)、二重化されている場合には(ステップF7のYESルート参照)、ステップF8において、LUN管理テーブル61の項11及び項12のIO禁止フラグを確認する。すなわち、ライト対象のRAID構成ディスク31a及びその対応する予備ディスク31bの両方のIO禁止フラグが“0(off)”であるかを確認する。
確認の結果(ステップF9)、ライト対象のRAID構成ディスク31a及びその対応する予備ディスク31bの各IO禁止フラグが共にoffの場合には(ステップF9のYESルート参照)、ステップF10において、IO制御部11は、RAID構成ディスク31aと対応する予備ディスク31bとを二重書きの対象ディスク31として選択する。
一方、ステップF8における確認の結果、禁止フラグが共にoffではない場合、すなわち、RAID構成ディスク31a及び対応する予備ディスク31bの一方に、禁止フラグにonが設定されている場合には(ステップF9のNOルート参照)、ステップF11に移行する。
ステップF11において、IO制御部11は、RAID構成ディスク31a及び対応する予備ディスク31bのうち、IO禁止フラグにoffが設定されている方をライト対象ディスク31として選択する。
その後、ステップF12において、IO制御部11は、選択されたライト対象ディスク31について、LUN管理テーブル61の項9もしくは項10のリード/ライト中カウンタをカウントアップする。これにより、選択されたライト対象ディスク31がfailされたりフリーにされることを阻止することができ、信頼性が向上する。
また、ステップF6における確認の結果、二重化がされていない場合にも(ステップF7のNOルート参照)、このステップF12に移行する。
ステップF13において、IO制御部11は、ライト対象ディスク31へライトを実行し、このライトが完了すると、ステップF14において、当該ライト対象ディスク31について、LUN管理テーブル61の項9もしくは項10のリード/ライト中カウンタをカウントダウンして、処理を終了する。
このように、実施形態の一例としてのストレージ装置1によれば、ミラーリング処理部15がRAID構成ディスク31aの複製を、当該RAID構成ディスク31aに対応する予備ディスク31bに作成することで、各RAID構成ディスク31aのデータを冗長化することができる。これにより、複数のRAID構成ディスク31aが故障した場合でも、予備ディスク31bを用いてRAIDを構成しなおすことにより、RAID内の全データのロストの発生を阻止することができる。これにより信頼性を向上させることができる。
また、リビルド処理が完了したLUNは、リビルド処理による性能劣化の影響が緩和され、データ保護状態に速やかに戻ることができる。
リード時において、冗長化されたRAID構成ディスク31aのデータと予備ディスク31bのデータとをラウンドロビンで交互に選択してリード処理を行なうことで、リビルド中であっても高いストレージアクセス性能を実現することができる。更に、リード時に、冗長化されたRAID構成ディスク31aと予備ディスク31bとを均等に用いることで負荷を分散させることができる。
RAID構成変更部16が、リビルド処理の完了時点で、RAIDグループ30a内に不安定なRAID構成ディスク31aを検知した場合に、この不安定なRAID構成ディスク31aに代えて対応する予備ディスク31bを用いてRAIDを構成し直す。これにより、RAID構成ディスク31aの故障を未然に阻止することができ、信頼性を向上させることができる。
ミラーリング処理部15が、リビルド時にリビルド元ディスク31aからメモリ106に読み出されたデータを、当該リビルド元ディスク31aに対応する予備ディスク31bにデッドコピーすることで、リビルド元ディスク31aの複製を予備ディスク31bに容易に作成することができる。この際、コントローラ100のCPU110等による特別な制御が不要であり、コントローラ100の負荷の増大や処理速度の低下が発生することがない。
そして、開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。本実施形態の各構成及び各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。
例えば、上述した実施形態においては、リビルド処理部13がいずれかの記憶装置31aの故障を検知した場合にリビルド処理を行なっている例を示しているが、これに限定されるものではない。例えば、いずれかの記憶装置31a故障の発生が予測される場合に、この故障の発生が予測される記憶装置31aを故障ディスク31aとしてリビルド処理を行なってもよく、又、予防保守の観点等から、異常のない記憶装置31aを故障ディスク31aとしてリビルド処理を行なってもよい。
また、上述した実施形態においては、RAIDグループ30aが4本(3本+1本)のRAID構成ディスク31aによりRAID5を実現している例を示しているが、これに限定されるものではない。例えば、RAID2〜4やRAID50(5+0)、RAID6,RAID10等、種々変形して実施することができる。
上述した実施形態においては、IO制御部11が、RAIDグループ30aのRAID構成ディスク31aと、予備ディスクグループ30bの予備ディスク31bとをラウンドロビンで交互に選択してリード処理を行なっているが、これに限定されるものではない。すなわち、RAID構成ディスク31aと、このRAID構成ディスク31aの複製が格納された予備ディスク31bとから必ずしも交互にデータリードを行なう必要はなく、結果として均等にデータのリードを行なうことで負荷が分散できればよい。
また、上述した開示により本実施形態を当業者によって実施・製造することが可能である。
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
冗長構成がなされた複数の記憶装置及び複数の予備記憶装置と通信路を介して通信可能に接続されるストレージ制御装置であって、
前記複数の記憶装置のうち復元対象記憶装置以外の冗長用記憶装置から読み出した冗長データを用いて、前記復元対象記憶装置のデータを、前記複数の予備記憶装置のうちの第1の予備記憶装置に再構成する再構成処理部と、
前記再構成処理部による再構成を行なう際に前記冗長用記憶装置から読み出したデータを、前記複数の予備記憶装置のうちの前記冗長用記憶装置に対応する第2の予備記憶装置に格納することで、前記冗長用記憶装置の複製を行なう複製処理部と
を備えることを特徴とする、ストレージ制御装置。
(付記2)
リード要求受信時には、前記冗長用記憶装置と、当該冗長用記憶装置のデータを格納する前記第2の予備記憶装置とを併用することを特徴とする、付記1記載のストレージ制御装置。
(付記3)
ライト要求受信時には、前記冗長用記憶装置及び当該冗長用記憶装置のデータを格納する前記予備記憶装置の双方に書き込みを行なうことを特徴とする、付記1又は2記載のストレージ制御装置。
(付記4)
前記記憶装置に対して前記予備記憶装置を割り当てる割当処理部を備え、
前記複製処理部が、前記冗長用記憶装置から読み出したデータを、前記割当処理部が割り当てた前記予備記憶装置に格納することを特徴とする、付記1〜3のいずれか1項に記載のストレージ制御装置。
(付記5)
前記記憶装置に割り当て可能な前記予備記憶装置の数が前記記憶装置の数よりも少ない場合に、
前記割当処理部が、
前記予備記憶装置を、安定度の低い前記記憶装置から優先して割り当てることを特徴とする、付記4記載のストレージ制御装置。
(付記6)
前記再構成処理部による再構成の完了後に、安定度の低い前記冗長用記憶装置に代えて、当該安定度の低い前記冗長用記憶装置の複製がされた前記予備記憶装置を用いて、前記冗長構成を変更する冗長構成変更部を備えることを特徴とする、付記1〜付記5のいずれか1項に記載のストレージ制御装置。
(付記7)
冗長構成がなされた複数の記憶装置と、
複数の予備記憶装置と、
前記複数の記憶装置のうち復元対象記憶装置以外の冗長用記憶装置から読み出した冗長データを用いて、前記復元対象記憶装置のデータを、前記複数の予備記憶装置のうちの第1の予備記憶装置に再構成する再構成処理部と、
前記再構成処理部による再構成を行なう際に前記記憶装置から読み出したデータを、前記複数の予備記憶装置のうちの前記冗長用記憶装置に対応する第2の予備記憶装置に格納することで、前記冗長用記憶装置の複製を行なう複製処理部と
を備えることを特徴とする、ストレージシステム。
(付記8)
リード要求受信時には、前記冗長用記憶装置と、当該冗長用記憶装置のデータを格納する前記第2の予備記憶装置とを併用することを特徴とする、付記7記載のストレージシステム。
(付記9)
ライト要求受信時には、前記冗長用記憶装置及び当該冗長用記憶装置のデータを格納する前記予備記憶装置の双方に書き込みを行なうことを特徴とする、付記7又は8記載のストレージシステム。
(付記10)
前記記憶装置に対して前記予備記憶装置を割り当てる割当処理部を備え、
前記複製処理部が、前記冗長用記憶装置から読み出したデータを、前記割当処理部が割り当てた前記予備記憶装置に格納することを特徴とする、付記7〜9のいずれか1項に記載のストレージシステム。
(付記11)
前記記憶装置に割り当て可能な前記予備記憶装置の数が前記記憶装置の数よりも少ない場合に、
前記割当処理部が、
前記予備記憶装置を、安定度の低い前記記憶装置から優先して割り当てることを特徴とする、付記10記載のストレージシステム。
(付記12)
前記再構成処理部による再構成の完了後に、安定度の低い前記冗長用記憶装置に代えて、当該安定度の低い前記冗長用記憶装置の複製がされた前記予備記憶装置を用いて、前記冗長構成を変更する冗長構成変更部を備えることを特徴とする、付記7〜付記11のいずれか1項に記載のストレージシステム。
(付記13)
冗長構成がなされた複数の記憶装置及び複数の予備記憶装置と通信路を介して通信可能に接続されるコンピュータに、
前記複数の記憶装置のうち復元対象記憶装置以外の冗長用記憶装置から読み出した冗長データを用いて、前記復元対象記憶装置のデータを、前記複数の予備記憶装置のうちの第1の予備記憶装置に再構成し、
前記再構成を行なう際に前記冗長用記憶装置から読み出したデータを、前記複数の予備記憶装置のうちの前記冗長用記憶装置に対応する第2の予備記憶装置に格納することで、前記冗長用記憶装置の複製を行なう
処理を実行させることを特徴とする、制御プログラム。
(付記14)
リード要求受信時には、前記冗長用記憶装置と、当該冗長用記憶装置のデータを格納する前記第2の予備記憶装置とを併用する
処理を前記コンピュータに実行させることを特徴とする、付記13記載の制御プログラム。
(付記15)
ライト要求受信時には、前記冗長用記憶装置及び当該冗長用記憶装置のデータを格納する前記予備記憶装置の双方に書き込みを行なう
処理を前記コンピュータに実行させることを特徴とする、付記13又は14記載の制御プログラム。
(付記16)
前記記憶装置に対して前記予備記憶装置を割り当て、
前記冗長用記憶装置から読み出したデータを、前記割当処理部が割り当てた前記予備記憶装置に格納する
処理を前記コンピュータに実行させることを特徴とする、付記13〜15のいずれか1項に記載の制御プログラム。
(付記17)
前記記憶装置に割り当て可能な前記予備記憶装置の数が前記記憶装置の数よりも少ない場合に、
前記予備記憶装置を、安定度の低い前記記憶装置から優先して割り当てる
処理を前記コンピュータに実行させることを特徴とする、付記16記載の制御プログラム。
(付記18)
前記再構成の完了後に、安定度の低い前記冗長用記憶装置に代えて、当該安定度の低い前記冗長用記憶装置の複製がされた前記予備記憶装置を用いて、前記冗長構成を変更する
処理を前記コンピュータに実行させることを特徴とする、付記13〜付記17のいずれか1項に記載の制御プログラム。
1 ストレージ装置
2 ホスト装置
3a,3b スイッチ
4 ストレージシステム
11 IO制御部
12 RAID制御部
13 リビルド処理部
14 割当処理部
15 ミラーリング処理部
16 RAID構成変更部
30 ドライブエンクロージャ
30a RAIDグループ
30b 予備ディスクグループ
31 記憶装置
31a,31a−1〜31a−4 記憶装置(RAID構成ディスク,リビルド元ディスク)
31b,31b−1〜31b−4 予備ディスク
40 コントローラエンクロージャ
61 LUN管理テーブル
62 仮/実ボリューム変換テーブル
63 ディスク構成情報
64 RAID構成テーブル
100 コントローラ(ストレージ制御装置)
101a,101b ポート
103 DA
106 メモリ
107 SSD
108 IOC
110 CPU

Claims (8)

  1. 冗長構成がなされた複数の記憶装置及び複数の予備記憶装置と通信路を介して通信可能に接続されるストレージ制御装置であって、
    前記複数の記憶装置のうち復元対象記憶装置以外の冗長用記憶装置から読み出した冗長データを用いて、前記復元対象記憶装置のデータを、前記複数の予備記憶装置のうちの第1の予備記憶装置に再構成する再構成処理部と、
    前記再構成処理部による再構成を行なう際に、前記再構成処理部が前記冗長用記憶装置から読み出したデータを利用して、前記複数の予備記憶装置における、当該データを読み出した前記冗長用記憶装置に対応する第2の予備記憶装置に格納することで、前記冗長用記憶装置の複製を行なう複製処理部と
    を備えることを特徴とする、ストレージ制御装置。
  2. リード要求受信時には、前記冗長用記憶装置と、当該冗長用記憶装置のデータを格納する前記第2の予備記憶装置とを併用することを特徴とする、請求項1記載のストレージ制御装置。
  3. ライト要求受信時には、前記冗長用記憶装置及び当該冗長用記憶装置のデータを格納する前記予備記憶装置の双方に書き込みを行なうことを特徴とする、請求項1又は2記載のストレージ制御装置。
  4. 前記記憶装置に対して前記予備記憶装置を割り当てる割当処理部を備え、
    前記複製処理部が、前記冗長用記憶装置から読み出したデータを、前記割当処理部が割り当てた前記予備記憶装置に格納することを特徴とする、請求項1〜3のいずれか1項に記載のストレージ制御装置。
  5. 前記記憶装置に割り当て可能な前記予備記憶装置の数が前記記憶装置の数よりも少ない場合に、
    前記割当処理部が、
    前記予備記憶装置を、安定度の低い前記記憶装置から優先して割り当てることを特徴とする、請求項4記載のストレージ制御装置。
  6. 前記再構成処理部による再構成の完了後に、安定度の低い前記冗長用記憶装置に代えて、当該安定度の低い前記冗長用記憶装置の複製がされた前記予備記憶装置を用いて、前記冗長構成を変更する冗長構成変更部を備えることを特徴とする、請求項1〜請求項5のいずれか1項に記載のストレージ制御装置。
  7. 冗長構成がなされた複数の記憶装置と、
    複数の予備記憶装置と、
    前記複数の記憶装置のうち復元対象記憶装置以外の冗長用記憶装置から読み出した冗長データを用いて、前記復元対象記憶装置のデータを、前記複数の予備記憶装置のうちの第1の予備記憶装置に再構成する再構成処理部と、
    前記再構成処理部による再構成を行なう際に、前記再構成処理部が前記冗長用記憶装置から読み出したデータを利用して、前記複数の予備記憶装置における、当該データを読み出した前記冗長用記憶装置に対応する第2の予備記憶装置に格納することで、前記冗長用記憶装置の複製を行なう複製処理部と
    を備えることを特徴とする、ストレージシステム。
  8. 冗長構成がなされた複数の記憶装置及び複数の予備記憶装置と通信路を介して通信可能に接続されるコンピュータに、
    前記複数の記憶装置のうち復元対象記憶装置以外の冗長用記憶装置から読み出した冗長データを用いて、前記復元対象記憶装置のデータを、前記複数の予備記憶装置のうちの第
    1の予備記憶装置に再構成し、
    前記再構成を行なう際に前記冗長用記憶装置から読み出したデータを利用して、前記複数の予備記憶装置における、当該データを読み出した前記冗長用記憶装置に対応する第2の予備記憶装置に格納することで、前記冗長用記憶装置の複製を行なう
    処理を実行させることを特徴とする、制御プログラム。
JP2014030390A 2014-02-20 2014-02-20 ストレージ制御装置,ストレージシステム及び制御プログラム Expired - Fee Related JP6233086B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014030390A JP6233086B2 (ja) 2014-02-20 2014-02-20 ストレージ制御装置,ストレージシステム及び制御プログラム
US14/559,389 US9697087B2 (en) 2014-02-20 2014-12-03 Storage controller to perform rebuilding while copying, and storage system, and control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014030390A JP6233086B2 (ja) 2014-02-20 2014-02-20 ストレージ制御装置,ストレージシステム及び制御プログラム

Publications (2)

Publication Number Publication Date
JP2015156081A JP2015156081A (ja) 2015-08-27
JP6233086B2 true JP6233086B2 (ja) 2017-11-22

Family

ID=53798218

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014030390A Expired - Fee Related JP6233086B2 (ja) 2014-02-20 2014-02-20 ストレージ制御装置,ストレージシステム及び制御プログラム

Country Status (2)

Country Link
US (1) US9697087B2 (ja)
JP (1) JP6233086B2 (ja)

Families Citing this family (137)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8819208B2 (en) 2010-03-05 2014-08-26 Solidfire, Inc. Data deletion in a distributed data storage system
US11614893B2 (en) 2010-09-15 2023-03-28 Pure Storage, Inc. Optimizing storage device access based on latency
US8589625B2 (en) 2010-09-15 2013-11-19 Pure Storage, Inc. Scheduling of reconstructive I/O read operations in a storage environment
US8589655B2 (en) 2010-09-15 2013-11-19 Pure Storage, Inc. Scheduling of I/O in an SSD environment
US11275509B1 (en) 2010-09-15 2022-03-15 Pure Storage, Inc. Intelligently sizing high latency I/O requests in a storage environment
US8732426B2 (en) 2010-09-15 2014-05-20 Pure Storage, Inc. Scheduling of reactive I/O operations in a storage environment
US8468318B2 (en) 2010-09-15 2013-06-18 Pure Storage Inc. Scheduling of I/O writes in a storage environment
US9244769B2 (en) 2010-09-28 2016-01-26 Pure Storage, Inc. Offset protection data in a RAID array
US8775868B2 (en) 2010-09-28 2014-07-08 Pure Storage, Inc. Adaptive RAID for an SSD environment
US8589640B2 (en) 2011-10-14 2013-11-19 Pure Storage, Inc. Method for maintaining multiple fingerprint tables in a deduplicating storage system
US11636031B2 (en) 2011-08-11 2023-04-25 Pure Storage, Inc. Optimized inline deduplication
US9838269B2 (en) 2011-12-27 2017-12-05 Netapp, Inc. Proportional quality of service based on client usage and system metrics
US9054992B2 (en) 2011-12-27 2015-06-09 Solidfire, Inc. Quality of service policy sets
US8719540B1 (en) 2012-03-15 2014-05-06 Pure Storage, Inc. Fractal layout of data blocks across multiple devices
US11032259B1 (en) 2012-09-26 2021-06-08 Pure Storage, Inc. Data protection in a storage system
US10623386B1 (en) 2012-09-26 2020-04-14 Pure Storage, Inc. Secret sharing data protection in a storage system
US8745415B2 (en) 2012-09-26 2014-06-03 Pure Storage, Inc. Multi-drive cooperation to generate an encryption key
US11733908B2 (en) 2013-01-10 2023-08-22 Pure Storage, Inc. Delaying deletion of a dataset
US9646039B2 (en) 2013-01-10 2017-05-09 Pure Storage, Inc. Snapshots in a storage system
US10908835B1 (en) 2013-01-10 2021-02-02 Pure Storage, Inc. Reversing deletion of a virtual machine
US11768623B2 (en) 2013-01-10 2023-09-26 Pure Storage, Inc. Optimizing generalized transfers between storage systems
US10263770B2 (en) 2013-11-06 2019-04-16 Pure Storage, Inc. Data protection in a storage system using external secrets
US10365858B2 (en) 2013-11-06 2019-07-30 Pure Storage, Inc. Thin provisioning in a storage device
US11128448B1 (en) 2013-11-06 2021-09-21 Pure Storage, Inc. Quorum-aware secret sharing
US9516016B2 (en) 2013-11-11 2016-12-06 Pure Storage, Inc. Storage array password management
US9208086B1 (en) 2014-01-09 2015-12-08 Pure Storage, Inc. Using frequency domain to prioritize storage of metadata in a cache
US20150244795A1 (en) 2014-02-21 2015-08-27 Solidfire, Inc. Data syncing in a distributed system
US10656864B2 (en) 2014-03-20 2020-05-19 Pure Storage, Inc. Data replication within a flash storage array
US9513820B1 (en) 2014-04-07 2016-12-06 Pure Storage, Inc. Dynamically controlling temporary compromise on data redundancy
US9779268B1 (en) 2014-06-03 2017-10-03 Pure Storage, Inc. Utilizing a non-repeating identifier to encrypt data
US11399063B2 (en) 2014-06-04 2022-07-26 Pure Storage, Inc. Network authentication for a storage system
US9218244B1 (en) 2014-06-04 2015-12-22 Pure Storage, Inc. Rebuilding data across storage nodes
US9218407B1 (en) 2014-06-25 2015-12-22 Pure Storage, Inc. Replication and intermediate read-write state for mediums
US10496556B1 (en) 2014-06-25 2019-12-03 Pure Storage, Inc. Dynamic data protection within a flash storage system
US10296469B1 (en) 2014-07-24 2019-05-21 Pure Storage, Inc. Access control in a flash storage system
US9558069B2 (en) 2014-08-07 2017-01-31 Pure Storage, Inc. Failure mapping in a storage array
US9495255B2 (en) 2014-08-07 2016-11-15 Pure Storage, Inc. Error recovery in a storage cluster
US9864761B1 (en) 2014-08-08 2018-01-09 Pure Storage, Inc. Read optimization operations in a storage system
US10430079B2 (en) 2014-09-08 2019-10-01 Pure Storage, Inc. Adjusting storage capacity in a computing system
US10133511B2 (en) 2014-09-12 2018-11-20 Netapp, Inc Optimized segment cleaning technique
US10164841B2 (en) 2014-10-02 2018-12-25 Pure Storage, Inc. Cloud assist for storage systems
US9489132B2 (en) 2014-10-07 2016-11-08 Pure Storage, Inc. Utilizing unmapped and unknown states in a replicated storage system
US10430282B2 (en) 2014-10-07 2019-10-01 Pure Storage, Inc. Optimizing replication by distinguishing user and system write activity
US9836229B2 (en) 2014-11-18 2017-12-05 Netapp, Inc. N-way merge technique for updating volume metadata in a storage I/O stack
US9727485B1 (en) 2014-11-24 2017-08-08 Pure Storage, Inc. Metadata rewrite and flatten optimization
US9773007B1 (en) 2014-12-01 2017-09-26 Pure Storage, Inc. Performance improvements in a storage system
US9588842B1 (en) * 2014-12-11 2017-03-07 Pure Storage, Inc. Drive rebuild
US9552248B2 (en) 2014-12-11 2017-01-24 Pure Storage, Inc. Cloud alert to replica
US9864769B2 (en) 2014-12-12 2018-01-09 Pure Storage, Inc. Storing data utilizing repeating pattern detection
US10545987B2 (en) 2014-12-19 2020-01-28 Pure Storage, Inc. Replication to the cloud
US9569357B1 (en) 2015-01-08 2017-02-14 Pure Storage, Inc. Managing compressed data in a storage system
US11947968B2 (en) 2015-01-21 2024-04-02 Pure Storage, Inc. Efficient use of zone in a storage device
US10296354B1 (en) 2015-01-21 2019-05-21 Pure Storage, Inc. Optimized boot operations within a flash storage array
US9710165B1 (en) 2015-02-18 2017-07-18 Pure Storage, Inc. Identifying volume candidates for space reclamation
US10082985B2 (en) 2015-03-27 2018-09-25 Pure Storage, Inc. Data striping across storage nodes that are assigned to multiple logical arrays
US10178169B2 (en) 2015-04-09 2019-01-08 Pure Storage, Inc. Point to point based backend communication layer for storage processing
US10140149B1 (en) 2015-05-19 2018-11-27 Pure Storage, Inc. Transactional commits with hardware assists in remote memory
US9547441B1 (en) 2015-06-23 2017-01-17 Pure Storage, Inc. Exposing a geometry of a storage device
US10310740B2 (en) 2015-06-23 2019-06-04 Pure Storage, Inc. Aligning memory access operations to a geometry of a storage device
US11341136B2 (en) 2015-09-04 2022-05-24 Pure Storage, Inc. Dynamically resizable structures for approximate membership queries
KR20170028825A (ko) 2015-09-04 2017-03-14 퓨어 스토리지, 아이앤씨. 압축된 인덱스들을 사용한 해시 테이블들에서의 메모리 효율적인 스토리지 및 탐색
US11269884B2 (en) 2015-09-04 2022-03-08 Pure Storage, Inc. Dynamically resizable structures for approximate membership queries
US9843453B2 (en) 2015-10-23 2017-12-12 Pure Storage, Inc. Authorizing I/O commands with I/O tokens
US10235059B2 (en) * 2015-12-01 2019-03-19 Netapp, Inc. Technique for maintaining consistent I/O processing throughput in a storage system
US10929022B2 (en) 2016-04-25 2021-02-23 Netapp. Inc. Space savings reporting for storage system supporting snapshot and clones
US10452297B1 (en) 2016-05-02 2019-10-22 Pure Storage, Inc. Generating and optimizing summary index levels in a deduplication storage system
US10133503B1 (en) 2016-05-02 2018-11-20 Pure Storage, Inc. Selecting a deduplication process based on a difference between performance metrics
US10203903B2 (en) 2016-07-26 2019-02-12 Pure Storage, Inc. Geometry based, space aware shelf/writegroup evacuation
US10365958B2 (en) 2016-09-13 2019-07-30 Hewlett Packard Enterprise Development Lp Storage drive management to fail a storage drive based on adjustable failure criteria
US10642763B2 (en) 2016-09-20 2020-05-05 Netapp, Inc. Quality of service policy sets
US10545861B2 (en) 2016-10-04 2020-01-28 Pure Storage, Inc. Distributed integrated high-speed solid-state non-volatile random-access memory
US10756816B1 (en) 2016-10-04 2020-08-25 Pure Storage, Inc. Optimized fibre channel and non-volatile memory express access
US10191662B2 (en) 2016-10-04 2019-01-29 Pure Storage, Inc. Dynamic allocation of segments in a flash storage system
US10162523B2 (en) 2016-10-04 2018-12-25 Pure Storage, Inc. Migrating data between volumes using virtual copy operation
US10481798B2 (en) 2016-10-28 2019-11-19 Pure Storage, Inc. Efficient flash management for multiple controllers
US10185505B1 (en) 2016-10-28 2019-01-22 Pure Storage, Inc. Reading a portion of data to replicate a volume based on sequence numbers
US10359942B2 (en) 2016-10-31 2019-07-23 Pure Storage, Inc. Deduplication aware scalable content placement
US10452290B2 (en) 2016-12-19 2019-10-22 Pure Storage, Inc. Block consolidation in a direct-mapped flash storage system
US11550481B2 (en) 2016-12-19 2023-01-10 Pure Storage, Inc. Efficiently writing data in a zoned drive storage system
US11093146B2 (en) 2017-01-12 2021-08-17 Pure Storage, Inc. Automatic load rebalancing of a write group
US10528488B1 (en) 2017-03-30 2020-01-07 Pure Storage, Inc. Efficient name coding
US11403019B2 (en) 2017-04-21 2022-08-02 Pure Storage, Inc. Deduplication-aware per-tenant encryption
US10944671B2 (en) 2017-04-27 2021-03-09 Pure Storage, Inc. Efficient data forwarding in a networked device
US10402266B1 (en) 2017-07-31 2019-09-03 Pure Storage, Inc. Redundant array of independent disks in a direct-mapped flash storage system
US10831935B2 (en) 2017-08-31 2020-11-10 Pure Storage, Inc. Encryption management with host-side data reduction
US10776202B1 (en) 2017-09-22 2020-09-15 Pure Storage, Inc. Drive, blade, or data shard decommission via RAID geometry shrinkage
US10789211B1 (en) 2017-10-04 2020-09-29 Pure Storage, Inc. Feature-based deduplication
US10884919B2 (en) 2017-10-31 2021-01-05 Pure Storage, Inc. Memory management in a storage system
US10860475B1 (en) 2017-11-17 2020-12-08 Pure Storage, Inc. Hybrid flash translation layer
US11144638B1 (en) 2018-01-18 2021-10-12 Pure Storage, Inc. Method for storage system detection and alerting on potential malicious action
US10970395B1 (en) 2018-01-18 2021-04-06 Pure Storage, Inc Security threat monitoring for a storage system
US11010233B1 (en) 2018-01-18 2021-05-18 Pure Storage, Inc Hardware-based system monitoring
US10467527B1 (en) 2018-01-31 2019-11-05 Pure Storage, Inc. Method and apparatus for artificial intelligence acceleration
US11036596B1 (en) 2018-02-18 2021-06-15 Pure Storage, Inc. System for delaying acknowledgements on open NAND locations until durability has been confirmed
US11494109B1 (en) 2018-02-22 2022-11-08 Pure Storage, Inc. Erase block trimming for heterogenous flash memory storage devices
US11934322B1 (en) 2018-04-05 2024-03-19 Pure Storage, Inc. Multiple encryption keys on storage drives
US11385792B2 (en) 2018-04-27 2022-07-12 Pure Storage, Inc. High availability controller pair transitioning
US10678433B1 (en) 2018-04-27 2020-06-09 Pure Storage, Inc. Resource-preserving system upgrade
CN110413208B (zh) * 2018-04-28 2023-05-30 伊姆西Ip控股有限责任公司 用于管理存储系统的方法、设备和计算机程序产品
US10678436B1 (en) 2018-05-29 2020-06-09 Pure Storage, Inc. Using a PID controller to opportunistically compress more data during garbage collection
US11436023B2 (en) 2018-05-31 2022-09-06 Pure Storage, Inc. Mechanism for updating host file system and flash translation layer based on underlying NAND technology
US10776046B1 (en) 2018-06-08 2020-09-15 Pure Storage, Inc. Optimized non-uniform memory access
US11281577B1 (en) 2018-06-19 2022-03-22 Pure Storage, Inc. Garbage collection tuning for low drive wear
US11869586B2 (en) 2018-07-11 2024-01-09 Pure Storage, Inc. Increased data protection by recovering data from partially-failed solid-state devices
US11133076B2 (en) 2018-09-06 2021-09-28 Pure Storage, Inc. Efficient relocation of data between storage devices of a storage system
US11194759B2 (en) 2018-09-06 2021-12-07 Pure Storage, Inc. Optimizing local data relocation operations of a storage device of a storage system
US10846216B2 (en) 2018-10-25 2020-11-24 Pure Storage, Inc. Scalable garbage collection
US11113409B2 (en) 2018-10-26 2021-09-07 Pure Storage, Inc. Efficient rekey in a transparent decrypting storage array
US11194473B1 (en) 2019-01-23 2021-12-07 Pure Storage, Inc. Programming frequently read data to low latency portions of a solid-state storage array
US11588633B1 (en) 2019-03-15 2023-02-21 Pure Storage, Inc. Decommissioning keys in a decryption storage system
US11334254B2 (en) 2019-03-29 2022-05-17 Pure Storage, Inc. Reliability based flash page sizing
US11397674B1 (en) 2019-04-03 2022-07-26 Pure Storage, Inc. Optimizing garbage collection across heterogeneous flash devices
US11775189B2 (en) 2019-04-03 2023-10-03 Pure Storage, Inc. Segment level heterogeneity
US10990480B1 (en) 2019-04-05 2021-04-27 Pure Storage, Inc. Performance of RAID rebuild operations by a storage group controller of a storage system
US11099986B2 (en) 2019-04-12 2021-08-24 Pure Storage, Inc. Efficient transfer of memory contents
US11487665B2 (en) 2019-06-05 2022-11-01 Pure Storage, Inc. Tiered caching of data in a storage system
US11281394B2 (en) 2019-06-24 2022-03-22 Pure Storage, Inc. Replication across partitioning schemes in a distributed storage system
US10929046B2 (en) 2019-07-09 2021-02-23 Pure Storage, Inc. Identifying and relocating hot data to a cache determined with read velocity based on a threshold stored at a storage device
US11422751B2 (en) 2019-07-18 2022-08-23 Pure Storage, Inc. Creating a virtual storage system
US11086713B1 (en) 2019-07-23 2021-08-10 Pure Storage, Inc. Optimized end-to-end integrity storage system
US11403043B2 (en) 2019-10-15 2022-08-02 Pure Storage, Inc. Efficient data compression by grouping similar data within a data segment
US11651075B2 (en) 2019-11-22 2023-05-16 Pure Storage, Inc. Extensible attack monitoring by a storage system
US11687418B2 (en) 2019-11-22 2023-06-27 Pure Storage, Inc. Automatic generation of recovery plans specific to individual storage elements
US11520907B1 (en) 2019-11-22 2022-12-06 Pure Storage, Inc. Storage system snapshot retention based on encrypted data
US11625481B2 (en) 2019-11-22 2023-04-11 Pure Storage, Inc. Selective throttling of operations potentially related to a security threat to a storage system
US11720714B2 (en) 2019-11-22 2023-08-08 Pure Storage, Inc. Inter-I/O relationship based detection of a security threat to a storage system
US11341236B2 (en) 2019-11-22 2022-05-24 Pure Storage, Inc. Traffic-based detection of a security threat to a storage system
US11645162B2 (en) 2019-11-22 2023-05-09 Pure Storage, Inc. Recovery point determination for data restoration in a storage system
US11720692B2 (en) 2019-11-22 2023-08-08 Pure Storage, Inc. Hardware token based management of recovery datasets for a storage system
US11675898B2 (en) 2019-11-22 2023-06-13 Pure Storage, Inc. Recovery dataset management for security threat monitoring
US11615185B2 (en) 2019-11-22 2023-03-28 Pure Storage, Inc. Multi-layer security threat detection for a storage system
US11657155B2 (en) 2019-11-22 2023-05-23 Pure Storage, Inc Snapshot delta metric based determination of a possible ransomware attack against data maintained by a storage system
US11755751B2 (en) 2019-11-22 2023-09-12 Pure Storage, Inc. Modify access restrictions in response to a possible attack against data stored by a storage system
US11941116B2 (en) 2019-11-22 2024-03-26 Pure Storage, Inc. Ransomware-based data protection parameter modification
US11500788B2 (en) 2019-11-22 2022-11-15 Pure Storage, Inc. Logical address based authorization of operations with respect to a storage system
CN111581221B (zh) * 2020-03-18 2023-09-26 宁波送变电建设有限公司永耀科技分公司 一种分布式多站融合系统信息冗余存储与重构的方法
US20230136274A1 (en) * 2021-11-04 2023-05-04 Softiron Limited Ceph Media Failure and Remediation

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2842837B2 (ja) * 1996-05-15 1999-01-06 日本電気株式会社 ミラーディスクシステム
JPH10293658A (ja) 1997-04-21 1998-11-04 Hitachi Ltd ディスクアレイサブシステム
JP3597349B2 (ja) * 1997-09-05 2004-12-08 株式会社日立製作所 記憶サブシステムおよびその障害回復方法
US6347359B1 (en) * 1998-02-27 2002-02-12 Aiwa Raid Technology, Inc. Method for reconfiguration of RAID data storage systems
JP3790756B2 (ja) 2003-09-01 2006-06-28 株式会社東芝 ディスクアレイ装置、ディスク制御装置及びディスクアレイのデータ障害を復旧する方法
JP2006164304A (ja) * 2006-01-20 2006-06-22 Hitachi Ltd ドライブの2重障害を防止するアレイ型ディスク装置、プログラム、及び方法
JP2007233903A (ja) * 2006-03-03 2007-09-13 Hitachi Ltd 記憶制御装置及び記憶制御装置のデータ回復方法
US7500136B2 (en) * 2006-06-05 2009-03-03 International Business Machines Corporation Replacing member disks of disk arrays with spare disks
US7685463B1 (en) * 2006-06-23 2010-03-23 Emc Corporation Disk drive management system
US20080126839A1 (en) * 2006-09-19 2008-05-29 Satish Sangapu Optimized reconstruction and copyback methodology for a failed drive in the presence of a global hot spare disc
GB2504956A (en) * 2012-08-14 2014-02-19 Ibm Management of RAID error recovery procedures and configuration

Also Published As

Publication number Publication date
JP2015156081A (ja) 2015-08-27
US9697087B2 (en) 2017-07-04
US20150234709A1 (en) 2015-08-20

Similar Documents

Publication Publication Date Title
JP6233086B2 (ja) ストレージ制御装置,ストレージシステム及び制御プログラム
JP5124103B2 (ja) 計算機システム
US9037795B1 (en) Managing data storage by provisioning cache as a virtual device
JP4958739B2 (ja) 障害の発生した記憶装置に記憶されているデータを修復するストレージシステム
JP5996787B2 (ja) システム管理方法、及び計算機システム
US7415506B2 (en) Storage virtualization and storage management to provide higher level storage services
US20160070490A1 (en) Storage control device and storage system
US8898385B2 (en) Methods and structure for load balancing of background tasks between storage controllers in a clustered storage environment
JP5511960B2 (ja) 情報処理装置、及びデータの転送方法
US8700948B2 (en) Storage area managing apparatus and storage area managing method
US8914577B2 (en) Disk array control apparatus
US20060218360A1 (en) Method, apparatus and program storage device for providing an optimized read methodology for synchronously mirrored virtual disk pairs
WO2015052798A1 (ja) ストレージシステム及び記憶制御方法
US20050097132A1 (en) Hierarchical storage system
JP5635621B2 (ja) ストレージシステム及びストレージシステムのデータ転送方法
JP2008509474A (ja) 耐故障性raidアレイプリエンプティブ復元の実行
JP2007087039A (ja) ディスクアレイシステム及びその制御方法
JP2002182862A (ja) 複数ボリュームのミラーリングにおけるプライマリ・ボリュームの引き継ぎのための方法およびディスク装置。
JP2006285808A (ja) ストレージシステム
US10884622B2 (en) Storage area network having fabric-attached storage drives, SAN agent-executing client devices, and SAN manager that manages logical volume without handling data transfer between client computing device and storage drive that provides drive volume of the logical volume
US20170220249A1 (en) Systems and Methods to Maintain Consistent High Availability and Performance in Storage Area Networks
US9760296B2 (en) Storage device and method for controlling storage device
US10877844B2 (en) Using deletable user data storage space to recover from drive array failure
JP6957845B2 (ja) ストレージ制御装置及びストレージ装置
JP5032620B2 (ja) ディスクアレイ装置及び同ディスクアレイ装置に適用される論理ディスク再構成方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161102

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170718

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170926

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171009

R150 Certificate of patent or registration of utility model

Ref document number: 6233086

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees