JP2007213721A - ストレージシステム及びその制御方法 - Google Patents

ストレージシステム及びその制御方法 Download PDF

Info

Publication number
JP2007213721A
JP2007213721A JP2006033905A JP2006033905A JP2007213721A JP 2007213721 A JP2007213721 A JP 2007213721A JP 2006033905 A JP2006033905 A JP 2006033905A JP 2006033905 A JP2006033905 A JP 2006033905A JP 2007213721 A JP2007213721 A JP 2007213721A
Authority
JP
Japan
Prior art keywords
disk drive
storage system
disk
inspection
data access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006033905A
Other languages
English (en)
Inventor
Kenji Ishii
健治 石井
Akira Murotani
暁 室谷
Tetsuya Abe
哲也 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2006033905A priority Critical patent/JP2007213721A/ja
Priority to US11/412,961 priority patent/US7558988B2/en
Priority to EP06254510A priority patent/EP1860556A3/en
Publication of JP2007213721A publication Critical patent/JP2007213721A/ja
Priority to US12/457,146 priority patent/US8161317B2/en
Priority to US13/423,709 priority patent/US8412986B2/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2211/00Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
    • G06F2211/10Indexing scheme relating to G06F11/10
    • G06F2211/1002Indexing scheme relating to G06F11/1076
    • G06F2211/1088Scrubbing in RAID systems with parity

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Automatic Disk Changers (AREA)

Abstract

【課題】 ディスクドライブの障害を早期に発見することでデータロストを未然に防ぐ。
【解決手段】 ストレージシステム(10)は、データを格納する一つ以上のディスクドライブ(150)と、ディスクドライブ(150)へのデータアクセスを制御するディスク制御部(140)と、ディスクドライブ(150)へのデータアクセス状況に応じてディスクドライブ(150)の電源を自律的にオフに制御する一方、電源オフに制御されたディスクドライブ(150)の電源をディスクドライブ(150)へのデータアクセス状況に関わりなく、電源オフから所定期間経過後に自律的にオンに制御する電源制御部(141)と、ディスクドライブ(150)へのデータアクセス状況に関わりなく自律的に電源オンに制御されたディスクドライブ(150)の障害を検査するメディア検査部(12)と、を備える。
【選択図】 図1

Description

本発明はストレージシステム及びその制御方法に関する。
近年、ストレージシステムの管理方法として、データライフサイクル管理(DLCM)が注目されている。DLCMは、時間と共に変化するデータの価値に応じて、ストレージシステム間のデータマイグレーションを管理することにより、コスト効率のよいデータ管理を実現する概念である。例えば、メールシステムは、企業等の基幹システムに位置付けられているので、高性能かつ高信頼性を有するハイエンドストレージシステムが必要である。数週間経過したメールはアクセス頻度が低下するので、ハイエンドストレージシステムからニアラインストレージシステムにデータを移動させる。ニアラインストレージシステムは、ハイエンドストレージシステムと比較すると、性能や信頼性は劣るものの、低価格というメリットがあり、必要に応じて即時アクセスが可能である。そして、ニアラインストレージシステムにデータを移動してから1〜2年経過した後に、テープ媒体にデータを移動させ、保管庫に保管する。DLCMの考えに立脚してデータ管理コストを削減するには、データの移動管理が重要である。
特開2005−157710号広報には、DLCMの考えを更に一歩進めた技術として長期間アクセスされないディスクドライブを停止させることで、消費電力を低減するMAID(Massive Arrays of Inactive Disks)と称される技術が開示されている。ディスクアレイシステムに要求される記憶容量の増大に伴い、ディスクドライブの搭載数は飛躍的に増加する傾向にあるので、MAID技術を適用することで、ディスクアレイシステムの消費電力を効果的に低減させることができる。
特開2005−157710号広報
しかし、ディスクドライブを停止させている期間は、ディスクドライブの障害を検出することができないので、ディスクドライブの停止期間が長期にわたると、停止していたディスクドライブをホストアクセス契機で稼働させたときに、ディスクドライブが起動しなかったり、或いはデータエラーの発生が検出されたりする等の不都合が生じ得る。複数のディスクドライブがRAID5で管理されている場合には、同一のRAIDグループ内で2台以上のディスクドライブに障害が生じると、データ復旧が不可能となる。
そこで、本発明は上述の問題を解決し、ディスクドライブの障害を早期に発見することで、データロストを未然に防ぐことを課題とする。
上記の課題を解決するため、本発明のストレージシステムは、データを格納する一つ以上のディスクドライブと、ディスクドライブへのデータアクセスを制御するディスク制御部と、ディスクドライブへのデータアクセス状況に応じてディスクドライブの電源を自律的にオフに制御する一方、電源オフに制御されたディスクドライブの電源をディスクドライブへのデータアクセス状況に関わりなく、電源オフから所定期間経過後に自律的にオンに制御する電源制御部と、ディスクドライブへのデータアクセス状況に関わりなく自律的に電源オンに制御されたディスクドライブの障害を検査するメディア検査部と、を備える。
電源制御部は、予め定義されたポリシーに基づいて、ディスクドライブへのデータアクセス状況に関わりなく電源オンに制御するディスクドライブを選択する。ポリシーは、例えば、(1)障害が生じたディスクドライブの属性情報に一致又は近似する属性情報を有するディスクドライブを優先的に選択すること、(2)障害が生じたディスクドライブの属性情報のうち優先順位が高く設定されている属性情報に一致又は近似する属性情報を有するディスクドライブを優先的に選択すること、(3)ディスクドライブへのデータアクセス状況に関わりなく、ディスクドライブの電源を所定の検査周期で定期的にオンにすること(この場合、検査周期は、ディスクドライブタイプに応じて異なるのが望ましい。)、(4)最新のデータアクセスから所定期間経過していないディスクドライブをメディア検査の対象から除外すること、である。
ここで、ディスクドライブの属性情報とは、例えば、ディスクドライブのベンダ名、ディスクドライブタイプ、記憶容量、型名、ロット番号、ファームウェアリビジョン、起動回数、総稼働時間、前回検査日時、検査済最終LBA、ユーザデータ格納の有無のうち何れかの情報である。
メディア検査部は、予め定義されたポリシーに基づいてディスクドライブの障害を検査する。ポリシーは、例えば、(1)同一のRAIDグループに属する全てのディスクドライブの全記憶領域についてリードを行い、障害を検査すること、(2)同一のRAIDグループに属する複数のディスクドライブの一部の憶領域についてリードを行い、障害を検査すること、(3)同一のRAIDグループに属する複数のディスクドライブがレディ状態になるか否かをチェックすること、(4)同一のRAIDグループに属する全てのディスクドライブの一部の憶領域についてリードを行い、障害を検査すること、(5)同一のRAIDグループに属する全てのディスクドライブがレディ状態になるか否かをチェックすること、(6)同一のRAIDグループに属する複数のディスクドライブのうち一つのディスクドライブの全記憶領域についてリードを行い、障害を検査すること、(7)同一のRAIDグループに属する複数のディスクドライブのうち一つのディスクドライブの一部の記憶領域についてリードを行い、障害を検査すること、(8)同一のRAIDグループに属する複数のディスクドライブのうち一つのディスクドライブがレディ状態になるか否かをチェックすること、のうち何れかである。
本発明によれば、データアクセス状況に応じて電源オフに制御されたディスクドライブの電源を、データアクセス状況に関わりなく、自律的にオンに制御し、ディスクドライブの障害を検査するので、障害を早期に発見することが可能となり、データロストを未然に防ぐことができる。
以下、各図を参照しながら本発明の実施形態について説明する。
図1は本実施形態に係るストレージシステム10のハードウェア構成を示す。ストレージシステム10は、通信ネットワーク22を介して、一つ以上のホスト計算機20に接続している。ストレージシステム10は、RAID構成された複数のディスクドライブ150を備えるディスクアレイシステムである。
ホスト計算機20は、ワークステーションシステム、メインフレームコンピュータ、パーソナルコンピュータ等である。ホスト計算機20は、業務用のアプリケーションプログラム21を有している。アプリケーションプログラム21は、例えば、データベースソフトウェア、Webアプリケーションソフトウェア、ストリーミングアプリケーションソフトウェア、Eビジネスアプリケーションソフトウェア等である。
通信ネットワーク22としては、SAN(Storage Area Network)、LAN(Local Area Network)、WAN(Wide Area Network)、インターネット、専用回線、公衆回線等を挙げることができる。ホスト計算機20がSANを介してストレージシステム10に接続する場合、ホスト計算機20は、ファイバチャネルプロトコル又はiSCSI(internet Small Computer System Interface)等のプロトコルにより、ブロック単位でのデータ入出力をストレージシステム10に要求する。ホスト計算機20がLANを介してストレージシステム10に接続する場合、ホスト計算機20は、NFS(Network File System)又はCIFS(Common Internet File System)等のファイル転送プロトコルにより、ファイル名を指定してファイル単位でのデータ入出力をストレージシステム10に要求する。ストレージシステム10がホスト計算機20からのファイルアクセス要求を受け付けるためには、ストレージシステム10にNAS(Network Attached Storage)機能が搭載されている必要がある。
ストレージシステム10は、ホストインターフェース11、CPU12、メモリ13、ディスクインターフェース14、複数のディスクボックス15、複数の電源装置16、及び管理インターフェース17を備える。ディスクインターフェース14は、ディスク制御部140、及び電源制御部141を備える。各ディスクボックス15には、複数のディスクドライブ150が搭載されている。
ホストインターフェース11は、ストレージシステム10とホスト計算機20との間のインターフェースを制御するコントローラであり、例えば、ファイバチャネルプロトコル又はiSCSI等のプロトコルによるブロック単位でのデータ入出力要求を処理したり、或いはNFS又はCIFS等のファイル転送プロトコルによるファイル単位でのデータ入出力要求を処理したりする。尚、ホストインターフェース11は、チャネルインターフェースと別称することもできる。
CPU12は、ホスト計算機51からのデータ入出力要求に応答して、複数のディスクドライブ150へのI/O処理(ライトアクセス、又はリードアクセス)を制御するプロセッサである。CPU12は、後述するメディア検査処理を実施するメディア検査部として機能する。
メモリ13には、ディスクドライブ150の制御に必要な各種マイクロプログラムがロードされる他、後述する各種のテーブル(ディスクドライブ配列テーブル40、RAID構成管理テーブル50、検査レベル管理テーブル60、検査処理管理テーブル70、及びディスクドライブ属性テーブル80)が格納される。
ディスク制御部140は、複数のディスクドライブ150をいわゆるRAID方式に規定されるRAIDレベル(例えば、0,1,5)で制御する。RAID方式においては、複数のディスクドライブ150が一つのRAIDグループとして管理される。RAIDグループ上には、ホスト計算機20からのアクセス単位である複数の論理ユニットが定義される。それぞれの論理ユニットには、LUN(Logical Unit Number)がアサインされる。尚、ディスクインターフェース14は、ドライブインターフェースと別称することもできる。
電源制御部141は、ディスクボックス15に搭載されている各ディスクドライブ150の電源をオン/オフ制御する。電源制御部141は、ディスクドライブ150へのデータアクセス状況に応じて、ディスクドライブ150の電源を自律的にオフに制御する。例えば、ディスクドライブ150へのアクセス頻度が低下すると、電源制御部141は、ディスクドライブ150の電源を自律的にオフに制御する。電源制御部141は、電源オフに制御された同一のRAIDグループに属する全部又は一部のディスクドライブ150の電源をディスクドライブ150へのデータアクセス状況に関わりなく、後述するメディア検査処理の実施を目的として、電源オフから所定期間経過後に自律的にオンに制御する。
尚、上述の説明では、複数のディスクドライブ50がRAID構成されている例を示したが、複数のディスクドライブ150がRAID構成されてない場合には、電源制御部141は、ディスクドライブ150毎に電源装置16のオン/オフを制御してもよい。
ディスクドライブ150は、FC(Fibre Channel)ディスクドライブ、SATA(Serial Advanced Technology Attachment)ディスクドライブ、PATA(Parallel Advanced Technology Attachment)ディスクドライブ、FATA(Fibre Attached Technology Adapted)ディスクドライブ、SAS(Serial Attached SCSI)ディスクドライブ或いはSCSI(Small Computer System Interface)ディスクドライブ等のストレージデバイスである。ディスクドライブ150に替えて、磁気テープドライブ、半導体メモリドライブなどのストレージデバイスを用いてもよい。
ストレージシステム10は、各ディスクドライブ150(又は各RAIDグループ)を複数のストレージ階層に分類する。例えば、ある一つのストレージ階層は、高信頼性のFC階層として定義可能である。例えば、複数のFCディスクドライブをRAID1で構成してなる一つ以上のRAIDグループをFC階層として定義可能である。他のストレージ階層は、低コストのSATA階層として定義可能である。例えば、複数のSATAディスクドライブ44をRAID5で構成してなる一つ以上のRAIDグループをSATA階層として定義可能である。
尚、ストレージ階層の定義は、上述の例に限られるものではなく、ディスクドライブ150のスペックに応じてストレージ階層を定義してもよい。例えば、高回転のFCディスクドライブと低回転のFCディスクドライブとの間でストレージ階層を分けてもよく、大記憶容量のFCディスクドライブと小記憶容量のFCディスクドライブとの間でストレージ階層を分けてもよい。また、ストレージデバイスの種類(例えば、ハードディスクドライブ、フレキシブルディスクドライブ、磁気テープドライブ、半導体メモリドライブ、光ディスクドライブ等の種類)に応じて、ストレージ階層を分けてもよい。
各電源装置16は、各ディスクボックス15に搭載されているディスクドライブ150に電力を供給する。電源装置16は、交流電源(商用電源)を直流電源に変換するAC/DCコンバータと、補助電源としてのバッテリモジュールを含む。
管理インターフェース17には、サービスプロセッサ30が接続されている。管理サーバ31は、管理LAN32を介してサービスプロセッサ30に接続している。管理LAN32は、例えば、インターネット、或いは専用線等である。管理LAN32を介して行われる、管理サーバ31とサービスプロセッサ30との間の通信は、例えば、TCP/IP等の通信プロトコルに基づいて行われる。
サービスプロセッサ30と管理サーバ31は、何れもストレージシステム10を保守管理するための管理端末であり、管理用のユーザインターフェースを備える。システム管理者は、管理サーバ31を入力操作することにより、ストレージシステム10を管理するためのコマンドをサービスプロセッサ30経由でストレージシステム10に送信する。ストレージシステム10を管理するためのコマンドとして、例えば、ディスクドライブ150の増設或いは減設、又はRAID構成の変更を指示するためのコマンド、ホスト計算機20とストレージシステム10との間の通信パスを設定するためのコマンド、CPU12のマイクロプログラムをメモリ13にインストールするためのコマンド等がある。
次に、ディスクドライブ150の障害の有無を検査する処理(以下、メディア検査処理と称する。)の概要について説明を加える。電源制御部141は、ディスクドライブ150へのデータアクセス頻度が低下すると、ディスクドライブ150の電源を自律的にオフに制御する。電源制御部141は、電源オフに制御された同一のRAIDグループに属する全部又は一部のディスクドライブ150の電源をディスクドライブ150へのデータアクセス状況に関わりなく、メディア検査処理の実施を目的として、電源オフから所定期間経過後に自律的にオンに制御する。CPU12は、ディスクドライブ150へのデータアクセス状況に関わりなく自律的に電源オンに制御された同一のRAIDグループに属する全部又は一部のディスクドライブ150の障害を検査する。
ここで、電源制御部141は、予め定義されたポリシーに基づいて、データアクセス状況に関わりなく自律的に電源オンに制御するディスクドライブ150を選択する。ポリシーとは、メディア検査処理の実施基準をいう。ポリシーの具体例として、例えば、(1)定期的(例えば、1回/月)に全てのディスクドライブ150についてメディア検査を実施する、(2)メディア検査により障害が発生したディスクドライブ150の属性情報に一致又は近似する属性情報を有するディスクドライブ150を優先的に選択する、(3)ディスク制御部140からの最新のデータアクセスから所定期間経過していないディスクドライブ150をメディア検査の対象から除外する、ことが考えられる。また、後述する検査レベルもポリシーに含まれる。
次に、図2乃至図16を参照しながらメディア検査処理の詳細について説明を加える。
図2はディスクドライブ配列テーブル40を示す。ディスクドライブ配列テーブル40は、各ディスクボックス15に搭載されているディスクドライブ150の物理的な配列位置を示す配列番号を格納する。例えば、ディスクドライブ配列テーブル40の中の配列番号“M−N”は、ディスクドライブ150がディスボックスMの第N列目に搭載されていることを示す。ここで、ディスクボックスMは、複数のディスクボックス15を一列に並べたときにM番目に位置するディスクボックス15である。
図3はRAID構成管理テーブル50を示す。RAID構成管理テーブル50は、各RAIDグループの構成情報を管理するためのものであり、RAIDグループ番号(以下、RG番号と称する。)、RAIDレベル、RAIDグループを構成するディスクドライブ150の情報をそれぞれ対応付けて格納している。メディア検査処理は、原則として、RAIDグループ単位で実施し、スペアディスクドライブ又は未使用ディスクドライブが存在する場合は、スペアディスクドライブ単位又は未使用ディスクドライブ単位でも実施するものとする。このため、便宜上、スペアディスクドライブの番号(以下、スペアディスク番号と称する。)、及び未使用ディスクドライブの番号(以下、未使用ディスク番号と称する。)もRG番号に含めて管理している。
例えば、同図に示す例では、RAIDグループ2には、“2−1”〜“2−5”の5台のディスクドライブ150が含まれる。RAIDグループ2のRAIDレベルは、RAID5である。RAIDグループ3には、“3−1”〜“3−4”の4台のディスクドライブ150が含まれる。RAIDグループ3のRAIDレベルは、RAID5である。スペア1には、“3−5”のディスクドライブ150がスペアドライブとしてアサインされている。未使用のディスクドライブであることを示す未使用1には、“5−5”のディスクドライブ150がアサインされている。
図4は検査レベル管理テーブル60を示す。検査レベル管理テーブル60は、各RAIDグループの検査レベルの情報を格納する。検査レベルとは、メディア検査処理の精密度を示す指標値である。レベル1は、同一のRAIDグループに属する全てのディスクドライブ150の全ての記憶領域についてデータを読み取り、エラーの有無をチェックすることを示す。レベル2は、同一のRAIDグループに属する全てのディスクドライブの一部の憶領域についてデータを読み取り、エラーの有無をチェックすることを示す。レベル3は、同一のRAIDグループに属する全てのディスクドライブのうち一つのディスクドライブの一部の記憶領域についてデータを読み取り、エラーの有無をチェックすることを示す。レベル4は、同一のRAIDグループに属する全てのディスクドライブがレディ状態になるか否かをチェックすることを示す。
このように、各RAIDグループについて複数の検査レベルの中から任意の検査レベルを設定しておくことで、ディスクドライブ150の障害の有無を効率的に実施できる。例えば、高信頼性のFCディスクドライブからなるRAIDグループについては、低い検査レベル(例えば、レベル3又はレベル4)を設定しておくことにより、FCディスクドライブからなるRAIDグループのメディア検査処理を迅速かつ低消費電力で実施することができる。一方、低信頼性のSATAディスクドライブからなるRAIDグループについては、高い検査レベル(例えば、レベル1又はレベル2)を設定しておくことにより、SATAディスクドライブからなるRAIDグループのメディア検査処理を精密に実施し、ディスクドライブの障害を早期に発見できる。
図5乃至図7は検査処理管理テーブル70を示す。検査処理管理テーブル70は、メディア検査処理の検査順序や検査状態を管理するためのものであり、メディア検査処理の検査順序、RG番号、前回のメディア検査処理で検査された最後のセクタブロックの論理ブロックアドレス(以下、検査済最終LBAと称する。)、前回のメディア検査処理の完了時刻、最新のホストI/Oが発生した時刻、及び検査レベルをそれぞれ対応付けて格納している。
尚、図5は初期状態における検査処理管理テーブル70を示す。図6は検査順順序が確定したときの検査処理管理テーブル70を示す。図7は検査処理を実施しているときの検査処理管理テーブル70を示す。
図8はディスクドライブ属性テーブル80を示す。ディスクドライブ属性テーブル80は、各ディスクドライブ150の属性情報を格納する。ディスクドライブ150の属性情報として、ベンダ名、HDDタイプ、記憶容量、型名、ロット番号、製造番号、ファームウェアリビジョン、起動回数、総稼働時間、前回検査日時、検査済最終LBA、ユーザデータ格納の有無などがある。HDDタイプ(ディスクドライブタイプ)は、ディスクドライブの種別を示す。例えば、ディスクドライブ150の種別がFCディスクドライブ及びSATAディスクドライブの2種類であるときは、HDDタイプは、FCディスクドライブ又はSATAディスクドライブのうち何れかである。ファームウェアリビジョンは、ディスクコントローラ系のファームウェアのリビジョン情報である。起動回数は、ディスクドライブ150の電源がオンにされた回数(電源投入回数)である。総稼働時間は、ディスクドライブ150の電源がオンになっている期間と、ディスクドライブ150の電源がオフになっている期間を合算した期間である。“HDDM−N”は、ディスボックスMの第N列目に搭載されているディスクドライブ150を示す。
“優先順位”は、メディア検査処理の優先度を示す。ストレージシステム10は、優先順位の高いディスクドライブ属性を有するディスクドライブ150を優先的に選択してメディア検査処理を実施する。例えば、同図に示す例では、ロット番号の優先順位が一番高く設定されているので、ストレージシステム10は、障害が発見されたディスクドライブ150のロット番号と同一のロット番号を有するディスクドライブ150を優先的にメディア検査処理する。ロット番号が同一の複数のディスクドライブ150は、同一の製造環境下で製造されたものであるので、障害の早期発見に好適である。
ディスクドライブ150の属性情報に基づいてポリシーを定義する具体例として、以下の例を挙げることができる。
(1)ディスクドライブタイプに基づいて、メディア検査処理の実施対象となるディスクドライブ150を選択する。例えば、高信頼性ディスクドライブ(例えば、FCディスクドライブ)よりも、低信頼性ディスクドライブ(例えば、SATAディスクドライブ)の優先順位を高く設定する。
(2)総稼働時間に基づいて、メディア検査処理の実施対象となるディスクドライブ150を選択する。例えば、総稼働時間の短いディスクドライブ150よりも、総稼働時間の長いディスクドライブ150の優先順位を高く設定する。
(3)前回検査日時に基づいて、メディア検査処理の実施対象となるディスクドライブ150を選択する。例えば、前回検査日時の新しいディスクドライブ150よりも、前回検査日時の古いディスクドライブ150の優先順位を高く設定する。
(4)この他、複数の属性情報の組み合わせを基に、ディア検査処理の実施対象となるディスクドライブ150を選択してもよい。
(5)複数のディスクドライブタイプのディスクドライブ150がストレージシステム10に搭載されている場合には、それぞれのディスクドライブタイプ毎にメディア検査の検査周期を設定してもよい。例えば、高信頼性ディスクドライブ(例えば、FCディスクドライブ)の検査周期は長く設定し、低信頼性ディスクドライブ(例えば、SATAディスクドライブ)の検査周期は短く設定するのが好適である。
図9乃至図10はメディア検査処理の優先順位を編集するための編集画面90の表示例を示す。システム管理者は、複数のディスクドライブ属性の中からある一つのディスクドライブ属性を選択し、ボタン91又は92を操作することで、選択されたディスクドライブ属性の優先順位を変更することができる。ボタン91は、優先順位を繰り上げるときに操作され、ボタン92は、優先順位を繰り下げるときに操作される。例えば、図9に示す例では、ロット番号が選択され、ボタン91の操作により、ロット番号の優先順位が繰り上げられる様子が示されている。図10は編集後の編集画面90を示す。
ここで、判定条件の“=”は一致条件を示し、“>”は比較条件を示す。例えば、ベンダ名やHDDタイプは、一致条件により属性情報が一致するか否かが判定される。一方、記憶容量や起動回数は、比較条件により属性情報が一致するか否かが判定される。
尚、システム管理者は、管理端末(例えば、サービスプロセッサ30又は管理サーバ30)のユーザインターフェースに表示される編集画面90を参照して、メディア検査処理の優先順位を編集することができる。システム管理者は、ストレージシステム10に接続するコンピュータ(例えば、ホスト計算機51或いはその他の端末装置)のユーザインターフェースに表示される編集画面90を参照して、メディア検査処理の優先順位を編集してもよい。
上述の説明では、システム管理者がディスクドライブ150の属性情報を個々に指定した上で優先順位を決定する例を示したが、システム管理者が抽象的な指示を入力し、抽象的な指示を受けたサービスプロセッサ30又は管理サーバ30が優先順位を具体的に設定してもよい。例えば、システム管理者が低信頼性のディスクドライブ150の優先順位を高く設定することを要求する抽象的な指示をサービスプロセッサ30又は管理サーバ30に入力する。抽象的な指示を受けたサービスプロセッサ30又は管理サーバ30は、HDDタイプがSATAディスクドライブであるディスクドライブ150の優先順位を高く設定する。システム管理者が抽象的なポリシー管理を行える環境を提供することで、ストレージシステム10の管理が容易になる。
図11は検査処理管理テーブル作成処理を示すフローチャートである。検査処理管理テーブル作成処理は、ストレージシステム10が立ち上がるときを契機として、CPU12により実行される。
検査処理管理テーブル作成処理が起動されると、CPU12は、ディスクドライブ配列テーブル40をメモリ13に退避し(S101)、ディスクドライブ配列テーブル40に格納されている複数の配列番号の中から最小の配列番号を有するディスクドライブ150が属するRG番号を検査処理管理テーブル70の「検査順序」の空欄に登録する(S102)。このとき、最小の配列番号を有するディスクドライブ150が未使用ディスク又はスペアディスクである場合には、検査処理管理テーブル70の「検査順序」の空欄に未使用ディスク番号又はスペアディスク番号を登録する。
次に、CPU12は、検査処理管理テーブル70の「検査順序」の空欄に登録されたRG番号を有するRAIDグループに属する全てのディスクドライブ150の配列番号をディスクドライブ配列テーブル40から削除する(S103)。
次に、CPU12は、ディスクドライブ配列テーブル40が空になったか否かを判定し(S104)、空になっていなければ(S104;NO)、CPU12は、S102〜S104のループを繰り返し実行する。空になっている場合には(S104;YES)、CPU12は、ディスクドライブ配列テーブル40を回復する(S105)。
次に、CPU12は、検査レベル管理テーブル60をメモリ13に退避し(S106)、検査レベル管理テーブル60に格納されているそれぞれのRAIDグループ、スペアディスクドライブ、及び未使用ディスクドライブの検査レベルを検査処理管理テーブル70の「検査レベル」の空欄に順次に格納する(S107)。
次に、CPU12は、検査処理管理テーブル60の「検査レベル」の空欄に登録された検査レベルを検査レベル管理テーブル60から削除する(S108)。
次に、CPU12は、検査処理管理テーブル60が空になったか否かを判定し(S109)、空になっていなければ(S109;NO)、CPU12は、S107〜S109のループを繰り返し実行する。空になっている場合には(S109;YES)、CPU12は、検査処理管理テーブル60を回復する(S110)。
以上の処理ステップを経て、検査処理管理テーブル70には、RG番号と検査レベルとが対応付けられて格納される(図5参照)。
図12はディスクドライブ属性テーブル作成処理を示すフローチャートである。ディスクドライブ属性テーブル作成処理は、ストレージシステム10が立ち上がるときを契機として、CPU12により実行される。
ディスクドライブ属性テーブル作成処理が起動されると、CPU12は、ディスクドライブ配列テーブル40をメモリ13に退避する(S201)。そして、CPU12は、ディスクドライブ配列テーブル40に格納されている複数の配列番号を順次選択し、選択した配列番号を有するディスクドライブ150にinquiryコマンドを発行して、各ディスクドライブ150の属性情報を取得し、取得した属性情報をディスクドライブ属性テーブル80に登録する(S202)。inquiryコマンドの詳細は、SCSIプロトコルに規定されており、inquiryコマンドの戻り値には、ディスクドライブ150のベンダ名、HDDタイプ、記憶容量、型名などが含まれる。ディスクドライブ150の属性情報は、ディスクドライブ150のSMART(Self Monitoring and Reporting Technology)機能を用いて取得することも可能である。
次に、CPU12は、属性情報の取得が完了したディスクドライブ150の配列番号をディスクドライブ配列テーブル40から削除する(S203)。
次に、CPU12は、ディスクドライブ配列テーブル40が空になったか否かを判定し(S204)、空になっていなければ(S204;NO)、CPU12は、S202〜S204のループを繰り返し実行する。空になっている場合には(S204;YES)、CPU12は、ディスクドライブ配列テーブル40を回復する(S205)。
図13はメディア検査処理を示すフローチャートである。メディア検査処理は、ホストアクセスのバックグランドで動作するバックグランドプロセスである。メディア検査処理が実施されるタイミングは、予めポリシーにて定義されるが、ポリシーに定義されてない場合には、デフォルト設定されたタイミング(例えば、1回/月などの定期的なタイミング)で実施される。
メディア検査処理が起動されると、CPU12は、まず、検査処理管理テーブル70の「検査順序」の欄に登録されているRG番号を検査順序通りに読み取り、読み取ったRG番号を有するRAIDグループに属する全てのディスクドライブ150を起動する(S301)。
次に、CPU12は、RAIDグループを構成するディスクドライブ150が正常に起動するか否かをチェックする(S302)。ディスクドライブ150が正常に起動しないならば(S302;NO)、CPU12は、ふるい分け処理を実施し(S304)、S301の処理に戻る。ふるい分け処理の詳細については、後述する。
一方、ディスクドライブ150が正常に起動するならば(S302;YES)、CPU12は、検査レベルに応じたメディア検査処理を実施する(S303)。
次に、CPU12は、メディア検査の結果、ディスクドライブ150にエラーが発生したか否かをチェックする(S305)。ディスクドライブ150にエラーが発生したならば(S305;YES)、CPU12は、エラー状況区別処理を実施する(S307)。エラー状況区別処理の詳細については、後述する。
一方、ディスクドライブ150にエラーが発生してないならば(S305;YES)、CPU12は、検査処理管理テーブル70に検査結果(検査済最終LBA、及び検査完了時刻)を記録する(S306)。
次に、CPU12は、全てのディスクドライブ150についてメディア検査処理を実施したか否かをチェックする(S308)。一部のディスクドライブ150について、メディア検査処理を実施してないならば(S308;NO)、CPU12は、S301の処理に戻る。一方、全てのディスクドライブ150について、メディア検査処理が完了しているならば(S308;YES)、CPU12は、メディア検査処理を終了する。
図14はふるい分け処理を示すフローチャートである。ふるい分け処理は、メディア検査処理(図13)において、ディスクドライブ150が正常に起動しないと判定されたとき(S302;NO)、又はエラー状態区別処理(図17)において、エラーカウントが規定値を超えたときに(S705;YES)、実施される。
ふるい分け処理が起動されると、CPU12は、まず、正常に起動しないディスクドライブ150又はエラーカウントが規定値を超えたディスクドライブ150が属するRAIDグループの他のディスクドライブ150を用いてデータ復旧が可能であるか否かをチェックする(S401)。データ復旧不可能な場合には(S401;NO)、CPU12は、アラーム処理を実施する(S405)。アラーム処理の詳細については、後述する。
一方、データ復旧可能な場合には(S401;YES)、CPU12は、スペアディスクにコレクションコピーを行い、データを復旧させる(S402)。
次に、CPU12は、検査処理管理テーブル70に登録されている「検査順序」を再設定し(S403)、検査順序再設定後の検査処理管理テーブル70に基づいて、メディア検査処理を実施する(S404)。
図15は検査順序再設定処理を示すフローチャートである。検査順序再設定処理は、ディスクドライブ150が正常に起動しないときや、エラーカウント値が規定値を超えるなど、ディスクドライブ150に何等かの障害が生じたときに、障害が生じたディスクドライブ150の属性情報のうち、ディスクドライブ属性テーブル80において「優先順位」が高く設定されている属性情報と一致する属性情報を有するディスクドライブ150の検査順序を繰り上げるための処理である。
尚、検査順序再設定処理が起動するときに、検査処理管理テーブル70の「RG番号」は初期化される(空欄に戻される)ものとする。
検査順序再設定処理が起動されると、CPU12は、まず、ディスクドライブ配列テーブル40をメモリ13に退避し(S501)、障害が生じたディスクドライブ150の属性情報のうち、ディスクドライブ属性テーブル80において「優先順位」が高く設定されている属性情報(例えば、優先順位が「1」に設定されている属性情報)と一致する属性情報を有するディスクドライブ150以外のディスクドライブ150の配列番号をディスクドライブ配列テーブル40から削除する(S502)。
次に、CPU12は、ディスクドライブ配列テーブル40に格納されている複数の配列番号の中から最小の配列番号を有するディスクドライブ150が属するRG番号を検査処理管理テーブル70の「検査順序」の空欄に登録する(S503)。このとき、最小の配列番号を有するディスクドライブ150が未使用ディスク又はスペアディスクである場合には、検査処理管理テーブル70の「検査順序」の空欄に未使用ディスク番号又はスペアディスク番号を登録する。
次に、CPU12は、検査処理管理テーブル70の「検査順序」の空欄に登録されたRG番号を有するRAIDグループに属する全てのディスクドライブ150の配列番号をディスクドライブ配列テーブル40から削除する(S504)。
次に、CPU12は、ディスクドライブ配列テーブル40が空になったか否かを判定し(S505)、空になっていなければ(S505;NO)、CPU12は、S503〜S505のループを繰り返し実行する。空になっている場合には(S505;YES)、CPU12は、ディスクドライブ配列テーブル40を回復する(S506)。
次に、CPU12は、RAID構成管理テーブル50を参照し、検査処理管理テーブル70の「RG番号」の欄に登録されたRG番号を有するRAIDグループに属する全てのディスクドライブ150の配列番号をディスクドライブ配列テーブル40から削除する(S507)。
次に、CPU12は、ディスクドライブ配列テーブル40に格納されている複数の配列番号の中から最小の配列番号を有するディスクドライブ150が属するRG番号を検査処理管理テーブル70の「検査順序」の空欄に登録する(S508)。このとき、最小の配列番号を有するディスクドライブ150が未使用ディスク又はスペアディスクである場合には、検査処理管理テーブル70の「検査順序」の空欄に未使用ディスク番号又はスペアディスク番号を登録する。
次に、CPU12は、検査処理管理テーブル70の「検査順序」の空欄に登録されたRG番号を有するRAIDグループに属する全てのディスクドライブ150の配列番号をディスクドライブ配列テーブル40から削除する(S509)。
次に、CPU12は、ディスクドライブ配列テーブル40が空になったか否かを判定し(S510)、空になっていなければ(S510;NO)、CPU12は、S508〜S510のループを繰り返し実行する。空になっている場合には(S510;YES)、CPU12は、ディスクドライブ配列テーブル40を回復する(S511)。
尚、上述の説明では、障害が生じたディスクドライブ150の属性情報のうち、ディスクドライブ属性テーブル80において「優先順位」が高く設定されている属性情報(例えば、優先順位が「1」に設定されている属性情報)と一致する属性情報を有するディスクドライブ150の検査順序を繰り上げ、その他のディスクドライブ150の検査順序をディスクドライブ配列テーブル40内の配列番号に基づいて決定する例を示したが、本実施形態は、これに限られるものではない。例えば、障害が生じたディスクドライブ150の属性情報のうち、ディスクドライブ属性テーブル80において「優先順位」が「1」に設定されている属性情報と一致する属性情報を有するディスクドライブ150の検査順序を繰り上げて順位確定し、障害が生じたディスクドライブ150の属性情報のうち、ディスクドライブ属性テーブル80において「優先順位」が「2」に設定されている属性情報と一致する属性情報を有するディスクドライブ150の検査順序を繰り上げて順位確定し、障害が生じたディスクドライブ150の属性情報のうち、ディスクドライブ属性テーブル80において「優先順位」が「3」に設定されている属性情報と一致する属性情報を有するディスクドライブ150の検査順序を繰り上げて順位確定する、という操作を順次繰り返してもよい。
また、図13のフローチャートは、ふるい分け処理により検査順序が再設定されると、検査順序が再設定された後の検査処理管理テーブル70に基づいて、もう一度最初からメディア検査処理が実施されるアルゴリズムになっているので、メディア検査処理が既に実施されたRAIDグループ、スペアディスクドライブ、及び未使用ディスクドライブについて再検査が実施される。メディア検査処理が既に実施されたRAIDグループ、スペアディスクドライブ、及び未使用ディスクドライブについては、検査済みフラグを設定しておき、検査済みフラグが設定されているRAIDグループ、スペアディスクドライブ、及び未使用ディスクドライブの再検査を省略してもよい。
図16はアラーム処理を示すフローチャートである。アラーム処理は、ふるい分け処理(図14)において、データ復旧不可能と判定されたとき(S401;NO)、又はエラー状態区別処理(図17)において、データ復旧不可能と判定されたときに(S702;NO)、実施される。
アラーム処理が起動されると、CPU12は、まず、ユーザに障害発生を通知し(S601)、障害が発生したディスクドライブ150が属するRAIDグループを閉塞して(S602)、その他のRAIDグループについて、メディア検査処理を実施する(S603)。
図17はエラー状態区別処理を示すフローチャートである。エラー状態区別処理は、メディア検査処理(図13)において、ディスクドライブ150のエラーを検出したときに(S305;YES)、実施される、
エラー状態区別処理が起動されると、CPU12は、まず、エラーが検出されたディスクドライブ150がリトライにより回復するか否かをチェックする(S701)。リトライで回復しない場合には(S701;NO)、CPU12は、そのディスクドライブ150がデータ復旧可能か否かをチェックする(S702)。データ復旧不可能な場合には(S702;NO)、CPU12は、アラーム処理を実施する(S703)。
一方、リトライによりディスクドライブ150が回復する場合(S701;YES)、又はディスクドライブ150のデータ復旧が可能な場合には(S702;YES)、CPU12は、エラーカウントをインクリメントし(S704)、エラーカウントが規定値を超えたか否かをチェックする(S705)。
エラーカウントが規定値を超えた場合には(S705;YES)、CPU12は、ふるい分け処理を実施する(S707)。エラーカウントが規定値を超えない場合には(S705;NO)、CPU12は、メディア検査処理を実施する(S706)。
尚、上述の説明では、同一のRAIDグループに属する全部又は一部のディスクドライブ150についてメディア検査処理を実施する例を示したが、同一の論理ユニットに属する全部又は一部のディスクドライブ150についてメディア検査処理を実施してもよい。
また、メディア検査処理を頻繁に実施すると、ディスクドライブ150の寿命を短くしたり、或いは消費電力を増大させたりする等の不都合が生じ得るので、ディスク制御部140からの最新のデータアクセスから所定期間経過していないディスクドライブ150をメディア検査の対象から除外するのが好ましい。矛盾
各ディスクボックス15にディスクドライブ150を冷却するための冷却ファンが設けられている場合には、冷却ファンの回転数が規定回転数を超えない程度に、メディア検査処理の対象となるディスクドライブ150の電源をオンに設定するのが好ましい。メディア検査処理の対象となるディスクドライブ150の数が増大すると、消費電力も増大してしまうので、ストレージシステム10の補機類の消費電力を考慮した上で、メディア検査処理を実施することで、ストレージシステム10全体の消費電力を抑えることができる。
また、3D+1PのRAID構成を有するRAID4のRAIDグループについては、3Dのディスクドライブ150についてのみメディア検査処理を実施してもよい。
また、ストレージシステム100は、必ずしも複数のディスクドライブ150を備えている必要はなく、単一のディスクドライブ150のみを備えている場合でも、メディア検査処理を適用できる。
本実施形態によれば、データアクセス頻度の低下に基づいて電源オフに制御されたディスクドライブ150の電源を、データアクセス状況に関わりなく自律的にオンに制御し、メディア検査処理を実施するので、ディスクドライブの障害を早期に発見することが可能となり、データロストを未然に防ぐことができる。また、メディア検査処理を実施するディスクドライブ150をポリシーに基づいて選択することにより、効率的にメディア検査処理を実施できる。
本実施形態に係るストレージシステムのハードウェア構成図である。 ディスクドライブ配列テーブルの説明図である。 RAID構成管理テーブルの説明図である。 検査レベル管理テーブルの説明図である。 初期状態における検査処理管理テーブルの説明図である。 検査順順序が確定したときの検査処理管理テーブルの説明図である。 検査処理を実施しているときの検査処理管理テーブルの説明図である。 ディスクドライブ属性テーブルの説明図である。 優先順位編集画面の説明図である。 優先順位編集画面の説明図である。 検査処理管理テーブル作成処理を示すフローチャートである。 ディスクドライブ属性テーブル作成処理を示すフローチャートである。 メディア検査処理を示すフローチャートである。 ふるい分け処理を示すフローチャートである。 検査順序再設定処理を示すフローチャートである。 アラーム処理を示すフローチャートである。 エラー状態区別処理を示すフローチャートである。
符号の説明
10…ストレージシステム 11…ホストインターフェース 12…CPU 13…メモリ 14…ディスクインターフェース 15…ディスクボックス 150…ディスクドライブ 16…電源装置 17…管理インターフェース 30…サービスプロセッサ 31…管理サーバ 40…ディスクドライブ配列テーブル 50…RAID構成管理テーブル 60…検査レベル管理テーブル 70…検査処理管理テーブル 80…ディスクドライブ属性テーブル

Claims (21)

  1. データを格納する一つ以上のディスクドライブと、
    前記ディスクドライブへのデータアクセスを制御するディスク制御部と、
    前記ディスクドライブへのデータアクセス状況に応じて前記ディスクドライブの電源を自律的にオフに制御する一方、電源オフに制御された前記ディスクドライブの電源を前記ディスクドライブへのデータアクセス状況に関わりなく、前記電源オフから所定期間経過後に自律的にオンに制御する電源制御部と、
    前記ディスクドライブへのデータアクセス状況に関わりなく自律的に電源オンに制御された前記ディスクドライブの障害を検査するメディア検査部と、
    を備えるストレージシステム。
  2. 請求項1に記載のストレージシステムであって、前記電源制御部は、予め定義されたポリシーに基づいて、前記ディスクドライブへのデータアクセス状況に関わりなく電源オンに制御する前記ディスクドライブを選択する、ストレージシステム。
  3. 請求項2に記載のストレージシステムであって、前記ポリシーは、障害が生じた前記ディスクドライブの属性情報に一致又は近似する属性情報を有するディスクドライブを優先的に選択することである、ストレージシステム。
  4. 請求項2に記載のストレージシステムであって、前記ポリシーは、障害が生じた前記ディスクドライブの属性情報のうち優先順位が高く設定されている属性情報に一致又は近似する属性情報を有するディスクドライブを優先的に選択することである、ストレージシステム。
  5. 請求項2に記載のストレージシステムであって、前記ポリシーは、前記ディスクドライブへのデータアクセス状況に関わりなく、前記ディスクドライブの電源を所定の検査周期で定期的にオンにすることである、ストレージシステム。
  6. 請求項5に記載のストレージシステムであって、前記検査周期は、前記ディスクドライブのディスクドライブタイプに応じて異なる、ストレージシステム。
  7. 請求項2に記載のストレージシステムであって、前記ポリシーは、前記ディスク制御部からの最新のデータアクセスから所定期間経過していない前記ディスクドライブをメディア検査の対象から除外することである、ストレージシステム。
  8. 請求項3に記載のストレージシステムであって、前記属性情報は、前記ディスクドライブのベンダ名、ディスクドライブタイプ、記憶容量、型名、ロット番号、ファームウェアリビジョン、起動回数、総稼働時間、前回検査日時、検査済最終LBA、ユーザデータ格納の有無のうち何れかの情報である、ストレージシステム。
  9. 請求項1に記載のストレージシステムであって、前記メディア検査部は、予め定義されたポリシーに基づいて前記ディスクドライブの障害を検査する、ストレージシステム。
  10. 請求項8に記載のストレージシステムであって、前記ポリシーは、
    (1)同一のRAIDグループに属する全てのディスクドライブの全記憶領域についてリードを行い、障害を検査すること、
    (2)同一のRAIDグループに属する全てのディスクドライブの一部の憶領域についてリードを行い、障害を検査すること、
    (3)同一のRAIDグループに属する全てのディスクドライブがレディ状態になるか否かをチェックすること、
    のうち何れかである、ストレージシステム。
  11. 請求項8に記載のストレージシステムであって、前記ポリシーは、
    (1)同一のRAIDグループに属する全てのディスクドライブの全記憶領域についてリードを行い、障害を検査すること、
    (2)同一のRAIDグループに属する複数のディスクドライブの一部の憶領域についてリードを行い、障害を検査すること、
    (3)同一のRAIDグループに属する複数のディスクドライブがレディ状態になるか否かをチェックすること、
    のうち何れかである、ストレージシステム。
  12. RAID構成された複数のディスクドライブと、
    前記ディスクドライブへのデータアクセスを制御するディスク制御部と、
    前記ディスクドライブへのデータアクセス状況に応じて、前記ディスクドライブの電源を自律的にオフに制御する一方、電源オフに制御された同一のRAIDグループに属する全てのディスクドライブの電源を前記ディスクドライブへのデータアクセス状況に関わりなく、前記電源オフから所定期間経過後に自律的にオンに制御する電源制御部と、
    前記ディスクドライブへのデータアクセス状況に関わりなく自律的に電源オンに制御された同一のRAIDグループに属する全部又は一部のディスクドライブの障害を検査するメディア検査部と、
    を備えるストレージシステム。
  13. ディスクドライブへのデータアクセス状況に応じて前記ディスクドライブの電源を自律的にオフに制御するステップと、
    電源オフに制御された前記ディスクドライブの電源を前記ディスクドライブへのデータアクセス状況に関わりなく、前記電源オフから所定期間経過後に自律的にオンに制御するステップと、
    前記ディスクドライブへのデータアクセス状況に関わりなく自律的に電源オンに制御された前記ディスクドライブの障害を検査するステップと、
    を備えるストレージシステムの制御方法。
  14. 請求項13に記載のストレージシステムの制御方法であって、
    予め定義されたポリシーに基づいて、前記ディスクドライブへのデータアクセス状況に関わりなく電源オンに制御する前記ディスクドライブを選択するステップを更に備える、ストレージシステムの制御方法。
  15. 請求項14に記載のストレージシステムの制御方法であって、前記ポリシーは、障害が生じた前記ディスクドライブの属性情報に一致又は近似する属性情報を有するディスクドライブを優先的に選択することである、ストレージシステムの制御方法。
  16. 請求項14に記載のストレージシステムの制御方法であって、前記ポリシーは、障害が生じた前記ディスクドライブの属性情報のうち優先順位が高く設定されている属性情報に一致又は近似する属性情報を有するディスクドライブを優先的に選択することである、ストレージシステムの制御方法。
  17. 請求項14に記載のストレージシステムの制御方法であって、前記ポリシーは、前記ディスクドライブへのデータアクセス状況に関わりなく、前記ディスクドライブの電源を所定の検査周期で定期的にオンにすることである、ストレージシステムの制御方法。
  18. 請求項17に記載のストレージシステムの制御方法であって、前記検査周期は、前記ディスクドライブのディスクドライブタイプに応じて異なる、ストレージシステムの制御方法。
  19. 請求項14に記載のストレージシステムの制御方法であって、前記ポリシーは、最新のデータアクセスから所定期間経過していない前記ディスクドライブをメディア検査の対象から除外することである、ストレージシステムの制御方法。
  20. 請求項15に記載のストレージシステムの制御方法であって、前記属性情報は、前記ディスクドライブのベンダ名、ディスクドライブタイプ、記憶容量、型名、ロット番号、ファームウェアリビジョン、起動回数、総稼働時間、前回検査日時、検査済最終LBA、ユーザデータ格納の有無のうち何れかの情報である、ストレージシステムの制御方法。
  21. 請求項13に記載のストレージシステムの制御方法であって、
    (1)同一のRAIDグループに属する全てのディスクドライブの全記憶領域についてリードを行い、障害を検査する第一の検査レベル、
    (2)同一のRAIDグループに属する全てのディスクドライブの一部の憶領域についてリードを行い、障害を検査する第二の検査レベル、
    (3)同一のRAIDグループに属する全てのディスクドライブがレディ状態になるか否かをチェックする第三の検査レベル、
    のうち何れかの検査レベルに基づいて前記ディスクドライブの障害を検査するステップを更に備える、ストレージシステムの制御方法。
JP2006033905A 2006-02-10 2006-02-10 ストレージシステム及びその制御方法 Pending JP2007213721A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2006033905A JP2007213721A (ja) 2006-02-10 2006-02-10 ストレージシステム及びその制御方法
US11/412,961 US7558988B2 (en) 2006-02-10 2006-04-28 Storage system and control method thereof
EP06254510A EP1860556A3 (en) 2006-02-10 2006-08-30 Storage system and control method thereof
US12/457,146 US8161317B2 (en) 2006-02-10 2009-06-02 Storage system and control method thereof
US13/423,709 US8412986B2 (en) 2006-02-10 2012-03-19 Storage system and control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006033905A JP2007213721A (ja) 2006-02-10 2006-02-10 ストレージシステム及びその制御方法

Publications (1)

Publication Number Publication Date
JP2007213721A true JP2007213721A (ja) 2007-08-23

Family

ID=38492000

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006033905A Pending JP2007213721A (ja) 2006-02-10 2006-02-10 ストレージシステム及びその制御方法

Country Status (3)

Country Link
US (3) US7558988B2 (ja)
EP (1) EP1860556A3 (ja)
JP (1) JP2007213721A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009104412A (ja) * 2007-10-23 2009-05-14 Hitachi Ltd ストレージ装置及びその制御方法
JP2009223636A (ja) * 2008-03-17 2009-10-01 Fujitsu Ltd 情報処理システム、機能拡張装置及び制御方法
JP2010287019A (ja) * 2009-06-11 2010-12-24 Toshiba Corp Raid、及びこれを備えるコンピュータシステム
WO2011128936A1 (ja) 2010-04-14 2011-10-20 株式会社日立製作所 記憶制御装置及び記憶制御装置の制御方法
JP2012014531A (ja) * 2010-07-01 2012-01-19 Fujitsu Ltd ストレージ装置、ストレージ装置のコントローラおよびストレージ装置の制御方法
JP2013025632A (ja) * 2011-07-22 2013-02-04 Fujitsu Ltd ディスク制御装置、ディスク装置異常検出方法、及びプログラム
JP5437373B2 (ja) * 2009-07-22 2014-03-12 株式会社日立製作所 複数のフラッシュパッケージを有するストレージシステム

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8171204B2 (en) * 2000-01-06 2012-05-01 Super Talent Electronics, Inc. Intelligent solid-state non-volatile memory device (NVMD) system with multi-level caching of multiple channels
JP2006277320A (ja) * 2005-03-29 2006-10-12 Toshiba Corp ディスクアレイ装置、ディスクアレイ制御方法及びプログラム
JP2007334770A (ja) * 2006-06-16 2007-12-27 Fujitsu Ltd Raid装置、そのモジュール、ディスク組込み可否判定方法、及びプログラム
GB0614515D0 (en) 2006-07-21 2006-08-30 Ibm An apparatus for managing power-consumption
WO2009041291A1 (ja) * 2007-09-28 2009-04-02 Nec Personal Products, Ltd. ライブラリ装置
US8418072B1 (en) * 2007-12-24 2013-04-09 Emc Corporation UI data model abstraction
TWI364686B (en) * 2008-05-15 2012-05-21 Lumous Technology Co Ltd Method for protecting computer file used in solid state disk array
TW201005516A (en) * 2008-07-22 2010-02-01 Inventec Corp Method for providing a customized response from a disk array
JP2010055152A (ja) * 2008-08-26 2010-03-11 Hitachi Ltd 記憶制御装置
JP4719802B2 (ja) * 2009-03-09 2011-07-06 富士通株式会社 ストレージ管理装置、ストレージ管理方法およびストレージシステム
TWI431464B (zh) * 2009-04-29 2014-03-21 Micro Star Int Co Ltd Computer system with power control and power control method
US8732394B2 (en) 2009-12-24 2014-05-20 International Business Machines Corporation Advanced disk drive power management based on maximum system throughput
US8356198B2 (en) 2010-03-30 2013-01-15 Hewlett-Packard Development Company, L.P. Performing power management based on information regarding zones of devices in a system
JP4806084B1 (ja) * 2010-05-28 2011-11-02 株式会社東芝 情報処理装置
WO2011158294A1 (en) * 2010-06-17 2011-12-22 Hitachi, Ltd. Storage apparatus and method of detecting power failure in storage apparatus
US9939865B2 (en) 2014-06-13 2018-04-10 Seagate Technology Llc Selective storage resource powering for data transfer management
US10467172B2 (en) 2016-06-01 2019-11-05 Seagate Technology Llc Interconnect for shared control electronics
CN108345510B (zh) * 2018-01-11 2022-02-08 中国人民解放军国防科技大学 一种自动巡检检测大规模离线归档系统可靠性的方法
US11847324B2 (en) * 2020-12-31 2023-12-19 Pure Storage, Inc. Optimizing resiliency groups for data regions of a storage system

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5283792A (en) * 1990-10-19 1994-02-01 Benchmarq Microelectronics, Inc. Power up/power down controller and power fail detector for processor
US5414861A (en) * 1991-09-11 1995-05-09 Fujitsu Limited Data protection system using different levels of reserve power to maintain data in volatile memories for any period of time
TW292365B (en) * 1995-05-31 1996-12-01 Hitachi Ltd Computer management system
US6098128A (en) * 1995-09-18 2000-08-01 Cyberstorage Systems Corporation Universal storage management system
US5884055A (en) * 1996-11-27 1999-03-16 Emc Corporation Method and apparatus including a shared resource and multiple processors running a common control program accessing the shared resource
JP4325817B2 (ja) 1999-04-05 2009-09-02 株式会社日立製作所 ディスクアレイ装置
US7007141B2 (en) * 2001-01-30 2006-02-28 Data Domain, Inc. Archival data storage system and method
US7424627B2 (en) * 2003-05-22 2008-09-09 Canon Kabushiki Kaisha Storage device protection system, method for protecting hard disk thereof, medium for providing control program, and control program
JP4486348B2 (ja) 2003-11-26 2010-06-23 株式会社日立製作所 ドライブの稼働時間を抑止するディスクアレイ
US20050228943A1 (en) * 2004-04-02 2005-10-13 Decenzo David P Multipath redundant storage system architecture and method
US20050283682A1 (en) * 2004-06-18 2005-12-22 Hitachi, Ltd. Method for data protection in disk array systems
JP2006252649A (ja) * 2005-03-10 2006-09-21 Fujitsu Ltd 媒体記憶装置の装置固有情報の回復処理方法及び媒体記憶装置
US7263581B2 (en) * 2005-03-31 2007-08-28 Inventec Corporation System and method for accessing and verifying the validity of data content stored in the cache memory on disk

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009104412A (ja) * 2007-10-23 2009-05-14 Hitachi Ltd ストレージ装置及びその制御方法
JP2009223636A (ja) * 2008-03-17 2009-10-01 Fujitsu Ltd 情報処理システム、機能拡張装置及び制御方法
JP2010287019A (ja) * 2009-06-11 2010-12-24 Toshiba Corp Raid、及びこれを備えるコンピュータシステム
JP5437373B2 (ja) * 2009-07-22 2014-03-12 株式会社日立製作所 複数のフラッシュパッケージを有するストレージシステム
WO2011128936A1 (ja) 2010-04-14 2011-10-20 株式会社日立製作所 記憶制御装置及び記憶制御装置の制御方法
US8984352B2 (en) 2010-04-14 2015-03-17 Hitachi, Ltd. Storage control apparatus and control method of storage control apparatus
JP2012014531A (ja) * 2010-07-01 2012-01-19 Fujitsu Ltd ストレージ装置、ストレージ装置のコントローラおよびストレージ装置の制御方法
JP2013025632A (ja) * 2011-07-22 2013-02-04 Fujitsu Ltd ディスク制御装置、ディスク装置異常検出方法、及びプログラム
US8977892B2 (en) 2011-07-22 2015-03-10 Fujitsu Limited Disk control apparatus, method of detecting failure of disk apparatus, and recording medium for disk diagnosis program

Also Published As

Publication number Publication date
US20070220307A1 (en) 2007-09-20
US8412986B2 (en) 2013-04-02
US20120179937A1 (en) 2012-07-12
EP1860556A2 (en) 2007-11-28
US8161317B2 (en) 2012-04-17
US7558988B2 (en) 2009-07-07
US20090240992A1 (en) 2009-09-24
EP1860556A3 (en) 2011-06-08

Similar Documents

Publication Publication Date Title
JP2007213721A (ja) ストレージシステム及びその制御方法
JP4583150B2 (ja) ストレージシステム、及びストレージシステムにおけるスナップショットデータ作成方法
US7653781B2 (en) Automatic RAID disk performance profiling for creating optimal RAID sets
US9141457B1 (en) System and method for predicting multiple-disk failures
US8127182B2 (en) Storage utilization to improve reliability using impending failure triggers
US9766965B2 (en) System and method for monitoring and detecting faulty storage devices
US8959375B2 (en) System and method for power management of storage resources
JP2007156597A (ja) ストレージ装置
US8725945B2 (en) Method and system for governing an enterprise level green storage system drive technique
US20080172571A1 (en) Method and system for providing backup storage capacity in disk array systems
CN105009085A (zh) 信息处理系统、控制程序以及信息处理设备
JP2007115232A (ja) 低消費電力記憶装置とその制御方法
TW200540623A (en) System and method for drive recovery following a drive failure
US8037332B2 (en) Quad-state power-saving virtual storage controller
US8370688B2 (en) Identifying a storage device as faulty for a first storage volume without identifying the storage device as faulty for a second storage volume
US9229814B2 (en) Data error recovery for a storage device
WO2012081058A1 (en) Storage subsystem and its logical unit processing method
US8543789B2 (en) System and method for managing a storage array
US20110107317A1 (en) Propagating Firmware Updates In A Raid Array
US20220137837A1 (en) Storage system and file relocation method for storage system
US11080136B2 (en) Dropped write error detection
KR102659829B1 (ko) Raid 동작을 제어하는 방법 및 시스템
US20090063770A1 (en) Storage control apparatus, storage control program, and storage control method
JP2013012173A (ja) レイドの検出とデータ移動方法及びそのシステム
JP2018190192A (ja) ストレージ装置およびストレージ制御プログラム