JP4509549B2 - ディスクアレイ装置、及びハードディスクドライブの診断方法 - Google Patents

ディスクアレイ装置、及びハードディスクドライブの診断方法 Download PDF

Info

Publication number
JP4509549B2
JP4509549B2 JP2003428043A JP2003428043A JP4509549B2 JP 4509549 B2 JP4509549 B2 JP 4509549B2 JP 2003428043 A JP2003428043 A JP 2003428043A JP 2003428043 A JP2003428043 A JP 2003428043A JP 4509549 B2 JP4509549 B2 JP 4509549B2
Authority
JP
Japan
Prior art keywords
diagnosis
hard disk
error
self
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003428043A
Other languages
English (en)
Other versions
JP2005190003A (ja
Inventor
賢治 大谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003428043A priority Critical patent/JP4509549B2/ja
Publication of JP2005190003A publication Critical patent/JP2005190003A/ja
Application granted granted Critical
Publication of JP4509549B2 publication Critical patent/JP4509549B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、ディスクアレイ装置、及びハードディスクドライブの診断方法に関する。
近年、情報処理システムで取り扱われるデータ量が増大しており、ディスクアレイ装置の大容量化が進んでいる。また、情報処理システムが取り扱うデータの内容はますます重要度を増し、ディスクアレイ装置においては高い信頼性が求められている。
このような環境において、ディスクアレイ装置の出荷時や定期的な保守点検時等に、ハードディスクドライブに障害が発生していないかどうか診断することは非常に重要である。
SCSI規格のハードディスクドライブにおいては、自己診断機能を備えるものがある。このようなハードディスクドライブの場合、自己診断命令(Send Diagnostic)を用いることで、ハードディスクドライブに障害が発生していないかどうかを簡易に診断することが可能である。また、特許文献1においては、自己診断においてエラーが発生した際に、自己診断を途中で停止するかどうかをパラメータで指定する方法が開示されている。
特開2002−189571号公報
SCSI規格の自己診断命令を受けて実行される自己診断の内容は、ハードディスクドライブの製造者により決められているものである。そのため、ハードディスクドライブを利用する者にとっては自己診断の内容が不明であり、自己診断による判定結果が妥当であるかどうか判断することができない。特許文献1においては、自己診断においてエラーが発生した際の動作をパラメータで指定する方法が開示されているが、自己診断の内容は製造者により決められている標準の内容のままである。
本発明は上記課題を鑑みてなされたものであり、ディスクアレイ装置、及びハードディスクドライブの診断方法を提供することを目的とする。
上記課題を解決するために、本発明は、ディスク制御装置、及び前記ディスク制御装置と通信可能に接続される複数のハードディスクドライブを備えるディスクアレイ装置であって、前記ディスク制御装置は、通信可能に接続している情報処理装置から送信されるデータ入出力要求を受信するチャネル制御部、前記ハードディスクドライブを制御するディスク制御部、出力装置を備える管理端末、及び前記チャネル制御部、前記ディスク制御部、及び前記管理端末の夫々と通信可能に接続され、前記ハードディスクドライブが行う自己診断のパラメータが記憶される共有メモリを有し、前記ハードディスクドライブは、データが記憶される磁気ディスク、前記管理端末から命令を受信するハードディスクコントローラ、マイクロコンピュータ、及び前記マイクロコンピュータが読み書きするデータが記憶されるメモリを有し、前記管理端末は、前記ハードディスクドライブの自己診断命令、前記共有メモリから取得した前記パラメータ、及び前記自己診断命令を実行する前記ハードディスクドライブのドライブ番号を前記ディスク制御部に送信する第一の命令送信部を有し、前記ディスク制御部は、前記第一の命令送信部から送信される、前記自己診断命令、前記パラメータ、及び前記ドライブ番号を受信する命令受信部、及び前記自己診断の命令及び前記パラメータを、前記ドライブ番号で指定される前記ハードディスクドライブに送信する第二の命令送信部、を有し、前記マイクロコンピュータは、前記管理端末から前記ハードディスクコントローラを介して自己診断命令及び前記パラメータを受信する命令受信部、前記パラメータを前記メモリに記憶するメモリ記憶部、前記パラメータに設定されている、前記磁気ディスクの開始LBAから終了LBAまでに記憶されているデータの読み出し、又は前記開始LBAから前記終了LBAまでにデータの書き込みを行う診断実行部、及び前記開始LBAから前記終了LBAまでの前記読み出し又は前記書き込みが、実行中であるか、エラーを検出せずに終了しているか、エラーを検出して終了しているかを示すデータを記憶するテスト結果記憶部を有し、前記ディスク制御部は、 前記自己診断命令が実行中であるか、エラーを検出せずに終了しているか、エラーを検出して終了しているかを示すデータであるテスト結果を読み出す要求を所定の間隔で前記ハードディスクドライブに送信するテスト結果読み出し要求部、前記テスト結果にエラーを検出して終了していることを示すデータが設定されている場合は、前記自己診断命令の実行中に検出されたエラーのエラーコードの読み出し要求を前記ハードディスクドライブに送信するエラーコード読み出し要求部、前記ハードディスクドライブより受領する前記エラーコードの数を前記エラーコードごとに集計するエラー集計部、前記共有メモリに記憶されている前記エラーコードごとの閾値を参照し、前記エラー集計部により集計される前記エラーコードの数を前記エラーコードごとに前記閾値と比較する閾値チェック部、及び前記エラー集計部により集計される前記エラーコードの数が前記閾値より大きいものがあるかどうかを示すデータを診断結果として前記管理端末に送信する診断結果送信部を有し、前記管理端末は、前記診断結果送信部より受信する前記診断結果のデータに応じた情報を前記出力装置に出力する診断結果出力部を有する。
ハードディスクドライブ、情報処理装置、ディスク制御装置、及びハードディスクドライブの診断方法を提供することができる。
==全体構成==
図1は、本実施の形態に係るディスクアレイ装置100の全体構成を示すブロック図である。
ディスクアレイ装置100は、ディスク制御装置110とディスク駆動装置120とを備えている。ディスクアレイ装置100は情報処理装置200と通信手段により接続されている。通信手段は、例えば、LAN(Local Area Network)やSAN(Storage Area Network)、iSCSI(Internet Small Computer System Interface)、ESCON(Enterprise Systems Connection)(登録商標)、FICON(Fibre Connection)(登録商標)などである。
情報処理装置200は、CPU(Central Processing Unit)やメモリを備えるコンピュータであり、パーソナルコンピュータやワークステーション、メインフレームなどのコンピュータである。情報処理装置200は、結合された複数台のコンピュータで構成されることもある。情報処理装置200ではオペレーティングシステムが動作している。オペレーティングシステム上ではアプリケーションソフトウエアが動作している。アプリケーションソフトウエアは、例えば、銀行の自動預金預け払いシステムや航空機の座席予約システムの機能を提供する。
ディスク制御装置110はディスクアレイ装置100全体の制御を司る。ディスク駆動装置120はデータを記憶するハードディスクドライブ121を多数備える。ディスク制御装置110は、情報処理装置200から受信したコマンドに従ってハードディスクドライブ121に対する制御を行う。例えば情報処理装置200からデータの入出力要求を受信して、ハードディスクドライブ121に記憶されているデータの入出力のための処理を行う。
ディスク制御装置110は、チャネル制御部101、ディスク制御部102、共有メモリ103、キャッシュメモリ104、これらの間を通信可能に接続するクロスバスイッチなどで構成されるスイッチング制御部105、及び管理端末106などを備えて構成される。
キャッシュメモリ104は、主としてチャネル制御部101とディスク制御部102との間で授受されるデータを一時的に記憶するために用いられる。例えばチャネル制御部101が情報処理装置200から受信したデータ入出力コマンドが書き込みコマンドである場合には、チャネル制御部101は情報処理装置200から受信した書き込みデータをキャッシュメモリ104に書き込む。またディスク制御部102はキャッシュメモリ104から書き込みデータを読み出してハードディスクドライブ121に書き込む。
ディスク制御部102は、チャネル制御部101により共有メモリ103に書き込まれたデータ入出力要求を読み出してそのデータ入出力要求に設定されているコマンド(例えば、SCSI(Small Computer System Interface)規格のコマンド)に従ってハードディスクドライブ121にデータの書き込みや読み出しなどの処理を実行する。ディスク制御部102はハードディスクドライブ121から読み出したデータをキャッシュメモリ104に書き込む。またデータの書き込み完了通知や読み出し完了通知などをチャネル制御部101に送信する。ディスク制御部102は、ハードディスクドライブ121をいわゆるRAID(Redundant Array of Inexpensive Disks)方式に規定されるRAIDレベル(例えば、0,1,5)で制御する機能を備えることもある。
ハードディスクドライブ121により提供される記憶領域は、この記憶領域上に論理的に設定されるボリュームである論理ボリュームを単位として管理されている。ハードディスクドライブ121へのデータの書き込みや読み出しは、論理ボリュームに付与される識別子を指定して行なうことができる。
管理端末106はディスクアレイ装置100を保守・管理するためのコンピュータである。チャネル制御部101やディスク制御部102において実行されるソフトウエアやパラメータの変更は、管理端末106からの指示により行われる。管理端末106はディスクアレイ装置100に内蔵される形態とすることもできるし、別体とすることもできる。
なお、ディスクアレイ装置100は、以上に説明した構成のもの以外にも、例えば、NFS(Network File System)などのプロトコルにより情報処理装置200からファイル名指定によるデータ入出力要求を受け付けるように構成されたNAS(Network Attached Storage)として機能するものなどであってもよい。
共有メモリ103はチャネル制御部101、ディスク制御部102、及び管理端末106からアクセスが可能である。チャネル制御部101とディスク制御部102との間におけるデータ入出力要求コマンドの受け渡しに利用される他、ディスクアレイ装置100の管理情報等が記憶される。
==ディスクアレイ装置の外観構成==
図2は、本実施の形態に係るディスクアレイ装置100の外観構成を示す図である。
図2に示すディスクアレイ装置100ではディスク制御装置110が中央に配置され、その左右にディスク駆動装置120が配置されている。なお、ディスクドライブ121はディスク制御装置110にも収納されるようにすることができる。
ディスク制御装置110は、コントローラ111、ファン113、電源部112を備えている。コントローラ111はチャネル制御部101、ディスク制御部102、共有メモリ103、キャッシュメモリ104、又はスイッチング制御部105等を搭載する基板である。ディスク制御装置110にコントローラ111が装着されることにより、ディスクアレイ装置100の制御が行われる。ファン113はディスク制御装置110を冷却するために用いられる。電源部112はディスク制御装置110への電力の供給を行うために用いられる。
ディスク駆動装置120には多数のディスクドライブ121が収納される。ディスクドライブ121は、ディスク駆動装置120を構成する筐体に着脱可能なように収納されている。
図3は、コントローラ111がディスク制御装置110の装着部130に挿入される様子を示している。装着部130には複数のスロットが設けられており、各スロットにはコントローラ111を装着するためのガイドレールが設けられている。ガイドレールに沿ってコントローラ111をスロットに挿入することにより、コントローラ111をディスク制御装置110に装着することができる。各スロットに装着されたコントローラ111は、ガイドレールに沿って引き抜くことにより取り外すことができる。またコントローラ111には、コントローラ111とディスク制御装置110とを電気的に接続するためのコネクタが設けられている。コネクタはディスク制御装置110の装着部130の奥手方向正面部に設けられた相手側コネクタと嵌合する。
==情報処理装置==
次に、情報処理装置200の構成を示すブロック図を図4に示す。
情報処理装置200は、CPU401、計時機構402、メモリ403、記憶装置404、ポート405、記録媒体読取装置406、入力装置407、出力装置408を備える。
CPU401は情報処理装置200の全体の制御を司るもので、メモリ403に格納されたプログラムを実行することにより各種機能を実現する。計時機構402は、現在時刻を保持するクロック機構である。記録媒体読取装置406は、記録媒体409に記録されているプログラムやデータを読み取るための装置である。読み取られたプログラムやデータはメモリ403に格納される。記録媒体409としてはフレキシブルディスクやCD−ROM、半導体メモリ等を用いることができる。記録媒体読取装置406は情報処理装置200に内蔵されている形態とすることもできるし、外付されている形態とすることもできる。入力装置407はオペレータ等による情報処理装置200へのデータ入力等のために用いられる。入力装置407としては例えばキーボードやマウス等が用いられる。出力装置408は情報を外部に出力するための装置である。出力装置408としては例えばディスプレイやプリンタ等が用いられる。ポート405はディスクアレイ装置100と通信を行うための装置である。ポート405にはSAN500上の機器を特定するための識別子であるWWN(World Wide Name)が付与されている。またポート405は、他の情報処理装置200との間で通信を行うために使用することもできる。
==管理端末==
管理端末106はディスクアレイ装置100を保守・管理するためのコンピュータである。管理端末106を操作することにより、例えばディスク駆動装置120が備える物理ディスク構成の設定や、論理ボリュームの設定、チャネル制御部101やディスク制御部102において実行されるマイクロプログラムのインストール等を行うことができる。
管理端末106はディスクアレイ装置100に内蔵されている形態とすることもできるし、外付けされている形態とすることもできる。また管理端末106は、ディスク制御装置110及びディスク駆動装置120の保守・管理を専用に行うコンピュータとすることもできるし、汎用のコンピュータに保守・管理機能を持たせたものとすることもできる。
管理端末106の構成を示すブロック図を図5に示す。
管理端末106は、CPU501、計時機構502、メモリ503、記憶装置504、ポート505、記録媒体読取装置506、入力装置507、出力装置508を備える。
CPU501は管理端末106の全体の制御を司るもので、メモリ503に格納されたプログラムを実行することにより上記保守管理機能を実現する。計時機構502は、現在時刻を保持するクロック機構である。記録媒体読取装置506は、記録媒体509に記録されているプログラムやデータを読み取るための装置である。読み取られたプログラムやデータはメモリ503や記憶装置504に格納される。また例えば同様に、チャネル制御部101やディスク制御部102で実行させるためのマイクロプログラムが記録された記録媒体509からマイクロプログラムを記録媒体読取装置506を用いて読み取って、メモリ503や記憶装置504に格納し、チャネル制御部101やディスク制御部102にインストールするようにすることもできる。
記録媒体509としてはフレキシブルディスクやCD−ROM、半導体メモリ等を用いることができる。記録媒体読取装置506は管理端末106に内蔵されている形態とすることもできるし、外付されている形態とすることもできる。記憶装置504は、例えばハードディスク装置や半導体記憶装置等である。入力装置507はオペレータ等による管理端末106へのデータ入力等のために用いられる。入力装置106としては例えばキーボードやマウス等が用いられる。出力装置508は情報を外部に出力するための装置である。出力装置508としては例えばディスプレイやプリンタ等が用いられる。ポート505はスイッチング制御部105に接続されており、これにより管理端末106はチャネル制御部101やディスク制御部102等と通信を行うことができる。
==ディスク制御部==
次にディスク制御部140の構成を示す図を図6に示す。
ディスク制御部102は、インタフェース部601、メモリ602、CPU603、NVRAM(nonvolatile random-access memory)604、コネクタ605を備え、これらが一枚もしくは複数枚の回路基板に一体的なユニットとして形成されている。
インタフェース部601は、コネクタ305を介してチャネル制御部101等との間で通信を行うための通信インタフェースや、ディスク駆動装置120との間で通信を行うための通信インタフェースを備える。
CPU603は、ディスク制御部102全体の制御を司ると共に、チャネル制御部101やディスク駆動装置120、管理端末106との間の通信を行う。CPU603によりメモリ602やNVRAM604に格納された各種プログラムが実行されることによりディスク制御部102の機能が実現される。ディスク制御部102により実現される機能としては、ディスク駆動装置120に記憶されるデータの読み書きの制御やRAIDの制御等である。
NVRAM604はCPU603の制御を司るプログラムを格納する不揮発性メモリである。NVRAM604に記憶されるプログラムの内容は、管理端末106を用いて書き込みや書き換えを行うことができる。
==ハードディスクドライブ==
図7にハードディスクドライブ121の構成の一例を示す。ハードディスクドライブ121は、その筐体701内に、磁気ディスク702、アクチュエータ703、スピンドルモータ704、データの読み書きを行うヘッド705、磁気ディスク702へのデータの読み書き信号を制御する回路が搭載される信号処理基板706、各種コマンドやデータが入出力されるインタフェースコネクタ707、電源コネクタ708等を備えて構成される。
ハードディスクドライブ121は、例えば、コンタクトスタートストップ(CSS:Contact Start Stop)方式の3.5インチサイズの磁気ディスクや、ロード/アンロード方式の2.5インチサイズの磁気ディスクなどを備える記憶装置である。ハードディスクドライブ121は、例えば、SCSI−1、SCSI−2、SCSI−3などの通信インタフェースを有している。
図8は、信号処理基板706に搭載される回路を示すブロック図である。信号処理基板706には、マイクロコンピュータ801、メモリ802、ハードディスクコントローラ(以後、「HDC」と称する)803、リード・ライト・チャネル804が搭載されている。
マイクロコンピュータ801は、CPU、タイマ等を内蔵し、CPU801がメモリ802に格納されているプログラムを実行することにより、ハードディスクドライブ121の全体の制御を司る。メモリ802は、フラッシュメモリ等の不揮発性記憶領域である。メモリ802はマイクロコンピュータ801に内蔵することもできる。
HDC803は、インタフェースコネクタ707を介して各種コマンドやデータの送受信を行う。HDC803は、ECC(Error Correction Code)による誤り訂正を行うための誤り訂正回路805を有している。
リード・ライト・チャネル804は、HDC803から受信した書き込み用のデータをエラーが少なくなるようなデータに変調してヘッドアンプ806に送信したり、ヘッドアンプ806から受信した信号を復調してHDC803に送信する。ヘッドアンプ806は、ヘッド705から読み出した信号の増幅や、書き込み用信号の電流の増幅を行う。
マイクロコンピュータ801が、HDC803を介してデータの書き込み要求を受信した場合の動作について説明する。HDC803は、書き込み用のデータにECCを追加して、リード・ライト・チャネル804に送信する。リード・ライト・チャネルは、HDC803から受信したデータを、エラーが少なくなるようなデータ列に変調し、ヘッドアンプ806に送信する。この変調の方式は、例えば、RLL(Run Length Limited)などである。マイクロコンピュータ801は、HDC803及びリード・ライト・チャネル804の一連の動作を制御する。
次に、マイクロコンピュータ801が、HDC803を介してデータの読み出し要求を受信した場合の動作について説明する。リード・ライト・チャネル804はデータの読み出し要求をヘッドアンプ806に送信し、ヘッドアンプ806からデータを受信する。リード・ライト・チャネル804はヘッドアンプ806から受信したデータを復調し、HDC803に送信する。HDC803は、リード・ライト・チャネル804から受信したデータに付与されているECCを用いてエラー訂正を行い、当該データをインタフェースコネクタ707を介して読み出し要求の送信元に送信する。マイクロコンピュータ801は、HDC803及びリード・ライト・チャネル804の一連の動作を制御する。
HDC803のエラー訂正回路805が行う、ECCを用いたエラー訂正について説明する。図9は、ECCが付与された1つのセクタ901の構成を示す図である。セクタ901は、データ部902、CRC(Cyclic Redundancy Check)コード部903、ECC部904で構成されている。HDC803は、1つのセクタ901を先頭から順番に3つのウェイ905に分割する。それぞれのウェイ905にはセクタ901のECC部904のECCが分割されて付与されている。エラー訂正回路805は、各々のウェイ905についてECCを用いたエラー訂正を行う。また、HDC803は、マイクロコンピュータ801からの指示により、エラー訂正を行うウェイ905の数を変更することができる。なお、ウェイ905の数は3つに限られるものではない。
==自己診断命令とパラメータ==
本実施の形態における自己診断命令について説明する前に、SCSI−3の規格により定められている自己診断命令(SEND DIAGNOSTIC)について説明する。図10は、SCSI−3で規定されている自己診断命令1001のフォーマットを示す図である。1バイト目の2ビット目にある自己診断ビット(Self Test Bit)に1が設定され、1バイト目の5〜7ビット目にある自己診断コード(Self Test Code)に0以外の決められたコードが設定されている。ハードディスクドライブ121は、自己診断命令1001を受信すると、ハードディスクドライブ121の診断を行う。この診断の内容は、ハードディスクドライブ121の製造者により予め定められているものである。
次に、本実施の形態における自己診断命令について説明する。図11は、本実施の形態における自己診断命令1101のフォーマットを示す図である。自己診断命令1101は、SCSI−3規格の自己診断命令1001の自己診断ビットと自己診断コードとに0が設定されているものである。0バイト目の命令コード(Operation Code)には、SCSI−3規格の自己診断命令1001と同じ1Dhが設定されている。3,4バイト目のパラメータリスト長(Parameter List Length)には、自己診断命令1101に続けて発行されるパラメータ1201のバイト長が設定されている。
図12は、自己診断命令1101に続けて指定されるパラメータ1201のフォーマットを示す図である。パラメータ1201は、ヘッダ部1201とパラメータ部1203で構成されている。ヘッダ部1202は、ページコード(Page Code)、テスト個数、開始タイムスタンプで構成されている。ヘッダ部1202の0バイト目にあるページコードには、B0hが設定されている。ヘッダ部1202の1バイト目にあるテスト個数には、1回の自己診断命令1101で行う診断の数(N)が設定されている。ヘッダ部1202の2〜7バイト目にある開始タイムスタンプには、自己診断命令1101が発行された時刻または0が設定されている。パラメータ部1203は、N個のテストパラメータで構成されている。各テストパラメータには、テスト番号、開始LBA、終了LBA、シークモード、テストモード、ライトデータパターン、データ長、テスト時間、テスト回数、コマンド間隔、ECC能力モードが設定されている。1つのテストパラメータのサイズは20バイトである。
テストパラメータの内容について、詳細に説明する。テスト番号は、テストパラメータを識別するための番号である。開始LBAと終了LBAは、ハードディスクドライブ121において診断を行う範囲を示すLBA(Logical Block Address)である。シークモードは、開始LBAと終了LBAとの間をシーケンシャル、つまりアドレス順にアクセスするか、ランダムにアクセスするかを示すデータである。テストモードは、磁気ディスクへのアクセスの種類を表すデータである。テストモードには、読み出しモード、書き込みモード、書き込み確認モードがある。読み出しモードの場合、磁気ディスクに記録されているデータを読み出すことにより自己診断を実施する。読み出しモードの動作は、例えば、SCSI−3規格におけるREADコマンドを実行することにより実現することができる。書き込みモードの場合、磁気ディスクにデータを書き込むことにより自己診断を実施する。書き込みモードの動作は、例えば、SCSI−3規格におけるWRITEコマンドを実行することにより実現することができる。書き込み確認モードの場合、磁気ディスクにデータを書き込み、さらに書き込まれたデータを読み出すことにより自己診断を実施する。書き込み確認モードの動作は、例えば、SCSI−3規格におけるWRITE AND VERIFYコマンドを実行することにより実現することができる。ライトデータパターンには、磁気ディスクに書き込まれるデータのデータパターンを示す番号が設定される。データパターンは数種類あり、メモリ802に記憶されている。データパターンの例としては、全てが0のデータ、全てが1のデータ、0と1とが交互に出現するデータ等である。データ長には、1回の読み出し又は書き込みにおけるデータ長が設定されている。したがって、磁気ディスクにおけるヘッドのシーク回数は、開始LBAから終了LBAまでのデータサイズをデータ長で割った値となる。テスト時間には、テストパラメータで指定される自己診断の実行時間の上限が設定されている。つまり、自己診断の実行時間がテストパラメータに設定されているテスト時間を超過すると、自己診断は強制的に終了される。テスト回数には、テストパラメータで指定される自己診断を繰り返し実行する回数が設定されている。コマンド間隔には、読み出し又は書き込みの命令を実行する間隔を示す時間が設定されている。ECC能力モードには、ECCによるエラー訂正能力を制御するためのフラグが設定されている。
本実施の形態においては、1つのセクタ901は3つのウェイ905により構成されているものとし、ECC能力モードが0の場合は、全てのウェイ905についてエラー訂正を行い、ECC能力モードが1の場合は、2つのウェイ905についてエラー訂正を行うものとする。なお、ウェイの数は3に限られるものではない。また、ECC能力モードに、エラー訂正を行うウェイの数が設定されているものとしてもよい。
図13は、本実施の形態における自己診断命令1101の実行結果として出力されるログ1301のフォーマットを示す図である。ログ1301は、磁気ディスク702上の管理領域に記憶される。ハードディスクドライブ121の電源切断後もログ1301は磁気ディスク702上に記憶されたままであり、電源を再投入した後にログ1301を参照することが可能である。
ログ1301は、ヘッダ部1302とエラーログ部1303とで構成されている。ヘッダ部1302の0バイト目には、ページコード(Page Code)として20hが設定されている。ヘッダ部13021バイト目の0〜3ビット目には、自己診断命令1101のテスト結果(Test Result)が設定される。テスト結果は、自己診断命令を実行中であるか、エラーを検出することなく終了したか、エラーを検出して終了したか、エラーログが一杯となり終了したかを示すデータである。ヘッダ部1302のページ長(Page Length)には、エラーログ部1303のバイト数が設定される。
エラーログ部1303には、自己診断命令1101の実行により検出されたエラーの内容が記憶されている。1つのエラーは24バイトのエラーログに記憶され、エラーログ部には最大で100個のエラーログが記憶される。エラーの数が100を超えた場合は、前述したTestResultにエラーログが一杯であることを示すデータが設定され、自己診断命令1101の実行が中断される。1つのエラーログには、テスト番号、テストモード、タイムスタンプ、エラー検出LBA、エラーコードが設定されている。テスト番号及びテストモードは、テストパラメータで設定されたデータである。タイムスタンプには、テストパラメータの開始タイムスタンプに応じたデータが設定される。開始タイムスタンプに、自己診断命令1101の開始日時が設定されている場合、エラーログのタイムスタンプにはエラーを検出した日時が設定される。開始スタンプに0が設定されている場合、エラーログのタイムスタンプには、自己診断命令1101の実行開始からエラー検出までの経過時間が記録される。エラー検出LBAは、読み出し又は書き込みにおいてエラーが検出されたLBAが記録される。エラーコードには、検出されたエラーのセンスキー(Sense Key)およびセンスコード(Sense Code)が記録される。
磁気ディスク702に記憶されているログ1301は、例えば、SCSI−3のLOG SENSEコマンドを用いることにより読み出すことが可能である。LOG SENSEコマンドにおいてページコード(Page Code)に20h、アロケーション長(Allocation Length)に4バイトを指定することで、ヘッダ部1302に記憶されているテスト結果及びエラーログ部1303のサイズを取得することができる。また、LOG SENSEコマンドにおいてページコードに20h、アロケーション長にログ1301の全領域を指定することで、エラーログ部1303に記憶されているエラーログを取得することができる。
==自己診断の形態(1)==
以上に説明した自己診断命令1101、パラメータ1201、及び1301を用いて行うハードディスクドライブ121の診断について説明する。
図14は、診断を行う際の形態を示す図である。情報処理装置200は、DKU120に格納されているハードディスクドライブ121とFC−AL122を介して接続されている。情報処理装置200は、FC−AL122で通信可能に接続されているハードディスクドライブ121に対して自己診断命令1101を発行する。
図15は、ハードディスクドライブ121が有する機能を示すブロック図である。ハードディスクドライブ121は、命令受信部1501、メモリ記憶部1502、診断実行部1503、テスト結果記憶部1504、エラーコード記憶部1505を備えている。各部1501〜1505は、マイクロコンピュータ801が備えるCPUがメモリ802に格納されているプログラムを実行することにより実現される。
図16は、情報処理装置200が有する機能を示すブロック図である。情報処理装置200は、モードパラメータ読み出し要求部1601、命令設定部1602、命令送信部1603、テスト結果読み出し要求部1604、エラーコード読み出し要求部1605、エラー集計部1606、閾値チェック部1607、診断結果出力部1608を備えている。各部1601〜1608は、情報処理装置200が備えるCPU401がメモリ403に格納されているプログラムを実行することにより実現される。
図17は、自己診断命令1101を実行するハードディスクドライブ121の処理を示すフローチャートである。
命令受信部1501は、HDC803を介して自己診断命令1101とパラメータ1201とを受信する(S1701)。
メモリ記憶部1502は、メモリ802に記憶されている前回のパラメータ1201を消去し(S1702)、磁気ディスク702に記憶されている前回のログ1301を消去する(S1703)。メモリ記憶部1502は、受信したパラメータ1201をメモリ802に記憶する(S1704)。
エラーコード記憶部1505は、パラメータの開始タイムスタンプをタイマーの初期値に設定し(S1705)、タイマーの動作を開始する(S1706)。テスト結果記憶部1504は、磁気ディスク702上に当該自己診断に対するログ1302の領域を確保し、ヘッダ部1302のテスト結果に「実行中」を示すデータを設定する(S1707)。
診断実行部1503は、変数Nに初期値1を設定し(S1708)、N番目のテストパラメータに対するテスト処理を実行する(S1709)。診断実行部1503は、Nに1加え(S1710)、Nがパラメータ1201に設定されているテスト個数より大きくなるまで(S1711)テスト処理を繰り返し行う。
全てのテスト処理が完了すると、テスト結果記憶部1504はエラーログ部1303にエラーログが出力されているかどうかを確認する(S1712)。エラーログが出力されている場合、テスト結果記憶部1504はログ1301のテスト結果に、エラーを検出して終了したことを示すデータを設定する(S1713)。エラーログが出力されていない場合、テスト結果記憶部1504はログ1301のテスト結果に、エラーを検出することなく終了したことを示すデータを設定する(S1714)。
図18は、N番目のテストパラメータに対して実行されるテスト処理(S1708)を示すフローチャートである。
診断実行部1503は、パラメータ1201に設定されているN番目のテストパラメータを参照する(S1801)。診断実行部1503は、テスト処理の実行開始からの経過時間を計測するためのタイマーを開始する(S1802)。経過時間は、当該テスト処理の実行時間がテストパラメータのテスト時間を超えないように制御するために用いられる。診断実行部1503は、テストパラメータの開始LBA、終了LBA、データ長を用いて必要なシーク回数を算出し、変数Nに設定する(S1803)。診断実行部1503は、テストパラメータのテスト時間を変数Tに設定する(S1804)。診断実行部1503は、テストパラメータのテスト回数を変数Xに設定する(S1805)。
診断実行部1503は、テストパラメータのテストモードに設定されているデータが読み出しモードを示すデータであるかどうか確認する(S1806)。診断実行部は、テストモードに設定されているデータが読み出しモードを示すデータでない場合は、テストパラメータのライトデータパターンの番号に対応するデータをメモリ802から読み出し、書き込み用のデータを生成する(S1807)。
診断実行部1503は、後述するLBA選択処理を実行し、アクセス対象のLBAを選択する(S1808)。診断実行部1503は、テストモードに設定されているデータが読み出しモードを示すデータであるかどうか確認し(S1809)、読み出しモードを示すデータである場合は、選択されたLBAのデータをREADコマンドで読み出す(S1810)。なお、診断実行部1503はテストパラメータのECC能力モードに設定されているデータを参照し、ECC能力モードに設定されているデータが1である場合は、データをREADコマンドを用いて読み出す(S1810)際に、3つのウェイのうちの2つのウェイについてのみECCによる訂正を行うよう、HDC803に通知する。
テストモードに設定されているデータが読み出しモードを示すデータでない場合、診断実行部1503はテストモードに設定されているデータが書き込みモードを示すデータであるかどうか確認する(S1811)。書き込みモードを示すデータである場合、診断実行部1503は、選択されたLBAに書き込み用のデータをWRITEコマンドで書き込む(S1812)。書き込みモードを示すデータでない場合、つまり、書き込み確認モードを示すデータである場合、診断実行部1503は、選択されたLBAに書き込み用のデータをWRITE AND VERIFYコマンドで書き込む(S1813)。
エラーコード記憶部1505は、選択されたLBAへの読み出し又は書き込み(S1810,S1812,S1813)においてエラーが検出されたかどうか確認する(S1814)。エラーが検出されなかった場合、診断実行部1503は、テストパラメータのコマンド間隔に設定されている時間だけ待機する(S1815)。
エラーが検出された場合、エラーコード記憶部1505は、エラーコードを取得し(S1816)、検出されたエラーの数を示すエラー検出数に1加算する(S1817)。エラーコード記憶部1505は、エラー検出数が100以下であるかどうか確認する(S1818)。エラー検出数が100以下である場合、エラーコード記憶部1505は、テスト番号、テストモード、タイムスタンプ、エラー検出LBA、エラーコードをエラーログに記憶する(S1819)。なお、タイムスタンプには、S1706で開始されたタイマーにより算出された値が設定される。そのため、パラメータ1201の開始タイムスタンプに自己診断命令1101の開始日時が設定されている場合は、エラーが検出された日時が記録され、開始タイムスタンプに0が設定されている場合は、自己診断命令1101の実行開始からエラー検出までの経過時間が記録される。エラー検出数が100を超えている場合、テスト結果記憶部1504は、ログ1301のテスト結果にログが一杯になって終了したことを示すデータを設定し(S1820)、自己診断処理を終了する。
エラーが検出されなかった場合、又はエラーが検出されたがエラー検出数が100以下である場合、診断実行部1503は、後述する終了判定処理を実行する(S1821)。診断実行部は、終了判定処理の結果を確認する(S1822)。終了判定処理の結果が処理の終了を示すものである場合、診断実行部1503はN番目のテストパラメータに対するテスト処理を終了する。終了判定処理の結果が処理の続行を示すものである場合、診断実行部1503は次にアクセスするLBAを選択し(S1808)、選択されたLBAに対する処理を前述同様に行う。
図19は、LBA選択処理(S1808)を示すフローチャートである。
診断実行部1503は、テストパラメータにのシークモードに設定されているデータがシーケンシャルアクセスを示すデータであるかどうか確認する(S1901)。
シーケンシャルアクセスを示すデータである場合、診断実行部1503は、変数Sが開始LBA、終了LBA、データ長から算出されたシーク回数と一致しているかどうか確認する(S1902)。変数Sがシーク回数と一致している場合、診断実行部1503はアクセス対象のLBAとして開始LBAを選択する(S1903)。変数Sがシーク回数と一致していない場合、診断実行部1503は前回のアクセス対象LBAにテストパラメータに設定されているデータ長を加えた値をアクセス対象のLBAとして選択する(S1904)。
ランダムアクセスを示すデータである場合、診断実行部1503は、開始LBAから終了LBAまでのデータ領域について、アクセスが行われたかどうかを図20に示すシーク管理テーブル2001に記憶している。シーク管理テーブル2001にはシーク番号の欄と未済の欄とがある。シーク番号は、図21に示すように、開始LBAからのオフセットを示す値である。テストパラメータに設定されている開始LBA、終了LBA、データ長から算出されるシーク回数をSとすると、シーク番号は0番からS−1番まで存在する。未済の欄には、開始LBA+データ長×シーク番号からデータ長のサイズの領域がアクセスされていない場合は0が、アクセスされている場合は1が記憶されている。
ランダムアクセスの場合、診断実行部1503は、変数Sが開始LBA、終了LBA、データ長から算出されたシーク回数と一致しているかどうか確認する(S1905)。変数Sがシーク回数と一致している場合、診断実行部1503はシーク管理テーブル2001の全てのシーク番号について未済を0にクリアする(S1906)。診断実行部1503は、シーク管理テーブル2001において未済が0となっているシーク番号を任意に選択し(S1907)、選択したシーク番号についてシーク管理テーブル2001の未済に1を設定する。診断実行部1503は、選択したシーク番号を変数Aに設定し(S1908)、開始LBA+データ長×変数Aをアクセス対象のLBAとして選択する。
診断実行部1503は、シークモードに従いアクセス対象のLBAを選択した後、変数Sを1減じる(S1910)。
図22は、終了判定処理(S1821)を示すフローチャートである。
診断実行部1503は、S1802で計測を開始した経過時間がテストパラメータのテスト時間を示す値である変数T未満であるかどうか確認する(S2201)。
経過時間が変数T未満である場合、診断実行部1503は、変数Sが0であるかどうか確認する(S2202)。変数Sが0であるということは、テストパラメータで指定された開始LBAから終了LBAまでの領域が全てアクセスされたことを示している。
変数Sが0でない場合、診断実行部1503は、N番目のテストパラメータに対する自己診断を続行すると判定する(S2203)。
変数Sが0である場合、診断実行部1503は、テスト回数を制御する変数Xを1減じる(S2204)。診断実行部1503は、変数Xが0であるかどうか確認する(S2205)。
変数Xが0でない場合、診断実行部1503は、開始LBA、終了LBA、データ長から算出されたシーク回数を変数Sに設定し(S2206)、N番目のテストパラメータに対する自己診断を続行すると判定する(S2203)。
経過時間がT以上である場合、もしくは変数Xが0である場合、診断実行部1503はN番目のテストパラメータに対する自己診断を終了すると判定する(S2207)。
以上、自己診断命令1101とパラメータ1201とを受信して自己診断を実行するハードディスクドライブ121の動作について説明した。
次に、図23のフローチャートを用いて、情報処理装置200の動作について説明する。モードパラメータ読み出し要求部1601は、ハードディスクドライブ121に設定されているモードパラメータを読み出す(S2301)。モードパラメータの読み出しは、例えば、SCSI−3規格におけるMODE SENSEコマンドを実行することにより実現することができる。命令送信部1603は、モードパラメータに自己診断命令1101を実行可能であることを示すデータが設定されているかどうか確認する(S2302)。
モードパラメータに自己診断命令1101を実行可能であることを示すデータが設定されていない場合、命令送信部1603は、当該ハードディスクドライブ121が自己診断命令1101を実行できないことを示す情報を出力装置408に出力する(S2303)。
モードパラメータに自己診断命令1101を実行可能であることを示すデータが設定されている場合、命令設定部1602は、記憶装置404に記憶されているパラメータ1201を参照する(S2304)。命令設定部1602は、パラメータ1201の開始タイムスタンプの値が0であるかどうか確認する(S2305)。開始タイムスタンプが0でない場合、命令設定部1602は、開始タイムスタンプに現在時刻を設定する(S2306)。命令設定部1602は、自己診断命令1101を生成する(S2307)。
命令送信部1603は、自己新命令1101とパラメータ1201とをハードディスクドライブ121に送信する(S2308)。
テスト結果読み出し要求部1604は、所定の時間待機し(S2309)、自己診断命令1101のテスト結果をハードディスクドライブ121から取得する(S2310)。前述した通り、テスト結果の取得はハードディスクドライブ121に記憶されているログ1301のヘッダ部1302をLOG SENSEコマンドを実行して取得することにより実現することができる。テスト結果読み出し要求部1604は、取得したログ1301のテスト結果に実行中を示すデータが設定されているかどうか確認する(S2311)。実行中を示すデータが設定されている間、テスト結果読み出し要求部1604は、所定の間隔で自己診断命令のテスト結果の取得を繰り返し行う(S2309〜S2311)。
取得したログ1301のテスト結果に実行中であることを示すデータ以外が設定されている場合、エラーコード読み出し要求部1605は、ログ1301のヘッダ部1302に設定されているページ長をもとに、ログ1301の全領域を取得する(S2312)。ログ1301の全領域の取得も、同様にLOG SENSEコマンドを実行することにより実現することができる。
エラー集計部1606は、ログ1301のエラーログ部1303に記憶されているエラーログを参照し、エラーの数をエラーコード毎に集計する(S2313)。閾値チェック部1607は、記憶装置404に記憶されているエラーコード毎の閾値を参照する(S2314)。閾値チェック部1607は、エラー集計部1606により集計されたエラーコード毎のエラー数のうち、閾値を超えているものがあるかどうか確認する(S2315)。
閾値を超えているものが無い場合、診断結果出力部1608は、当該ハードディスクドライブ121の診断の結果が合格であることを示す情報を出力装置408に出力する(S2316)。閾値を超えているものがある場合、診断結果出力部1608は、当該ハードディスクドライブ121の診断の結果が不合格であることを示す情報を出力装置408に出力する(S2317)。
以上、自己診断命令1101を実行するハードディスクドライブ121、及び当該自己診断命令1101の指示および自己診断結果の出力を行う情報処理装置200について説明した。
近年、ハードディスクドライブ121に記憶されるデータの重要性は益々高まってきている。ハードディスクドライブ121は大容量化の一途をたどり、これに伴い記録密度も高くなってきている。記録密度が高くなることに伴ってトラック幅が狭くなり、様々な障害が増加する可能性がある。例えば、スピンドルモータの振動に起因するヘッドのポジショニング不正によるエラーや、ヘッドの読み出し信号の低下によるエラーなどである。
このような障害は、長時間、媒体にアクセスしないと検出できない場合もある。そのため、ハードディスクドライブ121の使用を開始する前に、十分な診断を行い、障害を未然に防ぐ必要がある。前述の通り、SCSI−3の規格においては、ハードディスクドライブ121の自己診断命令1001が提供されている。しかし、SCSI−3の規格における自己診断命令1001を用いたハードディスクドライブ121の診断においては、診断の詳細が明確でない。そのため、ハードディスクドライブ121を導入するユーザにとっては、診断が妥当であるかどうか判断することができない。そのため、ユーザは情報処理装置200からSCSIコマンドを用いてハードディスクドライブ121の全領域にアクセスするプログラムを作成し、詳細な診断を実施する場合もある。SCSIにおけるデータアクセスにおいては、アクセスするLBAとデータ長とを指定する。ハードディスクドライブ121の全領域にアクセスするためには、全LBAをデータ長で割った数のコマンドを発行する必要がある。情報処理装置200は1つのコマンドの完了後に次のコマンドを発行する。そのため、ハードディスクドライブ121の全領域を診断するためには相当の時間を要する。
本発明においては、診断の対象範囲が開始LBAと終了LBAとしてパラメータ1201に設定される。ハードディスクドライブ121は当該パラメータ1201に設定されている範囲においてデータの読み出し又はデータの書き込みを行う診断を実施する。例えば、開始LBAに先頭LBAを、終了LBAに末尾LBAを設定すれば、1回のコマンドでハードディスクドライブ121の全領域の診断をハードディスクドライブ121に指示することが可能となる。また、診断はハードディスクドライブ121内部で行われる。そのため、診断において情報処理装置200とハードディスクドライブ121との間でデータ転送が発生しない。情報処理装置200はハードディスクドライブ121に記憶されているログ1301を取得することで、当該診断のテスト結果を確認することができる。したがって、SCSIコマンドでプログラムを作成してハードディスクドライブ121の診断を行う場合と比較して短い時間で、ユーザが指定する範囲の診断を行うことが可能となる。また、自己診断において発生するエラーのエラーコードをエラーログとして記憶しておくことにより、自己診断において発生したエラーの詳細を確認することができる。
また、パラメータ1201設定により、ハードディスクドライブ121が使用される環境に応じた診断を行うことが可能となる。
例えば、データのバックアップ用に用いられるハードディスクドライブ121の場合は、シーケンシャルアクセスの頻度が高い。そのため、パラメータ1201のシークモードにシーケンシャルアクセスを示すデータを設定することにより、シーケンシャルアクセスを連続して行う診断を行うことが可能である。例えば、オンライン業務のデータベース格納用に用いられるハードディスクドライブ121の場合は、ランダムアクセスの頻度が高い。そのため、パラメータのシークモードにランダムアクセスを示すデータを設定することにより、ランダムアクセスを連続して行う診断を行うことが可能である。
例えば、既に業務データが記憶されているハードディスクドライブ121を診断する場合は、業務データに診断用のデータを上書きすることができない。そのような場合には、テストモードに読み出しモードを示すデータを設定することにより、業務データを失うことなく、READコマンドによる診断を行うことが可能である。
例えば、ハードディスクドライブ121を製品として出荷する前に診断する場合は、テストモードに書き込みモードを示すデータを設定することにより、データの書き込みテストを行うことが可能である。
例えば、データを失うことが許容されない基幹業務等に用いられるハードディスクドライブ121を診断する場合は、テストモードに書き込み確認モードを示すデータを設定することにより、データの書き込みが確実に行われていることを確認することが可能となる。
例えば、オンライン業務の停止時間が限られており、その時間内にハードディスクドライブ121の診断を行う必要がある場合がある。このような場合、パラメータ1201のテスト時間に診断の上限時間を設定することにより、オンライン業務の再開に影響を与えることなく、ハードディスクドライブ121の診断を行うことが可能である。
例えば、長時間連続で使用されるハードディスクドライブ121の場合は、テスト回数を増やすことにより、長時間アクセスによる診断を行うことが可能となる。
例えば、アクセス頻度の高いオンライン業務で使用されるハードディスクドライブ121の場合は、コマンド間隔を短くすることにより、アクセス頻度の高い環境における診断を行うことが可能となる。また、コマンド間隔を短くすることにより、診断の完了時間を短くすることが可能となる。
例えば、無停止運用されているハードディスクドライブ121の場合は、コマンド間隔を長くすることにより、通常業務によるハードディスクドライブ121へのアクセス性能を低下させることなく、ハードディスクドライブ121の診断を行うことが可能となる。
例えば、パラメータにECC能力モードを設定することにより、ECCの訂正可能範囲を制御し、エラーの検出能力を高めることができる。
また、情報処理装置200は、ハードディスクドライブ121において自己診断命令1101が実行されている最中は、定期的にテスト結果を確認するだけで良い。つまり、情報処理装置200とハードディスクドライブ121との間で多くのコマンドやデータが送受信されることがない。そのため、情報処理装置200は、1台のハードディスクドライブ121に自己診断命令1101とパラメータ1201とを送信した後、当該自己診断命令1101の実行が終了するのを待たずに、別のハードディスクドライブ121に自己診断命令1101とパラメータ1201とを送信することが可能となる。したがって、複数台のハードディスクドライブ121に並行して診断を行わせることが可能となる。ディスクアレイ装置100を構成するDKU120に情報処理装置200を接続し、情報処理装置200からDKU120の全ハードディスクドライブ121に自己診断命令1101とパラメータ1201とを送信することにより、DKU120の全ハードディスクドライブ121の診断を並行して行うことが可能となる。したがって、SCSIコマンドを用いてハードディスクドライブ121の全領域にアクセスするプログラムを用いてDKU120の全ハードディスクドライブ121を1台ずつ診断する場合と比較して短い時間でDKU120の全ハードディスクドライブ121の診断することが可能となる。
また、ハードディスクドライブ121において発生したエラーの数をエラーコード毎の閾値と比較し、閾値より大きいものがあるかどうかにより合否判定を行う。これにより、複数のハードディスクドライブ121の診断を並行して行う場合に、各々のハードディスクドライブ121における診断結果の判断を容易に行うことが可能となる。
また、自己診断命令1101を実行可能なハードディスクドライブ121と実行不可能なハードディスクドライブ121とが混在している環境において、自己診断命令1101を実行可能なハードディスクドライブ121のみを選択して診断を行うことが可能となる。例えば、複数のハードディスクドライブ121により構成されるDKU120では、自己診断命令1101を実行可能なハードディスクドライブ121と実行不可能なハードディスクドライブ121とが混在する場合がある。このような状況は、自己診断命令1101を実行不可能なハードディスクドライブ121で構成されるDKU120において、障害が発生したハードディスクドライブ121を自己診断命令1101を実行可能なハードディスクドライブ121と交換する等により発生する。そこで、自己診断命令1101を実行可能であるかどうかをハードディスクドライブ121のモードパラメータに設定する。情報処理装置200はモードパラメータを参照し、自己診断命令1101を実行可能なハードディスクドライブ121のみに自己診断命令1101とパラメータ1201とを送信する。これにより、自己診断命令1101を実行可能なハードディスクドライブ121と実行不可能なハードディスクドライブ121とが混在している環境において、自己診断命令1101を実行可能なハードディスクドライブ121のみを対象とした診断を行うことが可能となる。
==自己診断の形態(2)==
次に、情報処理装置200を用いずに、ディスクアレイ装置100内で行うハードディスクドライブ121の診断について説明する。なお、ハードディスクドライブ121における処理は、前述した自己診断の形態(1)と同様である。
図24は、管理端末106が有する機能を示すブロック図である。管理端末106は、命令設定部2401、第一の命令送信部2402、診断結果出力部2403を備えている。各部2401〜2403は、管理端末106が備えるCPU501がメモリ503に格納されているプログラムを実行することにより実現される。
図25は、ディスク制御部102が有する機能を示すブロック図である。ディスク制御部102は、命令受信部2501、モードパラメータ読み出し要求部2502、第二の命令送信部2503、テスト結果読み出し要求部2504、エラーコード読み出し要求部2505、エラー集計部2506、閾値チェック部2507、診断結果送信部2508を備えている。各部2501〜2508は、ディスク制御部102が備えるCPU603がメモリ602やNVRAM604に格納されているプログラムを実行することにより実現される。
図26は、管理端末106における処理を示すフローチャートである。命令設定部2201は、共有メモリ103に記憶されているパラメータ1201を参照する(S2601)。命令設定部2401は、パラメータ1201の開始タイムスタンプに設定されている値が0であるかどうか確認する(S2602)。開始タイムスタンプに設定されている値が0でない場合、命令設定部2401は、開始タイムスタンプに現在時刻を設定する(S2603)。命令設定部2401は、自己診断命令1101を生成する(S2604)。
第一の命令送信部2402は、自己診断命令1101、パラメータ1201、及び自己診断命令1101を実行するハードディスクドライブ121のドライブ番号をディスク制御部102に送信する(S2605)。
診断結果出力部2405は、ディスク制御部102から当該ハードディスクドライブ121における自己診断命令1101の診断結果を受信すると(S2606)、診断結果に応じた情報を出力装置508に出力する(S2607)。なお、診断結果には、ハードディスクドライブ121が「合格」であるか、「不合格」であるか、又は自己診断命令1101を「実行不可」であるかを示すデータが設定されている。
図27は、ディスク制御部102における処理を示すフローチャートである。命令受信部2501は、管理端末106から、自己診断命令1101、パラメータ1201、及び自己診断命令1101を実行するハードディスクドライブ121のドライブ番号とを受信する(S2701)。モードパラメータ読み出し要求部2502は、当該ドライブ番号のハードディスクドライブ121に設定されているモードパラメータを取得する(S2702)。
モードパラメータに自己診断命令1101を実行可能であることを示すデータが設定されていない場合、第二の命令送信部2503は、当該ハードディスクドライブ121が自己診断命令1101の診断結果に実行不可であることを示すデータを設定する(S2704)。
モードパラメータに自己診断命令1101を実行可能であることを示すデータが設定されている場合、第二の命令送信部2503は、自己診断命令1101とパラメータ1201とを当該ドライブ番号のハードディスクドライブ121に送信する(S2705)。
テスト結果読み出し要求部2504は、所定の時間待機し(S2706)、自己診断命令1101のテスト結果をハードディスクドライブ121から取得する(S2707)。テスト結果の取得はハードディスクドライブ121に記憶されているログ1301のヘッダ部1302をLOG SENSEコマンドを実行して取得することにより実現することができる。テスト結果読み出し要求部2504は、取得したログ1301のテスト結果に実行中を示すデータが設定されているかどうか確認する(S2708)。実行中を示すデータが設定されている間、テスト結果読み出し要求部2504は、所定の間隔で自己診断命令のテスト結果の取得を繰り返し行う(S2706〜S2708)。
取得したログ1301のテスト結果に実行中を示すデータ以外が設定されている場合、エラーコード読み出し要求部2505は、ログ1301のヘッダ部1302に設定されているページ長をもとに、ログ1301の全領域を取得する(S2709)。ログ1301の全領域の取得も、同様にLOG SENSEコマンドを実行することにより実現することができる。
エラー集計部2506は、ログ1301のエラーログ部1303に記憶されているエラーログを参照し、エラーの数をエラーコード毎に集計する(S2710)。閾値チェック部2507は、共有メモリ103に記憶されているエラーコード毎の閾値を参照する(S2711)。閾値チェック部2507は、エラー集計部2506により集計されたエラーコード毎のエラー数のうち、閾値を超えているものがあるかどうか確認する(S2712)。
閾値を超えているものが無い場合、閾値チェック部2507は、当該ハードディスクドライブ121における自己診断命令1101の診断結果に合格であることを示すデータを設定する(S2713)。閾値を超えているものがある場合、閾値チェック部2507は、当該ハードディスクドライブ121における自己診断命令1101の実行結果が不合格であると設定する(S2714)。
診断結果送信部2508は、実行不可、合格、又は不合格を示すデータが設定されている診断結果を管理端末106に送信する(S2715)。
以上、ディスクアレイ装置100内で、ハードディスクドライブ121の診断を行う方法について説明した。
これにより、複数のハードディスクドライブ121を有するディスクアレイ装置100において、これらハードディスクドライブ121の診断を情報処理装置200を用いることなく行うことが可能となる。したがって、本番業務で使用されている情報処理装置200に負荷をかけることもなく、診断用に特別な情報処理装置200を用意する必要もない。また、情報処理装置200からの診断の場合と同様に、複数のハードディスクドライブ121の診断を並行して行うことが可能となる。したがって、SCSIコマンドを用いてハードディスクドライブ121の全領域にアクセスするプログラムを用いてディスクアレイ装置100の全ハードディスクドライブ121を1台ずつ診断する場合と比較して短い時間でディスクアレイ装置100の全ハードディスクドライブ121の診断を行うことが可能となる。また、エラーの数を閾値と比較して診断の結果を判定し、これを管理端末106に表示することにより、各々のハードディスクドライブ121における診断結果の判断を容易に行うことが可能となる。
また、情報処理装置200からの診断の場合と同様に、ディスクアレイ装置100内に自己診断命令1101を実行可能なハードディスクドライブ121と実行不可能なハードディスクドライブ121とが混在している環境において、自己診断命令1101を実行可能なハードディスクドライブ121のみを選択して診断を行うことが可能となる。
以上、本実施の形態について説明したが、上記実施例は本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物も含まれる。
本実施の形態に係る、ディスクアレイ装置の全体構成を示すブロック図である。 本実施の形態に係る、ディスクアレイ装置の外観構成を示す図である。 本実施の形態に係る、コントローラがディスク制御装置の装着部に挿入される様子を示す図である。 本実施の形態に係る、情報処理装置の構成を示すブロック図である。 本実施の形態に係る、管理端末の構成を示すブロック図である。 本実施の形態に係る、ディスク制御部の構成を示すブロック図である。 本実施の形態に係る、ハードディスクドライブの構成を示す図である。 本実施の形態に係る、ハードディスクドライブの信号処理基板に搭載される回路を示すブロック図である。 本実施の形態に係る、ECCが付与されたセクタの構成を示す図である。 SCSI−3で規定されている自己診断命令のフォーマットを示す図である。 本実施の形態に係る、自己診断命令のフォーマットを示す図である。 本実施の形態に係る、自己診断命令に続けて指定されるパラメータのフォーマットを示す図である。 本実施の形態に係る、自己診断命令の実行結果として出力されるログのフォーマットを示す図である。 本実施の形態に係る、自己診断命令を用いてハードディスクドライブの診断を行う際の形態を示す図である。 本実施の形態に係る、ハードディスクドライブが有する機能を示すブロック図である。 本実施の形態に係る、情報処理装置が有する機能を示すブロック図である。 本実施の形態に係る、自己診断命令を実行するハードディスクドライブの処理を示すフローチャートである。 本実施の形態に係る、自己診断命令を実行するハードディスクドライブにおいて、N番目のテストパラメータに対して実行されるテスト処理を示すフローチャートである。 本実施の形態に係る、自己診断命令を実行するハードディスクドライブにおいて、アクセスするLBAを選択する処理を示すフローチャートである。 本実施の形態に係る、ランダムアクセスを制御するためのシーク管理テーブルを示す図である。 本実施の形態に係る、シーク管理テーブルにおけるシーク番号を示す図である。 本実施の形態に係る、自己診断命令を実行するハードディスクドライブにおいて、N番目のテストパラメータに対して実行される診断の終了を判定する処理を示すフローチャートである。 本実施の形態に係る、自己診断命令とパラメータとをハードディスクドライブに送信する情報処理装置の処理を示すフローチャートである。 本実施の形態に係る、管理端末が有する機能を示すブロック図である。 本実施の形態に係る、ディスク制御部が有する機能を示すブロック図である。 本実施の形態に係る、自己診断命令とパラメータとをディスク制御部に送信する管理端末の処理を示すフローチャートである。 本実施の形態に係る、自己診断命令とパラメータとをハードディスクドライブに送信するディスク制御部の処理を示すフローチャートである。
符号の説明
100 ディスクアレイ装置 101 チャネル制御部
102 ディスク制御部 103 共有メモリ
104 キャッシュメモリ 105 スイッチング制御部
106 管理端末 110 ディスク制御装置
111 コントローラ 112 電源部
113 ファン 120 ディスク駆動装置
121 ハードディスクドライブ 130 装着部
401 CPU 402 計時機構
403 メモリ 404 記憶装置
405 ポート 406 記録媒体読取装置
407 入力装置 408 出力装置
409 記録媒体 501 CPU
502 計時機構 503 めもり
504 記憶装置 505 ポート
506 記録媒体読取装置 507 入力装置
508 出力装置 509 記録媒体
601 インタフェース部 602 メモリ
603 CPU 604 NVRAM
605 コネクタ 701 筐体
702 磁気ディスク 703 アクチュエータ
704 スピンドルモータ 705 ヘッド
706 信号処理基板 707 インタフェースコネクタ
708 電源コネクタ 801 マイクロコンピュータ
802 メモリ 803 ハードディスクコントローラ
804 リード・ライト・チャネル 805 エラー訂正回路
806 ヘッドアンプ 901 セクタ
902 データ部 903 CRCコード部
904 ECC部 905 ウェイ
1001 自己診断命令 1101 自己診断命令
1201 パラメータ 1202 ヘッダ部
1203 パラメータ部 1301 ログ
1302 ヘッダ部 1303 エラーログ部
1501 命令受信部 1502 メモリ記憶部
1503 診断実行部 1504 テスト結果記憶部
1505 エラーコード記憶部
1601 モードパラメータ読み出し要求部
1602 命令設定部 1603 命令送信部
1604 テスト結果読み出し要求部 1605 エラーコード読み出し要求部
1606 エラー集計部 1607 閾値チェック部
1608 診断結果出力部 2001 シーク管理テーブル
2401 命令設定部 2402 第一の命令送信部
2403 診断結果出力部 2501 命令受信部
2502 モードパラメータ読み出し要求部
2503 第二の命令送信部 2504 テスト結果読み出し要求部
2505 エラーコード読み出し要求部 2506 エラー集計部
2507 閾値チェック部 2508 診断結果送信部

Claims (10)

  1. ディスク制御装置、及び前記ディスク制御装置と通信可能に接続される複数のハードディスクドライブを備えるディスクアレイ装置であって、
    前記ディスク制御装置は、
    通信可能に接続している情報処理装置から送信されるデータ入出力要求を受信するチャネル制御部、
    前記ハードディスクドライブを制御するディスク制御部、
    出力装置を備える管理端末、及び
    前記チャネル制御部、前記ディスク制御部、及び前記管理端末の夫々と通信可能に接続され、前記ハードディスクドライブが行う自己診断のパラメータが記憶される共有メモリを有し、
    前記ハードディスクドライブは、
    データが記憶される磁気ディスク、
    前記管理端末から命令を受信するハードディスクコントローラ、
    マイクロコンピュータ、及び
    前記マイクロコンピュータが読み書きするデータが記憶されるメモリ
    を有し、
    前記管理端末は、
    前記ハードディスクドライブの自己診断命令、前記共有メモリから取得した前記パラメータ、及び前記自己診断命令を実行する前記ハードディスクドライブのドライブ番号を前記ディスク制御部に送信する第一の命令送信部を有し、
    前記ディスク制御部は、
    前記第一の命令送信部から送信される、前記自己診断命令、前記パラメータ、及び前記ドライブ番号を受信する命令受信部、及び
    前記自己診断の命令及び前記パラメータを、前記ドライブ番号で指定される前記ハードディスクドライブに送信する第二の命令送信部、
    を有し、
    前記マイクロコンピュータは、
    前記管理端末から前記ハードディスクコントローラを介して自己診断命令及び前記パラメータを受信する命令受信部、
    前記パラメータを前記メモリに記憶するメモリ記憶部、
    前記パラメータに設定されている、前記磁気ディスクの開始LBAから終了LBAまでに記憶されているデータの読み出し、又は前記開始LBAから前記終了LBAまでにデータの書き込みを行う診断実行部、及び
    前記開始LBAから前記終了LBAまでの前記読み出し又は前記書き込みが、実行中であるか、エラーを検出せずに終了しているか、エラーを検出して終了しているかを示すデータを記憶するテスト結果記憶部
    を有し、
    前記ディスク制御部は、
    前記自己診断命令が実行中であるか、エラーを検出せずに終了しているか、エラーを検出して終了しているかを示すデータであるテスト結果を読み出す要求を所定の間隔で前記ハードディスクドライブに送信するテスト結果読み出し要求部、
    前記テスト結果にエラーを検出して終了していることを示すデータが設定されている場合は、前記自己診断命令の実行中に検出されたエラーのエラーコードの読み出し要求を前記ハードディスクドライブに送信するエラーコード読み出し要求部、
    前記ハードディスクドライブより受領する前記エラーコードの数を前記エラーコードごとに集計するエラー集計部、
    前記共有メモリに記憶されている前記エラーコードごとの閾値を参照し、前記エラー集計部により集計される前記エラーコードの数を前記エラーコードごとに前記閾値と比較する閾値チェック部、及び
    前記エラー集計部により集計される前記エラーコードの数が前記閾値より大きいものがあるかどうかを示すデータを診断結果として前記管理端末に送信する診断結果送信部
    を有し、
    前記管理端末は、前記診断結果送信部より受信する前記診断結果のデータに応じた情報を前記出力装置に出力する診断結果出力部を有する
    ことを特徴とするディスクアレイ装置。
  2. 請求項1に記載のディスクアレイ装置であって、
    前記ハードディスクドライブは、前記読み出し又は前記書き込みにおいて検出されたエラーのエラーコードを記憶するエラーコード記憶部を有する
    ことを特徴とするディスクアレイ装置。
  3. 請求項1に記載のディスクアレイ装置であって、
    前記診断実行部は、
    前記パラメータに設定されているシークモードを示すデータを参照し、
    前記シークモードを示すデータがシーケンシャルアクセスを示すデータである場合は、前記開始LBAから前記終了LBAまでアドレス順に前記読み出し又は前記書き込みを行い、
    前記シークモードを示すデータがランダムアクセスを示すデータである場合は、前記開始LBAから前記終了LBAの範囲でランダムに前記読み出し又は前記書き込みを行う
    ことを特徴とするディスクアレイ装置。
  4. 請求項1に記載のディスクアレイ装置であって、
    前記診断実行部は、
    前記パラメータに設定されているテストモードを示すデータを参照し、
    前記テストモードを示すデータが読み出しモードを示すデータである場合は、前記読み出しを行い、
    前記テストモードを示すデータが書き込みモードを示すデータである場合は、前記書き込みを行い、
    前記テストモードを示すデータが書き込み確認モードを示すデータである場合は、前記書き込みを行い、当該書き込みを行ったデータを前記磁気ディスクから読み出し、当該書き込んだデータと当該読み出したデータとが一致しているか確認する
    ことを特徴とするディスクアレイ装置。
  5. 請求項1に記載のディスクアレイ装置であって、
    前記診断実行部は、
    前記パラメータに設定されているテスト時間を参照し、
    前記読み出し又は前記書き込みの開始時刻から前記テスト時間を経過すると、前記読み出し又は前記書き込みを終了する
    ことを特徴とするディスクアレイ装置。
  6. 請求項1に記載のディスクアレイ装置であって、
    前記診断実行部は、
    前記パラメータに設定されているテスト回数を参照し、
    前記開始LBAから前記終了LBAまでの前記読み出し又は前記書き込みを前記テスト回数繰り返し行う
    ことを特徴とするディスクアレイ装置。
  7. 請求項1に記載のディスクアレイ装置であって、
    前記診断実行部は、
    前記パラメータに設定されている前記読み出し又は前記書き込みのコマンドを連続して発行する場合における前後して発行される前記コマンドの時間の間隔を参照し、
    前記読み出し又は前記書き込みのコマンドを前記間隔ごとに発行する
    ことを特徴とするディスクアレイ装置。
  8. 請求項1に記載のディスクアレイ装置であって、
    前記磁気ディスクに書き込まれているデータの1つのセクタが複数のウェイで構成され、前記ウェイの各々にECCが付与され、
    前記ハードディスクコントローラが、前記ECCを用いてエラー訂正を行うエラー訂正回路を有し、
    前記実行診断部は、
    前記パラメータに設定されているECC能力モードを示すデータを参照し、
    前記読み出しの際に、前記ECC能力モードを示すデータに応じた数の前記ウェイについて前記ECCを用いた誤り訂正を行う要求を前記ハードディスクコントローラに送信する
    ことを特徴とするディスクアレイ装置。
  9. 請求項1に記載のディスクアレイ装置であって、
    前記ディスク制御部は、前記ハードディスクドライブのモードパラメータの読み出し要求を前記ハードディスクドライブに送信するモードパラメータ読み出し要求部を有し、
    前記第二の命令送信部は、
    前記ハードディスクドライブより受領する前記モードパラメータに前記自己診断命令を実行可能であることを示すデータが設定されている場合は、前記自己診断命令と前記パラメータとを前記ハードディスクドライブに送信し、
    前記ハードディスクドライブより受領する前記モードパラメータに前記自己診断命令を実行可能であることを示すデータが設定されていない場合は、前記自己診断命令と前記パラメータとを前記ハードディスクドライブに送信せずに、前記ハードディスクドライブが前記自己診断命令を実行可能でないことを示すデータを設定した前記診断結果を前記管理端末に送信し、
    前記診断結果出力部は、前記第二の命令送信部より受信する前記診断結果のデータに応じた情報を前記出力装置に出力すること
    を特徴とするディスクアレイ装置。
  10. ディスク制御装置、及び前記ディスク制御装置と通信可能に接続される複数のハードディスクドライブを備えるディスクアレイ装置における、前記ハードディスクドライブの診断方法であって、
    前記ディスク制御装置は、
    通信可能に接続している情報処理装置から送信されるデータ入出力要求を受信するチャネル制御部、
    前記ハードディスクドライブを制御するディスク制御部、
    出力装置を備える管理端末、及び
    前記チャネル制御部、前記ディスク制御部、及び前記管理端末の夫々と通信可能に接続され、前記ハードディスクドライブが行う自己診断のパラメータが記憶される共有メモリを有し、
    前記ハードディスクドライブは、
    データが記憶される磁気ディスク、
    前記管理端末から命令を受信するハードディスクコントローラ、
    マイクロコンピュータ、及び
    前記マイクロコンピュータが読み書きするデータが記憶されるメモリ
    を有し、
    前記管理端末は、
    前記ハードディスクドライブの自己診断命令、前記共有メモリから取得した前記パラメータ、及び前記自己診断命令を実行する前記ハードディスクドライブのドライブ番号を前記ディスク制御部に送信し、
    前記ディスク制御部が、
    前記第一の命令送信部から送信される、前記自己診断命令、前記パラメータ、及び前記ドライブ番号を受信し、
    前記自己診断の命令及び前記パラメータを、前記ドライブ番号で指定される前記ハードディスクドライブに送信し、
    前記マイクロコンピュータが、
    前記管理端末から前記ハードディスクコントローラを介して自己診断命令及び前記パラメータを受信し、
    前記パラメータを前記メモリに記憶し、
    前記パラメータに設定されている、前記磁気ディスクの開始LBAから終了LBAまでに記憶されているデータの読み出し、又は前記開始LBAから前記終了LBAまでにデータの書き込みを行い、
    前記開始LBAから前記終了LBAまでの前記読み出し又は前記書き込みが、実行中であるか、エラーを検出せずに終了しているか、エラーを検出して終了しているかを示すデータを記憶し、
    前記ディスク制御部が、
    前記自己診断命令が実行中であるか、エラーを検出せずに終了しているか、エラーを検出して終了しているかを示すデータであるテスト結果を読み出す要求を所定の間隔で前記ハードディスクドライブに送信し、
    前記テスト結果にエラーを検出して終了していることを示すデータが設定されている場合は、前記自己診断命令の実行中に検出されたエラーのエラーコードの読み出し要求を前記ハードディスクドライブに送信し、
    前記ハードディスクドライブより受領する前記エラーコードの数を前記エラーコードごとに集計し、
    前記共有メモリに記憶されている前記エラーコードごとの閾値を参照し、前記エラー集計部により集計される前記エラーコードの数を前記エラーコードごとに前記閾値と比較し、
    前記エラー集計部により集計される前記エラーコードの数が前記閾値より大きいものがあるかどうかを示すデータを診断結果として前記管理端末に送信し、
    前記管理端末が、前記診断結果送信部より受信する前記診断結果のデータに応じた情報を前記出力装置に出力する
    ことを特徴とするハードディスクドライブの診断方法。
JP2003428043A 2003-12-24 2003-12-24 ディスクアレイ装置、及びハードディスクドライブの診断方法 Expired - Fee Related JP4509549B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003428043A JP4509549B2 (ja) 2003-12-24 2003-12-24 ディスクアレイ装置、及びハードディスクドライブの診断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003428043A JP4509549B2 (ja) 2003-12-24 2003-12-24 ディスクアレイ装置、及びハードディスクドライブの診断方法

Publications (2)

Publication Number Publication Date
JP2005190003A JP2005190003A (ja) 2005-07-14
JP4509549B2 true JP4509549B2 (ja) 2010-07-21

Family

ID=34787150

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003428043A Expired - Fee Related JP4509549B2 (ja) 2003-12-24 2003-12-24 ディスクアレイ装置、及びハードディスクドライブの診断方法

Country Status (1)

Country Link
JP (1) JP4509549B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170076391A (ko) * 2015-12-24 2017-07-04 삼성에스디에스 주식회사 자동화 테스트 수행 방법 및 시스템

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007183844A (ja) * 2006-01-10 2007-07-19 Hitachi Global Storage Technologies Netherlands Bv 補助記憶装置および記録再生方法
JP2007242207A (ja) 2006-03-13 2007-09-20 Fujitsu Ltd ディスク装置の媒体スキャン方法
JP4891811B2 (ja) 2007-02-28 2012-03-07 東芝ストレージデバイス株式会社 制御装置および記憶装置
JP5250869B2 (ja) * 2008-08-28 2013-07-31 株式会社日立製作所 ストレージシステム、論理記憶領域割り当て方法及び計算機システム
JP2010146463A (ja) * 2008-12-22 2010-07-01 Nec Corp ディスクアレイ装置、ディスクアレイ制御方法、及び、プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001256649A (ja) * 2000-03-14 2001-09-21 Matsushita Electric Ind Co Ltd ディスク記録方法、ディスク記録装置および情報記録媒体
JP2002189571A (ja) * 2000-12-21 2002-07-05 Hitachi Ltd 磁気ディスク装置及びその自己診断方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3183912B2 (ja) * 1991-07-23 2001-07-09 キヤノン株式会社 Scsi装置の自己診断方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001256649A (ja) * 2000-03-14 2001-09-21 Matsushita Electric Ind Co Ltd ディスク記録方法、ディスク記録装置および情報記録媒体
JP2002189571A (ja) * 2000-12-21 2002-07-05 Hitachi Ltd 磁気ディスク装置及びその自己診断方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170076391A (ko) * 2015-12-24 2017-07-04 삼성에스디에스 주식회사 자동화 테스트 수행 방법 및 시스템
KR102020798B1 (ko) * 2015-12-24 2019-09-16 삼성에스디에스 주식회사 자동화 테스트 수행 방법 및 시스템

Also Published As

Publication number Publication date
JP2005190003A (ja) 2005-07-14

Similar Documents

Publication Publication Date Title
US6493656B1 (en) Drive error logging
US6412089B1 (en) Background read scanning with defect reallocation
CN107015881B (zh) 数据存储驱动器中的增强的低开销数据保护
JP5059847B2 (ja) ハードディスク記憶システム
US6505281B1 (en) Hard disk drives employing high speed distribution bus
US5615335A (en) Storage system self-test apparatus and method
US9070390B2 (en) Modified areal densities for degraded storage device read heads
US7487400B2 (en) Method for data protection in disk array systems
US20040181388A1 (en) System having tape drive emulator and data tape cartridge housing carrying multiple disk drives
US20160011818A1 (en) Information processing system
US8904244B2 (en) Heuristic approach for faster consistency check in a redundant storage system
Iliadis et al. Disk scrubbing versus intra-disk redundancy for high-reliability raid storage systems
JP2005100259A5 (ja)
EP1860556A2 (en) Storage system and control method thereof
US10482911B1 (en) Multiple-actuator drive that provides duplication using multiple volumes
US7849258B2 (en) Storage apparatus and data verification method for the same
JP4509549B2 (ja) ディスクアレイ装置、及びハードディスクドライブの診断方法
US20140317443A1 (en) Method and apparatus for testing a storage system
US7325117B2 (en) Storage system and storage control method
US7533323B2 (en) Adaptive archival format
US11874801B2 (en) Deduplication in multiple-tiered storage systems
US8767328B2 (en) Certifying a data storage medium
Bairavasundaram et al. Characteristics, impact, and tolerance of partial disk failures
Grawinkel et al. Lonestar: an energy-aware disk based long-term archival storage system
CN117316252A (zh) 一种分布式zns ssd异常断电校验数据一致性的快速测试方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091027

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100126

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100301

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100428

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4509549

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees