JPH10162492A - データ記憶装置管理システム - Google Patents

データ記憶装置管理システム

Info

Publication number
JPH10162492A
JPH10162492A JP8330381A JP33038196A JPH10162492A JP H10162492 A JPH10162492 A JP H10162492A JP 8330381 A JP8330381 A JP 8330381A JP 33038196 A JP33038196 A JP 33038196A JP H10162492 A JPH10162492 A JP H10162492A
Authority
JP
Japan
Prior art keywords
data
hard disk
hdd
storage device
numerical information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8330381A
Other languages
English (en)
Inventor
Masaru Yasuda
勝 安田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Xing Inc
Original Assignee
Brother Industries Ltd
Xing Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd, Xing Inc filed Critical Brother Industries Ltd
Priority to JP8330381A priority Critical patent/JPH10162492A/ja
Publication of JPH10162492A publication Critical patent/JPH10162492A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 故障等が生ずる可能性の高いハードディスク
装置を予測でき、必要な処置を迅速に行うことができる
データ記憶装置管理システムを提供する。 【解決手段】 データ記憶装置管理システムKは下記の
要件を含んで構成される。(1)ディスク判別手段:所定
の判別項目について、各ハードディスク装置の作動状態
及び/又は該ハードディスク装置の記録ディスク部の状
態(ディスク状態)を判別する。(2)判別数値情報生成
手段:その判別結果に基づいて、各判別項目に対応した
数値情報(判別数値情報)を各ハードディスク装置毎に
生成する。(3)判別数値情報記憶手段:各ハードディス
ク装置と一対一に対応して設けられ、対応するハードデ
ィスク装置についてディスク状態の判別がなされる毎
に、生成される判別数値情報を累積して記憶する。(4)
出力手段:各判別数値情報記憶手段の記憶内容が予め定
められた条件を充足した場合に、それに対応するハード
ディスク装置において作動不具合が生じやすくなってい
ると判定して外部に所定の出力を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数のハードディ
スク装置を含んで構成されたデータ記憶装置の管理シス
テムに関し、特にハードディスク装置の故障等における
交換時期を診断するデータ記憶装置管理システムに関す
る。
【0002】
【従来の技術】従来より、大容量で高速な記憶装置とし
てディスクアレイ(別名RAID:Redundant Arraus o
f Inexpensive Disksの略)が知られている。ディスク
アレイでは、ハードディスク装置(以下HDDともい
う)を複数台パラレルに同時動作させてデータ入出力性
能の高速化を図っている。また、ディスクアレイでは、
データの信頼性を向上させるために冗長データ(誤り訂
正符号あるいはエラー訂正符号)を付加して記憶してお
り、ディスク上のデータが失われても元のデータを復元
することができるようになっている。
【0003】また、1つのHDDが故障して、その中の
データの読出しが不可能になった場合には、そのHDD
を新品のものと交換する必要がある。この場合、新品の
HDDには、予め元のデータをバックアップしておくと
いう方法もあるが、元のデータのバックアップが常にと
られているとは限らないため、通常は、故障していない
他のHDDのデータブロックと、エラー訂正符号のみが
記憶されたHDDからのエラー訂正符号とに基づいて、
新品のHDD上に障害を起こしたHDDにあったデータ
と同じものを再構築(リビルド)することが行なわれて
いる。
【0004】
【発明が解決しようとする課題】上記ディスクアレイで
は、例えばエラー訂正符号としてパリティを使用した場
合、複数のHDDのうち1つが故障した場合は、リビル
ドによりデータを復元することができる。しかしなが
ら、2つ以上のHDDが同時に故障するとデータの復元
はもはや不可能となり、データを分散記憶しているディ
スクアレイの原理上、すべてのデータが無効化して、シ
ステム停止等の致命的な事態を招いてしまう問題があっ
た。特に複数のHDDの消耗具合がほぼ同じような条件
下では、1つのHDDで故障が発生するとすぐに他のH
DDが故障してしまうといった可能性があるので、ある
HDDが故障した場合、他のHDDで故障が起きる前に
なるべく早く復旧を行なう必要がある。しかし、現実に
HDDに故障が発生してからでは復旧対策が手遅れにな
ってしまうことも考えられ、ディスクの故障等をいち早
く予見できる方式の開発が切望されていた。
【0005】本発明の課題は、故障等の作動不具合が生
ずる可能性が高いハードディスク装置を予測でき、例え
ばそのハードディスク装置の交換等、必要な処置を迅速
に行うことができるデータ記憶装置管理システムを提供
することにある。
【0006】
【課題を解決するための手段及び作用・効果】本発明
は、複数のハードディスク装置を含んで構成されたデー
タ記憶装置管理システムに関するものであり、上述の課
題を解決するために下記の要件を含んで構成されたこと
を特徴とする。 (1)ディスク判別手段:予め定められた1ないし複数の
判別項目について、各ハードディスク装置の作動状態及
び/又は該ハードディスク装置の記録ディスク部の状態
(ディスク状態)を判別する。 (2)判別数値情報生成手段:その判別結果に基づいて、
各判別項目に対応した数値情報(判別数値情報)を各ハ
ードディスク装置毎に生成する。 (3)判別数値情報記憶手段:各ハードディスク装置と一
対一に対応して設けられ、対応するハードディスク装置
についてディスク状態の判別がなされる毎に、生成され
る判別数値情報を累積して記憶する。 (4)出力手段:各判別数値情報記憶手段の記憶内容が予
め定められた条件を充足した場合に、それに対応するハ
ードディスク装置において作動不具合が生じやすくなっ
ていると判定して外部に所定の出力を行う。
【0007】上述の構成においては、ディスク状態の判
別結果に応じて生成される判別数値情報をハードディス
ク装置別に累積して記憶しておき、その記憶内容が予め
定められた条件を充足した場合に、ハードディスク装置
において作動不良が生じやすくなっていると判定して所
定の出力を行うようにしたことで、故障の可能性が高い
と思われるハードディスク装置がどれであるかを予測す
ることができ、ひいてはそのハードディスク装置の交換
等、必要な処置を迅速に行うことができる。また、故障
時期の近くなったハードディスク装置が完全に故障する
前に、修理あるいは交換等の必要な処置を装置のまだ動
作できる状態で行なうこができるので、ハードディスク
装置を停止させる時間を最小限に抑えることができる。
【0008】出力手段は、各判別数値情報記憶手段の記
憶内容が予め定められた条件を充足した場合に、視覚出
力及び/又は音声出力により報知する報知手段を含んで
構成することができる。これにより、例えば作動不具合
が生じやすくなっているハードディスク装置がどれであ
るかが報知され、必要な処置を的確に行なうことができ
る。
【0009】ディスク状態の判別項目としては、具体的
には次のようなものを使用することができる。 (1)各ハードディスク装置で読出しエラーあるいは書込
みエラーが発生したか否か。:判別数値情報は、読出し
エラーの発生回数あるいは書込みエラーの発生回数とす
ることができる。具体的には、読出しエラーあるいは書
込みエラーが発生する毎に、判別数値情報記憶手段に記
憶された読出しエラー発生回数カウンタあるいは書込み
エラー発生回数カウンタの値をインクリメントさせるよ
うにし、その回数が所定の回数に到達すれば出力手段に
所定の出力を行わせるようにすることができる。 (2)各ハードディスク装置の記録ディスク部に欠陥セク
タがあるか否か。:判別数値情報は、欠陥セクタの個数
とすることができる。具体的には、欠陥セクタが検出さ
れる毎に、判別数値情報記憶手段に記憶された欠陥セク
タ個数カウンタの値をインクリメントさせるようにし、
その回数が所定の回数に到達すれば出力手段に所定の出
力を行わせるようにすることができる。
【0010】(3)各ハードディスク装置の稼動時間。:
判別数値情報は、装置の累積作動時間とすることができ
る。例えばタイマーにより装置の作動時間を計測して、
判別数値情報記憶手段に記憶された累積作動時間カウン
タを、その計測された作動時間分だけインクリメントさ
せるようにし、累積作動時間が所定の値に到達すれば出
力手段に所定の出力を行わせるようにすることができ
る。 (4)データの読出し及び/又は書込みの再試行を行った
か否か。:判別数値情報は、データの読出し及び/又は
書込みの再試行の回数とすることができる。具体的に
は、読出し及び/又は書込みの再試行がなされる毎に、
判別数値情報記憶手段に記憶された再試行カウンタの値
をインクリメントさせるようにし、その回数が所定の回
数に到達すれば出力手段に所定の出力を行わせるように
することができる。
【0011】なお、上記判別項目は1種類のみを使用す
るようにしても、複数のものを組み合わせて使用するよ
うにしてもいずれでもよい。また、複数の判別項目が使
用される場合、判別数値情報は、各判別項目に対応する
もののいずれかの累積値が所定の値に到達した場合に前
記所定の出力を行わせるようにしてもよいし、複数の判
別項目に対応する各累積値同士の間で、和、積、平均等
の演算を施し、その演算値が所定の値に到達した場合に
前記所定の出力を行わせるようにしてもよい。
【0012】次に、データ記憶装置は、一まとまりとし
て読み書きされるべきデータ(以下、原データという)
が複数のデータブロックに分割され、これを該データブ
ロック単位で分散した形で記憶する複数のハードディス
ク装置と、複数のハードディスク装置に対し、データブ
ロックを並列して読み書きさせる読出/書込制御手段
と、原データに基づいて生成されたエラー訂正情報を別
途記憶するエラー訂正情報記憶部と、複数のハードディ
スク装置のいずれかにおいて、データブロックの読出し
が不能となった場合には、読出し可能な他のハードディ
スク装置のデータブロックと、エラー訂正情報記憶部に
記憶されたエラー訂正情報とに基づいて、その読出し不
能となったデータブロックの復元を行うデータ復元手段
とを有するディスクアレイ装置として構成するとができ
る。この場合、原データを、配列順序が予め定められた
同一数のデータビットからなるデータブロックに分割
し、それらデータブロック間で、互いに対応する配列位
置にあるデータビット同士のパリティを求めてこれを上
記エラー訂正情報として使用することができる。また、
エラー訂正情報としては上記パリティのほか、ハミング
符号、BCH符号あるいはリードソロモン符号等を使用
することができる。
【0013】データ記憶装置をディスクアレイ装置とし
て構成することで、データの入出力速度を高めることが
できる。しかしながら、前述の通りディスクアレイ装置
では、データを複数のハードディスク装置に分散記憶し
ている関係上、例えばエラー訂正符号としてパリティを
使用した場合、複数のハードディスク装置のうち2つ以
上のものが同時に故障するとデータの復元が不可能とな
り、すべてのデータが無効化してしまうというリスクが
伴う。しかしながら、本発明の管理システムを用いれ
ば、故障時期の近いハードディスク装置がどれであるか
を予知できるので、上記リスクを最小限にとどめること
ができる。
【0014】ここで、ディスクアレイ装置においては、
複数のハードディスク装置へのデータの読み書きと、デ
ータのエラー訂正あるいは復元を司るディスクアレイ制
御部が設けられる。この場合、そのディスクアレイ制御
部をディスク判別手段に兼用させればハードウェアを簡
略化でき、ひいてはシステム全体の構築コストを低減す
ることができる。また、判別数値情報記憶手段は、各ハ
ードディスク装置内に設けることができる。すなわち、
各ハードディスク装置を判別数値情報記憶手段に兼用さ
せることで余分な記憶手段が不要となり、システム全体
の構築コストを同様に低減することができる。
【0015】ここで、データ記憶装置をディスクアレイ
装置として構成する場合、判別数値情報として、データ
復元手段によるデータ復元回数を用いることができる。
この場合、データ復元手段がデータの復元を行う毎に、
判別数値情報記憶手段に記憶されたデータ復元回数カウ
ンタの値をインクリメントさせるようにし、その回数が
所定の回数に到達すれば出力手段に所定の出力を行わせ
るようにすることができる。
【0016】ディスク判別手段は、各ハードディスク装
置のディスク状態の判別を、例えばタイマー計測により
予め定められた時間が経過する毎に行うものとすること
ができる。これにより、各ハードディスク装置のディス
ク状態を定期的に判別することができ、ひいては故障発
生等をいちはやく察知して必要な処置をより的確に施す
ことができるようになる。
【0017】
【発明の実施の形態】以下、本発明の実施の形態を、図
面に示す実施例を参照して説明する。図1は、本発明の
データ記憶装置管理システムの一実施例の全体構成を示
すブロック図である。データ記憶装置管理システム(以
下、単に管理システムともいう)Kは、主コンピュータ
2と、これに接続されたデータ記憶装置1とを含んで構
成されている。データ記憶装置1は、ディスクアレイ制
御部3にハードディスク装置(以下、HDDと略記す
る)群4が接続されたディスクアレイ装置として構成さ
れている。HDD群4は、ディスクアレイ制御部3に接
続された複数のHDD列17からなり、各HDD列17
に含まれるHDD10〜16はSCSIバス6によりデ
ィスクアレイ制御部3に対しデイジーチェーン接続され
ている。また、ディスクアレイ制御部3に接続された主
コンピュータ2は、システム全体の作動制御を司る。
【0018】図2に示すように、ディスクアレイ制御部
3は、CPU20、ROM21及びRAM22を有する
中央制御部23、ハードディスク装置あるいはバックア
ップ電源付のRAM等で構成された記憶装置25、出力
手段(報知手段)としてのモニタ126及びスピーカ1
27、主コンピュータ2との接続インターフェースとな
る外部インタフェース28、LSI等で構成されて該イ
ンターフェース28に接続される複数のSCSIインタ
ーフェース30、及びタイマー31等を含んで構成され
ている。
【0019】ROM21には制御プログラムが格納され
ており、CPU20は、RAM22をワークエリアとし
て該制御プログラムに基づき、HDD群4の各HDDへ
のアクセス処理など、データ記憶装置1の全体の作動制
御を司る。また、各SCSIインターフェース30には
前述のHDD列17がそれぞれ接続されている。なお、
パラレル転送方式のSCSI規格においては、1つのS
CSIバスに接続可能なSCSI対応装置の個数は、最
大でSCSIバスに含まれるデータバスビットの数まで
という制約がある。本実施例では、HDD列17の接続
方式としてFast−SCSI規格が採用されているも
のとし、デイジーチェーン接続されるSCSI対応装置
の数は8台(すなわちSCSIインターフェース30+
HDD10〜16)とするが、他のSCSI規格を採用
することももちろん可能であり、例えば16ビットWi
de−SCSIの場合は16台まで、32ビットWid
e−SCSIの場合は32台までの接続が可能である。
また、SCSIバス6の終端部での信号反射によるノイ
ズ発生を防止するために、デイジーチェーン接続された
末端のHDD16にはターミネータと呼ばれる図示しな
い終端抵抗が装着されている。
【0020】図3(a)に示すように、HDD群4の各
HDD(以下、HDD10〜16のうちHDD10で代
表させる)10はCPU35、ROM36及びRAM3
7を有する中央制御部38、磁気ディスクで構成された
記録ディスク部39及びタイマー41等を含んで構成さ
れている。ROM36には、HDD10の全体の作動を
司る制御プログラムが格納されており、RAM37はC
PU35が該制御プログラムを実行する際のワークエリ
アとして機能する。
【0021】ここで、上記記録ディスク部39のデータ
は、それぞれ一まとまりとして読み書きされるべきも
の、(以下、原データという)が複数のデータブロック
に分割され、これがHDD群4に対しデータブロック単
位で分散して記憶されている。そして、原データは、そ
れら複数のHDDに対し、上記データブロック単位で並
列して読み書きされることでデータ入出力の高速化が図
られている(なお、データ入出力の制御は中央制御部2
3(図2)が行う)。なお、本実施例では、原データ
は、HDD群4を構成するHDDのうち、後述するエラ
ー訂正情報を格納するためのものを除くすべてのHDD
に分散・記憶する方式を採用するものとするが、HDD
群4をいくつかのグループ(例えばHDD列17)に分
け、各グループ毎に原データを分散・記憶する方式とし
てもよい。
【0022】ここで、ディスクアレイ装置では、データ
の信頼性を向上させるために、分割されたデータブロッ
クは、エラー訂正情報としてのパリティデータを付加し
て記憶されており、ディスク上のデータの一部が失われ
ても、元のデータを復元することができるようになって
いる。図4(a)に示すように、原データは数ビット単
位(例えば、1ビット単位、1バイト(=8ビット)単
位、あるいは予め定められたセクタ単位:本実施例では
1バイト単位とする)毎に区切られてデータブロックB
11、B12、‥‥に分割され、パリティP11、P12、‥‥
をそれぞれ付加して、同図(b)に示すように各HDD
に格納される。なお、図では説明の便宜上、原データは
3つHDD(ディスク1〜3)に分散・格納されるよう
に描いている。
【0023】パリティは、データブロック中の「1」と
なっているビット数が偶数である場合にパリティを
「1」、奇数の場合に「0」とする奇数パリティと、同
じく偶数である場合にパリティを「0」、奇数の場合に
「1」とする偶数パリティとがあり、例えば、データブ
ロックが「10001010」であったときの偶数パリ
ティは「1」となる。そして、該データブロックの読出
し時に、そのいずれか1つのビットが読み出せなかった
場合に、読み出しに成功した他のビットの値とパリティ
ビットの値とから、その読み出せなかったビットの値を
決定・復元することができる。なお、偶数パリティを使
用すれば、読めなかったビットを除いてデータブロック
中のパリティを含む全てのビットの排他的論理和をとる
ことで、その読めなかったビットの値を直接求めること
ができる。例えば、上記データ「10001010:
1」の、上から2桁目の「0」が読めなかった場合、上
記排他的論理和xは、 x=1#0#0#1#0#1#0#1=0 (「#」は、排他的論理和演算を表す記号とする)とな
り、上記読めなかったビットの値に等しくなっているこ
とがわかる。
【0024】次に、ディスクアレイとして構成された管
理システムKは、HDD群4を構成する複数のHDDの
1つが、原データに基づいて予め作成されたエラー訂正
情報を格納する専用のHDD(以下、訂正用HDDとい
う)とされており、他のHDDに格納されたデータブロ
ックのいずれか1つでデータブロックの読出しが不能と
なった場合は、上記訂正用HDDに格納されたエラー訂
正情報と、読出しに成功した他のHDDからのデータブ
ロックとから消失したデータブロックを復元する処理が
可能とされている。以下、その詳細について説明する。
なお、本実施例では、上記エラー訂正情報の生成と、読
出しに失敗したデータブロックの復元処理とは、ディス
クアレイ制御部3(図2)のROM21等に格納された
専用のプログラムに基づいてCPU20が行うものとす
るが、これを専用のハードウェアにより行う構成も可能
である。
【0025】まず、原データをブロック分割して分散記
憶するための、並列に並べた各HDDの各々の系統を、
第1レーン、第2レーン‥‥等と呼ぶことにする。ま
た、HDDを何台並列に並べるかという数をパラレル数
と呼び、pという変数で表すこととする。ただし、パラ
レル数pには、エラー訂正情報を格納するためのHDD
は含めない。従って、エラー訂正情報としてパリティを
採用した場合は、p+1個のレーンが存在することとな
る。なお、エラー訂正情報用のレーン、すなわちパリテ
ィデータ用のレーンはパリティレーンと呼ぶことにす
る。図4(b)を用いて説明すれば、パラレル数pは3
でありディスク1〜3が第1レーン〜第3レーンを形成
する。
【0026】まず、原データを各レーンに分散して書き
込む際は、図4(a)に示すように、3つのHDDに格
納するために前述の通り1バイト毎のデータブロックに
切り分ける。次いで、同図(b)に示すように、3つの
各データブロックの対応する位置にあるビット同士に排
他的論理和演算を施して奇数パリティを計算する。図に
示した例では、データブロックはそれぞれ「00101
111」、「01111000」、「1110010
0」であり、その第1ビット同士のパリティは0#0#
1=1、第2ビット同士のパリティはパリティは0#1
#1=0、‥‥等となり、8つのすべてのビットについ
て得られるパリティの組は「10110011」とな
る。このようにして求めたパリティデータと3つのデー
タブロックとの、計4つのブロックが4つのHDDに一
斉に書き込まれる。
【0027】次にデータの読出しを行う場合は、パリテ
ィレーン以外の3つのレーンからデータブロックを読み
出して、これを元の順に再配列することにより原データ
が復元される。ここで、3つのレーンのうちどれか1つ
においてデータの読出しが不能となった場合には、パリ
ティレーンからパリティデータを読み出し、これと読め
た2つのデータブロックとの間で、各ビット毎に排他的
論理和演算を行うと、読めなかったデータブロックが復
元できる。図4(c)には、第3レーン(ディスク3)
のデータ読出しが不能となった場合のデータ復元例を示
している。
【0028】また、ディスクアレイにおいて、1つのH
DDが障害を起こしてその中のデータが読出不可能にな
った場合には、その不良のHDDを抜いて新品のHDD
と交換する必要がある。このとき、上記パリティデータ
と正常な他のHDDのデータとから、抜き去ったHDD
内に格納されていたのと同じデータを復元して、これを
新品のHDD上に再構築(リビルド)することができ
る。
【0029】図5は、上記HDD10の記録ディスク部
39の内容を概念的に示している(なお、同図では説明
の便宜を図るため、円周状のものを展開して示してい
る)。すなわち、記録ディスク部39は、その記録面に
複数の記録トラックが同心円状に形成され、さらに各記
録トラック(以下、単にトラックという)はその周方向
において複数の記録セクタ(以下、単にセクタという)
に分割されている。また、HDD10は、同軸配置され
た複数枚の記録ディスク部39を有し、各記録ディスク
部39の半径方向において同位置にあるトラックは互い
に組をなしてシリンダと呼ばれる単位を構成している。
一方、記録ディスク部39の記録面においては、その半
径方向内側と外側とで一周当たりのトラック長に差があ
るために、内側のトラックと外側のトラックとでは記憶
される情報量に差が生じる。このため、記録面を半径方
向において数トラックずつのゾーンに分け、そのゾーン
毎にトラック一周分の記録情報量を変化させるものとす
る。
【0030】記録ディスク部39の記録面上では、磁気
材料そのものの不良や、表面材料の傷などが原因で、デ
ータが正確に記録されなかったり、あるいは記録された
データが正常に読み出せないことがある。このため、H
DD内には、不良になったセクタ(以下、欠陥セクタと
いう)の代替として使用するために、スペアセクタ(交
代セクタ)と呼ばれるエリアがあらかじめ用意されてい
る。通常、スペアセクタは、各シリンダの最終トラック
上に数セクタ分用意されている。
【0031】また、欠陥セクタの発生により各シリンダ
毎に用意されたスペアセクタを全て使用し尽くして、そ
のスペアセクタが無くなった場合には、この代替として
割り当てられるシリンダ(交代シリンダと呼ばれる)が
設けられている。この交代シリンダは、通常のデータ記
録領域を構成するシリンダとは別の予備のシリンダとし
て、例えばそのシリンダ番号の大きい側に形成される。
【0032】この場合、欠陥セクタが発生すると、その
欠陥セクタの代わりにまず同じシリンダ内のスペアセク
タが割り当てられる。その後、さらに同じシリンダ内に
欠陥セクタが発生して、同じシリンダ内のスペアセクタ
が全て使用し尽くされた場合には、交代シリンダ上のス
ペアセクタが割り当てられる。なお、欠陥セクタが発生
した場合のスペアセクタの割り当ての方法は、HDD1
0が欠陥セクタを検出した場合に、中央制御部38の判
断により、HDD10自身が自動的にスペアセクタを割
り当てる方法と、ディスクアレイ制御部3のCPU20
が判断して、HDD10に対してスペアセクタの割当命
令を出力する方法とがあるが、本実施例では前者の方法
を採用するものとする。
【0033】図3に戻って、HDD群4の各HDDの記
録ディスク部39には、判別数値情報記憶部(判別数値
情報記憶手段)40が設けられている。該判別数値情報
記憶部40には、同図(b)に示すように、欠陥セクタ
個数記憶部40aと稼働時間記憶部40bとが形成され
ている。このうち、欠陥セクタ個数記憶部40aには、
CPU35が欠陥セクタが発生したと判断する毎にイン
クリメントする欠陥セクタ個数カウンタの値が記憶され
ている。また、HDDが作動する毎にCPU35からの
指示により、該HDDの稼働時間がタイマー41により
計測され、その累積値(累積稼働時間)が稼働時間記憶
部40bに記憶される。ここで、CPU35は、ディス
ク判別手段及び判別数値情報生成手段の主体をなしてい
ると見ることができる。
【0034】次に、図6に示すように、ディスクアレイ
制御部3の記憶装置25には、判別数値情報記憶部26
とハードディスク装置交換条件記憶部27とが設けられ
ている。そして、判別数値情報記憶部26には、図8に
示すように、読出しエラー回数記憶部26a、書込みエ
ラー回数記憶部26b、データ読出再試行回数記憶部2
6c、欠陥セクタ個数記憶部26d及び稼働時間記憶部
26eの組が、HDD群4を構成するすべてのHDDに
一対一に対応して形成されている。このうち、読出しエ
ラー回数、書込みエラー回数、データ読出再試行回数の
各判別項目については、各HDDへのアクセスに伴い該
当するエラーないし再試行が生ずる毎に、対応する記憶
部26a〜26cに記憶されているカウント値が、CP
U20からの指示により更新される。また、CPU20
からの指示により、タイマー31が計測する所定の時間
毎に各HDDに定期的にアクセスして、その欠陥セクタ
個数記憶部40aと稼働時間記憶部40b(図3)に記
憶されている値を読み込み、これが上記欠陥セクタ個数
記憶部26d及び稼働時間記憶部26eにコピーされ
て、その記憶値が更新される。すなわち、上記CPU2
0がディスク判別手段と判別数値情報生成手段の主体を
なしていると見ることができる。
【0035】一方、ハードディスク装置交換条件記憶部
27(図6)には、図7に示すように、各HDDの交換
時期の判断基準となるべき各判別項目毎の設定値が記憶
されている。そして、ディスクアレイ制御部3のCPU
20は、ROM21に記憶された制御プログラムによ
り、図8に示す判別数値情報記憶部26の各項目毎の記
憶値が上記設定値に到達したか否かを各HDD毎に判定
し、設定値に到達したHDDがあれば、図2に示すモニ
タ126及びスピーカ127等に、例えばその交換を促
すメッセージ(あるいは警報音)を表示ないし音声出力
させる処理を行なう。
【0036】以下、データ記憶装置管理システムKの作
動について、図9のフローチャートを用いて説明する。
まず、S1において、タイマー31(図2)に対し設定
された所定の時間(例えば24時間)が経過するとS2
に進み、ディスクアレイ制御部3はすべてのHDDにア
クセスして、それぞれその欠陥セクタ個数記憶部40a
及び稼働時間記憶部40b(図3)から記憶値を読み出
すとともに、S3でこれを自身の欠陥セクタ個数記憶部
26d及び稼働時間記憶部26e(図8)にコピーして
その記憶値を更新する。そして、S4において図8に示
すすべての項目について、ハードディスク装置交換条件
記憶部27(図6)に記憶された設定値に到達したHD
Dがあるかどうかを判定し、到達したものがあればS5
に進んで該HDDの交換を促す表示(例えばメッセージ
など)をモニタ126に出力させ、さらにはメッセージ
や警報音をスピーカ127から出力させる。一方、S4
において、設定値に到達したHDDがない場合はS5を
スキップする。以降、S6からS1に戻って以下同様の
処理が繰り返される。
【0037】なお、図8に示す欠陥セクタ個数記憶部2
6d及び稼働時間記憶部26eの更新は、ディスクアレ
イ制御部3による読出しエラー回数記憶部26a、書込
みエラー回数記憶部26b、及びデータ読出再試行回数
記憶部26cの更新処理を行なう際に同時に行なうよう
にする処理態様も可能である。この場合のフローチャー
トを図10に示す。すなわち、S10において、読出し
エラー、書込みエラー及びデータ読出しの再試行のいず
れかがありと判断されるとS11に進み、そのエラーを
起こしたHDD内の欠陥セクタ個数記憶部26d及び稼
働時間記憶部26eの記憶値も合わせて読み込むか否か
が、所定の基準、例えば前回更新時から一定の時間が経
過しているかどうか等に基づいて判断される(S1
1)。Yesの場合はS12に進んで上記記憶値を読み
込み、Noの場合はS12をスキップする。そして、S
13で、読出しエラー回数記憶部26a、書込みエラー
回数記憶部26b、データ読出再試行回数記憶部26
c、欠陥セクタ個数記憶部26d及び稼働時間記憶部2
6eの記憶値のうち、必要なものの記憶値を更新する。
以下、S14及びS15の処理は、図9のS4及びS5
と同様である。
【0038】また、図11は、判別項目としてHDDの
稼働時間のみを用いる場合のフローチャートを示してい
る。この場合、S20において、タイマー31(図2)
に対し設定された所定の時間(例えば24時間)が経過
するとS21に進み、ディスクアレイ制御部3はすべて
のHDDにアクセスして、その稼働時間記憶部40b
(図3(b))の記憶値を読み込む。そして、S22で
これを自身の稼働時間記憶部26e(図8)にコピーし
てその記憶値を更新する。以下、S23及びS24の処
理は、図9のS4及びS5と同様である。この場合、稼
働時間以外の判別項目は特に設定する必要がなくなり、
対応する数値情報記憶部も省略することができる。
【0039】なお、データ記憶装置1がディスクアレイ
装置として構成されている場合、データ復元処理の回数
(データ復元回数)を判別数値情報として使用すること
ができ、図8に示すように、判別数値情報記憶部26に
は対応する記憶部26fを設けることができる。
【0040】また、本実施例では、複数の判別項目のう
ちの少なくとも1つにおいてその判別数値情報が設定値
に到達した場合に、HDDの交換時期と判定してこれを
報知するようにしていたが、例えば複数の判別項目の判
別数値情報の合計値あるいは平均値が設定値に到達した
場合に報知を行うようにしてもよい。
【0041】また、以上の実施例においては、データ読
み書きのためのHDDへのアクセスを利用して、欠陥セ
クタの判別とその個数のカウントを行う構成となってい
たが、これをアクセス時ではなく、HDDを使用してい
ない空き時間を利用して、例えばディスクのセクタの全
部または一部をスキャンすることにより、欠陥セクタの
検出およびその個数のカウントを行う構成も可能であ
る。
【0042】また、判別数値情報記憶部が、ディスクア
レイ制御部3とHDDとの両方に設けられていたが、こ
れをディスクアレイ制御部3又はHDDのいずれか一方
のみに設けることも可能である。また、図1の主コンピ
ュータ2をディスク状態判別手段として用いることもで
き、この場合は該主コンピュータ2に接続された記憶装
置5を判別数値情報記憶手段として使用することができ
る。
【0043】さらに、上記構成では、判別数値情報が設
定値に到達した(すなわち、交換時期と判断された)H
DDについては、その交換を促すメッセージあるいは警
報音等をモニタ126あるいはスピーカ127に出力す
るようになっていたが、例えばデータ記憶装置1に予備
のHDDを予め接続しておき、判別数値情報が設定値に
到達したHDDが生じた場合には、そのデータを上記予
備のHDDに対し自動的にコピーする構成も可能であ
る。この場合、例えばそのコピー処理を制御するプログ
ラムに対する起動信号(図2のCPU20から発せられ
る)が、請求項でいう所定の出力に相当すると見ること
ができる。
【図面の簡単な説明】
【図1】本発明のデータ記憶装置管理システムの一実施
例を示す全体構成を示すブロック図。
【図2】ディスクアレイ群制御部の電気的な内部構成を
示すブロック図。
【図3】ハードディスク装置の電気的な構成を示すブロ
ック図、及び判別情報記憶部内のデータ構成の内容を示
す説明図。
【図4】ディスクアレイにおけるデータ記憶形式の説明
図。
【図5】記録ディスク部の内部構成を示す説明図。
【図6】図2の判別数値情報記憶部内の各データの格納
領域を示す説明図。
【図7】図6のハードディスク交換条件記憶部内のデー
タ構成を示す説明図。
【図8】図2の判別数値情報記憶部内のデータ構成を示
す説明図。
【図9】データ記憶装置管理システムにおける判別数値
情報の更新処理の流れを示すフローチャート。
【図10】同じくその変形例を示すフローチャート。
【図11】さらに別の変形例を示すフローチャート。
【符号の説明】
K データ記憶装置管理システム 1 データ記憶装置 10〜16 ハードディスク装置(エラー訂正情報記憶
部、データ記憶装置) 20 CPU(ディスク判別手段、読出/書込制御手
段、データ復元手段) 35 CPU 26、40 判別数値情報記憶部(判別数値情報記憶手
段) 126 モニタ(報知手段、出力手段) 127 スピーカ(報知手段、出力手段)

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 複数のハードディスク装置を含んで構成
    されたデータ記憶装置の管理システムであって、 予め定められた1ないし複数の判別項目について、前記
    各ハードディスク装置の作動状態及び/又は該ハードデ
    ィスク装置の記録ディスク部の状態(以下、これらを総
    称してディスク状態という)を判別するディスク判別手
    段と、 その判別結果に基づいて、前記各判別項目に対応した数
    値情報(以下、判別数値情報という)を、前記各ハード
    ディスク装置毎に生成する判別数値情報生成手段と、 前記各ハードディスク装置と一対一に対応して設けら
    れ、対応するハードディスク装置について前記ディスク
    状態の判別がなされる毎に、生成される前記判別数値情
    報を累積して記憶する判別数値情報記憶手段と、 前記判別数値情報記憶手段の記憶内容が予め定められた
    条件を充足した場合に、対応するハードディスク装置に
    おいて作動不具合が生じやすくなっていると判定して、
    外部に所定の出力を行う出力手段とを備えたことを特徴
    とするデータ記憶装置管理システム。
  2. 【請求項2】 前記判別数値情報は、前記各ハードディ
    スク装置で発生した読出しエラーの回数、同じく書込み
    エラーの回数、前記各ハードディスク装置の前記記録デ
    ィスク部上の欠陥セクタの個数、前記各ハードディスク
    装置の稼動時間、及びデータの読出し及び/又は書込み
    の再試行を行った回数のうちの少なくとも1種を含むも
    のである請求項1記載のデータ記憶装置管理システム。
  3. 【請求項3】 前記データ記憶装置は、 一まとまりとして読み書きされるべきデータ(以下、原
    データという)が複数のデータブロックに分割され、こ
    れを該データブロック単位で分散した形で記憶する前記
    複数のハードディスク装置と、 前記複数のハードディスク装置に対し、前記データブロ
    ックを並列して読み書きさせる読出/書込制御手段と、 前記原データに基づいて生成されたエラー訂正情報を別
    途記憶するエラー訂正情報記憶部と、 前記複数のハードディスク装置のいずれかにおいて、前
    記データブロックの読出しが不能となった場合には、読
    出し可能な他のハードディスク装置のデータブロック
    と、前記エラー訂正情報記憶部に記憶されたエラー訂正
    情報とに基づいて、その読出し不能となったデータブロ
    ックの復元を行うデータ復元手段とを有するディスクア
    レイ装置として構成されている請求項1又は2に記載の
    データ記憶装置管理システム。
  4. 【請求項4】 前記判別数値情報は、前記データ復元手
    段によるデータ復元回数を含むものである請求項3記載
    のデータ記憶装置管理システム。
  5. 【請求項5】 前記ディスク判別手段は、前記各ハード
    ディスク装置の前記ディスク状態の判別を、予め定めら
    れた時間が経過する毎に行うものとされる請求項1ない
    し4のいずれかに記載のデータ記憶装置管理システム。
  6. 【請求項6】 前記判別数値情報記憶手段は、前記各ハ
    ードディスク装置内に設けられている請求項1ないし5
    のいずれかに記載のデータ記憶装置管理システム。
  7. 【請求項7】 前記出力手段は、前記各判別数値情報記
    憶手段の記憶内容が予め定められた条件を充足した場合
    に、視覚出力及び/又は音声出力により報知を行う報知
    手段を含む請求項1ないし6のいずれかに記載のデータ
    記憶装置管理システム。
JP8330381A 1996-11-25 1996-11-25 データ記憶装置管理システム Pending JPH10162492A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8330381A JPH10162492A (ja) 1996-11-25 1996-11-25 データ記憶装置管理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8330381A JPH10162492A (ja) 1996-11-25 1996-11-25 データ記憶装置管理システム

Publications (1)

Publication Number Publication Date
JPH10162492A true JPH10162492A (ja) 1998-06-19

Family

ID=18231972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8330381A Pending JPH10162492A (ja) 1996-11-25 1996-11-25 データ記憶装置管理システム

Country Status (1)

Country Link
JP (1) JPH10162492A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009267660A (ja) * 2008-04-23 2009-11-12 Konica Minolta Business Technologies Inc 画像処理装置及び画像処理システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009267660A (ja) * 2008-04-23 2009-11-12 Konica Minolta Business Technologies Inc 画像処理装置及び画像処理システム

Similar Documents

Publication Publication Date Title
JP2501752B2 (ja) コンピユ―タ・システムのストレ―ジ装置及びデ―タのストア方法
JP5887757B2 (ja) ストレージシステム、ストレージ制御装置およびストレージ制御方法
US5278838A (en) Recovery from errors in a redundant array of disk drives
US7543178B2 (en) Low cost RAID with seamless disk failure recovery
US5822782A (en) Methods and structure to maintain raid configuration information on disks of the array
JP3078972B2 (ja) ディスクアレイ装置
JP5768587B2 (ja) ストレージシステム、ストレージ制御装置およびストレージ制御方法
JP5285610B2 (ja) グローバルホットスペアディスクが存在するときに、故障したドライブを復元、及びコピーバックする最適化された方法
JPH11345095A (ja) ディスクアレイ装置およびその制御方法
EP1895414A1 (en) Storage control apparatus and failure recovery method for storage control apparatus
US20050229033A1 (en) Disk array controller and information processing apparatus
JP3681766B2 (ja) ディスクアレイ装置
EP0517857A4 (ja)
US20060190683A1 (en) Disk array apparatus and backup method of data
JPH07110743A (ja) ディスクアレイ装置の故障対処方法および装置
JP5776436B2 (ja) ストレージシステム、ストレージ制御装置およびストレージ制御方法
JP2010128773A (ja) ディスクアレイ装置、そのディスク管理方法及びそのディスク管理プログラム
US20150347224A1 (en) Storage control apparatus and method therefor
JPH0651915A (ja) ディスク装置およびディスクアレイ管理方式
JP2006079219A (ja) ディスクアレイ制御装置およびディスクアレイ制御方法
JP4012420B2 (ja) 磁気ディスク装置及びディスク制御装置
US5644767A (en) Method and apparatus for determining and maintaining drive status from codes written to disk drives of an arrayed storage subsystem
JP2010267037A (ja) ディスクアレイ装置
JP3120753B2 (ja) ディスクアレイ装置の障害復旧装置
JPH10162492A (ja) データ記憶装置管理システム