JP3158832B2 - ディスクアレイ装置 - Google Patents

ディスクアレイ装置

Info

Publication number
JP3158832B2
JP3158832B2 JP00198194A JP198194A JP3158832B2 JP 3158832 B2 JP3158832 B2 JP 3158832B2 JP 00198194 A JP00198194 A JP 00198194A JP 198194 A JP198194 A JP 198194A JP 3158832 B2 JP3158832 B2 JP 3158832B2
Authority
JP
Japan
Prior art keywords
disk device
disk
history information
information
storage area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP00198194A
Other languages
English (en)
Other versions
JPH07210331A (ja
Inventor
健次 堤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP00198194A priority Critical patent/JP3158832B2/ja
Publication of JPH07210331A publication Critical patent/JPH07210331A/ja
Application granted granted Critical
Publication of JP3158832B2 publication Critical patent/JP3158832B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディスクアレイ装置に
係わり、特に、データを冗長構成にして格納するディス
クアレイ装置に関する。
【0002】
【従来の技術】ディスクアレイ装置は、単体でも動作可
能な複数台のディスク装置を組み合わせた記憶装置であ
り、コンピュータなどのホスト装置からは、1台のディ
スク装置として扱えるように構成される。
【0003】図14に、従来のディスクアレイ装置の構
成の一例を示す。ディスクアレイ装置11は、インタフ
ェース12とディスクアレイコントローラ13と複数台
のディスク装置141 〜145 で構成される。内蔵され
るディスク装置14の台数は、ディスクアレイ装置によ
り異なる。このようなディスクアレイ装置には、データ
のアクセス速度の向上を目的としたものと、記憶装置と
しての信頼性の向上を目的としたものがあり、後者にお
いては、書き込み要求のなされたデータは、冗長度が付
加されて、ディスクアレイ装置内に格納される。
【0004】図15を用いて、このデータの書き込み動
作の説明を簡単に行う。なお、ここで説明に用いる冗長
構成は、RAID(Redundant Arrays of Inexpensive D
isks) のレベル3と呼ばれるものである。
【0005】ディスクアレイコントローラ13は、ホス
トから書き込み要求がなされたデータ20を、所定のサ
イズ、たとえば、セクタ単位に分割し、ディスク装置1
1〜144 の記憶領域161 〜164 に分散させて書
き込む。このとき、ディスクアレイコントローラ13
は、データD1 、D2 、D3 、D4 の排他的論理和演算
を行い、その演算結果であるパリティPを、ディスク装
置145 の記録領域16 5 に書き込むことも、併せて実
行する。
【0006】このような書き込み動作の結果、ディスク
アレイ装置内には、あるディスク装置に格納されたデー
タが、他のディスク装置に格納されたデータおよびパリ
ティから算出することができる状態が形成される。たと
えば、データD4 は、データD1 、D2 、D3 、パリテ
ィPの排他的論理和演算結果と一致する。このため、読
み出し要求があったデータが実際に格納されたディスク
装置を使用することなく、その要求に応答することが可
能である。ディスクアレイ装置では、内蔵するディスク
装置の1台にアクセス障害が発生した際にそのディスク
に対する読み出し要求があった場合には、このような形
で他のディスク装置に格納された情報から、必要とされ
るデータを再構築することにより、その読み出し要求に
応答を行なう。
【0007】この再構築による応答か否かを判断するに
は、ディスクアレイコントローラに、アクセス障害を有
するディスク装置を認識させることが必要である。この
ための手段としては、さまざまなものがあり、たとえ
ば、ディスクアレイコントローラ内のメモリに、障害を
有するディスク装置(障害ディスク装置)を特定する情
報を記憶させておくことも行なわれている。
【0008】しかし、障害ディスク装置を特定する情報
が揮発性メモリに記憶されている場合には、その情報
が、システム停止時に失われてしまうので、ディスクア
レイ装置の使用者は、再立ち上げ時に、障害ディスク装
置を特定する情報を再設定しなければならないという問
題があった。このため、障害ディスク装置を特定する情
報を揮発性メモリ以外に格納するさまざまな装置が提案
されている。
【0009】たとえば、特開平3−229331号公報
には、2重化ディスク装置の状態記憶に不揮発性メモリ
を用いる装置が開示されている。
【0010】図16に、その2重化ディスク装置の概要
を示す。このシステムは、2台のディスク装置22とそ
れらを統合的に制御する制御部23と不揮発性記憶部2
4とオペレーティングシステム(OS)25で構成され
る。この2重化ディスク装置では、1台のディスク装置
にアクセス障害が発生した際には、他方のディスク装置
に対応するディスク装置識別情報が、不揮発性記憶部2
4に書き込まれる。そして、装置の再立ち上げ時には、
この不揮発性記憶部24に書き込まれたディスク装置識
別情報から、正常に機能するディスク装置が特定され
る。
【0011】また、特公平2−32652号公報には、
ディスク媒体上に記録された情報から、ディスク装置の
状態を判定する2重化ディスク装置が開示されている。
【0012】図17を用いて、この2重化ディスク装置
の構成と動作の説明を行なう。特公平2−32652号
公報記載の2重化ディスク装置は、2台のディスク装置
22 1 、222 とチャネル装置261 、262 と中央処
理装置27で構成されており、各ディスク装置22のデ
ィスク媒体上には、ヒストリカウンタ部29とヒストリ
カウンタ検証部30が設けられ、中央処理装置27内の
主メモリ28には、各ディスク装置が正常に機能するか
否かを示す情報を記憶するための制御テーブル31が設
けられている。
【0013】中央処理装置27は、両方のディスク装置
22が、正常に機能しているときに、それぞれのヒスト
リカウンタ部29に同じ値を書き込んでおく。そして、
一方のディスク装置、たとえば、ディスク装置221
アクセス障害が発生した際には、他方のディスク装置2
2 のヒストリカウンタ部292 の値を増加させる。そ
して、装置の再立ち上げ時には、ヒストリカウンタ部2
1 と292 の値を読み出して比較し、それらの値が異
なるときには、大きな値が書き込まれている方のディス
ク装置が正常に機能する装置であると判断する。
【0014】なお、ヒストリカウンタ検証部30は、ヒ
ストリカウンタ部29に隣接する記憶領域であり、この
2重化ディスク装置では、この部分に書き込まれたデー
タの変更の有無を確認することにより、ヒストリカウン
タ部の内容の正否の判定を行っている。
【0015】
【発明が解決しようとする課題】以上説明した2重化デ
ィスク装置に対する2つの技術では、確かに、システム
が停止しても、障害ディスク装置を特定する情報は失わ
れることはない。しかし、これらの技術は、2重化ディ
スク装置に対するものであり、3台以上のディスク装置
を備えるディスクアレイ装置に直接適用できるものでは
ない。
【0016】また、これらの技術では、システム停止時
に、ディスク装置の交換がなされた場合に対する対処が
行なわれていないため、以下のような問題が生ずること
が考えられる。たとえば、不揮発性メモリにディスク装
置の状態を記憶する2重化ディスク装置では、システム
停止時にディスク装置が交換された場合には、そのこと
が、不揮発性メモリ内の情報に反映されない。このた
め、正常に動作する方のディスク装置が誤って交換され
た場合、制御部は、情報が格納されていないディスク装
置が正常な装置であると判断して、動作を開始してしま
う。
【0017】また、ディスク媒体上にヒストリカウンタ
を設ける2重化ディスク装置では、正常な方のディスク
装置が、新しいディスク装置に交換されて場合、そのヒ
ストリカウンタ検証部に格納された情報が正しいもので
ないため、その装置は正常に機能するものではないと判
断され、障害ディスク装置の方が正常に機能するものと
して動作が開始される。
【0018】そこで本発明の目的は、立ち上げ時に、ア
クセス障害を有するディスク装置を検出することができ
るディスクアレイ装置を提供することにある。
【0019】また、本発明の他の目的は、システム停止
時にディスク装置の交換が行なわれても、それぞれのデ
ィスク装置の状態を、正確に判定することができるディ
スクアレイ装置を提供することにある。
【0020】
【課題を解決するための手段】請求項1記載の発明は、
データを格納するための複数台のディスク装置と、これ
ら全てのディスク装置を巡回する順序を設定する設定手
段と、複数台のディスク装置のそれぞれの所定の記憶領
域に、各ディスク装置の状態の判定に用いる履歴情報と
して同一内容の数値情報を書き込む初期化手段と、ディ
スク装置にアクセス障害が発生したことを検出する検出
手段と、この検出手段によりアクセス障害が検出された
ディスク装置を除いたディスク装置を設定手段で設定さ
れた順序で1台ずつ指定する指定手段と、この指定手段
で指定されたディスク装置の所定の記憶領域に格納され
た履歴情報をその値が所定量増加するように書き換える
書換手段と、立ち上げ時に、複数台のディスク装置の所
定の記憶領域に格納されている履歴情報を読み出す読出
手段と、この読出手段が読みだした履歴情報を基に、設
定手段により後に順序付けられたディスク装置の履歴情
報の方が大きいディスク装置を探索する探索手段と、こ
の探索手段により探索されたディスク装置をアクセス障
害を有するディスク装置であると判断する判断手段とを
具備する。
【0021】すなわち請求項1記載の発明では、ディス
クアレイ装置の初期化時に、各ディスク装置の所定の記
憶領域に、同一の履歴情報を書き込んでおき、通常動作
中に、ディスク装置にアクセス障害が発生した際には、
その障害ディスク装置を除くディスク装置の履歴情報
を、その内容が所定量、たとえば、“1”だけ増加する
ように書き換えていく。この書換は、設定手段により設
定された順序で行なわれる。
【0022】読出手段は、立ち上げ時に、それぞれのデ
ィスク装置内の履歴情報の読み出しを行い、探索手段
は、設定手段により設定されている順序において、連続
する2台のディスク装置に格納されていた履歴情報の比
較を行い、後に順序付けられたディスク装置の履歴情報
の方が大きくなるディスク装置の探索を行なう。判断手
段は、この探索手段で探索されたディスク装置がアクセ
ス障害を有するディスク装置であると判断する。このよ
うに、所定の順序で履歴情報の書き換えを行なっている
ので、書換手段による履歴情報の書き換えが中断された
場合にも、立ち上げ時に、正確にアクセス障害を有する
ディスク装置が存在するか否かが判定できることにな
る。
【0023】請求項2記載の発明は、データを格納する
ための複数台のディスク装置と、これら全てのディスク
装置を巡回する順序を設定する設定手段と、複数台のデ
ィスク装置のそれぞれの所定の記憶領域に、各ディスク
装置の状態の判定に用いる管理情報としてそのディスク
装置が接続されるスロット番号と数値情報である履歴情
報とを書き込む初期化手段と、ディスク装置にアクセス
障害が発生したことを検出する検出手段と、この検出手
段によりアクセス障害が検出されたディスク装置を除い
たディスク装置を設定手段により設定された順序で1台
ずつ指定する指定手段と、この指定手段で指定されたデ
ィスク装置の所定の記憶領域に格納された履歴情報をそ
の値が所定量増加するように書き換える書換手段と、立
ち上げ時に、複数台のディスク装置のそれぞれの所定の
記憶領域に格納されている管理情報を読み出す読出手段
と、この読出手段が読みだした管理情報中のスロット番
号が初期化手段により書き込まれたものと一致している
か否かを判定する判定手段と、この判定手段が一致して
いないと判定したディスク装置から読みだした履歴情報
を初期化手段が書き込みに用いる履歴情報より小さな値
の履歴情報に変更する変更手段と、それぞれのディスク
装置に応じた履歴情報を基に、設定手段により後に順序
付けられたディスク装置の履歴情報の方が大きいディス
ク装置を探索する探索手段と、この探索手段により探索
されたディスク装置に対応する履歴情報が変更手段によ
り変更されたものであった場合に、そのディスク装置が
交換されたディスク装置であると判断し、それ以外の場
合には、そのディスク装置がアクセス障害を有するディ
スク装置であると判断する判断手段とを具備する
【0024】すなわち請求項2記載の発明では、ディス
クアレイ装置の初期化時に、各ディスク装置の所定の記
憶領域に、スロット情報と履歴情報とからなる管理情報
を書き込んでおき、通常動作中に、ディスク装置にアク
セス障害が発生した際には、その障害ディスク装置を除
くディスク装置の履歴情報を、その内容が所定量、たと
えば、“1”だけ増加するように書き換えていく。この
書換は、設定手段により設定された順序に従い行なわれ
る。
【0025】読出手段は、立ち上げ時に、それぞれのデ
ィスク装置内の管理情報の読み出しを行い、判定手段
は、管理情報中のスロット情報が初期化手段により書き
込まれたものであるか否かを判定する。変更手段は、こ
の判定手段によりスロット情報が正常でないと判定され
たディスク装置に対応する履歴情報を、初期化手段が書
き込みに用いる履歴情報より小さな値に変更する。な
お、この手段では、ディスク装置内の履歴情報が書き換
えられるのではなく、読み出された履歴情報に変更が加
えられるだけである。そして、探索手段は、設定手段に
より連続するよう順序付けられた2台のディスク装置に
対応する履歴情報の比較を行い、後に順序付けられたデ
ィスク装置の履歴情報の方が大きくなるディスク装置の
探索を行なう。判断手段は、この探索手段により探索さ
れたディスク装置に対応する履歴情報が変更手段により
変更されたものであった場合に、そのディスク装置が交
換されたディスク装置であると判断し、その履歴情報が
変更手段により変更されたものでなかった場合には、そ
のディスク装置がアクセス障害を有するディスク装置で
あると判断する。このように、所定の順序による履歴情
報の書き換えと、スロット情報を用いた判定を行なって
いるので、書換手段による履歴情報の書き換えが中断さ
れた場合や、システム停止時にディスク装置が交換され
た場合にも、正確に、アクセス障害を有するディスク装
置および正しく交換されたディスク装置が存在するか否
かが判定できることになる。
【0026】請求項3記載の発明は、データを格納する
ための複数台のディスク装置と、これら全てのディスク
装置を巡回する順序を設定する設定手段と、複数台のデ
ィスク装置のそれぞれの所定の記憶領域に、各ディスク
装置の状態の判定に用いる履歴情報として第1の履歴情
報を書き込む初期化手段と、ディスク装置にアクセス障
害が発生したことを検出する検出手段と、この検出手段
によりアクセス障害が検出されたディスク装置の設定手
段により後に順序付けられるディスク装置を指定する指
定手段と、この指定手段で指定されたディスク装置の所
定の記憶領域の内容を第1の履歴情報とは異なる第2の
履歴情報に書き換える書換手段と、立ち上げ時に、それ
ぞれのディスク装置の所定の記憶領域に格納された情報
を読み出す読出手段と、この読出手段により読み出され
た情報を基に、第2の履歴情報と一致する情報が記憶さ
れたディスク装置を探索する探索手段と、この探索手段
により探索されたディスク装置の設定手段により前に順
序付けられたディスク装置がアクセス障害を有するディ
スク装置であると判断する判断手段とを具備する。
【0027】すなわち請求項3記載の発明では、ディス
クアレイ装置の初期化時に、各ディスク装置の所定の記
憶領域に、同一内容の第1の履歴情報を書き込んでお
き、通常動作中に、ディスク装置にアクセス障害が発生
した際には、その障害ディスク装置の後に順序付けられ
たディスク装置の履歴情報を、第1の履歴情報とは異な
る第2の履歴情報に書き換える。
【0028】読出手段は、立ち上げ時に、それぞれのデ
ィスク装置内の履歴情報の読み出しを行い、探索手段
は、第2の履歴情報が記憶されているディスク装置の探
索を行なう。そして、判断手段は、この探索手段で探索
されたディスク装置の、設定手段により前に順序付けら
れたディスク装置がアクセス障害を有するディスク装置
であると判断する。このように、所定の順序で履歴情報
の書き換えを行なっているので、書換手段による履歴情
報の書き換えが中断された場合にも、立ち上げ時に、正
確にアクセス障害を有するディスク装置が存在するか否
かが判定できることになる。
【0029】請求項4記載の発明は、データを格納する
ための複数台のディスク装置と、これら全てのディスク
装置を巡回する順序を設定する設定手段と、複数台のデ
ィスク装置のそれぞれの所定の記憶領域に、各ディスク
装置の状態の判定に用いる履歴情報として第1の履歴情
報を書き込む初期化手段と、ディスク装置にアクセス障
害が発生したことを検出する検出手段と、この検出手段
によりアクセス障害が検出されたディスク装置の設定手
段により後に順序付けられるディスク装置を指定する指
定手段と、この指定手段で指定されたディスク装置の所
定の記憶領域の内容を第1の履歴情報とは異なる第2の
履歴情報に書き換える書換手段と、立ち上げ時に、それ
ぞれのディスク装置の所定の記憶領域に格納された情報
を読み出す読出手段と、この読出手段により読み出され
た情報を基に、第2の履歴情報と一致する情報が記憶さ
れたディスク装置の設定手段により前に順序付けられた
ディスク装置を特定する第1の特定手段と、読出手段に
より読み出された情報を基に、第1および第2の履歴情
報のいずれとも一致しない情報が記憶されているディス
ク装置を特定する第2の特定手段と、これら第1および
第2の特定手段で特定されたディスク装置が同じ装置で
あったときに、そのディスク装置を正しく交換されたデ
ィスク装置であると判断する第1の判断手段と、第2の
特定手段による特定が行なわれておらず、第1の特定手
段によるディスク装置の特定が行なわれていたときに、
第1の特定手段で特定されたディスク装置がアクセス障
害を有するディスク装置であると判断する第2の判断手
段とを具備する。
【0030】すなわち請求項4記載の発明では、ディス
クアレイ装置の初期化時に、各ディスク装置の所定の記
憶領域に、同一内容の第1の履歴情報を書き込んでお
き、通常動作中に、ディスク装置にアクセス障害が発生
した際には、その障害ディスク装置の後に順序付けられ
たディスク装置の履歴情報を、第1の履歴情報とは異な
る第2の履歴情報に書き換える。
【0031】読出手段は、立ち上げ時に、それぞれのデ
ィスク装置内の履歴情報の読み出しを行い、第1の特定
手段は、第2の履歴情報が記憶されているディスク装置
の探索して、そのようなディスク装置が探索できた場合
には、探索されたディスク装置の前に順序付けられたデ
ィスク装置の特定を行なう。また、第2の特定手段は、
第1および第2の履歴情報とは異なる履歴情報を有する
ディスク装置を探索して、そのようなディスク装置が探
索できた場合には、探索されたディスク装置の特定(識
別情報の記憶)を行なう。
【0032】そして、第1の判断手段は、これら第1お
よび第2の特定手段で特定されたディスク装置が同じ装
置であったときに、そのディスク装置を正しく交換され
たディスク装置であると判断し、第2の判断手段は、第
2の特定手段による特定が行なわれておらず、第1の特
定手段によるディスク装置の特定が行なわれていたとき
に、第1の特定手段で特定されたディスク装置がアクセ
ス障害を有するディスク装置であると判断する。このよ
うに、2種の履歴情報しか用いず、所定の順序で履歴情
報の書き換えを行なっているので、システム停止時にデ
ィスク装置が交換された場合にも、アクセス障害を有す
るディスク装置および正しく交換されたディスク装置が
存在するか否かが判定できることになる。
【0033】
【実施例】以下、実施例につき本発明を詳細に説明す
る。
【0034】第1の実施例
【0035】図1に、本発明の第1の実施例によるディ
スクアレイ装置の概要を示す。第1の実施例のディスク
アレイ装置11は、インターフェース12とディスクア
レイコントローラ13と5台のディスク装置141 ない
し145 で構成される。ディスク装置14は、単独でも
動作可能なディスク装置であり、それぞれのディスク装
置の所定の記憶領域には、ディスクアレイ装置の状態判
定に用いる管理情報を格納するための管理情報記憶領域
15が設けられている。ディスクアレイコントローラ1
3は、コンピュータなどのホスト21からのデータのア
クセス要求に応答するために、これら5台のディスク装
置141 ないし145 を統合的に制御する制御部であ
る。なお、ディスクアレイコントローラ13は、制御用
プロセッサと、制御用プロセッサの動作を規定するプロ
グラムが格納されたプログラムメモリと、その動作時に
使用するパラメータを格納するメモリと、各ディスク装
置とのインタフェースで構成されている。
【0036】このディスクアレイ装置の動作は、ディス
クアレイ装置の使用に先駆けて行われる初期化処理と、
通常動作中に、ディスク装置に障害が発生した際に行わ
れる管理情報更新処理と、各ディスク装置の状態を判
定、認識するために、装置の立ち上げ時に行われる状態
判定処理に大別される。まず、初期化処理について説明
を行うことにする。
【0037】図2に、初期化処理時におけるディスクア
レイコントローラの動作の流れを示す。ここで、処理対
象とされる各ディスク装置は、いわゆるフォーマットが
完了した装置であり、ディスクアレイコントローラ13
は、インターフェース12を介してホスト21からの初
期化指示を受信すると、カウンタCFAILと識別情報N
FAILに、それぞれ“0”をセットし、また、変数iに
“1”をセット(ステップS101)する。カウンタC
FAILは、正常でないディスク装置の台数の記憶に用いら
れ、識別情報NFAILは、カウンタCFAILでカウントされ
たディスク装置のうち、1台のディスク装置の識別情報
の記憶に用いられるパラメータである。
【0038】パラメータの設定を終えたディスクアレイ
コントローラ13は、i番のディスク装置14i が正常
に読み書きできるかどうかのテストを行い(ステップS
102)、正常に読み書き可能である場合には(ステッ
プS103;Y)、そのディスク装置14i の管理情報
記憶領域15i に管理情報を書き込み(ステップS10
4)、ステップS107に進む。なお、ステップS10
4では、ディスクアレイ装置を識別するための装置識別
情報と、接続されたスロット番号に応じた情報であるス
ロット情報と、履歴情報とからなる管理情報が書き込ま
れるが、管理情報中、変数iに応じてその内容が変化す
る情報はスロット情報だけである。
【0039】また、i番のディスク装置が正常に読み書
きが行なえない装置である場合(ステップS103;
N)には、カウンタCFAILに“1”が加算され、識別情
報NFA ILの内容がiに書き換えられる(ステップS10
5)。そして、カウンタCFAILが“1”以下である場合
(ステップS106;Y)に限り、ステップS107に
進む。カウンタCFAILが“2”以上である場合(ステッ
プS106;N)には、冗長度ゼロのディスクアレイ装
置としても動作させることができない旨を示すエラーメ
ッセージを出力(ステップS109)して、初期化処理
を終了する。
【0040】ステップS107では、iに“1”が加算
され、次に、変数iが全ディスク装置数NALL 以下であ
るか否かの判断(ステップS108)が行なわれる。変
数iが全ディスク装置数NALL 以下である場合(Y)
は、次のディスク装置に対して、テストおよび管理情報
の書き込みを行うために、ステップS102に戻る。
【0041】変数iが全ディスク台数NALL を越えたと
き(ステップS108;N)、すなわち、全てのディス
ク装置に対するテストおよび管理情報の書き込みが完了
したときには、カウンタCFAILが“0”であるか否かの
判定を行い(ステップS110)、“0”でない場合
(N)には、NFAIL番のディスク装置をアクセス対象か
ら除外して(ステップS111)、初期化処理を終了す
る。なお、アクセス対象から除外するディスク装置の設
定は、ディスクアレイコントローラ13内のメモリの所
定の記憶領域に、NFAIL番のディスク装置が使用不可で
あることを示す情報を書き込むことにより行なわれる。
【0042】このように第1の実施例のディスクアレイ
装置は、1台のディスク装置に障害があっても使用を開
始することができるように構成されているが、通常、全
てのディスク装置が正常に読み書きできる状態で、その
使用は開始される。
【0043】図3に、初期化処理において、全てのディ
スク装置が正常であった場合(CFA IL=0)における各
ディスク装置の管理情報記憶領域の内容を模式的に示
す。図中、管理情報記憶領域15の記憶領域17内に表
記してある“UID”は、装置識別情報であり、記憶領
域18と記憶領域19に示してある数値は、それぞれ、
スロット情報と履歴情報であるとする。このように、そ
れぞれのディスク装置の管理情報記憶領域15には、図
2に示した初期化処理により、スロット情報だけが異な
る管理情報が書き込まれることになる。
【0044】この管理情報は、各ディスク装置の状態判
定のために用いられる情報であり、第1の実施例のディ
スクアレイ装置では、通常動作中に、ディスク装置に障
害が発生すると、その障害ディスク装置を除くディスク
装置の管理情報記憶領域の内容が書き換えられる。この
管理情報更新処理は、以下に記す手順により実行され
る。
【0045】図4に、管理情報更新処理時のディスクア
レイコントローラの動作の流れを示す。ディスクアレイ
コントローラは、ディスク装置から障害が発生したこと
を示す情報を受けると、そのディスク装置の識別情報を
識別情報NFAILにセット(ステップS201)する。そ
して、識別情報NFAILが全ディスク台数NALL と等しい
場合(ステップS202;Y)は、変数iに“1”をセ
ット(ステップS203)し、NFAILが全ディスク装置
数NALL と等しくない場合(ステップS202;N)に
は、iに“NFAIL+1”をセット(ステップS204)
する。
【0046】その後、i番のディスク装置の管理情報中
の履歴情報が“1”だけ増加するように管理情報の書き
換えを行う(ステップS205)。このステップでは、
管理情報の読み出しと、読み出した管理情報中の履歴情
報の更新と、更新した管理情報の管理情報記憶領域への
書き込みが行われる。
【0047】次に、ディスクアレイコントローラは、変
数iに“1”を加算(ステップS206)し、iがN
ALL を越える場合(ステップS207;Y)に限り、i
を“1”に変更(ステップS208)する。そして、変
数iと識別情報NFAILの比較を行い、iがNFAILと一致
していない場合(ステップS209;N)には、次のデ
ィスク装置の管理情報を更新するために、ステップS2
05に戻る。この一連の処理は、変数iと識別情報N
FAILが一致したとき(ステップS209;Y)、すなわ
ち、識別情報NFAILで指定されるディスク装置を除くデ
ィスク装置の管理情報の更新が行われたときに、終了す
る。
【0048】なお、ステップS202ないしS204の
処理は、最初に管理情報の更新を行うディスク装置を決
定するための処理であり、これらの処理により、NALL
番(実施例のディスクアレイ装置では“5”)のディス
ク装置が障害ディスク装置であった場合には、1番のデ
ィスク装置が管理情報の更新対象とされ、それ以外の場
合には、障害ディスク装置が接続されたスロット番号よ
り、“1”だけ多いスロット番号を有するスロットに接
続されたディスク装置が最初の更新対象とされる。ステ
ップS206ないしS208の処理も、次に管理情報の
更新を行うディスク装置を同様の順序規則に従って、決
定するための処理である。
【0049】図5に、この管理情報更新処理により、各
ディスク装置の管理情報記憶領域の内容が更新されてい
くようすを模式的に示す。各ディスク装置の管理情報の
内容が(a)に示したような状態である場合に、たとえ
ば、☆印を付けたディスク装置(2番のディスク装置)
に障害が発生したときには、(b)に示すように、最初
に、3番のディスク装置の管理情報中の履歴情報が書き
換えられ、その後、4番、5番、1番の順序で管理情報
が更新されていき、最終的に、(c)に示したような状
態が形成される。
【0050】この管理情報は、装置の立ち上げ時に読み
だされ、アクセス対象としてはならないディスク装置
や、復旧処理を開始してもよいディスク装置が存在する
かなどの判定に用いられる。この状態判定処理の動作手
順は複雑であるので、その詳細な説明を行う前に、各デ
ィスク装置から読み出される管理情報の内容と、その内
容により、ディスクアレイコントローラが選択すべき動
作内容との関係を説明することにする。
【0051】図6および図7に、各ディスク装置から読
み出される場合が考えられる管理情報の内容を模式的に
示す。図6(c)は、2番のディスク装置に障害が発生
し、管理情報の更新処理が完了している場合の各管理情
報の内容を示したものである。この場合、ディスクアレ
イコントローラは、2番のディスク装置をアクセス対象
から除外して、ディスクアレイ装置を冗長度ゼロの記憶
装置として動作させるべきである。なお、2番のディス
ク装置の管理情報記憶領域は、読み出しが可能な場合も
あり、また、不可能な場合もある。
【0052】図6(d)は、実線の矢印で示したよう
に、障害ディスク装置が正しく交換された場合の管理情
報の内容を示したものである。交換されたディスク装置
の管理情報記憶領域は、管理情報が書き込まれていない
ことを示すために空白としてある。この場合のディスク
アレイ装置の状態は、2番のディスク装置に対して復旧
処理を行い、全てのディスク装置を利用可能とした後
に、動作させるべき状態である。なお、交換されたディ
スク装置がフォーマット直後のものであれば、その管理
情報記憶領域に対応する記憶領域には、所定のビットパ
ターン(たとえば、16進表記で“E5”のビットパタ
ーン)が書き込まれている。
【0053】図6(e)は、(c)の状態に対して、破
線の矢印で示したように、誤ったディスク装置交換が行
われた場合の一例を示したものである。この場合、ディ
スクアレイコントローラは、ディスクアレイ装置の状態
を、動作不可能な状態であると判定すべきである。
【0054】また、管理情報更新処理が中断されていた
場合には、ディスクアレイ装置の状態は同じでも、管理
情報の内容が、図6とは異なるものとなる。
【0055】図7に、管理情報の更新が中断された場合
の各ディスク装置の管理情報の内容を示す。ここでは、
1台のディスク装置の管理情報の更新が行われた段階
で、その処理が中断されたものとする。図7(b)、
(f)、(g)における各ディスク装置の状態は、それ
ぞれ、図6(c)、(d)、(e)における各ディスク
装置の状態と同じである。すなわち、(b)は、2番の
ディスク装置をアクセス対象から除外して冗長度ゼロの
ディスクアレイ装置として動作させるべき状態であり、
(d)は、2番のディスク装置に対して復旧処理を行っ
た後に、本来の冗長構成を用いたディスクアレイ装置と
して動作させるべき状態であり、また、(e)は、ディ
スクアレイ装置を動作させてはならない状態であり、誤
った交換がなされたことをユーザーに通知すべき状態で
ある。
【0056】第1の実施例のディスクアレイ装置では、
このような状態判定を以下のような手順により実現す
る。
【0057】図8に、立ち上げ時にディスクアレイコン
トローラが最初に行なう動作の流れを示す。電源が投入
されると、ディスクアレイコントローラは、まず、各デ
ィスク装置の状態を判別するために用いるパラメータを
初期化(ステップS301)する。このステップで初期
化されるパラメータとしては、CFAILとHj (j=1〜
ALL )とNINITとiとNUPとNDOWNがあり、CFAIL
j とNUPとNDOWNは、それぞれ“0”に、NINITとi
は“1”に初期化される。なお、Hj は、主に、管理情
報中の履歴情報を記憶するために用いられるパラメータ
であり、NINITは、異常であることが明らかなディスク
装置のスロット番号を記憶するためのパラメータであ
る。また、NUPとNDOWNは、図9を用いて後ほど説明す
る動作で用いられるパラメータである。
【0058】これらのパラメータの初期化後、ディスク
アレイコントローラは、i番のディスク装置の管理情報
の読み出しを試み(ステップS302)、正常に読み出
しが行なえなかった場合(ステップS303;N)に
は、Hi に“−1”をセット(ステップS309)し、
カウンタCFAILに“1”を加算するとともに、NINIT
iをセット(ステップS310)してから、ステップS
307に進む。
【0059】また、i番のディスク装置の管理情報の読
み出しが正常に行なえた場合(ステップS303;Y)
には、読み出した管理情報中の装置識別情報およびスロ
ット情報を、初期化時に書き込んだ装置識別情報および
スロット情報とそれぞれ比較(ステップS304)する
ことにより、そのディスク装置が正常に接続されたもの
かどうかの判断を行なう。そして、装置識別情報とスロ
ット情報が初期化時に書き込んだ装置識別情報とスロッ
ト情報とそれぞれ一致していた場合には、正常に接続さ
れたディスク装置であると判断(ステップS305;
Y)して、その管理情報中の履歴情報を、Hi として記
憶(ステップS306)し、ステップS307に進む。
【0060】なお、ステップS305の判断において、
“Y”側に分岐されるディスク装置は、正常に機能する
ディスク装置とは限らない。すなわち、そのディスク装
置が障害ディスク装置であっても、その接続が正しく、
管理情報記憶領域の内容が読み出せる場合には、ステッ
プS305における判断は、“Y”となる。
【0061】そして、装置識別情報とスロット番号のい
ずれかが初期化処理時に書き込んだ内容と異なっていた
場合には、そのディスク装置は、正常に接続されたもの
ではないと判断(ステップS305;N)して、カウン
タCFAILに“1”を加算するとともに、NINITにiをセ
ット(ステップS310)して、ステップS307に進
む。
【0062】ステップS307では、iに“1”が加算
され、iが全ディスク装置数NALL以下である場合(ス
テップS308;N)には、ステップS302に戻り、
次のディスク装置に対して処理が行なわれる。iが全デ
ィスク装置数NALL を越えたとき(ステップS308;
Y)、すなわち、全てのディスク装置の管理情報記憶領
域の読み出しが試みられた後に、この処理は終了する。
【0063】この処理が終了すると、管理情報の読み出
しが行なえないディスク装置があった場合には、その装
置に対応する変数Hが“−1”となり、装置識別情報ま
たはスロット情報のいずれかが初期化時に書き込んだ情
報と異なっているディスク装置があった場合には、その
装置に対応する変数Hの値は、“0”のままとなる。な
お、交換されたディスク装置に対応する変数Hの値も、
管理情報記憶領域に対応する記憶領域に、所定のパター
ンの管理情報が書き込まれていないため、ステップS3
05で正常に接続されたものではないと判断され、
“0”のままとなる。
【0064】そして、カウンタCFAILには、Hの値が
“−1”または“0”であるディスク装置、すなわち、
正常な状態ではないことが確実なディスク装置の台数が
記憶され、変数NINITには、そのうち1台のスロット番
号が記憶される。なお、カウンタCFAILが“0”であっ
た場合には、変数NINITの書き換え(ステップS31
0)が実行されないため、NINITの値は、ステップS3
01で設定された値である“1”のままとなる。
【0065】図9に、図8の流れに引き続いてディスク
アレイコントローラが実行する動作の流れを示す。ディ
スクアレイコントローラは、まず、図8の処理において
得られたカウンタCFAILの値が“1”より大きいか否か
の判断を行なう(ステップS401)。このカウンタC
FAILには、既に説明したように、正常な状態ではないこ
とが確実なディスク装置の台数がセットされているの
で、この値が“2”以上であるときには、ディスクアレ
イ装置を冗長度ゼロの記憶装置としても動作させること
ができないことが確定する。このため、カウンタCFAIL
が、“1”より大きい場合(ステップS401;Y)に
は、装置を立ち上げることができない旨を表わすエラー
メッセージを出力(ステップS402)して、処理を終
了する。
【0066】なお、図6および図7に例示した状態のう
ち、ステップS401の判断が行なわれた段階で、装置
を立ち上げることができないことが確定するのは、
(e)と(g)の状態において、☆印を付した障害ディ
スク装置の管理情報が読み出せなかった場合である。
【0067】カウンタCFAILの値が“1”以下である場
合(ステップS401;N)には、変数iの内容をN
INITに書き換え(ステップS403)、変数jに、その
値が“1”以上、NALL 以下になるように、“i+1”
または“i+1−NALL ”をセット(ステップS40
4)する。そして、図8の処理により内容が設定された
j とHi の大小関係の比較(ステップS405)を行
ない、Hj がHi より大きく、NUPが“0”である場合
(ステップS406;Y)には、NUPにiをセット(ス
テップS407)し、Hj がHi より大きく、NUP
“0”でない場合(ステップS406;N)には、NUP
を変更することなく、ステップS410に進む。
【0068】また、Hj がHi より小さく、NDOWN
“0”である場合(ステップS408;Y)には、N
DOWNにiをセット(ステップS409)し、Hj がHi
より大きく、NDOWNが“0”でない場合(ステップS4
08;N)には、NDOWNを変更することなく、ステップ
S410に進む。また、ステップS405の比較におい
て、Hj とHi が一致していた場合には、直接、ステッ
プS410に進む。
【0069】ステップS406またはS408において
行なっている分岐は、Hj とHi が最初に異なったとき
の変数iの値を、NUPまたはNDOWNに記憶させるための
ものである。たとえば、図6(e)の状態において障害
ディスク装置の管理情報が読み出せる場合には、図8の
処理によりNINITに“3”が設定されるので、図9のス
テップS405では、最初に、H4 とH3 の比較が行な
われ、その後、H5 とH4 、H1 とH5 、H2 とH1
3 とH2 の比較がこの順で行なわれることになる。
【0070】これらの5回の比較で、ステップS406
側に分岐されるのは、H4 とH3 の比較が行われたとき
だけであるが、ステップS408側に分岐される場合
は、H 2 とH1 の比較が行なわれたときと、H3 とH2
の比較が行なわれたときの2回存在する。このような場
合に、ステップS408においてNDOWNが“0”である
か否かの判断がなされているため、2回目の分岐では、
DOWNの書き換えが行なわれないことになり、結局、最
初に分岐された時の情報が、NDOWNに記憶されることに
なる。
【0071】ステップS410においては、全ての比較
が終了したか否かの判定が行われ、jがNINITと一致し
ていない場合(ステップS410;N)には、比較すべ
き組み合わせが残っているので、iの内容をjに書き換
えて(ステップS411)、ステップS404に戻る。
そして、変数jとNINITが一致したとき(ステップS4
10;Y)に、この処理は終了し、以下に記す、最終的
な判定処理が実行される。
【0072】図10に、図9の流れに引き続いて、ディ
スクアレイコントローラが行なう動作の流れを示す。デ
ィスクアレイコントローラは、まず、NUPが“0”であ
るか否かの判定(ステップS501)を行ない、NUP
“0”である場合(Y)は、全てのディスク装置が正常
に動作可能であると判断して、立ち上げ動作を終了す
る。この判定により、全ディスク装置が正常であるとす
ることができることは、NUPが“0”となる場合は、全
てのディスク装置の履歴情報が一致している場合である
ことから容易に理解出来よう。
【0073】また、NUPが“0”でない場合(ステップ
S501;N)には、カウンタCFA ILが“0”であるか
否かの判定(ステップS502)を行い、“0”であっ
た場合(Y)には、NUP番のディスク装置をアクセス対
象から除外して(ステップS509)、後処理(ステッ
プS510)を行なった後に、立ち上げ処理を終了す
る。このステップS502の判断により状態が決定され
るのは、図7(b)と図6(c)において、障害ディス
ク装置の管理情報記憶領域の読み出しが行なえた場合で
ある。
【0074】なお、ステップS510で行なわれる後処
理は、管理情報更新処理が中断されていた場合に、その
管理情報更新処理を完了させるための処理であり、この
処理により、たとえば、図7(b)の状態である各ディ
スク装置の管理情報は、図6(c)の状態に修正され
る。その実際の動作は、図4に示した管理情報更新処理
を中断されたステップ(NDOWNが中断直前に更新された
ディスク装置を示す情報となっている。)から再開する
といったものである。
【0075】そして、カウンタCFAILが“0”でなかっ
た場合(ステップS502;N)、NUP番のHであるH
N が“−1”であるか否かの判定(ステップS503)
を行い、“−1”であった場合(Y)、すなわち、その
ディスク装置が管理情報の読み出しが行なえない装置で
あった場合は、NUP番のディスク装置を障害ディスク装
置に特定(ステップS509)して、後処理(ステップ
S510)を行なった後に立ち上げ処理を終了する。こ
のステップS503の判断により状態が決定されるの
は、(b)と(c)の状態において、障害ディスク装置
の管理情報記憶領域の読み出しが不可能な場合である。
【0076】また、HN が“−1”でなかった場合(ス
テップS503;N)、変数jにその値が“1”以上、
ALL 以下になるように、“NDOWN+1”または“N
DOWN+1−NALL ”をセット(ステップS504)す
る。そして、NUPとjの比較(ステップS505)を行
い、NUPとjが一致していない場合(ステップS50
5;N)には、やはり、NUP番のディスク装置が障害デ
ィスク装置に特定される。このステップS505の判断
により状態が決定されるのは、(f)の状態と(e)の
状態において、障害ディスク装置の管理情報記憶領域の
読み出しが可能な場合である。
【0077】また、NUPとjが一致していた場合(Y)
には、NDOWN番のディスク装置が正常に読み書き可能で
あるかのテスト(ステップS506)を行なう。そし
て、そのディスク装置が正常であった場合(ステップS
507;Y)には、NUP番のディスク装置を正しく交換
されたディスク装置であるとして、復旧処理を行い(ス
テップS508)、立ち上げ処理を終了する。このステ
ップS508では、当然、管理情報の内容の設定も行な
われる。また、NDOWN番のディスク装置が正常に読み書
き可能でなかった場合(ステップS507;N)には、
UP番のディスク装置を障害ディスク装置に特定(ステ
ップS509)して、後処理(ステップS510)を行
なった後に立ち上げ処理を終了する。
【0078】このステップS507の判断まで行なわれ
るのは、(d)と(g)の状態である。これらの状態
は、履歴情報の内容が異なるだけで、その相対的な位置
関係は等しいものとなっており、ステップS505まで
の処理により得られる情報では、判別不可能である。こ
の判別のために行っている処理がステップS506およ
びS507の処理であり、誤った交換がなされた(g)
の状態では、NDOWN番のディスク装置が障害ディスク装
置に該当するため、正常に読み書きができないものであ
るのに対し、正しい交換が行なわれた(d)の状態で
は、NDOWN番のディスク装置は、正常に読み書きできる
ことを利用して両者の判別を行っている。
【0079】なお、このディスクアレイ装置では、装置
識別情報とスロット情報と履歴情報とからなる管理情報
を使用しているが、スロット情報と履歴情報からなる管
理情報、または、履歴情報だけからなる管理情報を用い
るようにしてもよい。スロット情報と履歴情報からなる
管理情報を用いる場合には、図8のステップS304に
おいて管理情報中のスロット情報だけが比較されるよう
に装置を構成すればよい。
【0080】また、履歴情報だけを用いる場合には、履
歴情報として用いる数値の範囲を、たとえば、1から1
00までに限定しておき、図8のステップS304にお
いて、読み出した履歴情報が、その範囲内であるか否か
を評価し、範囲外であった場合には、ステップS305
において、“N”側に分岐するように構成すればよい。
障害ディスク装置の交換には、フォーマットされた状
態、すなわち、データの書き込みが行われていない状態
のディスク装置が用いられるので、管理情報記憶領域に
対応する記憶領域の内容を数値として読みだした場合、
上記のような範囲内の数値になることはない。このた
め、このような判定によっても、交換されたディスク装
置を特定することはでき、他のディスク装置に記憶され
た管理情報(履歴情報)と比較することにより、やは
り、その交換が正しく行われたものであるか否かを判定
することができる。また、交換に用いる前に、そのディ
スク装置の管理情報記憶領域に特定の情報を書き込むこ
とにしておき、立ち上げ時に、その特定の情報の有無を
検出して、そのディスク装置が交換されたものか否かを
検出するようにしてもよい。
【0081】第2の実施例
【0082】第1の実施例のディスクアレイ装置は、管
理情報中の履歴情報の大小関係だけを用いて各ディスク
装置の状態判定を行なうが、第2の実施例のディスクア
レイ装置では、その内容に意味を持たせた2種の履歴情
報を用いて、ディスクアレイ装置の状態判定を行う。
【0083】第2の実施例のディスクアレイ装置の構成
は、図1に示したものと同様のものであるので、その構
成の説明は省略する。また、その初期化時の動作も、図
2を用いて説明した第1の実施例のディスク装置の動作
とほぼ同じものである。ただし、第2の実施例のディス
クアレイ装置で管理情報中の履歴情報として用いる情報
は、2種類しかなく、一方は、初期化時に書き込まれる
情報であり、他方は、ディスク装置に障害が発生した際
に、書き込まれる情報である。これらの履歴情報は、数
値としてではなく、ビット列として、判定に使用され
る。
【0084】図11に、第2の実施例のディスクアレイ
装置における管理情報更新処理の流れを示す。ディスク
アレイコントローラは、ディスク装置から障害が発生し
たことを示す情報を受けると、そのディスク装置の識別
情報を識別情報NFAILにセット(ステップS601)す
る。そして、NFAILが全ディスク台数NALL と等しい場
合(ステップS602;Y)は、変数iに“1”をセッ
ト(ステップS603)し、NFAILが全ディスク装置数
ALL と等しくない場合(ステップS602;N)に
は、iに“NFAIL+1”をセット(ステップS604)
する。
【0085】そして、i番のディスク装置の管理情報中
の履歴情報を第2の履歴情報に書き換えて(ステップS
605)、処理を終了する。このように、第2の実施例
のディスクアレイ装置では、障害ディスク装置の次に装
置の管理情報の内容だけが書き換えられる。
【0086】第2の実施例のディスクアレイ装置では、
立ち上げ時に、まず、図8に示した処理と同じ処理が行
なわれ、i番目のディスク装置の管理情報が読み出せ、
かつ、管理情報中の装置識別情報とスロット情報が初期
化時に書き込んだ情報と一致していた場合には、Hi
その履歴情報の内容が記憶される。また、i番のディス
ク装置の管理情報の内容が読み出せない場合には、Hi
に“−1”が設定され、管理情報中の装置識別情報とス
ロット情報が初期化時に書き込んだ情報と一致していな
い場合には、Hi に“0”が記憶される。カウンタC
FAILには、Hが“−1”または“0”であるディスク装
置の台数が記憶される。そして、第2の実施例のディス
クアレイ装置は、このようにして得られた情報を用い
て、各ディスク装置の状態の判定を行なう。
【0087】図12に、第2の実施例のディスクアレイ
コントローラが行う判定動作の流れを示す。図8の処理
を終えたディスクアレイコントローラは、まず、カウン
タC FAILが“1”より大きいか否かの判定を行い(ステ
ップS701)、“1”より大きい場合(Y)には、エ
ラーメッセージを出力(ステップS711)して、立ち
上げ動作を終了する。
【0088】カウンタCFAILが“1”より小さい場合
(ステップS701;N)には、HX=HFAILとなるX
を探索(ステップS702)する。ここで、HFAILは、
管理情報更新処理時に書き込まれる第2の履歴情報を示
すこととする。そして、そのようなHX が存在していた
場合(ステップS703;Y)には、そのディスク装置
の前に順序付けられたディスク装置を識別するための情
報iを算出する(ステップS704)。また、HX =H
FAILとなるHX が存在していなかった場合(ステップS
703;N)には、iに、“0”をセット(ステップS
705)する。次に、ディスクアレイコントローラは、
j =0となるjの探索を行う(ステップS706)。
このステップでは、Hj =0となるjが存在していない
場合には、jに“0”がセットされる。
【0089】変数jが“0”である場合(ステップS7
07;Y)、すなわち、管理情報中の装置識別情報ある
いはスロット情報が初期化時に書き込んだ情報と異なっ
ていたディスク装置が存在していなかった場合には、i
が“0”であるか否かの判断(ステップS708)を行
う。変数iが“0”であること(Y)は、第2の管理情
報が書き込まれたディスク装置が存在していないことを
示すので、ディスクアレイコントローラは、全てのディ
スク装置が正常であると判断して、立ち上げ処理を終了
する。
【0090】また、変数iが“0”でない場合(ステッ
プS708;N)には、i番のディスク装置をアクセス
対象から除外(ステップS709)することにより、デ
ィスクアレイ装置を冗長度ゼロの記憶装置として動作さ
せる。
【0091】変数jが“0”でない場合(ステップS7
07;N)には、j番のディスク装置が管理情報の読み
出しが行えない装置であるか、または、交換されたディ
スク装置であるため、jとiを比較(ステップS71
0)することにより、j番のディスク装置が交換された
ディスク装置であるか否かの判断を行う。jとiの内容
が一致していない場合(N)には、第2の管理情報の存
在により障害ディスク装置であるとされているj番の装
置の他に、使用することができないディスク装置が存在
することになるので、ディスクアレイ装置を動作させる
ことができない旨を出力(ステップS711)して、立
ち上げ処理を終了する。
【0092】jとiの内容が一致している場合(ステッ
プS710;Y)は、正しい交換が行われた場合である
ので、i(=j)番のディスク装置に対して復旧処理を
行い(ステップS712)、ディスクアレイ装置を全て
のディスク装置が使用可能な状態に戻して、立ち上げ処
理を終了する。なお、ステップS712では、復旧処理
の完了後、全てのディスク装置が正常であることを、デ
ィスク媒体上に記憶させるために、X番のディスク装置
(すなわち、第2の履歴情報が書き込まれていたディス
ク装置)の管理情報中の履歴情報を、第1の履歴情報に
戻す作業も行われる。
【0093】ここで、この判定動作により正確にディス
クアレイ装置の状態が判定できることを、図を参照して
説明しておく。
【0094】図13に、第2の実施例のディスクアレイ
コントローラが判断すべき、ディスクアレイ装置の状態
と履歴情報の内容の関係、および、上記の処理を各ディ
スクアレイ装置に加えた場合に得られるiとjの値を示
す。この図では、管理情報中の履歴情報だけを示してあ
り、“good”が第1の履歴情報を、“fail”が第2の履
歴情報を示すものとする。また、☆印を付けた履歴情報
が、障害の発生したディスク装置の履歴情報であり、そ
の管理情報記憶領域の読み出しは可能であるとする。
【0095】図13(A)に示したように、すべてのデ
ィスク装置の履歴情報が第1の履歴情報“good”である
場合には、カウンタCFAILは“0”になり、第2の履歴
情報が書き込まれたディスク装置を探索できないため、
iは“0”になり、装置識別情報またはスロット情報が
初期化時に書き込んだ値と異なっているディスク装置も
存在しないので、jも“0”となる。このため、ステッ
プS707およびS708ではいずれも“Y”側に分岐
され、全てのディスク装置が正常であると判断される。
【0096】また、(B)に示したように、図11に示
した流れに従って、3番のディスク装置の履歴情報が第
2の履歴情報“fail”に書き換えられている場合、すな
わち、2番のディスク装置に障害が発生していた場合に
は、HX =HFAILとなるHXが存在しているので、ステ
ップS704において、iに“2”が設定される。ま
た、装置識別情報またはスロット情報が初期化時に書き
込んだ値と異なっているディスク装置は存在しないの
で、jは“0”となる。結局、この場合は、ステップS
708で“N”側に分岐されることになり、2番のディ
スク装置がアクセス対象から除外される。
【0097】さらに、(B)の状態からディスク装置の
交換が、1台のディスク装置を取り外して、新しいディ
スク装置を取り付けるという形で行われた場合には、
(C)のように、正しい交換がなされる場合と、
(D)、(E)のように誤った交換がなされる場合が考
えられる。(C)、(E)の場合には、当然、(B)と
同様に、iに“2”が設定されるが、交換されたディス
ク装置が存在しているため、jは“0”とはならず、
(C)では、jが“2”に、(E)では、“4”に設定
される。このため、両者は、ステップS710で判別さ
れ、(C)は、正しくディスク装置の交換が行われてい
ると判断され、復旧処理が開始され、(E)は、誤った
交換がなされていると判断されて、エラーメッセージが
出力される。
【0098】(D)の状態は、第2の履歴情報が書き込
まれたディスク装置が誤って交換されてしまったという
点で特徴がある状態なのだが、この場合は、iが“0”
となり、jが“3”となるため、ステップS710で
“N”側に分岐されることになり、誤った交換がなされ
ていると判断されて、エラーメッセージが出力される。
なお、☆印を付けた管理情報記憶領域の内容が読みだせ
ない場合には、(D)、(E)は、ステップS701に
おいて、動作不可能と判定される。
【0099】第2の実施例のディスクアレイ装置におい
ても、管理情報をスロット情報と履歴情報、または、履
歴情報だけで構成することは可能であり、いずれの管理
情報を用いても、1台のディスク装置を取り外して新し
いディスク装置を取り付けるといった形の交換に対して
は、常に、正確にその状態を判定することができる。し
かし、履歴情報だけでは、たとえば、4番のスロット
に、5番のスロットに接続されるべきディスク装置が接
続された場合などを、識別することができないので、デ
ィスク装置の交換に全部のディスク装置を外すことが必
要なディスクアレイ装置では、管理情報中に少なくとも
スロット情報を含めておくことが望ましい。
【0100】
【発明の効果】以上詳細に説明したように、請求項1記
載の発明によれば、立ち上げ時に、ディスク装置内に書
き込んだ情報を基に、障害ディスク装置の特定を行なう
ので、障害ディスク装置に関する情報が、システムが停
止されても失われることがない。
【0101】請求項2記載の発明によれば、ディスク装
置内に書き込んだ情報を基に、障害ディスク装置の特定
と交換されたディスク装置が存在するか否か、また、存
在する場合には、その交換が正しいものであるか否かの
判定を行なえるので、人為的ミスによるデータ喪失を防
止することができる。
【0102】請求項3記載の発明によれば、立ち上げ時
に、ディスク装置内に書き込んだ情報を基に、障害ディ
スク装置の特定を行なうので、障害ディスク装置に関す
る情報が、システムが停止されても失われることがな
い。
【0103】請求項4記載の発明によれば、ディスク装
置に2種の管理情報を書き込むことにより、障害ディス
ク装置の特定と交換されたディスク装置が存在するか否
か、また、存在する場合には、その交換が正しいもので
あるか否かの判定を行なえるので、人為的ミスによるデ
ータ喪失を防止することができる。
【図面の簡単な説明】
【図1】 本発明の第1の実施例のディスクアレイ装置
の概要を示す構成図である。
【図2】 第1の実施例のディスクアレイ装置の初期化
動作の流れを示す流れ図である。
【図3】 第1の実施例のディスクアレイ装置におい
て、初期化時に各ディスク装置に記憶される管理情報の
概要を示す説明図である。
【図4】 第1の実施例のディスクアレイ装置におい
て、ディスク装置に障害が発生した際に行なわれる管理
情報更新処理の流れを示す流れ図である。
【図5】 第1の実施例のディスクアレイ装置における
管理情報更新処理時に、各ディスク装置に記憶された管
理情報が更新されていく様子を示す説明図である。
【図6】 第1の実施例のディスクアレイ装置におい
て、システム停止時にディスク装置が交換されることに
より生ずる管理情報の変化の様子を示すための説明図で
ある。
【図7】 第1の実施例のディスクアレイ装置におい
て、管理情報更新処理が中断された後に、システム停止
時にディスク装置が交換されることにより生ずる管理情
報の変化の様子を示すための説明図である。
【図8】 第1の実施例のディスクアレイ装置の立ち上
げ時の動作の流れを示す流れ図である。
【図9】 第1の実施例のディスクアレイ装置が、図8
の流れに引き続いて実行する動作の流れを示す流れ図で
ある。
【図10】 第1の実施例のディスクアレイ装置が、図
9の流れに引き続いて実行する動作の流れを示す流れ図
である。
【図11】 第2の実施例のディスクアレイ装置が、デ
ィスク装置に障害が発生した際に行なう管理情報更新処
理の流れを示す流れ図である。
【図12】 第2の実施例のディスクアレイ装置が、立
ち上げ時に行なう動作の流れを示す流れ図である。
【図13】 第2の実施例のディスクアレイ装置が立ち
上げ時の行う判定動作を説明するための説明図である。
【図14】 従来のディスクアレイ装置の概要を示す構
成図である。
【図15】 ディスクアレイ装置におけるデータの書き
込み動作の概要を示すための説明図である。
【図16】 従来の不揮発性メモリを用いた2重化ディ
スク装置の概要を示す構成図である。
【図17】 従来のヒストリカウンタを用いた2重化デ
ィスク装置の概要を示す構成図である。
【符号の説明】
11…ディスクアレイ装置、12…インタフェース、1
3…ディスクアレイコントローラ、14、22…ディス
ク装置、15…管理情報記録領域、16…記録領域、1
7…装置識別情報記憶領域、18…スロット情報記憶領
域、19…履歴情報記憶領域、20…書き込み要求デー
タ、21…ホストコンピュータ、23…制御部、24…
不揮発性記憶部、25…オペレーティングシステム、2
6…チャネル装置、27…中央処理装置、28…主メモ
リ、29…ヒストリカウンタ部、30…ヒストリカウン
タ検証部、31…制御テーブル
フロントページの続き (56)参考文献 特開 平4−279924(JP,A) 特開 平3−134728(JP,A) 特開 平3−123929(JP,A) 特開 平4−23032(JP,A) 特開 平5−233151(JP,A) 特開 平3−229331(JP,A) 特公 平2−32652(JP,B2) (58)調査した分野(Int.Cl.7,DB名) G06F 3/06

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 データを格納するための複数台のディス
    ク装置と、 これら全てのディスク装置を巡回する順序を設定する設
    定手段と、 前記複数台のディスク装置のそれぞれの所定の記憶領域
    に、各ディスク装置の状態の判定に用いる履歴情報とし
    て同一内容の数値情報を書き込む初期化手段と、 前記ディスク装置にアクセス障害が発生したことを検出
    する検出手段と、 この検出手段によりアクセス障害が検出されたディスク
    装置を除いたディスク装置を前記設定手段で設定された
    順序で1台ずつ指定する指定手段と、 この指定手段で指定されたディスク装置の前記所定の記
    憶領域に格納された履歴情報をその値が所定量増加する
    ように書き換える書換手段と、 立ち上げ時に、前記複数台のディスク装置の前記所定の
    記憶領域に格納されている履歴情報を読み出す読出手段
    と、 この読出手段が読みだした履歴情報を基に、前記設定手
    段により後に順序付けられたディスク装置の履歴情報の
    方が大きいディスク装置を探索する探索手段と、 この探索手段により探索されたディスク装置をアクセス
    障害を有するディスク装置であると判断する判断手段と
    を具備することを特徴とするディスクアレイ装置。
  2. 【請求項2】 データを格納するための複数台のディス
    ク装置と、 これら全てのディスク装置を巡回する順序を設定する設
    定手段と、 前記複数台のディスク装置のそれぞれの所定の記憶領域
    に、各ディスク装置の状態の判定に用いる管理情報とし
    てそのディスク装置が接続されるスロット番号と数値情
    報である履歴情報とを書き込む初期化手段と、 前記ディスク装置にアクセス障害が発生したことを検出
    する検出手段と、 この検出手段によりアクセス障害が検出されたディスク
    装置を除いたディスク装置を前記設定手段で設定された
    順序で1台ずつ指定する指定手段と、 この指定手段で指定されたディスク装置の前記所定の記
    憶領域に格納された履歴情報をその値が所定量増加する
    ように書き換える書換手段と、 立ち上げ時に、前記複数台のディスク装置のそれぞれの
    前記所定の記憶領域に格納されている管理情報を読み出
    す読出手段と、 この読出手段が読みだした管理情報中のスロット番号が
    前記初期化手段により書き込まれたものと一致している
    か否かを判定する判定手段と、 この判定手段が一致していないと判定したディスク装置
    から読みだした履歴情報を前記初期化手段が書き込みに
    用いる履歴情報より小さな値の履歴情報に変更する変更
    手段と、 それぞれのディスク装置に応じた履歴情報を基に、前記
    設定手段により後に順序付けられた後に順序付けられた
    ディスク装置の履歴情報の方が大きいディスク装置を探
    索する探索手段と、 この探索手段により探索されたディスク装置に対応する
    履歴情報が前記変更手段により変更されたものであった
    場合に、そのディスク装置が交換されたディスク装置で
    あると判断し、それ以外の場合には、そのディスク装置
    がアクセス障害を有するディスク装置であると判断する
    判断手段とを具備することを特徴とするディスクアレイ
    装置。
  3. 【請求項3】 データを格納するための複数台のディス
    ク装置と、 これら全てのディスク装置を巡回する順序を設定する設
    定手段と、 前記複数台のディスク装置のそれぞれの所定の記憶領域
    に、各ディスク装置の状態の判定に用いる履歴情報とし
    て第1の履歴情報を書き込む初期化手段と、 前記ディスク装置にアクセス障害が発生したことを検出
    する検出手段と、 この検出手段によりアクセス障害が検出されたディスク
    装置の前記設定手段により後に順序付けられるディスク
    装置を指定する指定手段と、 この指定手段で指定されたディスク装置の前記所定の記
    憶領域の内容を前記第1の履歴情報とは異なる第2の履
    歴情報に書き換える書換手段と、 立ち上げ時に、それぞれのディスク装置の前記所定の記
    憶領域に格納された情報を読み出す読出手段と、 この読出手段により読み出された情報を基に、前記第2
    の履歴情報と一致する情報が記憶されたディスク装置を
    探索する探索手段と、 この探索手段により探索されたディスク装置の前記設定
    手段により前に順序付けられたディスク装置がアクセス
    障害を有するディスク装置であると判断する判断手段と
    を具備することを特徴とするディスクアレイ装置。
  4. 【請求項4】 データを格納するための複数台のディス
    ク装置と、 これら全てのディスク装置を巡回する順序を設定する設
    定手段と、 前記複数台のディスク装置のそれぞれの所定の記憶領域
    に、各ディスク装置の状態の判定に用いる履歴情報とし
    て第1の履歴情報を書き込む初期化手段と、 前記ディスク装置にアクセス障害が発生したことを検出
    する検出手段と、 この検出手段によりアクセス障害が検出されたディスク
    装置の前記設定手段により後に順序付けられるディスク
    装置を指定する指定手段と、 この指定手段で指定されたディスク装置の前記所定の記
    憶領域の内容を前記第1の履歴情報とは異なる第2の履
    歴情報に書き換える書換手段と、 立ち上げ時に、それぞれのディスク装置の前記所定の記
    憶領域に格納された情報を読み出す読出手段と、 この読出手段により読み出された情報を基に、前記第2
    の履歴情報と一致する情報が記憶されたディスク装置の
    前記設定手段により前に順序付けられたディスク装置を
    特定する第1の特定手段と、 前記読出手段により読み出された情報を基に、前記第1
    および第2の履歴情報のいずれとも一致しない情報が記
    憶されているディスク装置を特定する第2の特定手段
    と、 これら第1および第2の特定手段で特定されたディスク
    装置が同じ装置であったときに、そのディスク装置を正
    しく交換されたディスク装置であると判断する第1の判
    断手段と、 前記第2の特定手段による特定が行なわれておらず、前
    記第1の特定手段によるディスク装置の特定が行なわれ
    ていたときに、第1の特定手段で特定されたディスク装
    置がアクセス障害を有するディスク装置であると判断す
    る第2の判断手段とを具備することを特徴とするディス
    クアレイ装置。
JP00198194A 1994-01-13 1994-01-13 ディスクアレイ装置 Expired - Fee Related JP3158832B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00198194A JP3158832B2 (ja) 1994-01-13 1994-01-13 ディスクアレイ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00198194A JP3158832B2 (ja) 1994-01-13 1994-01-13 ディスクアレイ装置

Publications (2)

Publication Number Publication Date
JPH07210331A JPH07210331A (ja) 1995-08-11
JP3158832B2 true JP3158832B2 (ja) 2001-04-23

Family

ID=11516701

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00198194A Expired - Fee Related JP3158832B2 (ja) 1994-01-13 1994-01-13 ディスクアレイ装置

Country Status (1)

Country Link
JP (1) JP3158832B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4619925B2 (ja) * 2005-10-28 2011-01-26 京セラ株式会社 通信装置および通信方法
JP5913078B2 (ja) * 2012-12-21 2016-04-27 株式会社 日立産業制御ソリューションズ ディスクアレイシステム、データ復旧方法、および、データ復旧プログラム

Also Published As

Publication number Publication date
JPH07210331A (ja) 1995-08-11

Similar Documents

Publication Publication Date Title
US5822782A (en) Methods and structure to maintain raid configuration information on disks of the array
EP0419004B1 (en) Computer system with program loading apparatus and loading method
US7444360B2 (en) Method, system, and program for storing and using metadata in multiple storage locations
US8341503B1 (en) Methods and systems for storing data in memory using zoning
US6952794B2 (en) Method, system and apparatus for scanning newly added disk drives and automatically updating RAID configuration and rebuilding RAID data
US6260156B1 (en) Method and system for managing bad areas in flash memory
JP3255751B2 (ja) 安全性の高いディスクアレイの改良
US5875477A (en) Method and apparatus for error management in a solid state disk drive using primary and secondary logical sector numbers
US5210875A (en) Initial bios load for a personal computer system
EP0455922B1 (en) Method and apparatus for deriving mirrored unit state when re-initializing a system
JP3058743B2 (ja) ディスクアレイ制御装置
US7689869B2 (en) Unit, method and program for detecting imprecise data
US5553230A (en) Identifying controller pairs in a dual controller disk array
US20050229033A1 (en) Disk array controller and information processing apparatus
EP3244315B1 (en) Method and apparatus for performing data recovery in redundant storage system
EP2124151B1 (en) Information processing system and method for starting/recovering the system
US6192484B1 (en) Method and system for recovering lost data
JPH0391839A (ja) パーソナルコンピユータシステム
US6363457B1 (en) Method and system for non-disruptive addition and deletion of logical devices
JP3158832B2 (ja) ディスクアレイ装置
JP2868001B1 (ja) ディスクアレイ装置制御方法およびディスクアレイ装置
US6678107B1 (en) System and method for reading and writing N-way mirrored storage devices
JPH0756694A (ja) ディスクアレイ装置
US7383482B2 (en) Abnormality detecting device and method of detecting an abnormality in a head of hard disk
CN117271225B (zh) 一种fru信息备份方法、装置和服务器

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees