JP2006235673A - ディスクアレイ装置 - Google Patents
ディスクアレイ装置 Download PDFInfo
- Publication number
- JP2006235673A JP2006235673A JP2005044960A JP2005044960A JP2006235673A JP 2006235673 A JP2006235673 A JP 2006235673A JP 2005044960 A JP2005044960 A JP 2005044960A JP 2005044960 A JP2005044960 A JP 2005044960A JP 2006235673 A JP2006235673 A JP 2006235673A
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- power
- power failure
- state
- power supply
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B19/00—Driving, starting, stopping record carriers not specifically of filamentary or web form, or of supports therefor; Control thereof; Control of operating function ; Driving both disc and head
- G11B19/02—Control of operating function, e.g. switching from recording to reproducing
- G11B19/04—Arrangements for preventing, inhibiting, or warning against double recording on the same blank or against other recording or reproducing malfunctions
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B19/00—Driving, starting, stopping record carriers not specifically of filamentary or web form, or of supports therefor; Control thereof; Control of operating function ; Driving both disc and head
- G11B19/02—Control of operating function, e.g. switching from recording to reproducing
- G11B19/08—Control of operating function, e.g. switching from recording to reproducing by using devices external to the driving mechanisms, e.g. coin-freed switch
Landscapes
- Power Sources (AREA)
Abstract
【課題】 電源部及びDKCの多重構成のディスクアレイ装置で、停復電時における復帰のための手間の省略、短時間、低コスト構成、及び処理負荷の低い復帰を実現する。
【解決手段】 ディスクアレイ装置で、多重化されたクラスタ(10A,10B)と、各クラスタを対象に電源供給する多重化された電源部(2A,2B)を有する。各クラスタに、他クラスタの電源状態を判定するための停電判断部103を含む。停電で一方のクラスタが先に稼動停止するケースに応じて、停電時、例えばクラスタ10AのMP101は、他クラスタ10Bの部位の閉塞処理を行うと共に、停電判断部103からの信号に基づき他クラスタ10Bの電源状態を判定して、それを表わす停電情報をメモリ102上に記録する。復電時、クラスタ10Aは、他クラスタ10Bで閉塞状態の部位について、停電による閉塞であると認識すると、その部位を回復処理する。
【選択図】 図3
【解決手段】 ディスクアレイ装置で、多重化されたクラスタ(10A,10B)と、各クラスタを対象に電源供給する多重化された電源部(2A,2B)を有する。各クラスタに、他クラスタの電源状態を判定するための停電判断部103を含む。停電で一方のクラスタが先に稼動停止するケースに応じて、停電時、例えばクラスタ10AのMP101は、他クラスタ10Bの部位の閉塞処理を行うと共に、停電判断部103からの信号に基づき他クラスタ10Bの電源状態を判定して、それを表わす停電情報をメモリ102上に記録する。復電時、クラスタ10Aは、他クラスタ10Bで閉塞状態の部位について、停電による閉塞であると認識すると、その部位を回復処理する。
【選択図】 図3
Description
本発明は、ハードディスクドライブ(HDD)等の記憶装置と前記記憶装置に対するデータの記憶を制御する記憶制御装置(以下、DKCとする)とを備えRAID制御が可能なディスクアレイ装置に関し、特に、停復電時の復帰のための技術に関する。
従来のディスクアレイ装置において、信頼性確保のために、DKC及びそれに対し電源供給する電源部を多重化した構成が採用されている。例えば、DKCを二重化、すなわち論理的なクラスタ(例えばCL1,CL2とする)とした構成とし、またそれに対応して2系統の電源部(例えばPS1,PS2とする)を備えた構成が可能である。前記PS1,PS2から、それぞれ、DKCのクラスタCL1,CL2に対してDC電源(例えばDC1,DC2とする)が供給される。上記二重化構成例において、停電などにより一方のDC電源供給が停止した場合でも、他方のDC電源供給を用いてDKCの稼動が継続される。また、電源部に更にバッテリを備える構成の場合は、DC電源供給が停止した場合でも、バッテリバックアップ機能によりDKCの稼動が継続される。両方のDC電源供給が停止した場合は、両方のクラスタが稼動停止することになる。復電時にDC電源供給が再開されると、保守員の操作の介在によりDKCのクラスタでの復帰処理が行われた後に稼動再開される。
特許文献1には、復帰のための技術の例について記載されている。この技術は、電源の停復電の状態に応じ、復電対象となる機器が停電前の状態に復帰するように制御出力するもので、停電前の機器状態を機器復帰用の情報として用いる旨が記載されている。
特開平9−325836号公報
前記二重化構成例では、停電時に両方のDC電源供給が停止した場合、両方のクラスタが稼動停止するが、その際、各電源部からのDC電源停止タイミングに差が生じるため、各クラスタの稼動停止タイミングも差が生じる。ここで、先に停止したクラスタの部位は、その後に停止するクラスタによる閉塞処理により、閉塞状態へ移行されることになる。復電時にDC電源供給が再開されると、両クラスタが再起動されるが、前記停電時の閉塞処理により、一方のクラスタの部位が閉塞状態となっている。従って、保守員の操作の介在により、クラスタの部位について回復処理が行われる必要がある。しかしながら、このような保守員介在による復帰の手続きに手間がかかる。
本発明は以上のような問題に鑑みてなされたものであり、その目的は、電源部及び電源部からの電源供給対象となるDKCが多重化された構成のディスクアレイ装置において、前記停復電時における復帰のための保守員介在の手間を省略でき、また、短時間での復帰、低コストな構成での復帰、及び、DKC処理負荷の低い復帰が実現される技術を提供することにある。
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、次のとおりである。前記目的を達成するために、本発明のディスクアレイ装置は、記憶装置と記憶制御装置(DKC)とを備えRAID制御が可能な装置であって、以下に示す技術的手段を備えることを特徴とする。
本発明のディスクアレイ装置は、多重化されたDKCによるクラスタ構成と、前記クラスタを対象として電源供給を行う多重化された電源部とを有する構成である。例えば、二重のクラスタと、それらを対象としてDC電源供給を行う二重の電源部とによる構成である。各電源部で複数系統のAC電源を入力してAC−DC変換してDC電源を出力する。第1の電源部から第1のクラスタへ第1のDC電源が供給され、第2の電源部から第2のクラスタへ第2のDC電源が供給される対応関係である。
電源部は、例えば、AC−DC電源部(PSと略称する)を有する構成である。各PSは、複数のスイッチング電源(SWPS)を含む構成である。各PSでは、各SWPSに対し異なる系統のAC電源が入力され、それぞれAC−DC変換して、PSに対応するクラスタに対するDC電源を供給する。各SWPSは、その停電耐力の差により、停電によるAC入力停止時におけるDC出力停止のタイミングに差が生じ得る。
DKCのクラスタは、通信接続されるホストコンピュータ(以下、ホストとする)等の他装置からのデータ入出力要求に従って、記憶装置上の記憶ボリュームに対するデータ入出力処理を行う。クラスタのそれぞれは、少なくともプロセッサとメモリの部位を有する。前記メモリは、不揮発性メモリを含む。各クラスタのプロセッサは、自クラスタ内のメモリに対する制御を行うと共に、他クラスタのプロセッサと通信可能であり、他クラスタのメモリに対する制御が可能である。
DKCのクラスタは、例えば、他装置側との通信インタフェース処理を行うチャネル制御部と、記憶装置側との通信インタフェース処理を行うディスク制御部と、データキャッシュのためのキャッシュメモリ部と、制御情報格納のための共有メモリ部と、それらを相互接続する接続部とを備える構成である。前記チャネル制御部及びディスク制御部は、プロセッサを備える。クラスタにおいて、プロセッサにより共有メモリ上に状態情報を読み書きしながら、停復電時の制御を実行する。
停復電時のパターンとして、電源部における電源供給停止タイミングの差によって発生する以下のものがある。第1の停電パターンとして、比較的長い時間の停電の場合に、複数のすべてのクラスタが稼動停止するケースがある。例えば、二重のクラスタの構成で、一方が先に停止し、他方が後に停止することで、結果的に両クラスタが稼動停止に至るケースである。また第2の停電パターンとして、短い停電の場合に、複数のクラスタのうち一部が稼動停止するが一部が稼動継続されるケースがある。例えば、二重のクラスタの構成で、一方が先に停止し、他方が停止せずに復電することで、結果的に片クラスタのみ稼動停止されるケースである。本ディスクアレイ装置は、停電時の状況に応じて、前記第1の停電パターンに対応した第1の制御と、前記第2の停電パターンに対応した第2の制御とを実行可能である。
本ディスクアレイ装置では、電源部と、プロセッサ及びメモリを有するクラスタとの多重構成において、各クラスタの電源状態あるいは停電状態を判定する手段を有する。本手段は、ディスクアレイ装置内に設けられた停電判断部などの回路と、クラスタのプロセッサによる停電判定処理などとにより実現される。前記メモリ上には、プロセッサにより、クラスタの部位の閉塞/回復の状態を管理する情報と、クラスタの電源状態を管理する情報とが、状態情報として管理される。
第1または第2の制御において、停電時の制御として、稼動しているクラスタは、閉塞判定をもとに、停止している他クラスタの部位についての閉塞処理を行うと共に、前記電源状態を判定する手段により、前記他クラスタの部位についての電源状態を判定する。そして、その時の閉塞状態を表わす情報と電源状態を表わす情報とを関係が対応付けられた形で状態情報として不揮発性メモリ上に記録する。そして、復電時の制御として、稼動しているクラスタは、前記他クラスタで閉塞状態となっている部位について、それが停電を原因・契機とした閉塞状態であると判断・認識した場合には、その部位を自動回復処理する。また停電による閉塞状態ではないと判断した場合には、その部位の自動回復処理を行わない。これらによりオペレータの介在なしでクラスタを通常稼動へ復帰する。
前記制御において、前記閉塞処理では、例えば、部位の閉塞状態を表わす閉塞情報を、稼動継続しているクラスタ内の不揮発性メモリ上に書き込む。また、前記電源状態の判定では、例えば、稼動継続しているクラスタのプロセッサは、前記閉塞処理の実行と同時または直前または直後に、停電判断部の回路からの信号の検出に従った停電判定によりクラスタの電源状態を認識し、停電状態である場合はそれを表わす停電情報を、稼動継続しているクラスタ内の不揮発性メモリ上に書き込む。また、前記回復処理では、例えば、前記クラスタの部位の閉塞状態を解除するようにメモリ上の前記閉塞情報を更新すると共に、クラスタ間のメモリの内容を一致させるためのメモリコピー処理を実施する。
(1) 第1の制御において、停電時の制御として、停電直後に稼動継続している第1のクラスタのプロセッサは、先に稼動停止した第2のクラスタの部位を閉塞処理すると共に、前記第2のクラスタの電源状態を判定し、前記第2のクラスタの電源状態を表わす情報をクラスタ内の不揮発性メモリ上に記録して保存する。その後第1のクラスタも稼動停止される。そして復電時の制御として、復電により複数のクラスタが再起動されると、直後に、前記第1のクラスタのプロセッサは、前記不揮発性メモリ上に保存されている情報をもとに、前記第2のクラスタの閉塞状態の部位について、停電による閉塞状態であることを認識できた場合に、その部位を回復処理する。
(2) 第2の制御において、停電時の制御として、停電直後に稼動継続している第1のクラスタのプロセッサは、稼動停止した第2のクラスタの部位を閉塞処理すると共に、前記第2のクラスタの電源状態を判定して、前記第2のクラスタの電源状態を表わす情報を前記メモリ上に記録して保存する。その後第1のクラスタが稼動停止する前に復電される。そして復電時の制御として、前記閉塞処理後に、前記第1のクラスタのプロセッサは、前記第2のクラスタでの閉塞状態の部位が停電によるものであることを認識しているので、その部位に対して、動作健全性チェックのためのアクセスを定期的に実施し、前記チェックの結果が問題ない場合に、その部位を回復処理する。前記チェックのアクセスは、復電前から実行するものとしてもよいし、復電後に実行するものとしてもよい。
(3) また、本発明のディスクアレイ装置は、内部に、前記クラスタの電源状態を判定する手段を、停電判断部などの回路により構成する。前記停電判断部の回路は、例えば、電源部におけるDC電源またはAC電源の供給の状態をもとに、クラスタの電源状態を表わす信号を、クラスタのプロセッサに対して出力する回路である。各プロセッサは、前記電源状態を表わす信号を検出することで他クラスタの電源状態を認識する。
前記電源状態を判定する手段は、第1の構成例として、各クラスタに停電判断部の回路を備え、各停電判断部の回路は、他のクラスタの電源部からのDC電源を入力して、停電判断結果を表わす信号を、クラスタ内のプロセッサに対して出力する構成である。前記電源状態または停電状態を表わす信号は、例えば、電源供給が途絶えた停電状態の時にアクティブ、停電なし状態の時にノンアクティブとなる停電信号である。この信号の検出により、プロセッサは、閉塞処理の時における、他クラスタの停電状態を判定する。
前記電源状態を判定する手段は、第2の構成例として、電源部とクラスタの間に停電判断部の回路を備え、停電判断部の回路は、電源部におけるAC電源を入力して、停電判断結果を表わす信号を、各クラスタ内のプロセッサに対して出力する構成である。この信号の検出により、プロセッサは、閉塞処理の時における、他クラスタの停電状態を判定する。
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。本発明によれば、前記停復電時における復帰のための保守員介在の手間を省略でき、また、短時間での復帰、低コストな構成での復帰、及び、DKC処理負荷の低い復帰が実現される。
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一部には原則として同一符号を付し、その繰り返しの説明は省略する。図1〜12は、本発明の実施の形態のディスクアレイ装置を説明するための図である。本発明の実施の形態のディスクアレイ装置は、DKC及び電源部の二重構成において、停電時の状況に応じて第1の制御と第2の制御を実行可能である。実施の形態1では、第1の制御を実行する機能を備える。実施の形態2では、第2の制御を実行する機能を備える。各実施の形態で、基本となるハードウェア構成は同様である。第1及び第2の制御では、停電時のクラスタの部位における閉塞状態の発生時に、停電判定により停電状態を認識して状態情報として保存し、復電時に前記閉塞状態の部位について自動回復処理する。各実施の形態で、停電判定のための回路の構成を備える。
(実施の形態1)
図1〜6は、本発明の実施の形態1におけるディスクアレイ装置1を説明するための図である。実施の形態1では、DKC及び電源部の二重構成において、第1の制御として、比較的長い停電の発生時におけるDKCの両クラスタ稼動停止に対応した、停電時制御と復電時制御とを行う。停電時制御では、停止時間の差により後に停止する側のクラスタによる、先に停止した側のクラスタの部位を対象とした閉塞処理時に、停電判定をもとに停電状態を認識して、閉塞状態の発生と停電状態との関係が対応付けられた形で状態情報を不揮発性メモリ上に保存する。そして、復電時制御では、再起動した両クラスタで、通常状態の側のクラスタは、前記保存しておいた状態情報から、クラスタにおける閉塞状態の部位について、その閉塞状態が停電によるものであることを認識すると、その部位を自動回復処理する。第1の制御では、再起動されたクラスタが、保存しておいた状態情報から前記閉塞状態の発生の原因・契機を認識する。
図1〜6は、本発明の実施の形態1におけるディスクアレイ装置1を説明するための図である。実施の形態1では、DKC及び電源部の二重構成において、第1の制御として、比較的長い停電の発生時におけるDKCの両クラスタ稼動停止に対応した、停電時制御と復電時制御とを行う。停電時制御では、停止時間の差により後に停止する側のクラスタによる、先に停止した側のクラスタの部位を対象とした閉塞処理時に、停電判定をもとに停電状態を認識して、閉塞状態の発生と停電状態との関係が対応付けられた形で状態情報を不揮発性メモリ上に保存する。そして、復電時制御では、再起動した両クラスタで、通常状態の側のクラスタは、前記保存しておいた状態情報から、クラスタにおける閉塞状態の部位について、その閉塞状態が停電によるものであることを認識すると、その部位を自動回復処理する。第1の制御では、再起動されたクラスタが、保存しておいた状態情報から前記閉塞状態の発生の原因・契機を認識する。
<ディスクアレイ装置ハードウェア>
図1は、ディスクアレイ装置1の全体のハードウェア外観構成を示す斜視図である。ディスクアレイ装置1は、例えば基本筐体と複数の増設筐体とから構成できる。図1は、基本筐体の前面右斜め上から筐体を透過して見たものであり、筐体内各部の配置の概略を示している。基本筐体は、最小構成単位であり、DKC10などが担う記憶制御機能と、HDD30などが担う記憶機能との両方を備える。増設筐体は、オプション単位であり、記憶機能を備える。記憶制御機能は、通信接続されるホストなどの他装置からの要求や命令に応じて、記憶機能の提供する記憶領域に対するユーザデータ等のデータの記憶を制御する。各筐体間が通信ケーブルで通信可能に接続される。
図1は、ディスクアレイ装置1の全体のハードウェア外観構成を示す斜視図である。ディスクアレイ装置1は、例えば基本筐体と複数の増設筐体とから構成できる。図1は、基本筐体の前面右斜め上から筐体を透過して見たものであり、筐体内各部の配置の概略を示している。基本筐体は、最小構成単位であり、DKC10などが担う記憶制御機能と、HDD30などが担う記憶機能との両方を備える。増設筐体は、オプション単位であり、記憶機能を備える。記憶制御機能は、通信接続されるホストなどの他装置からの要求や命令に応じて、記憶機能の提供する記憶領域に対するユーザデータ等のデータの記憶を制御する。各筐体間が通信ケーブルで通信可能に接続される。
基本筐体には、下から、複数のバッテリ21、複数のACボックス22、複数のAC−DC電源23、論理ボックス4、複数のファン5、SVP6、パネル7、HDDボックス8、複数のファン9等が配備されている。
バッテリ21は、AC−DC電源23に対して接続され、停電時のバックアップ電源として機能する。後述するように、各実施の形態では、バッテリ21の搭載を必要最低限に抑える。ACボックス22は、顧客設備の入力AC電源を接続する部分であり、AC−DC電源23と接続される。AC−DC電源23は、入力AC電源についてAC−DC変換を行い、DKC10他の筐体内各部位に対してDC電源を供給する。
論理ボックス4には、制御パッケージ100を収容可能な複数のスロットを有し、各スロットに制御パッケージ100がガイドレールに沿ってそれぞれ挿抜可能に収容・接続され制御パッケージ100単位で交換可能となっている。制御パッケージ100は、ホストインタフェース等の機能を実装したボード(回路基板)を中心に含んで、論理ボックス4等に装着するためのキャニスタ等の機械的構造を加えて一体的にモジュール化されたものである。各種の制御パッケージ100の相互接続によってDKC10が実現される。論理ボックス4内には、制御パッケージ100の相互接続のための図示しないバックプレーンボードを有する。各制御パッケージ100のコネクタが、スロット内でバックプレーンボードのコネクタに接続され、DKC10として組み込まれる。
SVP(保守・管理端末)6は、ディスクアレイ装置1の保守・管理の処理を担当するプロセッサを持つ装置である。SVP6は、例えばノート型PCの形態を有し、通常時には筐体内に収容され必要時に前面に取り出される。保守員は、SVP6を操作して、保守・管理の処理を行うことが可能である。パネル7は、ディスクアレイ装置1の基本操作のためのスイッチや、各種情報表示を行う表示器などが配置されている。
HDDボックス8には、複数のHDD30が、HDU(HDDユニット)の形態で、並列的に、それぞれ挿抜可能に収容・接続される。HDUは、HDD30を含んで、装着のためのキャニスタ等の機械的構造を加えて一体的にモジュール化されたものである。
筐体内に設けられた複数のファン5,9は、筐体内の部位に対して送風することにより空冷する。
<ディスクアレイ装置の機能ブロック構成>
図2は、ディスクアレイ装置1の機能ブロック構成を示す。図2に示すように、ディスクアレイ装置1は、電源部とDKC10とDKU(ディスクユニット)300とSVP6とを有する。電源部とDKC10とDKU300は、対応して二重化された構成である。
図2は、ディスクアレイ装置1の機能ブロック構成を示す。図2に示すように、ディスクアレイ装置1は、電源部とDKC10とDKU(ディスクユニット)300とSVP6とを有する。電源部とDKC10とDKU300は、対応して二重化された構成である。
DKC10は、論理的なクラスタ(CL)10A,10Bにより二重化された構成である。例えばCL(#1)10AとCL(#2)10Bで同一機能である。DKU300は、HDD30のグループを含む部分である。各CL10A,CL10Bは、DKU300の各HDD30に対して接続網などを介して通信接続される。
電源部は、DKC10に対する2系統のAC−DC電源部(PS)2A,2Bを含む。電源境界に対応して、一方側をPS#1(2A)、他方側をPS#2(2B)として構成管理している。各PS2A,2Bは、前記AC−DC電源23に対応した、二重のスイッチング電源(SWPS)により構成されている。PS2Aは、SWPS31,32を有し、PS2Bは、SWPS33,34を有する。また、ディスクアレイ装置1内には、DKU300内に対してDC電源を供給するPS2を有し、PS2は、SWPS35,36を有する。
各PSには、2系統の入力AC電源(AC1,AC2)のそれぞれが、前記ACボックス22を介して、二重のSWPSへと入力・接続される。AC1がSWPS31,33,35に入力され、AC2がSWPS32,34,36に入力される。各PS2A,2Bでは、各SWPSによりAC−DC変換され、対応するDKC10のCL10A,CL10Bに対してDC電源(DC1,DC2)が供給される。DC1はCL10Aを構成する各部位へ供給され、DC2はCL10Bを構成する各部位へ供給される。また、DKU300の各HDD30に対しても、DKC10に対してと同様に、PS2を介してDC電源が供給される。一方のAC入力が途絶えた場合でも、他方のAC入力により各PSでDC電源供給が継続される。
図2中に示す電源境界は、電源供給系に関する、電源部及びDKC10における論理的な境界を示す。電源部によるDKC10に対する電源供給が二重化されているので、電源境界の一方側、例えばPS2AからCL10Aに対するDC1の供給が停止した場合でも、他方側でPS2BからCL10Bに対するDC2の供給が継続されることで、他方側のCL10Bによりディスクアレイ装置1の機能の提供が継続できる。
なお、PSとDKC10の間にバッテリ21が更に接続される構成の場合は、入力AC電源AC1,AC2の停電時、すなわちPS2A,PS2BのDC電源供給の停止時にも、バッテリ21から電源供給され、CL10A,10Bの稼動をしばらく維持できる。
ディスクアレイ装置1に対しては、ネットワーク等の通信手段を介して、ホスト等の外部装置が通信接続される。前記ネットワークは、例えば、ファイバチャネルプロトコルに準拠した1つ以上のスイッチ等の通信機器により構築されたSAN(Storage Area Network)である。その場合、ホストとCHA11は、SAN上でファイバチャネルプロトコルに従った通信処理を行う。例えばホストからディスクアレイ装置1に対してブロック単位のデータ入出力要求が送信される。またDKC10は、ネットワーク等を介して他のディスクアレイ装置にも通信接続可能である。
ディスクアレイ装置1に通信接続されるホストは、CPU、メモリ、通信インタフェース部などを備えた、例えばPC、ワークステーション、サーバ、メインフレームコンピュータといった形態の情報処理装置である。ホストは、前記CPUにより各種プログラムが実行されることにより、ホストとしての様々な機能が実現される。ホストは、ディスクアレイ装置1に対するデータ入出力を行うためのソフトウェア(管理プログラムと称する)と、ディスクアレイ装置1に対するアクセスを利用して情報処理サービスを行うためのアプリケーションプログラム等とを備える。
クラスタ構成において、例えば、ホストが一方のCL10AのCHA11に通信接続され、ホストからの要求に従ってCM13及びSM14を介してDKA12によりHDD30に対するデータ読み書きが行われる。CL10Aが稼動停止する場合は、CL10BにCL10Aの処理を引き継ぐことができる。すなわち、同ホストは、CL10BのCHA11と通信接続され、同様にHDD30に対するデータ読み書きが行われる。
<DKC>
DKC10は、機能ごとの処理部として、CHA(チャネル制御部)11、DKA(ディスク制御部)12、CM(キャッシュメモリ)13、SM(シェアドメモリ:共有メモリ)14を有する。各処理部は、例えばスイッチ部などの接続部を介して相互に通信やデータ転送が可能に接続される。各処理部は、前記制御パッケージ100やその他のボード等により提供可能である。
DKC10は、機能ごとの処理部として、CHA(チャネル制御部)11、DKA(ディスク制御部)12、CM(キャッシュメモリ)13、SM(シェアドメモリ:共有メモリ)14を有する。各処理部は、例えばスイッチ部などの接続部を介して相互に通信やデータ転送が可能に接続される。各処理部は、前記制御パッケージ100やその他のボード等により提供可能である。
CHA11は、ホストや他の外部装置とのデータ入出力口となるホストインタフェース(チャネルインタフェースともいう)の機能を有する。また、DKA12は、DKU300のHDD30のデータを読み書きするディスクインタフェース(ドライブインタフェースともいう)の機能を有する。各CHA11及びDKA12は、MP(マイクロプロセッサ)やメモリや、各インタフェースに応じた処理部などの部位を有する構成である。MPがプログラムを実行してCHA11等としての機能を実現する。
CHA11とDKA12の処理データは、大容量のCM13を介してやり取りされる。SM14は、状態情報などの制御情報の格納用に使用され、DKC10内各部によって共有される。CM13及びSM14は、不揮発性メモリで構成され、バッテリ21によりバックアップされる。従って、停電によるDC電源供給停止時でも、前記状態情報を含む内容が保持され消失しない。
CHA11及びDKA12とCM13とは、データキャッシュ用のパスで接続される。CHA11及びDKA12とSM14とは、制御情報読み書き用のパスで接続される。CHA11とホストコンピュータ等の外部装置とがホストインタフェースのパスで接続される。DKA12と各HDD30とが、ディスクインタフェースのパスで接続される。各パスは、物理的なライン上に必要に応じて論理的なパスが設定されるものである。
ディスクアレイ装置1での通常のデータ入出力処理は例えば以下のような流れになる。ホストからの要求に応じたディスクアレイ装置1での記憶ボリュームに対するデータの書き込み/読み出し処理について示す。あるCHA11がホストから受信したデータ入出力要求がデータ書き込み要求であった場合、当該CHA11は、データ書き込み要求をSM14に書き込むと共に、ホストから受信した書き込みデータをCM13に書き込む。一方、DKA12は、SM14を監視しており、SM14にデータ書き込み要求が書き込まれたことを検出すると、当該データ書き込み要求に従ってCM13から書き込みデータを読み出して、HDD30上に書き込む。また、あるCHA11がホストから受信したデータ入出力要求がデータ読み出し要求であった場合、読み出し対象となるデータがCM13に存在するかどうかを調べる。ここでCM13に前記データが存在する場合、CHA11はそのデータをホストに送信する。一方、CM13に前記データが存在しない場合、CHA11はデータ読み出し要求をSM14に書き込むと共に、SM14を監視する。データ読み出し要求がSM14に書き込まれたことを検出したDKA12は、HDD30から読み出し対象となるデータを読み出してCM13に書き込むと共に、その旨をSM14に書き込む。そしてCHA11は、読み出し対象となるデータがCM13に書き込まれたことを検出すると、そのデータをホストへ送信する。
DKC10における各機能は他の構成も可能である。例えば、CM13とSM14とを一体的に形成されたメモリ構成とすることもできる。CHA11からDKA12に対するデータの書き込みや読み出しの指示をSM14を介在させて間接的に行う構成の他、例えばSM14を介在させずに直接的に行う構成とすることもできる。また、CHA11にDKA12の機能を持たせることにより、CHA11がHDD30に記憶されたデータの読み書きを行うようにすることもできる。また、SM14またはCM13がCHA11とDKA12の各々に分散されて設けられた構成とすることもできる。
ディスクアレイ装置1内の状態、例えば各部位の構成や障害状態や処理状況などは、DKC10内に有するSM14などのメモリに状態情報・データとして随時に格納される。本実施の形態では、DKC10内に有するCHA11及びDKA12に搭載されている各MPは、SM14に対し上記各種の状態情報を随時に読み書きする。
<DKU>
DKC10のDKA12に対して接続網を介してDKU300内の各HDD30が通信接続される。HDD30は、DKA12側からの要求に応じてそのディスク領域にデータを読み書きする動作を行う。HDD30における記憶領域単位は、例えばLBA(ロジカルブロックアドレス)に対応したブロック単位である。HDD30としては各種のインタフェースのドライブが使用可能である。
DKC10のDKA12に対して接続網を介してDKU300内の各HDD30が通信接続される。HDD30は、DKA12側からの要求に応じてそのディスク領域にデータを読み書きする動作を行う。HDD30における記憶領域単位は、例えばLBA(ロジカルブロックアドレス)に対応したブロック単位である。HDD30としては各種のインタフェースのドライブが使用可能である。
DKC10によりHDD30上に記憶ボリュームが設定される。記憶ボリュームは、HDD30により提供される物理的な記憶領域である物理ボリュームと、物理ボリューム上に論理的に設定される記憶領域である論理ボリュームとを含む、データを記憶するための記憶資源をいう。論理ボリュームを特にLU(論理ユニット)とも称する。複数のHDD30からディスクアレイが構成され、ホストに対する記憶領域を、RAID制御により管理されたRAIDグループとして提供可能である。各LUには、LUN(論理ユニット番号)等の固有の識別子が付与されて管理される。ホストからディスクアレイ装置1に対するデータ入出力要求には、対象を指定するためのLUNやLBA等が記述される。
<SVP>
DKC10に対しては、内部のLANを介してSVP6が接続される。SVP6は、内部のLANにより各CHA11及びDKA12のMPと接続され、各MPとの間で通信可能である。SVP6は、プログラムを実行して保守・管理処理を実現する。本実施の形態では、SVP6がディスクアレイ装置1内で内部接続されている。また、SVP6は、ディスクアレイ装置1に外部接続される形態でもよい。また、SVP6以外の保守・管理装置が、ディスクアレイ装置1に対してネットワーク等を介して通信接続される形態も可能である。例えば、ディスクアレイ装置1に通信接続されるホスト上に保守・管理処理用のプログラムをインストールしたものを保守・管理装置として使用可能である。
DKC10に対しては、内部のLANを介してSVP6が接続される。SVP6は、内部のLANにより各CHA11及びDKA12のMPと接続され、各MPとの間で通信可能である。SVP6は、プログラムを実行して保守・管理処理を実現する。本実施の形態では、SVP6がディスクアレイ装置1内で内部接続されている。また、SVP6は、ディスクアレイ装置1に外部接続される形態でもよい。また、SVP6以外の保守・管理装置が、ディスクアレイ装置1に対してネットワーク等を介して通信接続される形態も可能である。例えば、ディスクアレイ装置1に通信接続されるホスト上に保守・管理処理用のプログラムをインストールしたものを保守・管理装置として使用可能である。
SVP6は、ディスクアレイ装置1内の状態を、保守員などのオペレータが監視・把握できるように、その保守・管理の機能がGUI化されている。SVP6は、通常時、ディスクアレイ装置1内のDKC10を含む各部位の構成、障害状態、処理状況などの各状態を把握する。ディスクアレイ装置1内の状態情報はSM14上に保持され、SVP6は、SM14上の状態情報をもとにSVP6のディスプレイ画面へ各種情報の表示を行う。また、オペレータによるSVP6への操作入力により、SM14上の情報を変更することで、ディスクアレイ装置1の構成や状態を変更することができる。
ディスクアレイ装置1では、停復電時の制御をオペレータの介在なしで自動的に実行する。例えばSVP6からDKC10のクラスタに対して指示・制御することにより、クラスタのMPに停復電時の制御に係わる閉塞処理といった処理を行わせる。処理を行う対象となるMPは、その時に仕事が少ないMPや、ディスクアレイ装置1の機能によっては固定の代表MPなどである。処理を行うMPは、SM14上に対し、状態情報として、各部位の閉塞状態を示す情報や停電状態を示す情報などを読み書きする。例えば、SVP6からの制御に従い、健全な、すなわち障害や閉塞などの状態でないMPを用いて、故障停止した部位を閉塞状態にするようにSM14上の状態情報の内容を変更する。また健全なMPを用いて、前記故障停止した部位の閉塞状態を解除するようにSM14上の状態情報の内容を変更する。
MPは、停復電時の制御に関して、対象部位を前記閉塞状態へ移行する閉塞処理、停電状態を判定して保存する処理、前記閉塞状態を解除して通常状態に戻す回復処理などを行う。クラスタの部位における閉塞状態の発生の原因・契機として、ハードウェア故障以外に、停電によるDC電源供給停止がある。
<電源部及びクラスタ構成(1)>
図3(a),(b)は、実施の形態1及び2における停復電時の制御に係わる、電源部とクラスタの第1の構成例を示すブロック図である。図3(a)は、特に、停電状態を判定する手段に関する第1の構成例を示しており、図3(b)は、そのうちの停電判断部103の詳細構成を示す。ディスクアレイ装置1内で、停電状態を判定する手段を、停電判断部103の回路を中心に構成している。
図3(a),(b)は、実施の形態1及び2における停復電時の制御に係わる、電源部とクラスタの第1の構成例を示すブロック図である。図3(a)は、特に、停電状態を判定する手段に関する第1の構成例を示しており、図3(b)は、そのうちの停電判断部103の詳細構成を示す。ディスクアレイ装置1内で、停電状態を判定する手段を、停電判断部103の回路を中心に構成している。
本構成は、二重のDKC10のクラスタ及び電源部の構成において、各CL10A,10B内に、停電判断部103を設け、それぞれ相手クラスタ(CL10B,10A)側の供給DC電源(DC2,DC1)を入力して、相手クラスタ側の停電状態を示す停電信号F(#2,#1)を同クラスタ内のMP101に出力する構成である。
停電によりAC1,AC2の供給が途絶えると、DC1,DC2共に供給停止するが、SWPS31〜34の停電耐力の差により電源保持時間に差が生じ得る。そのため、DC1,DC2のCL10A,10Bへの供給停止タイミングに差が生じ、クラスタ稼動停止タイミングにずれが生じ得る。
CL10A,10Bにおいて、MP101、メモリ102、停電判断部103を有する。MP101は、前記CHA11等に搭載されているMPに相当する。メモリ102は、前記CM13とSM14に相当する。各MP101は、自クラスタ内の各MP101と通信可能であり、自クラスタ内の各メモリ102に対し読み書きアクセス可能である。また、各MP101は、他クラスタ内のMP101に対し通信可能であり、他クラスタ内のメモリ102に対し読み書きアクセス可能である。各MP101は相互に状態をチェックし合う。
第1及び第2の制御において、MP101は、停電時の閉塞処理、停電状態の判定処理、復電時の回復処理などを行う。また、メモリ102であるSM14上には、MP101により、各部位の閉塞/回復の状態を管理するための閉塞情報、停電状態を管理するための停電情報などが状態情報として記憶される。
停電判断部103は、他クラスタ、すなわち本実施の形態の場合における組となる相手クラスタのDC電源を入力して、相手クラスタ及び電源部についての停電判断、すなわち相手クラスタに供給されるDC電源供給の停止/保持についての判断を行い、停電状態を示す停電信号Fを、自クラスタ内のMP101に対して出力する。例えば、CL10Aにおいて停電判断部103はDC2を入力して、DC2の供給が停電なしで途絶えていない場合には、「PS#2及びCL#2における停電なし状態」を示す停電信号F#2を、DC2の供給が停電により途絶えている場合には、「PS#2及びCL#2における停電状態」を示す停電信号F#2を、MP101に対し出力する。CL10B側も同様である。停電信号Fの入力及び検出により、MP101は、相手クラスタについての停電状態を判定・認識できる。
図3(b)において、停電判断部103は、比較器104で構成される。比較器104は、相手クラスタのDC電圧(例えばDC2)を一方の端子に入力し、他方の端子に入力される基準電圧と比較して、結果を停電信号F(#2)として同クラスタ内のMP101に対し出力する。本構成の場合、相手クラスタのDC電圧での停電判定であるため、回路構成が容易である。
図3に示すような電源部及びDKC10のクラスタの構成において、停復電によるクラスタ稼動停止等のパターン(以下、停電パターンと称する)として、後述する停電パターン(1),(2)がある。
<従来の停復電時の動作>
比較のために、従来のディスクアレイ装置構成例における停復電時の動作例について説明しておく。従来のディスクアレイ装置構成例は、例えば前記図3(a)の構成で停電判断部103等を含まない構成である。停電によりAC1,AC2の供給が途絶えると、PS2A,2Bで、それぞれ停電耐力に応じた電源保持時間の後にDC1,DC2の出力が停止する。PS2A,2Bにおいて、個々のSWPS31〜34は、停電耐力にばらつきがあり、すなわち停電時の電源保持時間にばらつきがある。例えばSWPS31でAC1の入力が停電により途絶えると、そのSWPS31の停電耐力に応じた電源保持時間の間はDC1の出力が保持され、その後耐力限界によりDC1の出力が停止する。そのため、停電時、DC1,DC2の供給停止タイミングにも差が生じる。結果、各CL10A,10Bの稼動停止時間にも差が生じる。例えばCL10A,10Bの一方が先に停止することになる。
比較のために、従来のディスクアレイ装置構成例における停復電時の動作例について説明しておく。従来のディスクアレイ装置構成例は、例えば前記図3(a)の構成で停電判断部103等を含まない構成である。停電によりAC1,AC2の供給が途絶えると、PS2A,2Bで、それぞれ停電耐力に応じた電源保持時間の後にDC1,DC2の出力が停止する。PS2A,2Bにおいて、個々のSWPS31〜34は、停電耐力にばらつきがあり、すなわち停電時の電源保持時間にばらつきがある。例えばSWPS31でAC1の入力が停電により途絶えると、そのSWPS31の停電耐力に応じた電源保持時間の間はDC1の出力が保持され、その後耐力限界によりDC1の出力が停止する。そのため、停電時、DC1,DC2の供給停止タイミングにも差が生じる。結果、各CL10A,10Bの稼動停止時間にも差が生じる。例えばCL10A,10Bの一方が先に停止することになる。
例えば、コスト低減のために複数ベンダのSWPSを電源部に使用した構成の場合、前記停電耐力のばらつきは更に大きくなる。逆に、前記ばらつきを少なくするために、単一ベンダのSWPSに統一したり、前記ばらつきを少なくするための専用回路を付加したりといった手段が考えられるが、その場合コストが高くなり不利である。
停電時に2つのクラスタ(CL10A,10B)に対するPS2A,PS2Bで耐力に差がある場合、先に耐力限界に達したPS(例えばPS2B)に対応したクラスタ(例えばCL10B)のMP101やメモリ102等の部位が稼動停止する。この時点の状態は、片クラスタ停止状態と同じである。この片クラスタ停止状態の場合では、稼動を継続している側の、もう片方のクラスタ(例えばCL10A)でDKC10としての動作が継続される。しかしながら、停止した側のCL10Bのメモリ102では、格納されている情報・データの内容が更新されないため、システムを正常に保つために、稼動側のCL10Aの制御によって、停止側のCL10Bについて故意にメモリ102を閉塞状態に移行させる。また、停止側のCL10BのMP101もMP101間相互の状態チェックで反応できないため、同様に閉塞状態となる。このように、前記片クラスタ停止状態になると、稼動側のCL10Aの制御により、停止側のCL10BのMP101やメモリ102といった各ハードウェア資源の部位が閉塞状態へ移行される。
比較的長い停電の場合、前記片クラスタ停止状態の後、前記PS2Bの後に耐力限界に達したPS2Aに対応したCL10AのMP101やメモリ102等の部位が稼動停止する。結果的に、両クラスタ(CL10A,10B)が稼動停止した状態になる。その後、復電すると、両クラスタ(CL10A,10B)が再起動されるが、前記先に停止した側のCL10BのMP101やメモリ102等の部位は、閉塞状態での再稼動となる。当該部位は、閉塞状態ではあるがハードウェア故障ではないので、動作的には健全性を持つ。
前記閉塞状態で再稼動したCL10Bの部位について回復してクラスタを通常状態へ復帰させる必要があるが、この回復のために、従来では保守員が介在して手動での回復作業が必要となっていた。すなわち、SVP6経由でSM14の状態情報を変更することで閉塞状態にある部位を回復させる手間が必要であった。前記閉塞状態の回復及びクラスタの復帰は、できる限り短時間で行われることが望ましい。
<停電パターン(1)>
図4は、停電パターン(1)及び停電パターン(1)に対応した第1の制御の例を示すタイムシーケンス図である。停電パターン(1)として、比較的長い時間の停電の発生により両クラスタが電源停止するケースにおいて、まず片方のクラスタ(仮にCL10Bとする)が先に電源停止し、その後にもう片方のクラスタ(仮にCL10Aとする)が電源停止して、結果的に両クラスタが稼動停止に至るケースがある。クラスタ稼動停止タイミングの差により、閉塞処理による閉塞状態となる部位が発生する。
図4は、停電パターン(1)及び停電パターン(1)に対応した第1の制御の例を示すタイムシーケンス図である。停電パターン(1)として、比較的長い時間の停電の発生により両クラスタが電源停止するケースにおいて、まず片方のクラスタ(仮にCL10Bとする)が先に電源停止し、その後にもう片方のクラスタ(仮にCL10Aとする)が電源停止して、結果的に両クラスタが稼動停止に至るケースがある。クラスタ稼動停止タイミングの差により、閉塞処理による閉塞状態となる部位が発生する。
図4で、上から、(a)はAC1,AC2の状態、(b)はDC1状態及びCL#1(10A)動作、(c)はDC2状態及びCL#2(10B)動作、(d)は停電信号F#1、(e)は停電信号F#2、(f)はCL#1の稼動及び閉塞の状態、(g)はCL#2の稼動及び閉塞の状態を示す。t1等は時刻を示す。PS#1(2A)の停電耐力がPS#2(2B)の停電耐力より大きい場合である。s1は、片クラスタ停止状態、s2は、両クラスタ停止状態、s3は、片クラスタ閉塞状態に対応する。
(a)AC1,AC2の状態において、t1で停電の発生によりAC1,AC2の供給が停止している。その後t4で復電によりAC1,AC2の供給が再開されている。
(b)DC1状態及びCL#1動作において、t1からt3までの間のP1は、DC1耐力、すなわちPS2Aの停電耐力による電源保持時間を示し、この間、CL#1へのDC1の供給が継続されている。t3で耐力限界によりDC1の供給が停止しており、その後t4での復電によりt5でDC1の供給が再開され、CL#1が再起動される。CL#1の再起動時にCL#1は自己診断を実施して再稼動する。
(c)DC2状態及びCL#2動作において、t1からt2までの間のP2は、DC2耐力、すなわちPS2Bの停電耐力による電源保持時間を示し、この間、CL#2へのDC2の供給が継続されている。t2で耐力限界によりDC2の供給が停止しており、その後t4での復電によりt5でDC2の供給が再開され、CL#2が再起動される。CL#2の再起動時にCL#2は自己診断を実施して再稼動する。
(d)停電信号F#1において、t3のDC1供給停止の契機で“0”(停電なし状態)から“1”(停電状態)へ変化しており、t5のDC1供給再開の契機で“1”から“0”へ変化している。
(e)停電信号F#2において、t2のDC2供給停止の契機で“0”から“1”へ変化しており、t5のDC2供給再開の契機で“1”から“0”へ変化している。
(f)CL#1状態において、電源に関しては、t3までが稼動状態、t3からt5までが停止状態、t5以降が稼動状態である。また閉塞に関しては、通常状態である。
(g)CL#2状態において、電源に関しては、t2までが稼動状態、t2からt5までが停止状態、t5以降が稼動状態である。また閉塞に関しては、t2の直後の閉塞処理時点まで通常状態、t2直後の閉塞処理時点からt5の直後の自動回復処理時点までが閉塞状態、t5の直後の自動回復処理時点以降が通常状態である。
第1の制御において、停電時の制御では、停電直後において僅かの時間稼動している側のクラスタ(CL#1)のMP101は、僅かの時間稼動後に先に停止した相手クラスタ(CL#2)の部位(MP101及びメモリ102)についての閉塞判定と同時に停電判断部103からの停電信号(F#2)をもとに相手クラスタ(CL#2)についての停電状態を判定する。閉塞処理の直前に停電により停電信号F(#2)が変化している。後に停止する側のクラスタ(CL#1)は、従来の閉塞処理に従って相手クラスタ(CL#2)を閉塞状態へ移行させる閉塞処理を行うと共に、停電状態、すなわち電源供給停止による稼動停止である場合は、相手クラスタ(CL#2)の停電状態を表わす停電情報を、稼動している自クラスタ(CL#1)のSM14上に反映しておく。ほぼ同じタイミングで閉塞情報と停電情報がSM14上に記録されることになる。その後、より長く稼動していた側のクラスタ(CL#1)も耐力限界により稼動停止する。そして、復電後に両クラスタ(CL#1,#2)が再起動されるが、前記停電時に閉塞処理しているために、片クラスタ(CL#2)の部位が閉塞状態となっている。復電時の制御では、再起動されたクラスタ(CL#1)の通常状態のMP101は、SM14上の停電情報を含む状態情報の参照から、相手クラスタ(CL#2)の閉塞状態となっている部位について、それが停電による閉塞であると認識できた場合に、その部位を自動回復処理する。また停電による閉塞状態でないと判断した場合には、ハードウェア故障等による閉塞状態であるため、自動回復処理は行わない。これらにより、従来要していた保守操作の介在なしでクラスタが通常稼動へ復帰される。
図4中では、t2の直後、稼動側のCL#1は、停止側のCL#2についての閉塞判定と、停電信号F#2の検出によるCL#2についての停電判定とを行っている。閉塞判定では、CL#1は、CL#2の各部位を閉塞状態にする閉塞処理を行う。また、停電判定では、停電信号F#2が真(“1”)であることから、「CL#2がDC2供給停止による稼動停止状態であること」を認識する。両判定から、CL#1は、「CL#2の閉塞状態がDC2供給停止による稼動停止によること」を認識できる。CL#1は、それらを示す閉塞情報と停電情報とをCL#1のSM14上に状態情報として書き込む。また、t5での復電後、両クラスタCL#1,#2が再起動されるが、CL#2の部位は閉塞状態となっている。t5の直後、CL#1は、CL#1のSM14上に保存しておいた状態情報を読み出し、前記「CL#2の閉塞状態がDC2供給停止による稼動停止によること」を認識する。これにより、CL#1は、CL#2の閉塞状態の部位を、自動回復処理する。回復処理では、対象部位を通常状態へ移行するようにCL#1のSM14上の閉塞情報を更新する。また、クラスタ間でメモリ102のデータの内容を一致させるメモリコピー処理などを行う。
<閉塞/回復処理>
次に、ディスクアレイ装置1におけるDKC10のCL10Aまたは10Bで実行される閉塞処理及び回復処理の制御例について説明する。図5(a)は、クラスタの各部位の閉塞/回復の管理のために用いる情報の形式の例を示す。本例で用いる情報は、構成情報と閉塞情報である。ここで、閉塞とは、ディスクアレイ装置1のシステムからの論理的な切り離しの動作またはその状態を、回復とは、閉塞と対になる、システムへの論理的な再接合の動作またはその状態を表わす。
次に、ディスクアレイ装置1におけるDKC10のCL10Aまたは10Bで実行される閉塞処理及び回復処理の制御例について説明する。図5(a)は、クラスタの各部位の閉塞/回復の管理のために用いる情報の形式の例を示す。本例で用いる情報は、構成情報と閉塞情報である。ここで、閉塞とは、ディスクアレイ装置1のシステムからの論理的な切り離しの動作またはその状態を、回復とは、閉塞と対になる、システムへの論理的な再接合の動作またはその状態を表わす。
SM14のメモリ空間には、ディスクアレイ装置1内の構成情報と各構成部位の閉塞情報とが割り当てられている。例えば、SM14のメモリ空間のアドレス「10」の8bitに、CM13とCHA11の構成情報を有し、同アドレス「11」の8bitには、対応する部位についての閉塞情報を有する。構成情報及び閉塞情報において、bitデータ“1”はアクティブ、bitデータ“0”はノンアクティブを示す。
各情報のデータエリアで、各bit(b0〜b7)は、それぞれディスクアレイ装置1内のロケーションが割り当てられている。例えば、DKC10の各CL10A,10Bにおいてメモリ102が接続可能なロケーションが複数用意されており、各ロケーションに対してメモリ102部位が実装/非実装される。DKC10において各部位が制御パッケージ100等の形態で各ロケーションに対して挿抜可能に構成されている。本例では、構成情報及び閉塞情報のデータエリアにおける各bit(b0〜b7)は、順に、b0:CL#1−CM−ロケーションA、b1:CL#1−CM−ロケーションB、b2:CL#1−CHA−ロケーションC、b3:CL#1−CHA−ロケーションD、b4:CL#2−CM−ロケーションA、b5:CL#2−CM−ロケーションB、b6:CL#2−CHA−ロケーションC、b7:CL#2−CHA−ロケーションDとなっている。
構成情報のデータエリアで、bitデータ“1”(アクティブ)が反映されている箇所は、対応ロケーションにCHA11やCM13等の部位が実装されている状態であることを示しており、bitデータ“0”(ノンアクティブ)の箇所は非実装の状態であることを示している。本例では、構成情報のデータエリアの8bit(b0〜b7)のすべてが“1”であり、CL10A及びCL10BにおいてCM13とCHA11がすべて実装の状態であることを示している。
閉塞情報のデータエリアでも、同様に、bitデータ“1”(アクティブ)の箇所が閉塞状態、bitデータ“0”(ノンアクティブ)の箇所が通常状態を示している。本例では、閉塞情報のデータエリアの8bit(b0〜b7)において、CL10AのCM13とCHA11では“0”すなわち通常状態であることを示している。CL10BのCM13とCHA11では“1”すなわち閉塞状態であることを示している。
構成情報と閉塞情報のAND(論理積)が“1”の場合には、そのロケーションの部位で閉塞状態であることを示し、“0”の場合には、そのロケーションの部位で通常状態であることを示す。
本実施の形態において、対象部位についての閉塞処理とは、上記構成情報のデータエリアのbitに“1”として登録されているロケーションに対応する閉塞情報のデータエリアのbitを“0”から“1”にすることである。また回復処理とは、逆に、同ロケーションに対応する閉塞情報のデータエリアのbitを“1”から“0”にする処理である。
なお、本実施の形態では、簡単のため、停電時の閉塞処理で、停止したクラスタのすべてのMP101とメモリ102を閉塞状態へ移行して片クラスタ全体を閉塞状態として扱うものとする。これに限らず、クラスタ内の一部の部位を対象として閉塞状態にする場合もあり得る。
<停電状態の管理>
次に、ディスクアレイ装置1における各電源部及びクラスタの停電状態についての管理について説明する。図5(b)は、停電状態の管理のために用いる情報の形式の例を示す。本例で用いる情報は、停電情報である。クラスタの部位における閉塞状態の原因・契機を知るために、前記図5(a)に示す閉塞情報と合わせて、閉塞状態の原因・契機が停電によるものであるか否かを示す停電情報をSM14上に管理する。クラスタの各MP101は、停電判断部103からの停電信号Fの検出をもとに、相手クラスタの停電状態すなわちDC電源供給状態を認識して、対応した停電情報をSM14上に格納する。
次に、ディスクアレイ装置1における各電源部及びクラスタの停電状態についての管理について説明する。図5(b)は、停電状態の管理のために用いる情報の形式の例を示す。本例で用いる情報は、停電情報である。クラスタの部位における閉塞状態の原因・契機を知るために、前記図5(a)に示す閉塞情報と合わせて、閉塞状態の原因・契機が停電によるものであるか否かを示す停電情報をSM14上に管理する。クラスタの各MP101は、停電判断部103からの停電信号Fの検出をもとに、相手クラスタの停電状態すなわちDC電源供給状態を認識して、対応した停電情報をSM14上に格納する。
SM14のメモリ空間に、停電情報のデータエリアを設け、このデータエリアの各bitを、前記停電信号Fを検出するMP101ごとに割り当てる。図5(b)では、SM14のメモリ空間のアドレス「0f」に、停電情報のデータエリアを有する。本例では、停電情報のデータエリアの各bit(b0〜b7)において、順に、b0:CL#1−MP#1、b1:CL#1−MP#2、b2:CL#1−MP#3、b3:CL#1−判定結果、b4:CL#2−MP#1、b5:CL#2−MP#2、b6:CL#2−MP#3、b7:CL#2−判定結果となっている。例として各CL#1(10A)、CL#2(10B)でそれぞれMP#1〜MP#3(101)を有する場合である。
停電情報のデータエリアの各bit(b0〜b7)において、bitデータ“1”は、そのMP101が、相手クラスタについて「停電」すなわちDC電源供給オフの状態であると判定していることを表わす。bitデータ“0”は、そのMP101が、相手クラスタについて「停電なし」すなわちDC電源供給オンの状態であると判定していることを表わす。各クラスタにおける複数存在するMP101が多数決で相手クラスタについて停電判定し、多数が「停電」状態であると判定した場合に、クラスタとして相手クラスタを「停電」状態と判定したものとして、上記判定結果を示すbitに、その状態を示す“1”をセットする。この判定結果の情報が、クラスタ単位の制御に用いられる停電情報となる。
本例では、CL10Aで、各MP#1〜#3(101)は、相手クラスタCL10Bについての停電判定でそれぞれ“1”と判定しており、それらの多数決の結果、CL10AとしてのCL10Bについての停電判定結果として“1”、すなわち「CL#2が停電によるPS#2からのDC2供給停止による稼動停止状態である」と判断されている。
本実施の形態では、上記のような閉塞情報と停電情報との組み合わせがSM14上に管理されることによって、各クラスタの部位における閉塞状態の原因・契機が停電によるものであることが判定・認識される。
<第1の制御のフロー>
図6(a),(b)は、停電パターン(1)に対応した第1の制御を行う場合の処理を示すフロー図である。前記図4に示すようにCL#2(10B)が先に停止しCL#1(10A)が後に停止した場合に対応している。
図6(a),(b)は、停電パターン(1)に対応した第1の制御を行う場合の処理を示すフロー図である。前記図4に示すようにCL#2(10B)が先に停止しCL#1(10A)が後に停止した場合に対応している。
図6(a)は、停電時の制御を示す。ステップS11で、各CL10A,10Bは、通常動作を行っている。通常動作の間、ステップS12で、各CL10A,10Bは、MP101間相互の通信やチェックのためのアクセス等によって、MP101やメモリ102に閉塞状態へ移行させる要因となる何らかの状態があるか、または既に閉塞状態が発生しているか等を判断している。閉塞の要因となる状態があり閉塞状態へ移行させる場合または既に発生している閉塞状態を認識した場合は(S12−Yes)、次に移る。例えば、通常動作時に所定のエラーがあるかを判断して、所定のエラーがある場合には、該当部位を閉塞処理するために、次へ移る。
ステップS13で、相手クラスタ(CL10B)の部位について、閉塞の要因となる状態または閉塞状態の発生を認識したクラスタ(CL10A)は、停電判断部103からの停電信号(F#2)を確認する。停電信号(F#2)が真(“1”)の場合(S13−Yes)、ステップS14で、対象のクラスタ(CL10B)の部位が停電状態であることを示す停電情報(“1”)を、稼動しているクラスタ(CL10A)のSM14上へ書き込む。これにより対象部位における閉塞状態と停電状態とが関連付けられる。停電信号(F#2)が偽(“0”)の場合は(S13−No)、ステップS14の処理は行わずに次へ移る。
ステップS15では、稼動側のクラスタ(CL10A)は、対象のクラスタ(CL10B)の部位についての閉塞処理を実行する。なお既に閉塞処理済みの場合は必要ない。例えばDC2電源供給停止により稼動停止した側のクラスタ(CL10B)の部位が閉塞状態へ移行され、閉塞情報(“1”)が稼動側のクラスタ(CL10A)のSM14上へ書き込まれる。その後、耐力限界により、結果的に両クラスタ(CL10A,10B)で稼動停止される。
図6(b)は、復電時の制御を示す。ステップS21で、復電によりDC1,DC2の供給が再開され、両クラスタ(CL10A,10B)が再起動される。ステップS22で、再起動された各クラスタ(CL10A,10B)における各MP101等の部位は、自己診断を行う。自己診断は、ハードウェア資源に問題がないかどうかをチェックするための通常実施される処理である。自己診断で問題がない部位は稼動開始される。稼動開始されると、前記停電時の制御によって片クラスタ(CL10B)の部位(MP101、メモリ102)は閉塞状態となっている。
ステップS23で、通常状態で稼動開始しているクラスタ(CL10A)におけるMP101は、前記SM14上に保存されている各状態情報すなわち前記閉塞情報及び停電情報などを読み、閉塞状態の部位における原因・契機が停電であるかを判断する。対象部位が停電による閉塞状態であった場合は(S23−Yes)、ステップS24,S25で自動回復処理を行う。
ステップS24では、システムを正常に動作させるための、クラスタ(CL10A,10B)間でのメモリコピー処理を行う。稼動側のクラスタ(CL10A)のCM13及びSM14のデータ内容を、閉塞側のクラスタ(CL10B)のCM13及びSM14上へコピーして、内容を一致させる。
ステップS25では、対象部位における閉塞状態からの回復に合わせて、SM14上の閉塞情報を更新する。すなわち前記閉塞情報の記録を消去する(“1”から“0”にする)。
ステップS26で、両クラスタ(CL10A,10B)の通常状態での起動が完了した状態となる。すなわち閉塞状態の部位が通常状態で動作再開される。
以上のように、停電パターン(1)に対応した第1の制御では、クラスタの電源部に関してバッテリ21等の具備を必須としない安価なディスクアレイ装置構成において、停電時のクラスタ閉塞部位を復電時に保守操作の介在を不要で自動的に回復して通常稼動へ復帰できる。従って、クラスタ停止時間を短くしてディスクアレイ装置稼動率を向上できる。
(実施の形態2)
図7,8は、本発明の実施の形態2におけるディスクアレイ装置1を説明するための図である。実施の形態2では、DKC及び電源部の二重構成において、第2の制御として、短い停電の発生時におけるDKCの片クラスタ稼動停止に対応した、停電時制御と復電時制御とを行う。停電時制御では、停止しない稼動継続側のクラスタによる、停止した側のクラスタの部位を対象とした閉塞処理時に、停電判定をもとに停電状態を認識して、閉塞状態の発生と停電状態との関係が対応付けられた形で状態情報を不揮発性メモリに保存する。そして、復電時制御では、前記稼動継続側のクラスタが、前記閉塞処理後から、前記停止した側のクラスタにおける閉塞状態の部位に対する動作健全性チェックのアクセスを定期的に実施し、前記停止した側のクラスタの対象部位の動作健全性が確認されたら、その部位を自動回復処理する。第2の制御では、一方のクラスタが、前記停止した側のクラスタにおける閉塞状態の原因・契機が停電によるものであることを認識しているので、前記第1の制御における再起動後の状態情報参照の手順なしで前記チェックの結果に応じて自動回復処理する。実施の形態2における閉塞/回復の制御及び停電状態の管理などは、実施の形態1と同様である。
図7,8は、本発明の実施の形態2におけるディスクアレイ装置1を説明するための図である。実施の形態2では、DKC及び電源部の二重構成において、第2の制御として、短い停電の発生時におけるDKCの片クラスタ稼動停止に対応した、停電時制御と復電時制御とを行う。停電時制御では、停止しない稼動継続側のクラスタによる、停止した側のクラスタの部位を対象とした閉塞処理時に、停電判定をもとに停電状態を認識して、閉塞状態の発生と停電状態との関係が対応付けられた形で状態情報を不揮発性メモリに保存する。そして、復電時制御では、前記稼動継続側のクラスタが、前記閉塞処理後から、前記停止した側のクラスタにおける閉塞状態の部位に対する動作健全性チェックのアクセスを定期的に実施し、前記停止した側のクラスタの対象部位の動作健全性が確認されたら、その部位を自動回復処理する。第2の制御では、一方のクラスタが、前記停止した側のクラスタにおける閉塞状態の原因・契機が停電によるものであることを認識しているので、前記第1の制御における再起動後の状態情報参照の手順なしで前記チェックの結果に応じて自動回復処理する。実施の形態2における閉塞/回復の制御及び停電状態の管理などは、実施の形態1と同様である。
<停電パターン(2)>
図7は、停電パターン(2)及び停電パターン(2)に対応した第2の制御の例を示すタイムシーケンス図である。停電パターン(2)として、瞬停すなわち短い時間の停電の発生により片方のクラスタ(仮にCL10Bとする)が電源停止し、もう片方のクラスタ(仮にCL10Aとする)が電源停止しないケースがある。クラスタ稼動停止タイミングの差により、閉塞処理による閉塞状態となる部位が発生する。
図7は、停電パターン(2)及び停電パターン(2)に対応した第2の制御の例を示すタイムシーケンス図である。停電パターン(2)として、瞬停すなわち短い時間の停電の発生により片方のクラスタ(仮にCL10Bとする)が電源停止し、もう片方のクラスタ(仮にCL10Aとする)が電源停止しないケースがある。クラスタ稼動停止タイミングの差により、閉塞処理による閉塞状態となる部位が発生する。
図7で、上から、(a)はAC1,AC2の状態、(b)はDC1状態及びCL#1(10A)動作、(c)はDC2状態及びCL#2(10B)動作、(d)は停電信号F#1、(e)は停電信号F#2、(f)はCL#1の稼動及び閉塞の状態、(g)はCL#2の稼動及び閉塞の状態を示す。t1等は時刻を示す。PS#1(2A)の停電耐力がPS#2(2B)の停電耐力より大きく、かつ、PS#1の停電耐力による電源保持時間が瞬停時間よりも大きい場合である。s4は、片クラスタ停止状態、s5は、片クラスタ閉塞状態に対応する。
(a)AC1,AC2の状態において、t1で瞬停の発生によりAC1,AC2の供給が停止している。その後t3で復電によりAC1,AC2の供給が再開されている。
(b)DC1状態及びCL#1動作において、P1で示すDC1耐力がt1からt4までの間よりも長く持続するため、CL#1へのDC1の供給が継続され、CL#1は停止しない。
(c)DC2状態及びCL#2動作において、t1からt2までの間のP2で示すDC2耐力の間、CL#2へのDC2の供給が継続されている。t2で耐力限界によりDC2の供給が停止しており、その後t3での復電によりt4でDC2の供給が再開され、CL#2が再起動される。CL#2の再起動時にCL#2は自己診断を実施して再稼動する。
(d)停電信号F#1において、DC1供給が継続されるので、“0”が維持されている。
(e)停電信号F#2において、t2のDC2供給停止の契機で“0”から“1”へ変化しており、t4のDC2供給再開の契機で“1”から“0”へ変化している。
(f)CL#1状態において、電源に関しては稼動状態である。特に、t2直後の閉塞処理後からt5の間において、CL#1によるCL#2に対する動作健全性チェックのアクセスが定期的に実行されている。
(g)CL#2状態において、電源に関しては、t2までが稼動状態、t2からt4までが停止状態、t4以降が稼動状態である。また閉塞に関しては、t2の直後の閉塞処理時点まで通常状態、t2直後の閉塞処理時点からt5の自動回復処理時点までが閉塞状態、t5の自動回復処理時点以降が通常状態である。
第2の制御において、停電時の制御では、停電直後において稼動継続している側のクラスタ(CL#1)のMP101は、僅かの時間稼動後に停止した相手クラスタ(CL#2)の部位(MP101及びメモリ102)についての閉塞判定と同時に停電判断部103からの停電信号(F#2)をもとに相手クラスタ(CL#2)についての停電状態を判定する。停止しない側のクラスタ(CL#1)は、従来の閉塞処理に従って相手クラスタ(CL#2)を閉塞状態へ移行させる閉塞処理を行うと共に、停電状態、すなわち電源供給停止による稼動停止である場合は、相手クラスタ(CL#2)の停電状態を表わす停電情報を、自クラスタ(CL#1)のSM14上に反映しておく。その後、復電の方が先となったことにより結果的にクラスタ(CL#1)は稼動停止しない。
そして、復電時の制御では、クラスタ(CL#1)は、前記閉塞処理後、相手クラスタ(CL#2)の部位が停電による閉塞状態であると認識しているので、クラスタ(CL#1)の代表MP101により、クラスタ(CL#2)の閉塞状態の部位に対して、定期的な動作健全性チェックのためのアクセスを実施する。このチェックは、対象部位で通常動作が可能かどうか、閉塞状態から回復して問題ないかどうかをチェックするものである。その後、復電によりクラスタ(CL#2)が再起動されるが、片クラスタ(CL#2)の部位が閉塞状態となっている。クラスタ(CL#1)の代表MP101は、前記チェックにより相手クラスタ(CL#2)の閉塞状態の部位の動作健全性を確認すると、その部位を自動回復処理する。これらにより、停電パターン(1)のケースと同様に、従来要していた保守操作の介在なしでクラスタが通常稼動へ復帰される。なお、前記チェック実施中のクラスタ(CL#1)が電源停止した場合は、前記停電パターン(1)のケースになるので、第1の制御を行えばよい。
図7中で、t2の直後、稼動しているCL#1は、停止したCL#2についての閉塞判定と、停電信号(F#2)の検出によるCL#2についての停電判定とを行っている。閉塞判定では、CL#1は、CL#2の各部位を閉塞状態に移行する閉塞処理を行う。また、停電判定では、停電信号(F#2)が真(“1”)であることから、「CL#2がDC2供給停止による稼動停止状態であること」を認識する。両判定から、CL#1は、「CL#2の閉塞状態がDC2供給停止による稼動停止によること」を認識できる。CL#1は、それらを示す閉塞情報と停電情報をCL#1のSM14上に状態情報として書き込む。また、稼動継続しているCL#1は、前記t2直後の閉塞処理後、代表MP101により、CL#2の閉塞状態の部位に対して、定期的な動作健全性チェックのアクセスを実施する。前記チェックのアクセスは、通常のデータ入出力処理を阻害しない程度の頻度で実行される。前記チェックにより、t4以後において、復電により再起動されたCL#2の対象部位の健全性が確認されることになる。
<第2の制御のフロー>
図8(a),(b)は、停電パターン(2)に対応した第2の制御を行う場合の処理を示すフロー図である。前記図7に示すようにCL#2(10B)が先に停止しCL#1(10A)が停止しなかった場合に対応している。
図8(a),(b)は、停電パターン(2)に対応した第2の制御を行う場合の処理を示すフロー図である。前記図7に示すようにCL#2(10B)が先に停止しCL#1(10A)が停止しなかった場合に対応している。
図8(a)は、停電時の制御を示す。ステップS31〜S35の処理は第1の制御の場合と同様である。異なるのは、停電直後、結果的に片クラスタ(CL10B)のみ稼動停止することである。ステップS35で、停止しない側のクラスタ(CL10A)は、停止側のクラスタ(CL10B)の部位を閉塞処理する。
図8(b)は、復電時の制御を示す。ステップS41で、復電によりDC2の供給が再開され、停止していたクラスタ(CL10B)が再起動される。ステップS42で、再起動されたクラスタ(CL10B)における各MP101等の部位は、自己診断を行う。自己診断で問題がない部位は稼動開始される。稼動開始されると、前記停電時の制御によってクラスタ(CL10B)の部位(MP101、メモリ102)は閉塞状態となっている。
ステップS43で、通常状態で稼動継続しているクラスタ(CL10A)におけるMP101は、対象のクラスタ(CL10B)の閉塞状態の部位における閉塞の原因・契機が停電状態だったことを認識しているため、ステップS35の閉塞処理後、停止側のクラスタ(CL10B)の部位に対する動作健全性チェックのアクセスを定期的に実施している。稼動継続しているクラスタ(CL10A)は、チェックの結果がOKならば(S43−Yes)、ステップS44,S45で、その対象部位についての自動回復処理を実行する。この自動回復処理は、第1の制御の場合と同様である。
ステップS46で、クラスタ(CL10B)の通常状態での起動が完了した状態となる。すなわち閉塞状態の部位が通常状態で動作再開される。
以上のように、停電パターン(2)に対応した第2の制御においても、第1の制御と同様に、安価なディスクアレイ装置構成で保守操作の介在を不要でクラスタを通常稼動へ復帰でき、稼働率を向上できるという効果を得られる。
(実施の形態3)
図9(a),(b)は、本発明の実施の形態3におけるディスクアレイ装置1を説明するための図であり、実施の形態3で停復電時の制御に係わる、電源部とクラスタの第2の構成例を示すブロック図である。図9(a)は、特に、停電状態を判定する手段に関する第2の構成例を示しており、図9(b)は、そのうちの停電判断部103Bの詳細構成を示す。ディスクアレイ装置1内で、停電状態を判定する手段を、AC接続される停電判断部103Bの回路を中心に構成している。実施の形態3の回路構成上において、前記実施の形態1,2で示した第1、第2の制御の一方または両方を同様に実行する機能を備える。
図9(a),(b)は、本発明の実施の形態3におけるディスクアレイ装置1を説明するための図であり、実施の形態3で停復電時の制御に係わる、電源部とクラスタの第2の構成例を示すブロック図である。図9(a)は、特に、停電状態を判定する手段に関する第2の構成例を示しており、図9(b)は、そのうちの停電判断部103Bの詳細構成を示す。ディスクアレイ装置1内で、停電状態を判定する手段を、AC接続される停電判断部103Bの回路を中心に構成している。実施の形態3の回路構成上において、前記実施の形態1,2で示した第1、第2の制御の一方または両方を同様に実行する機能を備える。
<電源部及びクラスタ構成(2)>
図9(a)において、本構成は、入力AC電源(AC1,AC2)と各CL10A,10Bの間に1つの停電判断部103Bを設け、停電判断部103Bから各CL10A,10Bに、相手クラスタ(CL10B,10A)側の停電状態を示す停電信号F(#2,#1)を入力してMP101に出力する構成である。
図9(a)において、本構成は、入力AC電源(AC1,AC2)と各CL10A,10Bの間に1つの停電判断部103Bを設け、停電判断部103Bから各CL10A,10Bに、相手クラスタ(CL10B,10A)側の停電状態を示す停電信号F(#2,#1)を入力してMP101に出力する構成である。
停電判断部103Bは、入力AC電源(AC1,AC2)から停電状態を判断する。各CL10A,10Bに入力される停電信号F#2,#1の意味は第1の構成例の場合と同様である。停電によりAC1とAC2が途絶えた場合、停電信号F#1,#2共に真(“1”)となる。
図9(b)において、停電判断部103Bは、比較器104、ダイオードブリッジ105、トランス106、抵抗107、コンデンサ108で構成される。AC1,AC2がそれぞれトランス106に入力される。各トランス106とダイオードブリッジ105が接続されている。各ダイオードブリッジ105でDCに整流化された出力が比較器104の一方の端子に入力される。ダイオードブリッジ105の出力側には、抵抗107とコンデンサ108の並列回路が接続されている。比較器104は、2系統のAC入力をDCに整流化した入力を基準電圧と比較して、結果を停電信号F(#2,#1)として各CL10A,10BのMP101に対し出力する。
本構成の場合、AC入力をもとに判定するためDCをもとに判定する場合より停電発生を認知するまでの時間が短い。また、AC接続であるため、第1の構成例に比べると、回路構成がやや複雑になる。
<比較例>
本発明の発明者が本発明の実施の形態との比較のために検討した他の構成例について説明する。前述したように、DKC10及び電源部の多重化構成において、前記SWPS31〜34の停電耐力のばらつき等により停電発生時に各クラスタの稼動停止タイミングが異なるため、閉塞処理によってクラスタの部位における閉塞状態が発生する。このような停電時の閉塞状態発生に対処するための構成例として以下の比較例(1)〜(3)が考えられる。各比較例(1)〜(3)では、各クラスタ稼動停止タイミングの時間差の発生を回避する。
本発明の発明者が本発明の実施の形態との比較のために検討した他の構成例について説明する。前述したように、DKC10及び電源部の多重化構成において、前記SWPS31〜34の停電耐力のばらつき等により停電発生時に各クラスタの稼動停止タイミングが異なるため、閉塞処理によってクラスタの部位における閉塞状態が発生する。このような停電時の閉塞状態発生に対処するための構成例として以下の比較例(1)〜(3)が考えられる。各比較例(1)〜(3)では、各クラスタ稼動停止タイミングの時間差の発生を回避する。
比較例(1)として、各クラスタに対するDC電源供給を1系統の構成にする。図10は、比較例(1)に対応したDKC及び電源部の構成例を示す。前記図3等に示す電源境界を無くして、電源部からのDC出力を1系統にして各クラスタに入力する構成である。この構成の場合、停電時におけるクラスタ稼動停止タイミングが一致するため、前記閉塞状態は発生しないことになる。
しかしながら、この構成の場合、1系統のDC電源供給ラインにショートが発生した場合、両クラスタ共に稼動停止してしまうため、ディスクアレイ装置としての信頼性が低い。従ってDC電源供給を多系統にすることが望ましい。本実施の形態の場合、DC電源供給を多系統にしているので信頼性が確保されている。
比較例(2)として、電源部とクラスタの間の各DC電源に対してバッテリを取り付けた構成とする。前記回復及び復帰のために、バッテリを保有して、停電直後に一定時間を確実に稼動させて計画的にクラスタの停止処理を行うことで、前記閉塞状態の発生を回避させる。図11は、比較例(2)に対応したDKC及び電源部の構成例を示す。前記図9(a)に示す第2の構成例をベースとして、PS2A,PS2BからのDC1,DC2の供給ラインに対し、バッテリB1,B2が接続された構成である。これにより、停電発生によりPS2A,PS2BからのDC1,DC2の供給が停止した場合でも、バッテリB1,B2からの電源供給によりクラスタCL10A,10Bの稼動がしばらく継続される。停電後も両クラスタCL10A.10Bの動作が継続されるので、停電判断部103Bからの停電信号による停電判断をもとに、各クラスタCL10A,10Bの稼動停止タイミングを合わせた確実な停止処理を行わせる。これにより、復電後の再起動時における保守操作の介在を不要にする。
しかしながら、この構成の場合、バッテリB1,B2を搭載する必要があるため、ディスクアレイ装置が高コストとなり不利である。本実施の形態の場合、バッテリB1,B2を搭載する必要がないため、ディスクアレイ装置1が低コストの構成となる。
比較例(3)として、電源部の構成において停電検出手段を内蔵した構成とし、各SWPSからのDC出力停止タイミングを一致させる。図12は、比較例(3)に対応したDKC及び電源部の構成例を示す。SWPS31〜34のそれぞれに、停電検出タイマ91を加えた構成である。SWPS31〜34において、AC入力がダイオードブリッジ115でDCに整流化された出力が力率改善部120に入力され、力率改善部120の出力がコンデンサ118とトランス116を介してDC出力される。そして、ダイオードブリッジ115と力率改善部120の間に停電検出タイマ91が接続されており、ダイオードブリッジ115の出力が停電検出タイマ91に入力されて停電時間がカウントされる。各SWPS31〜34内で、停電検出タイマ91により停電時間をカウントして、決められた時間で自SWPS31〜34のDC出力を停止する。停電検出タイマ91から力率改善部120に停止信号を出力して停止させる。これにより、各CL10A,10Bの稼動停止タイミングを合わせる。
しかしながら、この構成の場合、各SWPS31〜34の停止時間精度を良くすることは難しい。また、各SWPS31〜34に専用回路を設ける必要があるため高コストになる。また例えば各SWPS31〜34の間に停止タイミングを一致させるための専用回路を設ける構成も考えられるが、同様に電源部が複雑化し高コストになる。本実施の形態の場合、SWPS31〜34の停止時間を揃える必要はなくて済む。
また、前記特許文献1記載の技術によれば、停電前に機器状態を一定期間ごとに保存しておくため、その負荷が大きい。一方、本実施の形態では、停電による対象部位への電源供給停止と閉塞状態の発生の瞬間に応じて状態情報を保存するので負荷は少ない。
以上説明したように、各実施の形態によれば、停復電時に、保守員の介在を必要とせずに短時間での自動回復処理実現できる。停電時に発生した部位の閉塞状態を復電時に自動回復することで、ディスクアレイ装置稼働率が向上する。また、SWPS31〜34の停電耐力のばらつきが許容されるので安価な電源部が採用でき、低コストな構成で自動回復を実現できる。停電時電源保持用のバッテリバックアップ機能の具備によるディスクアレイ装置の高コスト構造を不要にできる。また、閉塞発生時にのみ判定・制御が行われるため、通常時にはDKC10における状態確認や判定などのための負荷が少なく稼動できる。
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。
本発明は、多重化された電源部とこれら電源部から電源供給される多重化された装置部分とを有する、ディスクアレイ装置などの装置や情報処理システムに利用可能である。
1…ディスクアレイ装置、2,2A,2B…AC−DC電源部、21,B1,B2…バッテリ、22…ACボックス、23…AC−DC電源、4…論理ボックス、5…ファン、6…SVP、7…パネル、8…HDDボックス、9…ファン、10…DKC、10A,10B…クラスタ、11…CHA、12…DKA、13…CM、14…SM、30…HDD、31〜36…SWPS、91…停電検出タイマ、100…制御パッケージ、101…MP、102…メモリ、103,103B…停電判断部、104…比較器、105,115…ダイオードブリッジ、106,116…トランス、107…抵抗、108,118…コンデンサ、120…力率改善部、300…DKU、AC1,AC2…入力AC電源、DC1,DC2…DC電源。
Claims (10)
- 記憶装置と前記記憶装置に対するデータの記憶を制御する記憶制御装置とを備えたディスクアレイ装置であって、
前記記憶制御装置は、プロセッサとメモリを有する、多重化されたクラスタの構成を有し、
前記クラスタを対象として電源供給を行う、多重化された電源部と、前記クラスタの電源状態を判定する回路とを有し、
停電の場合に少なくとも一部のクラスタが先に稼動停止するケースに対応して実行する制御において、
停電時の制御として、前記クラスタは、閉塞判定をもとに他クラスタの部位についての閉塞処理を行うと共に、前記電源状態を判定する回路からの信号に基づき前記他クラスタの電源状態を判定して、前記他クラスタの電源状態を表わす情報を前記メモリ上に記録して保存し、
復電時の制御として、前記クラスタは、前記他クラスタで閉塞状態となっている部位について、停電による閉塞状態であると認識した場合に、その部位を回復処理することを特徴とするディスクアレイ装置。 - 請求項1記載のディスクアレイ装置において、
前記電源部は、AC−DC電源部を有する構成であり、
前記各AC−DC電源部は、複数のスイッチング電源を含む構成で、前記各スイッチング電源に対し異なる系統のAC電源が入力されAC−DC変換して、対応するクラスタに対するDC電源を出力する構成であり、
前記スイッチング電源は、停電耐力の差により停電時における前記DC電源の出力停止のタイミングに差が生じ得るものであり、
前記クラスタのプロセッサは、自クラスタ内のメモリに対する制御と、他クラスタのプロセッサとの通信と、他クラスタのメモリに対する制御とが可能であり、前記閉塞処理と、前記電源状態の判定と、前記回復処理とを実行することを特徴とするディスクアレイ装置。 - 請求項1記載のディスクアレイ装置において、
停電時にすべてのクラスタが稼動停止するケースに対応して実行する第1の制御において、
停電時の制御として、停電直後に稼動継続している第1のクラスタのプロセッサは、先に稼動停止した第2のクラスタの部位を閉塞状態に移行する閉塞処理を行うと共に、前記電源状態を判定する回路からの信号に基づき前記第2のクラスタの電源状態を判定して、前記第2のクラスタの電源状態を表わす情報を前記メモリ上に記録して保存し、
復電時の制御として、復電直後に、前記第1のクラスタのプロセッサは、前記メモリ上に保存されている情報をもとに、前記第2のクラスタで閉塞状態となっている部位について、停電による閉塞状態であると認識した場合に、その部位を回復処理することを特徴とするディスクアレイ装置。 - 請求項1記載のディスクアレイ装置において、
停電時に一部のクラスタのみ稼動停止するケースに対応して実行する第2の制御において、
停電時の制御として、停電直後に稼動継続している第1のクラスタのプロセッサは、稼動停止した第2のクラスタの部位を閉塞状態に移行する閉塞処理を行うと共に、前記電源状態を判定する回路からの信号に基づき前記第2のクラスタの電源状態を判定して、前記第2のクラスタの電源状態を表わす情報を前記メモリ上に記録して保存し、
復電時の制御として、前記閉塞処理後に、前記第1のクラスタのプロセッサは、前記第2のクラスタでの閉塞状態の部位に対して、動作健全性チェックのためのアクセスを定期的に実施し、前記チェックの結果で問題ない場合に、その部位を回復処理することを特徴とするディスクアレイ装置。 - 請求項1記載のディスクアレイ装置において、
前記クラスタの電源状態を判定する回路は、前記クラスタのそれぞれに備えた停電判断部の回路で構成され、
前記停電判断部の回路は、他クラスタの電源部からのDC電源供給状態を判断して、他クラスタの停電状態についての判断結果を表わす信号を、前記クラスタ内のプロセッサに対して出力し、
前記クラスタ内のプロセッサは、前記信号を検出することで、前記閉塞状態の発生時における前記他クラスタの電源状態を認識することを特徴とするディスクアレイ装置。 - 請求項1記載のディスクアレイ装置において、
前記クラスタの電源状態を判定する回路は、前記電源部とクラスタの間に備えた停電判断部の回路で構成され、
前記停電判断部の回路は、前記電源部におけるAC電源供給状態を判断して、他クラスタの停電状態についての判断結果を表わす信号を、前記クラスタのプロセッサに対して出力し、
前記クラスタのプロセッサは、前記信号を検出することで、前記閉塞状態の発生時における前記他クラスタの電源状態を認識することを特徴とするディスクアレイ装置。 - 請求項1記載のディスクアレイ装置において、
前記メモリ上には、前記記憶制御装置における部位のロケーションごとに前記閉塞状態を表わす情報が管理され、前記プロセッサごとに前記クラスタの電源状態の判定結果を表わす情報が管理されることを特徴とするディスクアレイ装置。 - 請求項1記載のディスクアレイ装置において、
前記クラスタに対して通信接続される保守・管理装置を有し、
前記保守・管理装置から前記クラスタに対し指示することにより、代表となるプロセッサが、前記停電時及び復電時の制御を実行することを特徴とするディスクアレイ装置。 - 請求項1記載のディスクアレイ装置において、
前記電源部からクラスタに対する電源供給ラインにおいてバッテリが接続されていない構成であることを特徴とするディスクアレイ装置。 - 記憶装置と前記記憶装置に対するデータの記憶を制御する記憶制御装置とを備えたディスクアレイ装置であって、
前記記憶制御装置は、プロセッサとメモリを有する、二重化されたクラスタの構成を有し、
前記クラスタを対象として電源供給を行う、二重化された電源部と、前記クラスタの電源状態を判定する回路とを有し、
前記記憶制御装置は、他装置側との通信インタフェース処理を行う、前記プロセッサを備えるチャネル制御部と、前記記憶装置側との通信インタフェース処理を行う、前記プロセッサを備えるディスク制御部と、データキャッシュのためのキャッシュメモリ部と、状態情報を格納するための共有メモリ部と、それらを相互接続する接続部とを備える構成であり、
前記クラスタのプロセッサは、自クラスタ内のメモリに対する制御と、他クラスタのプロセッサとの通信と、他クラスタのメモリに対する制御とが可能であり、
前記電源部は、AC−DC電源部を有する構成であり、前記各AC−DC電源部は、複数のスイッチング電源を含む構成で、前記各スイッチング電源に対し異なる系統のAC電源が入力されAC−DC変換して、対応するクラスタに対するDC電源を出力し、前記スイッチング電源は、停電耐力の差により停電時における前記DC電源の出力停止のタイミングに差が生じ得るものであり、
停電の場合に少なくとも一方のクラスタが先に稼動停止するケースに対応して実行する制御において、
停電時の制御として、稼動している第1のクラスタのプロセッサは、閉塞判定をもとに、停止した第2のクラスタの部位についての閉塞処理を行うと共に、前記電源状態を判定する回路からの信号に基づき前記第2のクラスタの電源状態を判定して、前記第2のクラスタの電源状態を表わす情報を前記共有メモリ部上に記録して保存し、
復電時の制御として、前記第1のクラスタのプロセッサは、前記第2のクラスタで閉塞状態となっている部位について、停電による閉塞状態であると認識した場合に、その部位を回復処理することを特徴とするディスクアレイ装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005044960A JP2006235673A (ja) | 2005-02-22 | 2005-02-22 | ディスクアレイ装置 |
US11/104,518 US7421596B2 (en) | 2005-02-22 | 2005-04-13 | Disk array system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005044960A JP2006235673A (ja) | 2005-02-22 | 2005-02-22 | ディスクアレイ装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006235673A true JP2006235673A (ja) | 2006-09-07 |
Family
ID=36914231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005044960A Withdrawn JP2006235673A (ja) | 2005-02-22 | 2005-02-22 | ディスクアレイ装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7421596B2 (ja) |
JP (1) | JP2006235673A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010146362A (ja) * | 2008-12-19 | 2010-07-01 | Fujitsu Ltd | 制御装置、ストレージ装置および制御方法 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006309317A (ja) * | 2005-04-26 | 2006-11-09 | Hitachi Ltd | ストレージシステム及びその制御方法 |
JP4857011B2 (ja) * | 2006-04-07 | 2012-01-18 | 株式会社日立製作所 | 記憶装置の駆動方法およびこの記憶装置を備えたディスクサブシステム |
JP4982304B2 (ja) * | 2007-09-04 | 2012-07-25 | 株式会社日立製作所 | 電源障害の発生を把握するストレージシステム |
US7877622B2 (en) * | 2007-12-13 | 2011-01-25 | International Business Machines Corporation | Selecting between high availability redundant power supply modes for powering a computer system |
US8200990B2 (en) * | 2007-12-22 | 2012-06-12 | International Business Machines Corporation | Apparatus, system, and method for a high efficiency redundant power architecture |
JP6128013B2 (ja) * | 2014-02-27 | 2017-05-17 | 株式会社デンソー | 回転角検出装置、および、これを用いた電動パワーステアリング装置 |
US10248558B2 (en) | 2017-08-29 | 2019-04-02 | Qualcomm Incorporated | Memory leakage power savings |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5673412A (en) * | 1990-07-13 | 1997-09-30 | Hitachi, Ltd. | Disk system and power-on sequence for the same |
JP3294108B2 (ja) | 1996-06-04 | 2002-06-24 | 株式会社東芝 | 復電処理方法及び装置 |
US6438647B1 (en) * | 2000-06-23 | 2002-08-20 | International Business Machines Corporation | Method and apparatus for providing battery-backed immediate write back cache for an array of disk drives in a computer system |
-
2005
- 2005-02-22 JP JP2005044960A patent/JP2006235673A/ja not_active Withdrawn
- 2005-04-13 US US11/104,518 patent/US7421596B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010146362A (ja) * | 2008-12-19 | 2010-07-01 | Fujitsu Ltd | 制御装置、ストレージ装置および制御方法 |
Also Published As
Publication number | Publication date |
---|---|
US7421596B2 (en) | 2008-09-02 |
US20060190747A1 (en) | 2006-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7360047B2 (en) | Storage system, redundancy control method, and program | |
JP2006235673A (ja) | ディスクアレイ装置 | |
JP4758666B2 (ja) | 記憶制御システム及び記憶制御方法 | |
JP4870915B2 (ja) | ストレージ装置 | |
US8074108B2 (en) | Storage controller and storage control method | |
US7457916B2 (en) | Storage system, management server, and method of managing application thereof | |
EP1746490B1 (en) | Storage controller and storage system | |
US8392756B2 (en) | Storage apparatus and method of detecting power failure in storage apparatus | |
US20040078663A1 (en) | Information processing system and disk control method used in the same | |
JP2007286937A (ja) | ストレージ装置及びストレージ装置の電源障害管理方法 | |
JP2007141185A (ja) | 記憶制御装置及び記憶制御装置のエラー情報管理方法 | |
JP2006107080A (ja) | ストレージ装置システム | |
US8327184B2 (en) | Storage control system and storage control method | |
JP2007025933A (ja) | ストレージシステム及びそのファームウェア自動更新方法 | |
JP4372427B2 (ja) | 記憶デバイス制御装置 | |
US7457990B2 (en) | Information processing apparatus and information processing recovery method | |
JP2007018034A (ja) | 制御装置及び制御方法 | |
JP6492939B2 (ja) | 制御装置、ストレージシステムおよびプログラム | |
JP2008176526A (ja) | 記憶制御装置及び記憶制御装置の制御方法 | |
JP2007018049A (ja) | 記憶制御システム | |
JP4322017B2 (ja) | バックアップ装置 | |
US20090313509A1 (en) | Control method for information storage apparatus, information storage apparatus, program and computer readable information recording medium | |
JP2003036127A (ja) | パッケージの閉塞方法 | |
CN113535472A (zh) | 集群服务器 | |
JPH10333794A (ja) | 入出力装置の活線挿抜方法、ならびに同方法を実現する入出力装置の実装構造、及び入出力サブシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071119 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20090601 |