JP3653197B2 - Disk controller - Google Patents
Disk controller Download PDFInfo
- Publication number
- JP3653197B2 JP3653197B2 JP20112999A JP20112999A JP3653197B2 JP 3653197 B2 JP3653197 B2 JP 3653197B2 JP 20112999 A JP20112999 A JP 20112999A JP 20112999 A JP20112999 A JP 20112999A JP 3653197 B2 JP3653197 B2 JP 3653197B2
- Authority
- JP
- Japan
- Prior art keywords
- module
- disk
- cache
- modules
- switch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【0001】
【発明の属する技術分野】
本発明は、メインフレーム系のホストコンピュータに接続されるディスクサブシステムに係わり、特にチャネルアダプタ、ディスクアダプタの増設が容易なようにモジュール構造をもつディスク制御装置に関する。
【0002】
【従来の技術】
メインフレーム系のホストコンピュータに接続されるディスクサブシステムは、ディスク制御装置(DKC)とディスク装置(DKU)から構成される。ディスク制御装置は、チャネルインタフェースを介してホストコンピュータとの間のデータ転送を制御するチャネルアダプタと、ディスクインタフェースを介してディスク装置との間のデータ転送を制御するディスクアダプタとを有する。近年のディスク制御装置は、より高い性能を得るため、複数のチャネルアダプタと複数のディスクアダプタを設け、ホストコンピュータとディスク装置間のデータ転送を並行して実行するディスクサブシステムが主流となっている。
【0003】
図2は、従来のディスクサブシステムの第1の構成例を示す図である。DKC2及びDKU3は、各々独立してAC電源を供給する電源A(18)及び電源B(28)を有し、各々の電源によって電源供給を受ける構成部分をクラスタと呼ぶ。この例では、チャネルアダプタ10、ディスクアダプタ11、キャッシュメモリ14及びバスアービタ15,16はクラスタA(17)に属し、チャネルアダプタ20、ディスクアダプタ21、キャッシュメモリ24及びバスアービタ25,26はクラスタB(27)に属する。1つのクラスタについて複数のチャネルアダプタおよび複数のディスクアダプタを設けることが可能である。各クラスタについて1台のキャッシュメモリは、これら複数のチャネルアダプタおよびディスクアダプタによって共有され、ホストプロセッサ1とDKU3の間に転送されるデータを一時的に格納する。DKU3は、複数のディスクドライブ30を有し、各々ディスクインタフェースを介してディスクアダプタ11,21と接続される。DKU3がディスクアレイの構成であってもよい。
【0004】
各アダプタは2組の共通バス12,22に接続され、キャッシュメモリ14,24はすべてのアダプタからアクセス可能である。共通バス12は電源A(18)によって電源供給を受け、ターミネータ13によってバス終端される。また共通バス22は電源B(28)によって電源供給を受け、ターミネータ23によってバス終端される。共通バス12にはバスアービタ15及びバスアービタ25が接続され、共通バス12のバスアクセス権の調停を行う。また共通バス22にはバスアービタ16及びバスアービタ26が接続され、共通バス22のバスアクセス権の調停を行う。この構成例ではバスアービタが2重化され、一方の障害時に備えている。共通バス12及び共通バス22は、1つのプラッタ(マザーボード)上に実装される。
【0005】
図3は、従来のディスクサブシステムの第2の構成例を示す図である。この構成例のディスクサブシステムは、電源A(18)の供給を受けるクラスタA(17)と、電源B(28)の供給を受けるクラスタB(27)から構成される。チャネルアダプタ10、キャッシュメモリ14及びディスクアダプタ11は、クラスタA(17)に属し、チャネルアダプタ20、キャッシュメモリ24及びディスクアダプタ21は、クラスタB(27)に属する。キャッシュメモリ14,24は、図示するように、それぞれチャネルアダプタ10,20の両方に接続され、またディスクアダプタ11,21の両方に接続される。すなわちキャッシュメモリ14,24を介して各チャネルアダプタ10,20と各ディスクアダプタ11,21間には2つのデータ転送パスが利用可能である。
【0006】
上記した従来の構成例は、いずれも各チャネルアダプタ、ディスクアダプタ、キャッシュメモリ及び共通バスが物理的に独立しており、いずれかのモジュール又は共通バスに障害が発生しても、故障部位を閉塞して部品交換などの障害回復処置と並行してホストプロセッサ1とDKU3間のデータ転送を継続できる。
【0007】
【発明が解決しようとする課題】
従来ディスクサブシステムの高性能化および記憶容量の増大の要求に対して、DKCではキャッシュメモリの記憶容量の増大およびアダプタの増設によって対応してきた。しかしながら上記第1の構成例に示す構成では、以下の理由によってアダプタの増設は制限を受ける。まずアダプタを増設するには、アダプタ実装エリアを確保するためにプラッタのサイズを大きくして共通バスの配線を長くする必要があるが、それによってバスの総配線長が長くなり、バス信号の伝送特性が劣化して高速伝送ができなくなる。また最大構成に合わせたプラッタをディスク制御装置に実装するため、装置床面積が大きくなる欠点もある。
【0008】
さらに同一バス上に多くのアダプタが接続されるため、バスの故障率は増大する。また共通バスの構造上、データ転送していない接続アダプタの故障が実際にデータ転送しているアダプタに伝搬するため、故障部位の特定は非常に困難である。またディスク制御装置に複数のクラスタを設ける場合に、いずれかの電源の障害によってその電源の供給を受けるモジュール及び共通バスが使用不能になるほかに、その共通バスのバスアクセス権を調停するバスアービタも使用不能となる。例えば電源B(28)の電源断によってバスアービタ25,26のほかに共通バス22が使用不能となるため、バスアービタ16も使用不能となる。
【0009】
また上記第2の構成例に示す構成では、クラスタ当りのアダプタ数を増加するためには、チャネルアダプタ−キャッシュメモリ間の接続線とディスクアダプタ−キャッシュメモリ間の接続線を増設しなければならないが、キャッシュメモリに入線する信号線が増加し、LSIのピンネック、パッケージコネクタのピンネックの制約からアダプタ数の増加は制限される。またいずれかの電源の電源断によって、チャネルアダプタとディスクアダプタ間に利用可能なデータ転送パスは1パスのみとなる。より高い信頼性を求めるならば、チャネルアダプタ−キャッシュメモリ間の接続線とディスクアダプタ−キャッシュメモリ間の接続線を2倍以上に増設しなければならないが、上記のピンネックの制約から同様にパスの拡張は制限される。さらに一方の電源が電力供給できるアダプタ数には限度があるため、最大構成を想定したときの消費電力、総電流を供給できる電源を設けなければならず、電源能力の面でもアダプタ数の増加は制限される。
【0010】
本発明の目的は、チャネルアダプタ及びディスクアダプタをほとんど無制限に増設可能で信頼性、可用性及び保守性の高いディスク制御装置を提供することにある。
【0011】
【課題を解決するための手段】
本発明は、外部チャネルとの間のデータ転送を制御する複数のチャネルアダプタモジュールと、ディスクとの間のデータ転送を制御する複数のディスクアダプタモジュールと、キャッシュメモリを有し該チャネルアダプタモジュール及び該ディスクアダプタモジュールからアクセスされる少なくとも1つのキャッシュモジュールと、接続線によって該チャネルアダプタモジュール及び該ディスクアダプタモジュールと接続するとともに、該キャッシュモジュールと接続しいずれかのアダプタモジュールと該キャッシュモジュールとの間の伝送路を設定する少なくとも1つのスイッチモジュールとを有するディスク制御装置であって、該チャネルアダプタモジュールと該ディスクアダプタモジュールのうちのいずれか1つは、特定の該キャッシュモジュールとの間にデータ転送のための複数のパスを設定可能に構成したディスク制御装置を特徴とする。
【0012】
また本発明は、外部チャネルとの間のデータ転送を制御し各々独立電源を有する複数のチャネルアダプタモジュールと、ディスクとの間のデータ転送を制御し各々独立電源を有する複数のディスクアダプタモジュールと、キャッシュメモリを有し該チャネルアダプタモジュール及び該ディスクアダプタモジュールからアクセスされ独立電源を有するキャッシュモジュールと、接続線によって該チャネルアダプタモジュール及び該ディスクアダプタモジュールと接続するとともに、該キャッシュモジュールと接続しいずれかのアダプタモジュールと該キャッシュモジュールとの間の伝送路を設定し各々独立電源を有する少なくとも1つのスイッチモジュールとを有し、独立のAC供給元からAC供給を受けるモジュールの集合を1つのクラスタとして複数のクラスタで構成し、1つのクラスタに属する該スイッチモジュールとその属するクラスタ内のキャッシュモジュール及び他クラスタに属するキャッシュモジュールとを接続線によって接続した構成を有するディスク制御装置を特徴とする。
【0013】
【発明の実施の形態】
以下本発明の実施形態について図面を用いて説明する。
【0014】
図1は、本実施形態のDKC5の構成を示す図である。DKC5は、AC供給元49,59により電源分離されたクラスタA(40)とクラスタB(50)から構成される。クラスタA(40)は、チャネルアダプタモジュール41、ディスクアダプタモジュール42、スイッチモジュール43,44及びキャッシュモジュール45を有する。またクラスタB(50)は、チャネルアダプタモジュール51、ディスクアダプタモジュール52、スイッチモジュール53,54及びキャッシュモジュール55を有する。クラスタA(40)のチャネルアダプタモジュール41とスイッチモジュール43は、各チャネルアダプタモジュール41について1本ずつ最大4本までのケーブルアセンブリ47によって接続され、スイッチモジュール43とキャッシュモジュール45は1本のケーブルアセンブリ48によって接続される。またチャネルアダプタモジュール41、ディスクアダプタモジュール42は、各々スイッチモジュール43とスイッチモジュール44に接続し、キャッシュモジュール45はスイッチモジュール43,44,53,54に接続する。クラスタB(50)についても同様である。チャネルアダプタモジュール41,51及びディスクアダプタモジュール42,52は、スイッチモジュール1台について各々4台まで実装可能である。スイッチモジュール43,44,53,54は、各々入力側と出力側にセレクタを有しており、8本の入力線のいずれかと、2本の出力線のいずれかを選択することによってチャネルアダプタとキャッシュモジュールとの間にデータ転送パスを形成する。また各モジュールは個別電源46を実装している。各モジュール間を接続する共通バスがないためプラッタが存在しないことと、モジュール間に共通の電源をもたないため消費電力、総電流の制約を受けないことによって、スイッチモジュールの増設とともにチャネルアダプタモジュール41,51及びディスクアダプタモジュール42,52をほとんど無制限に増設できる。
【0015】
以下ホストプロセッサ1からキャッシュメモリまでデータ転送し、キャッシュモジュール45,55に2重書き込みするときのDKC5の動作について説明する。チャネルアダプタモジュール41は、ホストプロセッサ1から転送されるデータを受信し、一旦内蔵バッファに蓄えるとともに、スイッチモジュール43に転送要求を発行する。スイッチモジュール43は、他のチャネルアダプタモジュール41およびディスクアダプタモジュール42からの転送要求を調停する。スイッチモジュール43は、チャネルアダプタモジュール41とスイッチモジュール43間、スイッチモジュール43とキャッシュモジュール45間およびスイッチモジュール43とキャッシュモジュール55間のデータ転送パスが確保された時点でチャネルアダプタモジュール41に転送許可を発行する。チャネルアダプタモジュール41はすぐにケーブルアセンブリ47を介してスイッチモジュール43へデータを転送する。スイッチモジュール43内部で転送データをバッファリングすることなく、キャッシュモジュール45及びキャッシュモジュール55へデータを転送できる。キャッシュモジュール45及びキャッシュモジュール55は、それぞれ転送すべきデータをすべて受信したとき、スイッチモジュール43にデータ転送終了の信号を送る。スイッチモジュール43は、これらの通知に従ってチャネルアダプタモジュール41に対するデータ転送パスの使用を終了させる。
【0016】
例えばAC供給元59からの電力供給が停止した場合、クラスタB(50)に属するチャネルアダプタモジュール51、ディスクアダプタモジュール52、スイッチモジュール53,54及びキャッシュモジュール55は動作停止する。一方AC供給元49から電力供給を受けているクラスタA(40)に属するモジュールは、キャッシュモジュール45のみのデータ読み書きモードによって動作を継続する。またケーブルアセンブリ47、スイッチモジュール43又はケーブルアセンブリ48に故障が発生しても、チャネルアダプタモジュール41はスイッチモジュール44を介してキャッシュモジュール45にアクセス可能である。
【0017】
表1は、図1に実施例を示す本発明の方式、図2に示す従来の第1の構成例及び図3に示す第2の構成例について、接続アダプタ数及びクラスタダウン時のチャネルアダプタ−キャッシュメモリ間の利用可能パス数を比較する表である。この表から分かるように本発明になるDKCは、アダプタの拡張性と信頼性に優れていることを示している。
【0018】
【表1】
【0019】
図4は、チャネルアダプタモジュール41、スイッチモジュール43及びキャッシュモジュール45の障害検出、データ保護関係について内部構成を示す図である。
【0020】
スイッチモジュール43は、セレクタ61、セレクタ62、障害検出器63、障害検出器64及び調停部68を有する。スイッチモジュール44,53,54も同じである。キャッシュモジュール45は、障害検出器65、障害検出器66、データライト保護部69及びキャッシュメモリ70を有する。キャッシュモジュール55も同じである。またチャネルアダプタモジュール41は障害検出器67を有する。チャネルアダプタモジュール51、ディスクアダプタモジュール42,52についても同様である。ケーブルアセンブリ47のうちの1本のケーブルは、データ線90、制御線81,83,84,91,92を収容する。またケーブルアセンブリ48は、データ線90、制御線82,84を収容する。障害検出器64はチャネルアダプタモジュール41からキャッシュモジュール45へ転送されるデータ、障害検出器65はキャッシュモジュール45へ転送されるデータ、障害検出器63はキャッシュモジュール45からチャネルアダプタモジュール41へ転送されるデータ、障害検出器67はチャネルアダプタモジュール41へ転送されるデータのチェックを行う。チャネルアダプタモジュール41は、マイクロプロセッサを内蔵し、チャネルアダプタモジュール41が検出した障害の割込み信号を受けて障害個所の特定を行う。
【0021】
チャネルアダプタモジュール41は、ホストプロセッサ1からデータを受信すると、受信したデータに水平パリティ、垂直パリティなどのデータ保証コードを付加して内蔵バッファに格納するとともに、制御線91を介してスイッチモジュール43へ転送要求を発行する。スイッチモジュール43の調停部68は、キャッシュモジュール45へのデータ転送パスが確保された段階で制御線92を介して転送許可を発行する。チャネルアダプタモジュール41は、すぐにデータ線90を介してスイッチモジュール43へデータを転送する。セレクタ61,62はこのデータ線90を選択しており、データはセレクタ61、セレクタ62を通過し、キャッシュモジュール45へ転送される。データはセレクタ61、セレクタ62間で障害検出器64によるデータ保証コードのチェックを受ける。キャッシュモジュール45の障害検出器65は、転送されるデータのデータ保証コードをチェックし、障害がなければキャッシュメモリ70にライトされる。
【0022】
ケーブルアセンブリ47の障害により、チャネルアダプタモジュール41からスイッチモジュール43へ転送されるデータに誤りが生じた場合、障害検出器64は、転送されるデータのデータ保証コードをチェックして障害を検出し、制御線82を介してキャッシュモジュール45の障害検出器65に障害検出を報告する。障害検出器65は、スイッチモジュール43から転送されるデータのデータ保証コードをチェックするが、障害の検出有無にかかわらず、データライト保護部69に対してデータライトの抑止を要求する。データライト保護部69は、誤りの生じている可能性のあるデータのライトを抑止する。
【0023】
例えばケーブルアセンブリ47だけでなくケーブルアセンブリ48も故障している場合には、転送データにデータ保証コードによる検出能力を超えるような多ビット誤りが発生し、障害検出器65がこの誤りを検出できないことがある。この障害検出機能によって、誤ったデータをキャッシュメモリ70に書き込むことを防止できる。このようにスイッチモジュール43内に障害検出器64を設け、ケーブルアセンブリ47、スイッチモジュール43及びケーブルアセンブリ48を介してチャネルアダプタモジュール41からキャッシュモジュール45へ転送するデータの誤りをチェックし、障害検出されたデータの書き込み保護を行うことは、信頼度の面から重要である。
【0024】
チャネルアダプタモジュール41がキャッシュモジュール45にアクセスしデータを転送すると、キャッシュモジュール45は、データ線90を介してチャネルアダプタモジュール41へ応答を返す。チャネルアダプタモジュール41は、所定時間内にキャッシュモジュール45から応答がないとき、無応答とみなしてそのマイクロプロセッサに割込み信号を送る。無応答の原因となった故障部位は、キャッシュモジュール45までのアクセス経路上にあるケーブルアセンブリ47、スイッチモジュール43、ケーブルアセンブリ48又はキャッシュモジュール45が考えられる。
【0025】
スイッチモジュール44が存在するDKC構成では、次のような手順で故障部位を特定することができる。チャネルアダプタモジュール41のマイクロプロセッサは、障害割り込み信号によってアクセス無応答を知ると、スイッチモジュール44を経由する経路によってスイッチモジュール43内の障害検出器64、キャッシュモジュール45内の障害検出器65及び障害検出器63の検出情報を採取し、また障害検出器67の検出情報を得る。データとその応答信号は、チャネルアダプタモジュール41からスイッチモジュール43、キャッシュモジュール45、スイッチモジュール43、チャネルアダプタモジュール41の順で流れるから、データの障害検出は障害検出器64、障害検出器65、障害検出器63、障害検出器67の順に行われる。従って最初に障害を検出した検出器の手前の部位が故障していることが分かる。
【0026】
またチャネルアダプタモジュール41は、障害検出器63、障害検出器64、障害検出器65とそれぞれ制御線81、制御線83,84によって接続されているので、スイッチモジュール44が存在しないDKC構成またはスイッチモジュール44経由で検出器の障害情報を採取できない場合には、障害検出器64、障害検出器65、障害検出器63、障害検出器67から得た障害情報から故障部位を特定できる。
図5は、各モジュールを接続するケーブルとケーブル接続を監視する機構を示す図である。チャネルアダプタモジュール41は、スイッチモジュール43,44とのケーブル接続に対応してそれぞれ接続確認部101を有する。またスイッチモジュール43は、各チャネルアダプタモジュール41、ディスクアダプタモジュール42とのケーブル接続に対応してケーブルイネーブル出力部102を有する。さらにスイッチモジュール43は、キャッシュモジュール45,55とのケーブル接続に対応して接続確認部103を有する。キャッシュモジュール45は、各スイッチモジュール43,44,53,54とのケーブル接続に対応してケーブルイネーブル出力部102を有する。接続確認部101は、構成情報チェック113、信号チェック114及びプルアップ抵抗115を有する。またケーブルイネーブル出力部102は、出力ドライバ111及びケーブルイネーブル制御112を有する。制御線116は、接続確認部101とケーブルイネーブル出力部102を接続する信号線である。
【0027】
スイッチモジュール43の電源がオンになると、ケーブルイネーブル出力部102のケーブルイネーブル制御112は、制御線116上のケーブルイネーブル信号をLOWレベルに固定する。チャネルアダプタモジュール41の接続確認部101は、信号チェック114により信号レベルを監視する。ケーブルアセンブリ47の障害またはコネクタ20が外れた場合、ケーブルイネーブル信号はドライブ元のケーブルイネーブル制御112から切り離され、接続確認部101のプルアップ抵抗115によりHIGHレベルに固定される。信号チェック114は信号がHIGHレベルになったことを検出し、構成情報チェック113に報告する。構成情報チェック113は、あらかじめ設定されているLOWデータと比較し、期待されるLOWデータと不一致であることから繋がっているはずの当該パスが開放されたことを検出し、チャネルアダプタモジュール41内の障害処理部130に報告する。障害処理部130は、チャネルアダプタモジュール41の制御を行うマイクロプロセッサに障害報告をする。マイクロプロセッサは、その制御プログラムの実行によって異常が発生している当該ケーブルアセンブリ47のパスを論理的に閉塞する。
【0028】
スイッチモジュール43の接続確認部103は、構成情報チェック113、信号チェック114、プルアップ抵抗115の他に障害処理部130を含んでおり、キャッシュモジュール45のケーブルイネーブル出力部102との間で同様のケーブル接続監視を行う。接続確認部103がケーブルアセンブリ48の開放を検出したとき、チャネルアダプタモジュール41のマイクロプロセッサに障害報告をする。チャネルアダプタモジュール41は障害の生じている当該ケーブルアセンブリ48のパスを論理的に閉塞する。
【0029】
なおケーブルイネーブル出力部102をスイッチモジュール43内に設け、対向する接続確認部103をキャッシュモジュール45内に設けても同様のケーブル接続監視が可能である。
【0030】
DKC5は、装置稼動中に上記のケーブル接続監視を常に行っており、データ転送中に発生する障害及び障害によるデータ化けを未然に防いでいる。
【0031】
DKC5は、設置されるモジュールの数とその組み合わせによって小規模構成から大規模構成まで多くの構成パターンをとり得る。そこでDKC5内に装置の構成を管理するためのテーブルを設けて、設置されているモジュールとモジュール間のパスを設定しておき、DKC5の電源オン後の装置立上げ時に各パスの接続状態をチェックすることによって、稼動する装置構成が構成管理テーブルに設定されている構成と一致するか否かをチェックできる。
【0032】
図6は、DKC5の他の構成を示す図であり、図1に示す構成に対してさらにモジュールを増設したときの構成図である。この例は図1に示すDKC5に対してチャネルアダプタモジュール151を4台、ディスクアダプタモジュール152を4台、およびスイッチモジュール153,154を増設した構成である。以下にその増設手順について説明する。
【0033】
クラスタB(50)のチャネルアダプタモジュール51及びディスクアダプタモジュール52は、スイッチモジュール53及びスイッチモジュール54を経由してキャッシュモジュール45とキャッシュモジュール55へのアクセスを行っている。まず増設するチャネルアダプタモジュール151、ディスクアダプタモジュール152、スイッチモジュール153及びスイッチモジュール154をDKC6の装置に実装し、増設した各モジュール間をケーブルアセンブリ47で接続し、各モジュールの個別電源をオンにする。増設したモジュール内のマイクロプロセッサは、すでに稼動しているモジュールからのパス診断要求が来るまで待機する。
【0034】
チャネルアダプタモジュール51又はディスクアダプタモジュール52内のマイクロプロセッサの指示により、スイッチモジュール53を使用可能な他のチャネルアダプタモジュール51、ディスクアダプタモジュール52、キャッシュモジュール45及びキャッシュモジュール55に対してスイッチモジュール53の論理閉塞命令を発行し、スイッチモジュール53を経由するキャッシュモジュール45,55へのアクセスを禁止する。この論理閉塞命令によって、各モジュールはスイッチモジュール53との間のケーブル接続を監視する接続確認機構の機能を抑止し、転送データのチェックを行う障害検出機構の機能を抑止する。次にスイッチモジュール53とキャッシュモジュール45間のケーブルアセンブリのスイッチモジュール53側のコネクタを引き抜き、増設するスイッチモジュール153に接続する。同様にしてスイッチモジュール53とキャッシュモジュール55間のケーブルアセンブリのスイッチモジュール53側のコネクタを引き抜き、増設するスイッチモジュール154に接続する。またスイッチモジュール53とスイッチモジュール153間、スイッチモジュール53とスイッチモジュール154間をそれぞれケーブルアセンブリによって接続する。これによってチャネルアダプタモジュール51およびディスクアダプタモジュール52は、スイッチモジュール53、スイッチモジュール153及びスイッチモジュール154を介したキャッシュモジュール45とキャッシュモジュール55への物理パスが形成された。チャネルアダプタモジュール51またはディスクアダプタモジュール52のマイクロプロセッサは、増設されたパスの診断を行い、論理的にパスが接続されていることを確認した後、パスの開通を他チャネルアダプタモジュール51、ディスクアダプタモジュール52、スイッチモジュール53、スイッチモジュール153、スイッチモジュール154、キャッシュモジュール45、キャッシュモジュール55に通知し、増設したパスを経由するキャッシュモジュール45,55へのアクセスが可能になる。同様の手順でスイッチモジュール54を閉塞し、ケーブルの張替え、ケーブル追加を行って物理パス増設とそのパス診断を行う。以上の増設処理及び増設作業は、キャッシュモジュール45,55へのアクセスを継続しながら行うことができる。
【0035】
以上の実施形態は、チャネルアダプタモジュール151、ディスクアダプタモジュール152の増設に伴なうものであったが、故障したモジュール及び接続するケーブルアセンブリの閉塞、交換、回復後のパス診断にも適用され、一連の処理と作業はキャッシュモジュールへのアクセスを継続しながら実行することができる。またAC給電系が停止した場合に起こるクラスタ動作停止の際の障害回復にも適用される。
【0036】
図7は、DKC5の他の構成を示す図である。システムは各々独立したディスク制御装置であるDKC5−1とDKC5−2から成り、これら装置筐体間はケーブルアセンブリ200によつて接続されている。DKC5−1のクラスタB(50)にあるスイッチモジュール53,54がDKC5−2のクラスタB(50)にあるキャッシュモジュール55と接続される。またDKC5−2のクラスタB(50)にあるスイッチモジュール53,54がDKC5−1のクラスタB(50)にあるキャッシュモジュール55と接続される。この構成によってDKC5−2のチャネルアダプタモジュール51とディスクアダプタモジュール52、DKC5−1のチャネルアダプタモジュール51とディスクアダプタモジュール52は、異なる装置のキャッシュモジュール55にアクセスが可能になる。この構成の利点は、DKC5−1,5−2の一方が稼動停止したとき他方のDKCによって動作継続できることと、DKC5−1のクラスタA(40)とDKC5−2のクラスタA(40)のAC供給が停止してもDKC5−1のクラスタB(50)とDKC5−2のクラスタB(50)によって動作継続できる点である。さらにDKC5−1のクラスタA(40)のスイッチモジュール43,44とDKC5−2のクラスタA(40)のキャッシュモジュール45とを接続し、DKC5−2のクラスタA(40)のスイッチモジュール43,44とDKC5−1のクラスタA(40)のキャッシュモジュール45とを相互に接続することも可能である。
【0037】
【発明の効果】
以上述べたように本発明のディスク制御装置によれば、チャネルアダプタモジュール及びディスクアダプタモジュールとキャッシュモジュールとの間に複数のスイッチモジュールを介入させて接続し、しかも複数段のスイッチモジュールを介入させて接続可能な構成としたので、従来の共通バスやピンネックの問題を回避でき、チャネルアダプタ及びディスクアダプタをほとんど無制限に増設可能である。このとき各モジュールに独立電源を設けたので、従来の供給電源能力の問題を回避できる。またモジュール間に転送するデータをモジュール間のケーブルアセンブリごと、データの転送方向ごとにチェックする障害検出機構を設けたこと、モジュール間のケーブル接続を監視する機構を設けたこと、および故障したモジュール及びそのモジュールへの接続線を閉塞し、他のモジュールの稼動を継続したまま部品交換ができることによって、信頼性、可用性、保守性のよいディスク制御装置を提供できる。
【図面の簡単な説明】
【図1】実施形態のディスク制御装置の構成を示す図である。
【図2】従来のディスクサブシステムの第1の構成例を示す図である。
【図3】従来のディスクサブシステムの第2の構成例を示す図である。
【図4】実施形態の障害検出関係についての装置の内部構成を示す図である。
【図5】実施形態のケーブル接続を監視する機構の構成を示す図である。
【図6】実施形態の他のディスク制御装置の構成図であり、モジュール増設の様子を示す図である。
【図7】実施形態のさらに他のディスク制御装置の構成を示す図である。
【符号の説明】
5:DKC、40:クラスタA、50:クラスタB、41,51:チャネルアダプタモジュール、42,52:ディスクアダプタモジュール、、43,44,53,54:スイッチモジュール、45,55:キャッシュモジュール、47,48:ケーブルアセンブリ[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a disk subsystem connected to a mainframe host computer, and more particularly to a disk controller having a module structure so that channel adapters and disk adapters can be easily added.
[0002]
[Prior art]
A disk subsystem connected to a mainframe host computer includes a disk control unit (DKC) and a disk unit (DKU). The disk controller includes a channel adapter that controls data transfer with a host computer via a channel interface, and a disk adapter that controls data transfer with the disk device via a disk interface. In order to obtain higher performance, recent disk control apparatuses have a plurality of channel adapters and a plurality of disk adapters, and a disk subsystem that executes data transfer between the host computer and the disk apparatus in parallel has become mainstream. .
[0003]
FIG. 2 is a diagram showing a first configuration example of a conventional disk subsystem. DKC2 and DKU3 each have a power source A (18) and a power source B (28) that supply AC power independently, and a component that receives power from each power source is called a cluster. In this example, the
[0004]
Each adapter is connected to two sets of
[0005]
FIG. 3 is a diagram showing a second configuration example of a conventional disk subsystem. The disk subsystem of this configuration example includes a cluster A (17) that is supplied with the power source A (18) and a cluster B (27) that is supplied with the power source B (28). The
[0006]
In each of the conventional configuration examples described above, each channel adapter, disk adapter, cache memory, and common bus are physically independent, and even if a failure occurs in any module or common bus, the failure site is blocked. Thus, data transfer between the
[0007]
[Problems to be solved by the invention]
Conventionally, DKC has responded to the demand for higher performance and increased storage capacity of the disk subsystem by increasing the storage capacity of the cache memory and adding adapters. However, in the configuration shown in the first configuration example, the addition of adapters is restricted for the following reason. First, to increase the number of adapters, it is necessary to increase the size of the platter and lengthen the wiring of the common bus in order to secure the adapter mounting area. However, this increases the total wiring length of the bus and transmits bus signals. The characteristics deteriorate and high-speed transmission becomes impossible. Further, since a platter adapted to the maximum configuration is mounted on the disk control device, there is a disadvantage that the floor area of the device becomes large.
[0008]
Further, since many adapters are connected on the same bus, the failure rate of the bus increases. In addition, because of the common bus structure, the failure of the connection adapter that is not transferring data is propagated to the adapter that is actually transferring data, so it is very difficult to identify the failed part. In addition, when a plurality of clusters are provided in the disk controller, a module that receives the power supply and a common bus become unusable due to any power failure, and a bus arbiter that arbitrates the bus access right of the common bus. It becomes unusable. For example, since the
[0009]
In the configuration shown in the second configuration example, in order to increase the number of adapters per cluster, it is necessary to increase the connection line between the channel adapter and the cache memory and the connection line between the disk adapter and the cache memory. The number of signal lines entering the cache memory is increased, and the increase in the number of adapters is limited due to restrictions of LSI pin necks and package connector pin necks. In addition, when one of the power supplies is turned off, only one data transfer path can be used between the channel adapter and the disk adapter. If higher reliability is required, the connection line between the channel adapter and the cache memory and the connection line between the disk adapter and the cache memory must be increased by a factor of two or more. Expansion is limited. Furthermore, since there is a limit to the number of adapters that can be supplied by one power supply, it is necessary to provide a power supply that can supply the power consumption and total current when the maximum configuration is assumed. Limited.
[0010]
An object of the present invention is to provide a disk control device with high reliability, availability, and maintainability in which channel adapters and disk adapters can be added almost without limitation.
[0011]
[Means for Solving the Problems]
The present invention includes a plurality of channel adapter modules that control data transfer with an external channel, a plurality of disk adapter modules that control data transfer with a disk, a cache memory, the channel adapter module, and the At least one cache module accessed from the disk adapter module and connected to the channel adapter module and the disk adapter module by a connection line, and connected to the cache module and between any of the adapter modules and the cache module A disk controller having at least one switch module for setting a transmission path, wherein either one of the channel adapter module and the disk adapter module is a specific cache module; Wherein the disk control apparatus configured capable of setting a plurality of paths for the data transfer between the modules.
[0012]
The present invention also provides a plurality of channel adapter modules that control data transfer to and from external channels and each have an independent power source, and a plurality of disk adapter modules that control data transfer to and from the disk and each have an independent power source, A cache module having a cache memory and having an independent power source accessed from the channel adapter module and the disk adapter module, and connected to the channel adapter module and the disk adapter module by a connection line, and connected to the cache module. A set of modules having an AC power supply from an independent AC supply source, each of which has at least one switch module having an independent power source and a transmission path between the adapter module and the cache module. And composed of a plurality of clusters, and wherein the disk control unit having the structure connected by the the said switch modules belonging to one cluster and cache modules belonging to the cache module and other clusters of belonging the cluster connection line.
[0013]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below with reference to the drawings.
[0014]
FIG. 1 is a diagram showing the configuration of the
[0015]
The operation of the
[0016]
For example, when the power supply from the
[0017]
Table 1 shows the number of connection adapters and channel adapters when the cluster is down for the method of the present invention shown in FIG. 1, the first configuration example shown in FIG. 2, and the second configuration example shown in FIG. 6 is a table for comparing the number of available paths between cache memories. As can be seen from this table, the DKC according to the present invention is excellent in the expandability and reliability of the adapter.
[0018]
[Table 1]
[0019]
FIG. 4 is a diagram showing the internal configuration of the fault detection and data protection relationship of the
[0020]
The
[0021]
When the
[0022]
When an error occurs in the data transferred from the
[0023]
For example, when not only the
[0024]
When the
[0025]
In the DKC configuration in which the
[0026]
Further, since the
FIG. 5 is a diagram showing a cable for connecting each module and a mechanism for monitoring the cable connection. The
[0027]
When the power of the
[0028]
The
[0029]
Similar cable connection monitoring is possible even if the cable enable
[0030]
The
[0031]
The
[0032]
FIG. 6 is a diagram showing another configuration of the
[0033]
The
[0034]
The
[0035]
The above embodiment was accompanied by the addition of the channel adapter module 151 and the
[0036]
FIG. 7 is a diagram illustrating another configuration of the
[0037]
【The invention's effect】
As described above, according to the disk control device of the present invention, a plurality of switch modules are interposed and connected between the channel adapter module and the disk adapter module and the cache module, and a plurality of stages of switch modules are interposed. Since it is configured to be connectable, the conventional common bus and pin neck problems can be avoided, and channel adapters and disk adapters can be added almost unlimitedly. At this time, since an independent power supply is provided for each module, the problem of the conventional power supply capability can be avoided. In addition, a failure detection mechanism for checking data to be transferred between modules for each cable assembly between the modules and for each data transfer direction, a mechanism for monitoring the cable connection between the modules, a failed module, and A disk control device with good reliability, availability, and maintainability can be provided by closing a connection line to the module and exchanging parts while continuing to operate other modules.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating a configuration of a disk control device according to an embodiment.
FIG. 2 is a diagram illustrating a first configuration example of a conventional disk subsystem.
FIG. 3 is a diagram illustrating a second configuration example of a conventional disk subsystem.
FIG. 4 is a diagram illustrating an internal configuration of a device regarding a failure detection relationship according to the embodiment.
FIG. 5 is a diagram illustrating a configuration of a mechanism for monitoring cable connection according to the embodiment.
FIG. 6 is a configuration diagram of another disk control device according to the embodiment, and shows how a module is added.
FIG. 7 is a diagram illustrating a configuration of still another disk control device according to the embodiment.
[Explanation of symbols]
5: DKC, 40: cluster A, 50: cluster B, 41, 51: channel adapter module, 42, 52: disk adapter module, 43, 44, 53, 54: switch module, 45, 55: cache module, 47 48: Cable assembly
Claims (6)
前記複数のチャネルアダプタモジュールと、前記複数のディスクアダプタモジュールと、前記複数のスイッチモジュールと、は、独立した電力供給元により電源分離された複数のクラスタの何れかに属し、前記複数のクラスタの何れかに属する前記チャネルアダプタモジュールと、前記ディスクアダプタモジュールと、は、前記クラスタに属する第1のスイッチモジュール又は、第2のスイッチモジュールを介して、特定の前記キャッシュモジュールにデータ転送のための複数のパスを設定可能であることを特徴とするディスク制御装置。A plurality of channel adapter modules for controlling data transfer to and from an external channel; a plurality of disk adapter modules for controlling data transfer to and from a disk; and a cache memory having the channel adapter module and the disk adapter module At least one cache module to be accessed is connected to the channel adapter module and the disk adapter module by a connection line, and connected to the cache module to set a transmission path between any adapter module and the cache module A plurality of switch modules ,
The plurality of channel adapter modules, the plurality of disk adapter modules, and the plurality of switch modules belong to any one of a plurality of clusters that are separated from each other by an independent power supply source. The channel adapter module and the disk adapter module belong to a plurality of specific cache modules via the first switch module or the second switch module belonging to the cluster. A disk controller characterized in that a path can be set .
前記第1の障害検出部からデータの誤りについて障害検出を報告する場合、前記第3の障害検出部は、前記障害検出の報告を受け、前記データライト保護部に前記データを前記キャッシュメモリに書き込むことを防止するよう要求することを特徴とする請求項3記載のディスク制御装置。 When reporting a failure detection for a data error from the first failure detection unit, the third failure detection unit receives the failure detection report and writes the data into the cache memory in the data write protection unit 4. The disk control apparatus according to claim 3, wherein the disk control apparatus is requested to prevent this.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20112999A JP3653197B2 (en) | 1999-07-15 | 1999-07-15 | Disk controller |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20112999A JP3653197B2 (en) | 1999-07-15 | 1999-07-15 | Disk controller |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004241793A Division JP2005004791A (en) | 2004-08-23 | 2004-08-23 | Disk controller |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001027972A JP2001027972A (en) | 2001-01-30 |
JP3653197B2 true JP3653197B2 (en) | 2005-05-25 |
Family
ID=16435900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20112999A Expired - Fee Related JP3653197B2 (en) | 1999-07-15 | 1999-07-15 | Disk controller |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3653197B2 (en) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003256147A (en) * | 2002-02-28 | 2003-09-10 | Hitachi Ltd | Cluster type disk array device and operation method for cluster type disk array device |
JP2005115771A (en) | 2003-10-09 | 2005-04-28 | Hitachi Ltd | Disk array system |
EP2296085B1 (en) | 2004-11-30 | 2013-05-15 | Fujitsu Limited | Data storage system and capacity changing method |
JP4486921B2 (en) | 2005-12-09 | 2010-06-23 | 富士通株式会社 | Storage virtualization apparatus and computer system using the same |
JP4414399B2 (en) | 2006-01-30 | 2010-02-10 | 富士通株式会社 | Disk controller |
JP4982304B2 (en) | 2007-09-04 | 2012-07-25 | 株式会社日立製作所 | Storage system that understands the occurrence of power failure |
-
1999
- 1999-07-15 JP JP20112999A patent/JP3653197B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2001027972A (en) | 2001-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3264465B2 (en) | Storage system | |
US6338110B1 (en) | Partitioning of storage channels using programmable switches | |
US20070076321A1 (en) | Data storage system, data storage control device, and failure location diagnosis method thereof | |
WO2003030006A1 (en) | Controller data sharing using a modular dma architecture | |
WO2003036484A1 (en) | Bus zoning in a channel independent storage controller architecture | |
JP4132322B2 (en) | Storage control device and control method thereof | |
US20020199040A1 (en) | High speed communications device/system | |
JP2004199551A (en) | Storage system and method for isolating defective storage device | |
US7487293B2 (en) | Data storage system and log data output method upon abnormality of storage control apparatus | |
US7143306B2 (en) | Data storage system | |
JP3653197B2 (en) | Disk controller | |
JP2005004791A (en) | Disk controller | |
US8429462B2 (en) | Storage system and method for automatic restoration upon loop anomaly | |
US7426658B2 (en) | Data storage system and log data equalization control method for storage control apparatus | |
US7293198B2 (en) | Techniques for maintaining operation of data storage system during a failure | |
JP3742405B2 (en) | Storage system | |
JP2007200357A (en) | Disk control device | |
JP3547411B2 (en) | Storage system | |
JPH11353776A (en) | Disk array controller | |
US10762026B2 (en) | Information processing apparatus and control method for suppressing obstacle | |
JPH03160529A (en) | Duplex computer system | |
JP2004303256A (en) | Storage system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040610 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040622 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040823 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050225 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090304 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100304 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110304 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110304 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120304 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130304 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130304 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140304 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |