JP3653197B2 - Disk controller - Google Patents

Disk controller Download PDF

Info

Publication number
JP3653197B2
JP3653197B2 JP20112999A JP20112999A JP3653197B2 JP 3653197 B2 JP3653197 B2 JP 3653197B2 JP 20112999 A JP20112999 A JP 20112999A JP 20112999 A JP20112999 A JP 20112999A JP 3653197 B2 JP3653197 B2 JP 3653197B2
Authority
JP
Japan
Prior art keywords
module
disk
cache
modules
switch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP20112999A
Other languages
Japanese (ja)
Other versions
JP2001027972A (en
Inventor
信幸 箕輪
昭 藤林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP20112999A priority Critical patent/JP3653197B2/en
Publication of JP2001027972A publication Critical patent/JP2001027972A/en
Application granted granted Critical
Publication of JP3653197B2 publication Critical patent/JP3653197B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、メインフレーム系のホストコンピュータに接続されるディスクサブシステムに係わり、特にチャネルアダプタ、ディスクアダプタの増設が容易なようにモジュール構造をもつディスク制御装置に関する。
【0002】
【従来の技術】
メインフレーム系のホストコンピュータに接続されるディスクサブシステムは、ディスク制御装置(DKC)とディスク装置(DKU)から構成される。ディスク制御装置は、チャネルインタフェースを介してホストコンピュータとの間のデータ転送を制御するチャネルアダプタと、ディスクインタフェースを介してディスク装置との間のデータ転送を制御するディスクアダプタとを有する。近年のディスク制御装置は、より高い性能を得るため、複数のチャネルアダプタと複数のディスクアダプタを設け、ホストコンピュータとディスク装置間のデータ転送を並行して実行するディスクサブシステムが主流となっている。
【0003】
図2は、従来のディスクサブシステムの第1の構成例を示す図である。DKC2及びDKU3は、各々独立してAC電源を供給する電源A(18)及び電源B(28)を有し、各々の電源によって電源供給を受ける構成部分をクラスタと呼ぶ。この例では、チャネルアダプタ10、ディスクアダプタ11、キャッシュメモリ14及びバスアービタ15,16はクラスタA(17)に属し、チャネルアダプタ20、ディスクアダプタ21、キャッシュメモリ24及びバスアービタ25,26はクラスタB(27)に属する。1つのクラスタについて複数のチャネルアダプタおよび複数のディスクアダプタを設けることが可能である。各クラスタについて1台のキャッシュメモリは、これら複数のチャネルアダプタおよびディスクアダプタによって共有され、ホストプロセッサ1とDKU3の間に転送されるデータを一時的に格納する。DKU3は、複数のディスクドライブ30を有し、各々ディスクインタフェースを介してディスクアダプタ11,21と接続される。DKU3がディスクアレイの構成であってもよい。
【0004】
各アダプタは2組の共通バス12,22に接続され、キャッシュメモリ14,24はすべてのアダプタからアクセス可能である。共通バス12は電源A(18)によって電源供給を受け、ターミネータ13によってバス終端される。また共通バス22は電源B(28)によって電源供給を受け、ターミネータ23によってバス終端される。共通バス12にはバスアービタ15及びバスアービタ25が接続され、共通バス12のバスアクセス権の調停を行う。また共通バス22にはバスアービタ16及びバスアービタ26が接続され、共通バス22のバスアクセス権の調停を行う。この構成例ではバスアービタが2重化され、一方の障害時に備えている。共通バス12及び共通バス22は、1つのプラッタ(マザーボード)上に実装される。
【0005】
図3は、従来のディスクサブシステムの第2の構成例を示す図である。この構成例のディスクサブシステムは、電源A(18)の供給を受けるクラスタA(17)と、電源B(28)の供給を受けるクラスタB(27)から構成される。チャネルアダプタ10、キャッシュメモリ14及びディスクアダプタ11は、クラスタA(17)に属し、チャネルアダプタ20、キャッシュメモリ24及びディスクアダプタ21は、クラスタB(27)に属する。キャッシュメモリ14,24は、図示するように、それぞれチャネルアダプタ10,20の両方に接続され、またディスクアダプタ11,21の両方に接続される。すなわちキャッシュメモリ14,24を介して各チャネルアダプタ10,20と各ディスクアダプタ11,21間には2つのデータ転送パスが利用可能である。
【0006】
上記した従来の構成例は、いずれも各チャネルアダプタ、ディスクアダプタ、キャッシュメモリ及び共通バスが物理的に独立しており、いずれかのモジュール又は共通バスに障害が発生しても、故障部位を閉塞して部品交換などの障害回復処置と並行してホストプロセッサ1とDKU3間のデータ転送を継続できる。
【0007】
【発明が解決しようとする課題】
従来ディスクサブシステムの高性能化および記憶容量の増大の要求に対して、DKCではキャッシュメモリの記憶容量の増大およびアダプタの増設によって対応してきた。しかしながら上記第1の構成例に示す構成では、以下の理由によってアダプタの増設は制限を受ける。まずアダプタを増設するには、アダプタ実装エリアを確保するためにプラッタのサイズを大きくして共通バスの配線を長くする必要があるが、それによってバスの総配線長が長くなり、バス信号の伝送特性が劣化して高速伝送ができなくなる。また最大構成に合わせたプラッタをディスク制御装置に実装するため、装置床面積が大きくなる欠点もある。
【0008】
さらに同一バス上に多くのアダプタが接続されるため、バスの故障率は増大する。また共通バスの構造上、データ転送していない接続アダプタの故障が実際にデータ転送しているアダプタに伝搬するため、故障部位の特定は非常に困難である。またディスク制御装置に複数のクラスタを設ける場合に、いずれかの電源の障害によってその電源の供給を受けるモジュール及び共通バスが使用不能になるほかに、その共通バスのバスアクセス権を調停するバスアービタも使用不能となる。例えば電源B(28)の電源断によってバスアービタ25,26のほかに共通バス22が使用不能となるため、バスアービタ16も使用不能となる。
【0009】
また上記第2の構成例に示す構成では、クラスタ当りのアダプタ数を増加するためには、チャネルアダプタ−キャッシュメモリ間の接続線とディスクアダプタ−キャッシュメモリ間の接続線を増設しなければならないが、キャッシュメモリに入線する信号線が増加し、LSIのピンネック、パッケージコネクタのピンネックの制約からアダプタ数の増加は制限される。またいずれかの電源の電源断によって、チャネルアダプタとディスクアダプタ間に利用可能なデータ転送パスは1パスのみとなる。より高い信頼性を求めるならば、チャネルアダプタ−キャッシュメモリ間の接続線とディスクアダプタ−キャッシュメモリ間の接続線を2倍以上に増設しなければならないが、上記のピンネックの制約から同様にパスの拡張は制限される。さらに一方の電源が電力供給できるアダプタ数には限度があるため、最大構成を想定したときの消費電力、総電流を供給できる電源を設けなければならず、電源能力の面でもアダプタ数の増加は制限される。
【0010】
本発明の目的は、チャネルアダプタ及びディスクアダプタをほとんど無制限に増設可能で信頼性、可用性及び保守性の高いディスク制御装置を提供することにある。
【0011】
【課題を解決するための手段】
本発明は、外部チャネルとの間のデータ転送を制御する複数のチャネルアダプタモジュールと、ディスクとの間のデータ転送を制御する複数のディスクアダプタモジュールと、キャッシュメモリを有し該チャネルアダプタモジュール及び該ディスクアダプタモジュールからアクセスされる少なくとも1つのキャッシュモジュールと、接続線によって該チャネルアダプタモジュール及び該ディスクアダプタモジュールと接続するとともに、該キャッシュモジュールと接続しいずれかのアダプタモジュールと該キャッシュモジュールとの間の伝送路を設定する少なくとも1つのスイッチモジュールとを有するディスク制御装置であって、該チャネルアダプタモジュールと該ディスクアダプタモジュールのうちのいずれか1つは、特定の該キャッシュモジュールとの間にデータ転送のための複数のパスを設定可能に構成したディスク制御装置を特徴とする。
【0012】
また本発明は、外部チャネルとの間のデータ転送を制御し各々独立電源を有する複数のチャネルアダプタモジュールと、ディスクとの間のデータ転送を制御し各々独立電源を有する複数のディスクアダプタモジュールと、キャッシュメモリを有し該チャネルアダプタモジュール及び該ディスクアダプタモジュールからアクセスされ独立電源を有するキャッシュモジュールと、接続線によって該チャネルアダプタモジュール及び該ディスクアダプタモジュールと接続するとともに、該キャッシュモジュールと接続しいずれかのアダプタモジュールと該キャッシュモジュールとの間の伝送路を設定し各々独立電源を有する少なくとも1つのスイッチモジュールとを有し、独立のAC供給元からAC供給を受けるモジュールの集合を1つのクラスタとして複数のクラスタで構成し、1つのクラスタに属する該スイッチモジュールとその属するクラスタ内のキャッシュモジュール及び他クラスタに属するキャッシュモジュールとを接続線によって接続した構成を有するディスク制御装置を特徴とする。
【0013】
【発明の実施の形態】
以下本発明の実施形態について図面を用いて説明する。
【0014】
図1は、本実施形態のDKC5の構成を示す図である。DKC5は、AC供給元49,59により電源分離されたクラスタA(40)とクラスタB(50)から構成される。クラスタA(40)は、チャネルアダプタモジュール41、ディスクアダプタモジュール42、スイッチモジュール43,44及びキャッシュモジュール45を有する。またクラスタB(50)は、チャネルアダプタモジュール51、ディスクアダプタモジュール52、スイッチモジュール53,54及びキャッシュモジュール55を有する。クラスタA(40)のチャネルアダプタモジュール41とスイッチモジュール43は、各チャネルアダプタモジュール41について1本ずつ最大4本までのケーブルアセンブリ47によって接続され、スイッチモジュール43とキャッシュモジュール45は1本のケーブルアセンブリ48によって接続される。またチャネルアダプタモジュール41、ディスクアダプタモジュール42は、各々スイッチモジュール43とスイッチモジュール44に接続し、キャッシュモジュール45はスイッチモジュール43,44,53,54に接続する。クラスタB(50)についても同様である。チャネルアダプタモジュール41,51及びディスクアダプタモジュール42,52は、スイッチモジュール1台について各々4台まで実装可能である。スイッチモジュール43,44,53,54は、各々入力側と出力側にセレクタを有しており、8本の入力線のいずれかと、2本の出力線のいずれかを選択することによってチャネルアダプタとキャッシュモジュールとの間にデータ転送パスを形成する。また各モジュールは個別電源46を実装している。各モジュール間を接続する共通バスがないためプラッタが存在しないことと、モジュール間に共通の電源をもたないため消費電力、総電流の制約を受けないことによって、スイッチモジュールの増設とともにチャネルアダプタモジュール41,51及びディスクアダプタモジュール42,52をほとんど無制限に増設できる。
【0015】
以下ホストプロセッサ1からキャッシュメモリまでデータ転送し、キャッシュモジュール45,55に2重書き込みするときのDKC5の動作について説明する。チャネルアダプタモジュール41は、ホストプロセッサ1から転送されるデータを受信し、一旦内蔵バッファに蓄えるとともに、スイッチモジュール43に転送要求を発行する。スイッチモジュール43は、他のチャネルアダプタモジュール41およびディスクアダプタモジュール42からの転送要求を調停する。スイッチモジュール43は、チャネルアダプタモジュール41とスイッチモジュール43間、スイッチモジュール43とキャッシュモジュール45間およびスイッチモジュール43とキャッシュモジュール55間のデータ転送パスが確保された時点でチャネルアダプタモジュール41に転送許可を発行する。チャネルアダプタモジュール41はすぐにケーブルアセンブリ47を介してスイッチモジュール43へデータを転送する。スイッチモジュール43内部で転送データをバッファリングすることなく、キャッシュモジュール45及びキャッシュモジュール55へデータを転送できる。キャッシュモジュール45及びキャッシュモジュール55は、それぞれ転送すべきデータをすべて受信したとき、スイッチモジュール43にデータ転送終了の信号を送る。スイッチモジュール43は、これらの通知に従ってチャネルアダプタモジュール41に対するデータ転送パスの使用を終了させる。
【0016】
例えばAC供給元59からの電力供給が停止した場合、クラスタB(50)に属するチャネルアダプタモジュール51、ディスクアダプタモジュール52、スイッチモジュール53,54及びキャッシュモジュール55は動作停止する。一方AC供給元49から電力供給を受けているクラスタA(40)に属するモジュールは、キャッシュモジュール45のみのデータ読み書きモードによって動作を継続する。またケーブルアセンブリ47、スイッチモジュール43又はケーブルアセンブリ48に故障が発生しても、チャネルアダプタモジュール41はスイッチモジュール44を介してキャッシュモジュール45にアクセス可能である。
【0017】
表1は、図1に実施例を示す本発明の方式、図2に示す従来の第1の構成例及び図3に示す第2の構成例について、接続アダプタ数及びクラスタダウン時のチャネルアダプタ−キャッシュメモリ間の利用可能パス数を比較する表である。この表から分かるように本発明になるDKCは、アダプタの拡張性と信頼性に優れていることを示している。
【0018】
【表1】

Figure 0003653197
【0019】
図4は、チャネルアダプタモジュール41、スイッチモジュール43及びキャッシュモジュール45の障害検出、データ保護関係について内部構成を示す図である。
【0020】
スイッチモジュール43は、セレクタ61、セレクタ62、障害検出器63、障害検出器64及び調停部68を有する。スイッチモジュール44,53,54も同じである。キャッシュモジュール45は、障害検出器65、障害検出器66、データライト保護部69及びキャッシュメモリ70を有する。キャッシュモジュール55も同じである。またチャネルアダプタモジュール41は障害検出器67を有する。チャネルアダプタモジュール51、ディスクアダプタモジュール42,52についても同様である。ケーブルアセンブリ47のうちの1本のケーブルは、データ線90、制御線81,83,84,91,92を収容する。またケーブルアセンブリ48は、データ線90、制御線82,84を収容する。障害検出器64はチャネルアダプタモジュール41からキャッシュモジュール45へ転送されるデータ、障害検出器65はキャッシュモジュール45へ転送されるデータ、障害検出器63はキャッシュモジュール45からチャネルアダプタモジュール41へ転送されるデータ、障害検出器67はチャネルアダプタモジュール41へ転送されるデータのチェックを行う。チャネルアダプタモジュール41は、マイクロプロセッサを内蔵し、チャネルアダプタモジュール41が検出した障害の割込み信号を受けて障害個所の特定を行う。
【0021】
チャネルアダプタモジュール41は、ホストプロセッサ1からデータを受信すると、受信したデータに水平パリティ、垂直パリティなどのデータ保証コードを付加して内蔵バッファに格納するとともに、制御線91を介してスイッチモジュール43へ転送要求を発行する。スイッチモジュール43の調停部68は、キャッシュモジュール45へのデータ転送パスが確保された段階で制御線92を介して転送許可を発行する。チャネルアダプタモジュール41は、すぐにデータ線90を介してスイッチモジュール43へデータを転送する。セレクタ61,62はこのデータ線90を選択しており、データはセレクタ61、セレクタ62を通過し、キャッシュモジュール45へ転送される。データはセレクタ61、セレクタ62間で障害検出器64によるデータ保証コードのチェックを受ける。キャッシュモジュール45の障害検出器65は、転送されるデータのデータ保証コードをチェックし、障害がなければキャッシュメモリ70にライトされる。
【0022】
ケーブルアセンブリ47の障害により、チャネルアダプタモジュール41からスイッチモジュール43へ転送されるデータに誤りが生じた場合、障害検出器64は、転送されるデータのデータ保証コードをチェックして障害を検出し、制御線82を介してキャッシュモジュール45の障害検出器65に障害検出を報告する。障害検出器65は、スイッチモジュール43から転送されるデータのデータ保証コードをチェックするが、障害の検出有無にかかわらず、データライト保護部69に対してデータライトの抑止を要求する。データライト保護部69は、誤りの生じている可能性のあるデータのライトを抑止する。
【0023】
例えばケーブルアセンブリ47だけでなくケーブルアセンブリ48も故障している場合には、転送データにデータ保証コードによる検出能力を超えるような多ビット誤りが発生し、障害検出器65がこの誤りを検出できないことがある。この障害検出機能によって、誤ったデータをキャッシュメモリ70に書き込むことを防止できる。このようにスイッチモジュール43内に障害検出器64を設け、ケーブルアセンブリ47、スイッチモジュール43及びケーブルアセンブリ48を介してチャネルアダプタモジュール41からキャッシュモジュール45へ転送するデータの誤りをチェックし、障害検出されたデータの書き込み保護を行うことは、信頼度の面から重要である。
【0024】
チャネルアダプタモジュール41がキャッシュモジュール45にアクセスしデータを転送すると、キャッシュモジュール45は、データ線90を介してチャネルアダプタモジュール41へ応答を返す。チャネルアダプタモジュール41は、所定時間内にキャッシュモジュール45から応答がないとき、無応答とみなしてそのマイクロプロセッサに割込み信号を送る。無応答の原因となった故障部位は、キャッシュモジュール45までのアクセス経路上にあるケーブルアセンブリ47、スイッチモジュール43、ケーブルアセンブリ48又はキャッシュモジュール45が考えられる。
【0025】
スイッチモジュール44が存在するDKC構成では、次のような手順で故障部位を特定することができる。チャネルアダプタモジュール41のマイクロプロセッサは、障害割り込み信号によってアクセス無応答を知ると、スイッチモジュール44を経由する経路によってスイッチモジュール43内の障害検出器64、キャッシュモジュール45内の障害検出器65及び障害検出器63の検出情報を採取し、また障害検出器67の検出情報を得る。データとその応答信号は、チャネルアダプタモジュール41からスイッチモジュール43、キャッシュモジュール45、スイッチモジュール43、チャネルアダプタモジュール41の順で流れるから、データの障害検出は障害検出器64、障害検出器65、障害検出器63、障害検出器67の順に行われる。従って最初に障害を検出した検出器の手前の部位が故障していることが分かる。
【0026】
またチャネルアダプタモジュール41は、障害検出器63、障害検出器64、障害検出器65とそれぞれ制御線81、制御線83,84によって接続されているので、スイッチモジュール44が存在しないDKC構成またはスイッチモジュール44経由で検出器の障害情報を採取できない場合には、障害検出器64、障害検出器65、障害検出器63、障害検出器67から得た障害情報から故障部位を特定できる。
図5は、各モジュールを接続するケーブルとケーブル接続を監視する機構を示す図である。チャネルアダプタモジュール41は、スイッチモジュール43,44とのケーブル接続に対応してそれぞれ接続確認部101を有する。またスイッチモジュール43は、各チャネルアダプタモジュール41、ディスクアダプタモジュール42とのケーブル接続に対応してケーブルイネーブル出力部102を有する。さらにスイッチモジュール43は、キャッシュモジュール45,55とのケーブル接続に対応して接続確認部103を有する。キャッシュモジュール45は、各スイッチモジュール43,44,53,54とのケーブル接続に対応してケーブルイネーブル出力部102を有する。接続確認部101は、構成情報チェック113、信号チェック114及びプルアップ抵抗115を有する。またケーブルイネーブル出力部102は、出力ドライバ111及びケーブルイネーブル制御112を有する。制御線116は、接続確認部101とケーブルイネーブル出力部102を接続する信号線である。
【0027】
スイッチモジュール43の電源がオンになると、ケーブルイネーブル出力部102のケーブルイネーブル制御112は、制御線116上のケーブルイネーブル信号をLOWレベルに固定する。チャネルアダプタモジュール41の接続確認部101は、信号チェック114により信号レベルを監視する。ケーブルアセンブリ47の障害またはコネクタ20が外れた場合、ケーブルイネーブル信号はドライブ元のケーブルイネーブル制御112から切り離され、接続確認部101のプルアップ抵抗115によりHIGHレベルに固定される。信号チェック114は信号がHIGHレベルになったことを検出し、構成情報チェック113に報告する。構成情報チェック113は、あらかじめ設定されているLOWデータと比較し、期待されるLOWデータと不一致であることから繋がっているはずの当該パスが開放されたことを検出し、チャネルアダプタモジュール41内の障害処理部130に報告する。障害処理部130は、チャネルアダプタモジュール41の制御を行うマイクロプロセッサに障害報告をする。マイクロプロセッサは、その制御プログラムの実行によって異常が発生している当該ケーブルアセンブリ47のパスを論理的に閉塞する。
【0028】
スイッチモジュール43の接続確認部103は、構成情報チェック113、信号チェック114、プルアップ抵抗115の他に障害処理部130を含んでおり、キャッシュモジュール45のケーブルイネーブル出力部102との間で同様のケーブル接続監視を行う。接続確認部103がケーブルアセンブリ48の開放を検出したとき、チャネルアダプタモジュール41のマイクロプロセッサに障害報告をする。チャネルアダプタモジュール41は障害の生じている当該ケーブルアセンブリ48のパスを論理的に閉塞する。
【0029】
なおケーブルイネーブル出力部102をスイッチモジュール43内に設け、対向する接続確認部103をキャッシュモジュール45内に設けても同様のケーブル接続監視が可能である。
【0030】
DKC5は、装置稼動中に上記のケーブル接続監視を常に行っており、データ転送中に発生する障害及び障害によるデータ化けを未然に防いでいる。
【0031】
DKC5は、設置されるモジュールの数とその組み合わせによって小規模構成から大規模構成まで多くの構成パターンをとり得る。そこでDKC5内に装置の構成を管理するためのテーブルを設けて、設置されているモジュールとモジュール間のパスを設定しておき、DKC5の電源オン後の装置立上げ時に各パスの接続状態をチェックすることによって、稼動する装置構成が構成管理テーブルに設定されている構成と一致するか否かをチェックできる。
【0032】
図6は、DKC5の他の構成を示す図であり、図1に示す構成に対してさらにモジュールを増設したときの構成図である。この例は図1に示すDKC5に対してチャネルアダプタモジュール151を4台、ディスクアダプタモジュール152を4台、およびスイッチモジュール153,154を増設した構成である。以下にその増設手順について説明する。
【0033】
クラスタB(50)のチャネルアダプタモジュール51及びディスクアダプタモジュール52は、スイッチモジュール53及びスイッチモジュール54を経由してキャッシュモジュール45とキャッシュモジュール55へのアクセスを行っている。まず増設するチャネルアダプタモジュール151、ディスクアダプタモジュール152、スイッチモジュール153及びスイッチモジュール154をDKC6の装置に実装し、増設した各モジュール間をケーブルアセンブリ47で接続し、各モジュールの個別電源をオンにする。増設したモジュール内のマイクロプロセッサは、すでに稼動しているモジュールからのパス診断要求が来るまで待機する。
【0034】
チャネルアダプタモジュール51又はディスクアダプタモジュール52内のマイクロプロセッサの指示により、スイッチモジュール53を使用可能な他のチャネルアダプタモジュール51、ディスクアダプタモジュール52、キャッシュモジュール45及びキャッシュモジュール55に対してスイッチモジュール53の論理閉塞命令を発行し、スイッチモジュール53を経由するキャッシュモジュール45,55へのアクセスを禁止する。この論理閉塞命令によって、各モジュールはスイッチモジュール53との間のケーブル接続を監視する接続確認機構の機能を抑止し、転送データのチェックを行う障害検出機構の機能を抑止する。次にスイッチモジュール53とキャッシュモジュール45間のケーブルアセンブリのスイッチモジュール53側のコネクタを引き抜き、増設するスイッチモジュール153に接続する。同様にしてスイッチモジュール53とキャッシュモジュール55間のケーブルアセンブリのスイッチモジュール53側のコネクタを引き抜き、増設するスイッチモジュール154に接続する。またスイッチモジュール53とスイッチモジュール153間、スイッチモジュール53とスイッチモジュール154間をそれぞれケーブルアセンブリによって接続する。これによってチャネルアダプタモジュール51およびディスクアダプタモジュール52は、スイッチモジュール53、スイッチモジュール153及びスイッチモジュール154を介したキャッシュモジュール45とキャッシュモジュール55への物理パスが形成された。チャネルアダプタモジュール51またはディスクアダプタモジュール52のマイクロプロセッサは、増設されたパスの診断を行い、論理的にパスが接続されていることを確認した後、パスの開通を他チャネルアダプタモジュール51、ディスクアダプタモジュール52、スイッチモジュール53、スイッチモジュール153、スイッチモジュール154、キャッシュモジュール45、キャッシュモジュール55に通知し、増設したパスを経由するキャッシュモジュール45,55へのアクセスが可能になる。同様の手順でスイッチモジュール54を閉塞し、ケーブルの張替え、ケーブル追加を行って物理パス増設とそのパス診断を行う。以上の増設処理及び増設作業は、キャッシュモジュール45,55へのアクセスを継続しながら行うことができる。
【0035】
以上の実施形態は、チャネルアダプタモジュール151、ディスクアダプタモジュール152の増設に伴なうものであったが、故障したモジュール及び接続するケーブルアセンブリの閉塞、交換、回復後のパス診断にも適用され、一連の処理と作業はキャッシュモジュールへのアクセスを継続しながら実行することができる。またAC給電系が停止した場合に起こるクラスタ動作停止の際の障害回復にも適用される。
【0036】
図7は、DKC5の他の構成を示す図である。システムは各々独立したディスク制御装置であるDKC5−1とDKC5−2から成り、これら装置筐体間はケーブルアセンブリ200によつて接続されている。DKC5−1のクラスタB(50)にあるスイッチモジュール53,54がDKC5−2のクラスタB(50)にあるキャッシュモジュール55と接続される。またDKC5−2のクラスタB(50)にあるスイッチモジュール53,54がDKC5−1のクラスタB(50)にあるキャッシュモジュール55と接続される。この構成によってDKC5−2のチャネルアダプタモジュール51とディスクアダプタモジュール52、DKC5−1のチャネルアダプタモジュール51とディスクアダプタモジュール52は、異なる装置のキャッシュモジュール55にアクセスが可能になる。この構成の利点は、DKC5−1,5−2の一方が稼動停止したとき他方のDKCによって動作継続できることと、DKC5−1のクラスタA(40)とDKC5−2のクラスタA(40)のAC供給が停止してもDKC5−1のクラスタB(50)とDKC5−2のクラスタB(50)によって動作継続できる点である。さらにDKC5−1のクラスタA(40)のスイッチモジュール43,44とDKC5−2のクラスタA(40)のキャッシュモジュール45とを接続し、DKC5−2のクラスタA(40)のスイッチモジュール43,44とDKC5−1のクラスタA(40)のキャッシュモジュール45とを相互に接続することも可能である。
【0037】
【発明の効果】
以上述べたように本発明のディスク制御装置によれば、チャネルアダプタモジュール及びディスクアダプタモジュールとキャッシュモジュールとの間に複数のスイッチモジュールを介入させて接続し、しかも複数段のスイッチモジュールを介入させて接続可能な構成としたので、従来の共通バスやピンネックの問題を回避でき、チャネルアダプタ及びディスクアダプタをほとんど無制限に増設可能である。このとき各モジュールに独立電源を設けたので、従来の供給電源能力の問題を回避できる。またモジュール間に転送するデータをモジュール間のケーブルアセンブリごと、データの転送方向ごとにチェックする障害検出機構を設けたこと、モジュール間のケーブル接続を監視する機構を設けたこと、および故障したモジュール及びそのモジュールへの接続線を閉塞し、他のモジュールの稼動を継続したまま部品交換ができることによって、信頼性、可用性、保守性のよいディスク制御装置を提供できる。
【図面の簡単な説明】
【図1】実施形態のディスク制御装置の構成を示す図である。
【図2】従来のディスクサブシステムの第1の構成例を示す図である。
【図3】従来のディスクサブシステムの第2の構成例を示す図である。
【図4】実施形態の障害検出関係についての装置の内部構成を示す図である。
【図5】実施形態のケーブル接続を監視する機構の構成を示す図である。
【図6】実施形態の他のディスク制御装置の構成図であり、モジュール増設の様子を示す図である。
【図7】実施形態のさらに他のディスク制御装置の構成を示す図である。
【符号の説明】
5:DKC、40:クラスタA、50:クラスタB、41,51:チャネルアダプタモジュール、42,52:ディスクアダプタモジュール、、43,44,53,54:スイッチモジュール、45,55:キャッシュモジュール、47,48:ケーブルアセンブリ[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a disk subsystem connected to a mainframe host computer, and more particularly to a disk controller having a module structure so that channel adapters and disk adapters can be easily added.
[0002]
[Prior art]
A disk subsystem connected to a mainframe host computer includes a disk control unit (DKC) and a disk unit (DKU). The disk controller includes a channel adapter that controls data transfer with a host computer via a channel interface, and a disk adapter that controls data transfer with the disk device via a disk interface. In order to obtain higher performance, recent disk control apparatuses have a plurality of channel adapters and a plurality of disk adapters, and a disk subsystem that executes data transfer between the host computer and the disk apparatus in parallel has become mainstream. .
[0003]
FIG. 2 is a diagram showing a first configuration example of a conventional disk subsystem. DKC2 and DKU3 each have a power source A (18) and a power source B (28) that supply AC power independently, and a component that receives power from each power source is called a cluster. In this example, the channel adapter 10, disk adapter 11, cache memory 14, and bus arbiters 15, 16 belong to cluster A (17), and channel adapter 20, disk adapter 21, cache memory 24, and bus arbiters 25, 26 belong to cluster B (27). ). It is possible to provide a plurality of channel adapters and a plurality of disk adapters for one cluster. One cache memory for each cluster is shared by the plurality of channel adapters and disk adapters, and temporarily stores data transferred between the host processor 1 and the DKU 3. The DKU 3 includes a plurality of disk drives 30 and is connected to the disk adapters 11 and 21 through disk interfaces. The DKU 3 may have a disk array configuration.
[0004]
Each adapter is connected to two sets of common buses 12 and 22, and the cache memories 14 and 24 are accessible from all the adapters. The common bus 12 is supplied with power by a power source A (18) and terminated by a terminator 13. The common bus 22 is supplied with power by a power source B (28) and terminated by a terminator 23. A bus arbiter 15 and a bus arbiter 25 are connected to the common bus 12 and arbitrate the bus access right of the common bus 12. A bus arbiter 16 and a bus arbiter 26 are connected to the common bus 22 and arbitrate the bus access right of the common bus 22. In this configuration example, the bus arbiter is duplicated and provided in the event of one failure. The common bus 12 and the common bus 22 are mounted on one platter (mother board).
[0005]
FIG. 3 is a diagram showing a second configuration example of a conventional disk subsystem. The disk subsystem of this configuration example includes a cluster A (17) that is supplied with the power source A (18) and a cluster B (27) that is supplied with the power source B (28). The channel adapter 10, the cache memory 14, and the disk adapter 11 belong to the cluster A (17), and the channel adapter 20, the cache memory 24, and the disk adapter 21 belong to the cluster B (27). As shown in the figure, the cache memories 14 and 24 are connected to both the channel adapters 10 and 20, and are connected to both the disk adapters 11 and 21, respectively. That is, two data transfer paths can be used between the channel adapters 10 and 20 and the disk adapters 11 and 21 via the cache memories 14 and 24.
[0006]
In each of the conventional configuration examples described above, each channel adapter, disk adapter, cache memory, and common bus are physically independent, and even if a failure occurs in any module or common bus, the failure site is blocked. Thus, data transfer between the host processor 1 and the DKU 3 can be continued in parallel with failure recovery measures such as component replacement.
[0007]
[Problems to be solved by the invention]
Conventionally, DKC has responded to the demand for higher performance and increased storage capacity of the disk subsystem by increasing the storage capacity of the cache memory and adding adapters. However, in the configuration shown in the first configuration example, the addition of adapters is restricted for the following reason. First, to increase the number of adapters, it is necessary to increase the size of the platter and lengthen the wiring of the common bus in order to secure the adapter mounting area. However, this increases the total wiring length of the bus and transmits bus signals. The characteristics deteriorate and high-speed transmission becomes impossible. Further, since a platter adapted to the maximum configuration is mounted on the disk control device, there is a disadvantage that the floor area of the device becomes large.
[0008]
Further, since many adapters are connected on the same bus, the failure rate of the bus increases. In addition, because of the common bus structure, the failure of the connection adapter that is not transferring data is propagated to the adapter that is actually transferring data, so it is very difficult to identify the failed part. In addition, when a plurality of clusters are provided in the disk controller, a module that receives the power supply and a common bus become unusable due to any power failure, and a bus arbiter that arbitrates the bus access right of the common bus. It becomes unusable. For example, since the common bus 22 becomes unusable in addition to the bus arbiters 25 and 26 when the power source B (28) is turned off, the bus arbiter 16 is also unusable.
[0009]
In the configuration shown in the second configuration example, in order to increase the number of adapters per cluster, it is necessary to increase the connection line between the channel adapter and the cache memory and the connection line between the disk adapter and the cache memory. The number of signal lines entering the cache memory is increased, and the increase in the number of adapters is limited due to restrictions of LSI pin necks and package connector pin necks. In addition, when one of the power supplies is turned off, only one data transfer path can be used between the channel adapter and the disk adapter. If higher reliability is required, the connection line between the channel adapter and the cache memory and the connection line between the disk adapter and the cache memory must be increased by a factor of two or more. Expansion is limited. Furthermore, since there is a limit to the number of adapters that can be supplied by one power supply, it is necessary to provide a power supply that can supply the power consumption and total current when the maximum configuration is assumed. Limited.
[0010]
An object of the present invention is to provide a disk control device with high reliability, availability, and maintainability in which channel adapters and disk adapters can be added almost without limitation.
[0011]
[Means for Solving the Problems]
The present invention includes a plurality of channel adapter modules that control data transfer with an external channel, a plurality of disk adapter modules that control data transfer with a disk, a cache memory, the channel adapter module, and the At least one cache module accessed from the disk adapter module and connected to the channel adapter module and the disk adapter module by a connection line, and connected to the cache module and between any of the adapter modules and the cache module A disk controller having at least one switch module for setting a transmission path, wherein either one of the channel adapter module and the disk adapter module is a specific cache module; Wherein the disk control apparatus configured capable of setting a plurality of paths for the data transfer between the modules.
[0012]
The present invention also provides a plurality of channel adapter modules that control data transfer to and from external channels and each have an independent power source, and a plurality of disk adapter modules that control data transfer to and from the disk and each have an independent power source, A cache module having a cache memory and having an independent power source accessed from the channel adapter module and the disk adapter module, and connected to the channel adapter module and the disk adapter module by a connection line, and connected to the cache module. A set of modules having an AC power supply from an independent AC supply source, each of which has at least one switch module having an independent power source and a transmission path between the adapter module and the cache module. And composed of a plurality of clusters, and wherein the disk control unit having the structure connected by the the said switch modules belonging to one cluster and cache modules belonging to the cache module and other clusters of belonging the cluster connection line.
[0013]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below with reference to the drawings.
[0014]
FIG. 1 is a diagram showing the configuration of the DKC 5 of this embodiment. The DKC 5 includes a cluster A (40) and a cluster B (50) that are separated by the AC supply sources 49 and 59. The cluster A (40) includes a channel adapter module 41, a disk adapter module 42, switch modules 43 and 44, and a cache module 45. The cluster B (50) includes a channel adapter module 51, a disk adapter module 52, switch modules 53 and 54, and a cache module 55. The channel adapter module 41 and the switch module 43 of the cluster A (40) are connected to each channel adapter module 41 by a maximum of four cable assemblies 47, and the switch module 43 and the cache module 45 are connected to one cable assembly. 48 is connected. The channel adapter module 41 and the disk adapter module 42 are connected to the switch module 43 and the switch module 44, respectively, and the cache module 45 is connected to the switch modules 43, 44, 53, and 54. The same applies to the cluster B (50). Up to four channel adapter modules 41 and 51 and disk adapter modules 42 and 52 can be mounted for each switch module. Each of the switch modules 43, 44, 53, and 54 has a selector on the input side and the output side, and selects one of the eight input lines and two of the output lines to select the channel adapter. A data transfer path is formed with the cache module. Each module has an individual power supply 46 mounted thereon. Since there is no common bus connecting each module, there is no platter, and there is no common power supply between modules, so there are no restrictions on power consumption and total current. 41 and 51 and the disk adapter modules 42 and 52 can be added almost unlimitedly.
[0015]
The operation of the DKC 5 when data is transferred from the host processor 1 to the cache memory and double-written to the cache modules 45 and 55 will be described below. The channel adapter module 41 receives the data transferred from the host processor 1, temporarily stores it in the built-in buffer, and issues a transfer request to the switch module 43. The switch module 43 arbitrates transfer requests from other channel adapter modules 41 and disk adapter modules 42. The switch module 43 grants transfer permission to the channel adapter module 41 when data transfer paths are secured between the channel adapter module 41 and the switch module 43, between the switch module 43 and the cache module 45, and between the switch module 43 and the cache module 55. Issue. The channel adapter module 41 immediately transfers data to the switch module 43 via the cable assembly 47. Data can be transferred to the cache module 45 and the cache module 55 without buffering the transfer data inside the switch module 43. When the cache module 45 and the cache module 55 have received all the data to be transferred, the cache module 45 and the cache module 55 send a data transfer end signal to the switch module 43. The switch module 43 terminates the use of the data transfer path for the channel adapter module 41 in accordance with these notifications.
[0016]
For example, when the power supply from the AC supply source 59 is stopped, the channel adapter module 51, the disk adapter module 52, the switch modules 53 and 54, and the cache module 55 belonging to the cluster B (50) stop operating. On the other hand, the modules belonging to cluster A (40) receiving power supply from the AC supply source 49 continue to operate in the data read / write mode of only the cache module 45. Even when a failure occurs in the cable assembly 47, the switch module 43, or the cable assembly 48, the channel adapter module 41 can access the cache module 45 via the switch module 44.
[0017]
Table 1 shows the number of connection adapters and channel adapters when the cluster is down for the method of the present invention shown in FIG. 1, the first configuration example shown in FIG. 2, and the second configuration example shown in FIG. 6 is a table for comparing the number of available paths between cache memories. As can be seen from this table, the DKC according to the present invention is excellent in the expandability and reliability of the adapter.
[0018]
[Table 1]
Figure 0003653197
[0019]
FIG. 4 is a diagram showing the internal configuration of the fault detection and data protection relationship of the channel adapter module 41, the switch module 43, and the cache module 45.
[0020]
The switch module 43 includes a selector 61, a selector 62, a failure detector 63, a failure detector 64, and an arbitration unit 68. The same applies to the switch modules 44, 53, and 54. The cache module 45 includes a failure detector 65, a failure detector 66, a data write protection unit 69, and a cache memory 70. The same applies to the cache module 55. The channel adapter module 41 has a failure detector 67. The same applies to the channel adapter module 51 and the disk adapter modules 42 and 52. One cable of the cable assembly 47 accommodates the data line 90 and the control lines 81, 83, 84, 91, 92. The cable assembly 48 accommodates the data line 90 and the control lines 82 and 84. The failure detector 64 is transferred from the channel adapter module 41 to the cache module 45, the failure detector 65 is transferred to the cache module 45, and the failure detector 63 is transferred from the cache module 45 to the channel adapter module 41. The data / failure detector 67 checks the data transferred to the channel adapter module 41. The channel adapter module 41 incorporates a microprocessor and receives a fault interrupt signal detected by the channel adapter module 41 to identify a fault location.
[0021]
When the channel adapter module 41 receives data from the host processor 1, it adds a data guarantee code such as horizontal parity and vertical parity to the received data and stores it in the built-in buffer, and sends it to the switch module 43 via the control line 91. Issue a transfer request. The arbitration unit 68 of the switch module 43 issues a transfer permission via the control line 92 when the data transfer path to the cache module 45 is secured. The channel adapter module 41 immediately transfers data to the switch module 43 via the data line 90. The selectors 61 and 62 select the data line 90, and the data passes through the selector 61 and the selector 62 and is transferred to the cache module 45. The data is checked by the failure detector 64 between the selector 61 and the selector 62 for a data guarantee code. The failure detector 65 of the cache module 45 checks the data guarantee code of the transferred data, and if there is no failure, it is written in the cache memory 70.
[0022]
When an error occurs in the data transferred from the channel adapter module 41 to the switch module 43 due to the failure of the cable assembly 47, the failure detector 64 checks the data guarantee code of the transferred data to detect the failure, The fault detection is reported to the fault detector 65 of the cache module 45 via the control line 82. The failure detector 65 checks the data guarantee code of the data transferred from the switch module 43, but requests the data write protection unit 69 to inhibit data write regardless of whether or not a failure is detected. The data write protector 69 suppresses writing of data that may have an error.
[0023]
For example, when not only the cable assembly 47 but also the cable assembly 48 fails, a multi-bit error exceeding the detection capability of the data guarantee code occurs in the transfer data, and the failure detector 65 cannot detect this error. There is. This failure detection function can prevent erroneous data from being written to the cache memory 70. In this way, the failure detector 64 is provided in the switch module 43, and an error in data transferred from the channel adapter module 41 to the cache module 45 via the cable assembly 47, the switch module 43 and the cable assembly 48 is checked, and the failure is detected. It is important from the aspect of reliability to perform write protection of the data.
[0024]
When the channel adapter module 41 accesses the cache module 45 and transfers data, the cache module 45 returns a response to the channel adapter module 41 via the data line 90. When there is no response from the cache module 45 within a predetermined time, the channel adapter module 41 considers that there is no response and sends an interrupt signal to the microprocessor. The failure part that caused the non-response may be the cable assembly 47, the switch module 43, the cable assembly 48, or the cache module 45 on the access path to the cache module 45.
[0025]
In the DKC configuration in which the switch module 44 exists, the failure site can be specified by the following procedure. When the microprocessor of the channel adapter module 41 knows no access response by the failure interrupt signal, the failure detector 64 in the switch module 43, the failure detector 65 in the cache module 45, and the failure detection are performed along the path through the switch module 44. The detection information of the detector 63 is collected, and the detection information of the failure detector 67 is obtained. Since the data and the response signal flow in the order of the channel adapter module 41 to the switch module 43, the cache module 45, the switch module 43, and the channel adapter module 41, the failure detection of the data is performed by the failure detector 64, the failure detector 65, The detection is performed in the order of the detector 63 and the failure detector 67. Therefore, it can be seen that the part in front of the detector that first detected the failure is broken.
[0026]
Further, since the channel adapter module 41 is connected to the failure detector 63, the failure detector 64, and the failure detector 65 by the control line 81 and the control lines 83 and 84, respectively, the DKC configuration or the switch module in which the switch module 44 does not exist. In the case where the failure information of the detector cannot be collected via 44, the failure site can be identified from the failure information obtained from the failure detector 64, the failure detector 65, the failure detector 63, and the failure detector 67.
FIG. 5 is a diagram showing a cable for connecting each module and a mechanism for monitoring the cable connection. The channel adapter module 41 has a connection confirmation unit 101 corresponding to the cable connection with the switch modules 43 and 44. The switch module 43 has a cable enable output unit 102 corresponding to the cable connection with each channel adapter module 41 and the disk adapter module 42. Further, the switch module 43 has a connection confirmation unit 103 corresponding to the cable connection with the cache modules 45 and 55. The cache module 45 has a cable enable output unit 102 corresponding to the cable connection with each switch module 43, 44, 53, 54. The connection confirmation unit 101 includes a configuration information check 113, a signal check 114, and a pull-up resistor 115. The cable enable output unit 102 includes an output driver 111 and a cable enable control 112. The control line 116 is a signal line that connects the connection confirmation unit 101 and the cable enable output unit 102.
[0027]
When the power of the switch module 43 is turned on, the cable enable control 112 of the cable enable output unit 102 fixes the cable enable signal on the control line 116 to the LOW level. The connection confirmation unit 101 of the channel adapter module 41 monitors the signal level by the signal check 114. When the cable assembly 47 fails or the connector 20 is disconnected, the cable enable signal is disconnected from the cable enable control 112 of the drive source, and is fixed at the HIGH level by the pull-up resistor 115 of the connection confirmation unit 101. The signal check 114 detects that the signal has become HIGH level and reports it to the configuration information check 113. The configuration information check 113 compares with the LOW data set in advance, detects that the path that should have been connected because it does not match the expected LOW data, and detects in the channel adapter module 41 Report to the failure processing unit 130. The failure processing unit 130 reports a failure to the microprocessor that controls the channel adapter module 41. The microprocessor logically closes the path of the cable assembly 47 in which an abnormality has occurred due to the execution of the control program.
[0028]
The connection confirmation unit 103 of the switch module 43 includes a failure processing unit 130 in addition to the configuration information check 113, the signal check 114, and the pull-up resistor 115, and is similar to the cable enable output unit 102 of the cache module 45. Monitor cable connections. When the connection confirmation unit 103 detects the opening of the cable assembly 48, it reports a failure to the microprocessor of the channel adapter module 41. The channel adapter module 41 logically blocks the path of the cable assembly 48 where the fault has occurred.
[0029]
Similar cable connection monitoring is possible even if the cable enable output unit 102 is provided in the switch module 43 and the opposing connection confirmation unit 103 is provided in the cache module 45.
[0030]
The DKC 5 always performs the above-described cable connection monitoring while the apparatus is operating, and prevents failures that occur during data transfer and data corruption due to failures.
[0031]
The DKC 5 can take many configuration patterns from a small-scale configuration to a large-scale configuration depending on the number of installed modules and combinations thereof. Therefore, a table for managing the device configuration is provided in DKC5, the paths between installed modules are set, and the connection status of each path is checked when the device is turned on after DKC5 is powered on. By doing so, it can be checked whether or not the operating device configuration matches the configuration set in the configuration management table.
[0032]
FIG. 6 is a diagram showing another configuration of the DKC 5, and is a configuration diagram when modules are further added to the configuration shown in FIG. In this example, four channel adapter modules 151, four disk adapter modules 152, and switch modules 153 and 154 are added to the DKC 5 shown in FIG. The extension procedure is described below.
[0033]
The channel adapter module 51 and the disk adapter module 52 of the cluster B (50) access the cache module 45 and the cache module 55 via the switch module 53 and the switch module 54. First, the channel adapter module 151, the disk adapter module 152, the switch module 153, and the switch module 154 to be added are mounted on the DKC6 device, the added modules are connected by the cable assembly 47, and the individual power supply of each module is turned on. . The microprocessor in the added module waits until a path diagnosis request is received from the already operating module.
[0034]
The switch module 53 is connected to the channel adapter module 51, the disk adapter module 52, the cache module 45, and the cache module 55 that can use the switch module 53 in accordance with instructions from the microprocessor in the channel adapter module 51 or the disk adapter module 52. A logical block instruction is issued, and access to the cache modules 45 and 55 via the switch module 53 is prohibited. With this logical block instruction, each module inhibits the function of the connection confirmation mechanism that monitors the cable connection with the switch module 53, and inhibits the function of the failure detection mechanism that checks the transfer data. Next, the connector on the switch module 53 side of the cable assembly between the switch module 53 and the cache module 45 is pulled out and connected to the switch module 153 to be added. Similarly, the connector on the switch module 53 side of the cable assembly between the switch module 53 and the cache module 55 is pulled out and connected to the switch module 154 to be added. The switch module 53 and the switch module 153 are connected to each other, and the switch module 53 and the switch module 154 are connected to each other by a cable assembly. As a result, the channel adapter module 51 and the disk adapter module 52 form physical paths to the cache module 45 and the cache module 55 via the switch module 53, the switch module 153, and the switch module 154. The microprocessor of the channel adapter module 51 or the disk adapter module 52 diagnoses the added path, confirms that the path is logically connected, and then opens the path to the other channel adapter module 51, the disk adapter. The module 52, the switch module 53, the switch module 153, the switch module 154, the cache module 45, and the cache module 55 are notified, and the cache modules 45 and 55 can be accessed via the added path. In the same procedure, the switch module 54 is closed, the cable is replaced, and the cable is added to perform physical path addition and path diagnosis. The above expansion processing and expansion work can be performed while continuing access to the cache modules 45 and 55.
[0035]
The above embodiment was accompanied by the addition of the channel adapter module 151 and the disk adapter module 152, but is also applied to the path diagnosis after the blockage, replacement, and recovery of the failed module and the connected cable assembly, A series of processes and operations can be executed while continuing to access the cache module. The present invention is also applied to failure recovery when the cluster operation is stopped when the AC power supply system is stopped.
[0036]
FIG. 7 is a diagram illustrating another configuration of the DKC 5. The system is composed of DKC5-1 and DKC5-2, which are independent disk control devices, and these device housings are connected by a cable assembly 200. The switch modules 53 and 54 in the cluster B (50) of the DKC 5-1 are connected to the cache module 55 in the cluster B (50) of the DKC 5-2. Further, the switch modules 53 and 54 in the cluster B (50) of the DKC5-2 are connected to the cache module 55 in the cluster B (50) of the DKC5-1. With this configuration, the channel adapter module 51 and the disk adapter module 52 of the DKC 5-2 and the channel adapter module 51 and the disk adapter module 52 of the DKC 5-1 can access the cache module 55 of different devices. The advantage of this configuration is that when one of the DKCs 5-1 and 5-2 is stopped, the operation can be continued by the other DKC, and the AC of the cluster A (40) of the DKC5-1 and the cluster A (40) of the DKC5-2. Even if the supply is stopped, the operation can be continued by the cluster B (50) of the DKC5-1 and the cluster B (50) of the DKC5-2. Further, the switch modules 43 and 44 of the cluster A (40) of the DKC5-1 are connected to the cache module 45 of the cluster A (40) of the DKC5-2, and the switch modules 43 and 44 of the cluster A (40) of the DKC5-2 are connected. And the cache module 45 of the cluster A (40) of the DKC 5-1 can be connected to each other.
[0037]
【The invention's effect】
As described above, according to the disk control device of the present invention, a plurality of switch modules are interposed and connected between the channel adapter module and the disk adapter module and the cache module, and a plurality of stages of switch modules are interposed. Since it is configured to be connectable, the conventional common bus and pin neck problems can be avoided, and channel adapters and disk adapters can be added almost unlimitedly. At this time, since an independent power supply is provided for each module, the problem of the conventional power supply capability can be avoided. In addition, a failure detection mechanism for checking data to be transferred between modules for each cable assembly between the modules and for each data transfer direction, a mechanism for monitoring the cable connection between the modules, a failed module, and A disk control device with good reliability, availability, and maintainability can be provided by closing a connection line to the module and exchanging parts while continuing to operate other modules.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating a configuration of a disk control device according to an embodiment.
FIG. 2 is a diagram illustrating a first configuration example of a conventional disk subsystem.
FIG. 3 is a diagram illustrating a second configuration example of a conventional disk subsystem.
FIG. 4 is a diagram illustrating an internal configuration of a device regarding a failure detection relationship according to the embodiment.
FIG. 5 is a diagram illustrating a configuration of a mechanism for monitoring cable connection according to the embodiment.
FIG. 6 is a configuration diagram of another disk control device according to the embodiment, and shows how a module is added.
FIG. 7 is a diagram illustrating a configuration of still another disk control device according to the embodiment.
[Explanation of symbols]
5: DKC, 40: cluster A, 50: cluster B, 41, 51: channel adapter module, 42, 52: disk adapter module, 43, 44, 53, 54: switch module, 45, 55: cache module, 47 48: Cable assembly

Claims (6)

外部チャネルとの間のデータ転送を制御する複数のチャネルアダプタモジュールと、ディスクとの間のデータ転送を制御する複数のディスクアダプタモジュールと、キャッシュメモリを有し該チャネルアダプタモジュール及び該ディスクアダプタモジュールからアクセスされる少なくとも1つのキャッシュモジュールと、接続線によって該チャネルアダプタモジュール及び該ディスクアダプタモジュールと接続するとともに、該キャッシュモジュールと接続しいずれかのアダプタモジュールと該キャッシュモジュールとの間の伝送路を設定する複数のスイッチモジュールと、を有し、
前記複数のチャネルアダプタモジュールと、前記複数のディスクアダプタモジュールと、前記複数のスイッチモジュールと、は、独立した電力供給元により電源分離された複数のクラスタの何れかに属し、前記複数のクラスタの何れかに属する前記チャネルアダプタモジュールと、前記ディスクアダプタモジュールと、は、前記クラスタに属する第1のスイッチモジュール又は、第2のスイッチモジュールを介して、特定の前記キャッシュモジュールにデータ転送のための複数のパスを設定可能であることを特徴とするディスク制御装置。
A plurality of channel adapter modules for controlling data transfer to and from an external channel; a plurality of disk adapter modules for controlling data transfer to and from a disk; and a cache memory having the channel adapter module and the disk adapter module At least one cache module to be accessed is connected to the channel adapter module and the disk adapter module by a connection line, and connected to the cache module to set a transmission path between any adapter module and the cache module A plurality of switch modules ,
The plurality of channel adapter modules, the plurality of disk adapter modules, and the plurality of switch modules belong to any one of a plurality of clusters that are separated from each other by an independent power supply source. The channel adapter module and the disk adapter module belong to a plurality of specific cache modules via the first switch module or the second switch module belonging to the cluster. A disk controller characterized in that a path can be set .
外部チャネルとの間のデータ転送を制御し各々独立電源を有する複数のチャネルアダプタモジュールと、ディスクとの間のデータ転送を制御し各々独立電源を有する複数のディスクアダプタモジュールと、キャッシュメモリを有し該チャネルアダプタモジュール及び該ディスクアダプタモジュールからアクセスされ独立電源を有するキャッシュモジュールと、接続線によって該チャネルアダプタモジュール及び該ディスクアダプタモジュールと接続するとともに、該キャッシュモジュールと接続しいずれかのアダプタモジュールと該キャッシュモジュールとの間の伝送路を設定し各々独立電源を有する複数のスイッチモジュールとを有し、モジュールの集合を1つのクラスタとし、独立の電力供給元から電力供給を受け、電源分離された複数のクラスタで構成し、1つのクラスタに属する前記複数のスイッチモジュールとその属するクラスタ内のキャッシュモジュール及び他クラスタに属するキャッシュモジュールとを接続線によって相互に接続した構成を有するディスク制御装置。A plurality of channel adapter modules that control data transfer to and from the external channel and each have an independent power supply, a plurality of disk adapter modules that control data transfer to and from the disk and each have an independent power supply, and a cache memory A cache module that is accessed from the channel adapter module and the disk adapter module and has an independent power source; and is connected to the channel adapter module and the disk adapter module by a connection line; and a plurality of switch modules each having an independent power supply to set the transmission path between the cache module, a set of modules and one cluster receives power supply from an independent power supply source, a plurality which are separate power supplies Constitute a cluster, the disk controller having a plurality of switch modules belonging to one cluster, and cache modules belonging to the cache module and other clusters in the belonging cluster, the configuration connected to each other by a connecting line. 該スイッチモジュール内に該チャネルアダプタモジュール及び該ディスクアダプタモジュールの1つから当該スイッチモジュールに転送されるデータの誤りを検出する第1の障害検出器と、該キャッシュモジュールから当該スイッチモジュールに転送されるデータの誤りを検出する第2の障害検出器とを設け、該キャッシュモジュール内に該スイッチモジュールから該キャッシュモジュールに転送されるデータの誤りを検出する第3の障害検出器を設け、該チャネルアダプタモジュール及び該ディスクアダプタモジュールの1つに該スイッチモジュールから当該のチャネルアダプタモジュール及びディスクアダプタモジュールの1つに転送されるデータの誤りを検出する第4の障害検出器を設けたことを特徴とする請求項1又は請求項2記載のディスク制御装置。  A first failure detector for detecting an error in data transferred from one of the channel adapter module and the disk adapter module to the switch module in the switch module, and transferred from the cache module to the switch module A second fault detector for detecting an error in the data, and a third fault detector for detecting an error in the data transferred from the switch module to the cache module in the cache module. One of the module and the disk adapter module is provided with a fourth fault detector for detecting an error in data transferred from the switch module to one of the channel adapter module and the disk adapter module. Claim 1 or claim 2 Disk controller. 該スイッチモジュール内にケーブル接続確認のための第1の信号を出力する機構を設け、接続線を介して該チャネルアダプタモジュール及び該ディスクアダプタモジュールの1つに第1の信号を検出する機構を設け、該キャッシュモジュールと該スイッチモジュールの一方にケーブル接続確認のための第2の信号を出力する機構を設け、接続線を介して該キャッシュモジュールと該スイッチモジュールの他方に第2の信号を検出する機構を設けたことを特徴とする請求項1又は請求項2記載のディスク制御装置。A mechanism for outputting a first signal for the cable connection confirmation in the switch module, a mechanism for detecting the first signal to one of the channel adapter module and the disk adapter module via the connection line provided a mechanism for outputting a second signal for one to the cable connection confirmation of the cache module and the switch module, the second signal to the other of the cache module and the switch module through the connection line 3. The disk control device according to claim 1, further comprising a detection mechanism. 前記ディスク制御装置中に閉塞すべきモジュールが生じたとき、前記チャネルアダプタモジュール及びディスクアダプタモジュールの1つから接続線によって該モジュールと接続する他のすべてのモジュールへ該モジュールの閉塞指令を発行し、該モジュール及び該モジュールから他モジュールへの伝送路を閉塞することを特徴とする請求項1又は請求項2記載のディスク制御装置。  When a module to be blocked occurs in the disk controller, issue a block command for the module from one of the channel adapter module and the disk adapter module to all other modules connected to the module through a connection line; 3. The disk control apparatus according to claim 1, wherein the module and a transmission path from the module to another module are closed. 前記キャッシュモジュールは、前記キャッシュメモリに転送されるデータの書き込みを保護するデータライト保護部を有し、  The cache module has a data write protector that protects writing of data transferred to the cache memory,
前記第1の障害検出部からデータの誤りについて障害検出を報告する場合、前記第3の障害検出部は、前記障害検出の報告を受け、前記データライト保護部に前記データを前記キャッシュメモリに書き込むことを防止するよう要求することを特徴とする請求項3記載のディスク制御装置。  When reporting a failure detection for a data error from the first failure detection unit, the third failure detection unit receives the failure detection report and writes the data into the cache memory in the data write protection unit 4. The disk control apparatus according to claim 3, wherein the disk control apparatus is requested to prevent this.
JP20112999A 1999-07-15 1999-07-15 Disk controller Expired - Fee Related JP3653197B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20112999A JP3653197B2 (en) 1999-07-15 1999-07-15 Disk controller

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20112999A JP3653197B2 (en) 1999-07-15 1999-07-15 Disk controller

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2004241793A Division JP2005004791A (en) 2004-08-23 2004-08-23 Disk controller

Publications (2)

Publication Number Publication Date
JP2001027972A JP2001027972A (en) 2001-01-30
JP3653197B2 true JP3653197B2 (en) 2005-05-25

Family

ID=16435900

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20112999A Expired - Fee Related JP3653197B2 (en) 1999-07-15 1999-07-15 Disk controller

Country Status (1)

Country Link
JP (1) JP3653197B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003256147A (en) * 2002-02-28 2003-09-10 Hitachi Ltd Cluster type disk array device and operation method for cluster type disk array device
JP2005115771A (en) 2003-10-09 2005-04-28 Hitachi Ltd Disk array system
EP2296085B1 (en) 2004-11-30 2013-05-15 Fujitsu Limited Data storage system and capacity changing method
JP4486921B2 (en) 2005-12-09 2010-06-23 富士通株式会社 Storage virtualization apparatus and computer system using the same
JP4414399B2 (en) 2006-01-30 2010-02-10 富士通株式会社 Disk controller
JP4982304B2 (en) 2007-09-04 2012-07-25 株式会社日立製作所 Storage system that understands the occurrence of power failure

Also Published As

Publication number Publication date
JP2001027972A (en) 2001-01-30

Similar Documents

Publication Publication Date Title
JP3264465B2 (en) Storage system
US6338110B1 (en) Partitioning of storage channels using programmable switches
US20070076321A1 (en) Data storage system, data storage control device, and failure location diagnosis method thereof
WO2003030006A1 (en) Controller data sharing using a modular dma architecture
WO2003036484A1 (en) Bus zoning in a channel independent storage controller architecture
JP4132322B2 (en) Storage control device and control method thereof
US20020199040A1 (en) High speed communications device/system
JP2004199551A (en) Storage system and method for isolating defective storage device
US7487293B2 (en) Data storage system and log data output method upon abnormality of storage control apparatus
US7143306B2 (en) Data storage system
JP3653197B2 (en) Disk controller
JP2005004791A (en) Disk controller
US8429462B2 (en) Storage system and method for automatic restoration upon loop anomaly
US7426658B2 (en) Data storage system and log data equalization control method for storage control apparatus
US7293198B2 (en) Techniques for maintaining operation of data storage system during a failure
JP3742405B2 (en) Storage system
JP2007200357A (en) Disk control device
JP3547411B2 (en) Storage system
JPH11353776A (en) Disk array controller
US10762026B2 (en) Information processing apparatus and control method for suppressing obstacle
JPH03160529A (en) Duplex computer system
JP2004303256A (en) Storage system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040622

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040823

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050225

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090304

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100304

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110304

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110304

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120304

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130304

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130304

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140304

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees