JP2905373B2 - ディスク制御装置及びその制御方法 - Google Patents
ディスク制御装置及びその制御方法Info
- Publication number
- JP2905373B2 JP2905373B2 JP5246650A JP24665093A JP2905373B2 JP 2905373 B2 JP2905373 B2 JP 2905373B2 JP 5246650 A JP5246650 A JP 5246650A JP 24665093 A JP24665093 A JP 24665093A JP 2905373 B2 JP2905373 B2 JP 2905373B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- failure
- recovery
- adapter
- disk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0775—Content or structure details of the error report, e.g. specific table structure, specific error fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0727—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0745—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in an input/output transactions management context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/10—Program control for peripheral devices
- G06F13/12—Program control for peripheral devices using hardware independent of the central processor, e.g. channel or peripheral processor
- G06F13/122—Program control for peripheral devices using hardware independent of the central processor, e.g. channel or peripheral processor where hardware performs an I/O function other than control of data transfer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/382—Information transfer, e.g. on bus using universal interface adapter
- G06F13/387—Information transfer, e.g. on bus using universal interface adapter for adaptation of different data processing systems to different peripheral devices, e.g. protocol converters for incompatible systems, open system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
- G06F3/0613—Improving I/O performance in relation to throughput
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0659—Command handling arrangements, e.g. command buffers, queues, command scheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0673—Single storage device
- G06F3/0674—Disk device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0656—Data buffering arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0673—Single storage device
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Debugging And Monitoring (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
【0001】
【産業上の利用分野】本発明はディスク制御装置及びそ
の制御方法に係わり、特に、上位装置とのインターフェ
ースを司るチャネルアダプタとI/Oデバイスとのイン
ターフェースを司るデバイスアダプタと全体の資源管理
及び処理動作に関する制御を行うリソースマネージャと
を備えたディスク制御装置及びその制御方法に関する。
の制御方法に係わり、特に、上位装置とのインターフェ
ースを司るチャネルアダプタとI/Oデバイスとのイン
ターフェースを司るデバイスアダプタと全体の資源管理
及び処理動作に関する制御を行うリソースマネージャと
を備えたディスク制御装置及びその制御方法に関する。
【0002】
【従来の技術】近年、情報処理装置に対する処理効率の
向上が求められている。例えば、磁気ディスク制御装置
において、チャネルインターフェース処理やデバイスイ
ンターフェース処理等複数のインターフェース処理を1
つのプロセッサで行うとすれば、処理手順がシーケンシ
ャルにならざるを得ず、処理効率に限界がある。また、
かかる1つのプロセッサ構成のディスク制御装置では、
機能変更や追加等が必要になると、全て設計しなおさな
くてはならない問題がある。このため、機能単位にモジ
ュール化し、各モジュールを共通バスに結合させ、モジ
ュールの組み合わせにより全体的に所望の機能を実行す
るようにディスク制御装置を構成することが行われてい
る。各モジュールはプロセッサを備え、それぞれの機能
に応じたマイクロプログラムに従って自分に割り当てら
れた機能を実行する。かかる構成のディスク制御装置に
よれば、処理を各モジュールに分散できるため処理効率
を向上でき、しかも、機能の追加、変更に際しては必要
なモジュールの追加、あるいは関係するモジュールの変
更だけで対応でき、簡単に新たなディスク制御装置を構
築することができる。
向上が求められている。例えば、磁気ディスク制御装置
において、チャネルインターフェース処理やデバイスイ
ンターフェース処理等複数のインターフェース処理を1
つのプロセッサで行うとすれば、処理手順がシーケンシ
ャルにならざるを得ず、処理効率に限界がある。また、
かかる1つのプロセッサ構成のディスク制御装置では、
機能変更や追加等が必要になると、全て設計しなおさな
くてはならない問題がある。このため、機能単位にモジ
ュール化し、各モジュールを共通バスに結合させ、モジ
ュールの組み合わせにより全体的に所望の機能を実行す
るようにディスク制御装置を構成することが行われてい
る。各モジュールはプロセッサを備え、それぞれの機能
に応じたマイクロプログラムに従って自分に割り当てら
れた機能を実行する。かかる構成のディスク制御装置に
よれば、処理を各モジュールに分散できるため処理効率
を向上でき、しかも、機能の追加、変更に際しては必要
なモジュールの追加、あるいは関係するモジュールの変
更だけで対応でき、簡単に新たなディスク制御装置を構
築することができる。
【0003】図2は機能毎にモジュール化して構成され
たI/Oサブシステム(磁気ディスク装置)の構成図で
あり、1はホスト装置(CPU)、2a,2bはチャネ
ル装置、3はI/Oサブシステム(磁気ディスク制御装
置)、4a〜4dはI/Oデバイスとしての磁気ディス
ク装置である。I/Oサブシステムにおいて、5a,5
bは上位装置とのインターフェースを司る複数の上位イ
ンターフェース装置(チャネルアダプタ)、6a,6b
はI/Oデバイスとのインターフェースを司る複数の下
位インターフェース装置(デバイスアダプタ)、7は全
体の資源管理及び処理動作に関する制御を行う全体管理
部(リソースマネージャ)、8は資源管理に必要な各種
テーブルを記憶するテーブル記憶部であり、チャネルア
ダプタ、デバイスアダプタ、リソースマネージャは内部
バス9により相互にデータ授受可能に接続されている。
たI/Oサブシステム(磁気ディスク装置)の構成図で
あり、1はホスト装置(CPU)、2a,2bはチャネ
ル装置、3はI/Oサブシステム(磁気ディスク制御装
置)、4a〜4dはI/Oデバイスとしての磁気ディス
ク装置である。I/Oサブシステムにおいて、5a,5
bは上位装置とのインターフェースを司る複数の上位イ
ンターフェース装置(チャネルアダプタ)、6a,6b
はI/Oデバイスとのインターフェースを司る複数の下
位インターフェース装置(デバイスアダプタ)、7は全
体の資源管理及び処理動作に関する制御を行う全体管理
部(リソースマネージャ)、8は資源管理に必要な各種
テーブルを記憶するテーブル記憶部であり、チャネルア
ダプタ、デバイスアダプタ、リソースマネージャは内部
バス9により相互にデータ授受可能に接続されている。
【0004】磁気ディスク装置の各トラック上にはCK
D形式(CKDフォーマット)に従ってデータが記憶さ
れている。図3はCKDフォーマットデータの説明図で
ある。トラック上には、ギャップで区切ったいくつかの
領域があり、先頭にはインデックスマークが付されてい
る。HAはホームアドレス領域であり、自分自身が存在
するトラックのアドレスを記述する領域であり、インデ
ックスマークの後に設けられている。ホームアドレス領
域の後にはカウント領域C、キー領域K、データ領域D
で構成されるレコードR0,R1,R2,・・・が複数
個書かれている。カウンタ領域Cには、トラックアドレ
ス(CCHH、CC:シリンダアドレス、HH:ヘッド
番号)、レコード番号R及び後に続くキー領域、データ
領域の長さなどが書かれている。従って、トラックアド
レスとレコード番号を指定することにより、個々のレコ
ードを指定することができる。キー領域Kには検索のた
めのキーが書かれるが必ずしも必要ではない。データ領
域Dには、ユーザデータが書かれている。
D形式(CKDフォーマット)に従ってデータが記憶さ
れている。図3はCKDフォーマットデータの説明図で
ある。トラック上には、ギャップで区切ったいくつかの
領域があり、先頭にはインデックスマークが付されてい
る。HAはホームアドレス領域であり、自分自身が存在
するトラックのアドレスを記述する領域であり、インデ
ックスマークの後に設けられている。ホームアドレス領
域の後にはカウント領域C、キー領域K、データ領域D
で構成されるレコードR0,R1,R2,・・・が複数
個書かれている。カウンタ領域Cには、トラックアドレ
ス(CCHH、CC:シリンダアドレス、HH:ヘッド
番号)、レコード番号R及び後に続くキー領域、データ
領域の長さなどが書かれている。従って、トラックアド
レスとレコード番号を指定することにより、個々のレコ
ードを指定することができる。キー領域Kには検索のた
めのキーが書かれるが必ずしも必要ではない。データ領
域Dには、ユーザデータが書かれている。
【0005】かかるI/Oサブシステムによれば、以下
のようにデータの書き込み、読み出しが行われる。尚、
I/Oサブシステムを磁気ディスク制御装置DCUとし
て説明する。図4はデータ書き込み時のシーケンス説明
図である。チャネル装置(CH)2a〜2bよりシーク
コマンドSKが発生すると、磁気ディスク制御装置(D
CU)3は磁気ディスク装置4a〜4dにシーク動作さ
せることなくコマンド待ち行列にキューイングし、しか
る後、あたかもシーク動作が終了したように見せ掛けて
動作終了信号をチャネル装置CHに返す。キューイング
する理由は、磁気ディスク装置では位置付け時間や回転
待ち時間があるため、複数の位置付けコマンド(シー
ク、セットセクタ等)をキューイングしておき、サーチ
IDコマンドを受信した時にキューイングしてあるコマ
ンド一気に実行して高速化を図るためである。
のようにデータの書き込み、読み出しが行われる。尚、
I/Oサブシステムを磁気ディスク制御装置DCUとし
て説明する。図4はデータ書き込み時のシーケンス説明
図である。チャネル装置(CH)2a〜2bよりシーク
コマンドSKが発生すると、磁気ディスク制御装置(D
CU)3は磁気ディスク装置4a〜4dにシーク動作さ
せることなくコマンド待ち行列にキューイングし、しか
る後、あたかもシーク動作が終了したように見せ掛けて
動作終了信号をチャネル装置CHに返す。キューイング
する理由は、磁気ディスク装置では位置付け時間や回転
待ち時間があるため、複数の位置付けコマンド(シー
ク、セットセクタ等)をキューイングしておき、サーチ
IDコマンドを受信した時にキューイングしてあるコマ
ンド一気に実行して高速化を図るためである。
【0006】チャネル装置CHはシーク動作終了信号を
受信すれば、セットセクタコマンドSSを発行する。磁
気ディスク制御装置DCUは該セットセクタコマンドを
キューイングし、ついで、セットセクタ動作が終了した
ように見せ掛けて動作終了信号をチャネル装置CHに返
す。チャネル装置CHはセットセクタ動作終了信号を受
信すれば、サーチIDコマンドSIDを発行する。磁気
ディスク制御装置DCUはサーチIDコマンドSIDを
受信すれば、磁気ディスク装置DEVにシーク及びセッ
トセクタを連続的に実行させると共に、該動作時間中チ
ャネル装置CHを磁気ディスク制御装置DCUから切り
離すためにリトライ信号を発行する。これにより、チャ
ネル装置CHは磁気ディスク制御装置から一時的に切り
離れ、その間別の磁気ディスク制御装置に対するサービ
ス等を実行できる。チャネル装置CHはリトライ信号を
受信して切離れてから、次に磁気ディスク制御装置DC
Uよりコマンド要求信号を受信した場合には、直前に発
行したコマンドを再送するようになっている。
受信すれば、セットセクタコマンドSSを発行する。磁
気ディスク制御装置DCUは該セットセクタコマンドを
キューイングし、ついで、セットセクタ動作が終了した
ように見せ掛けて動作終了信号をチャネル装置CHに返
す。チャネル装置CHはセットセクタ動作終了信号を受
信すれば、サーチIDコマンドSIDを発行する。磁気
ディスク制御装置DCUはサーチIDコマンドSIDを
受信すれば、磁気ディスク装置DEVにシーク及びセッ
トセクタを連続的に実行させると共に、該動作時間中チ
ャネル装置CHを磁気ディスク制御装置DCUから切り
離すためにリトライ信号を発行する。これにより、チャ
ネル装置CHは磁気ディスク制御装置から一時的に切り
離れ、その間別の磁気ディスク制御装置に対するサービ
ス等を実行できる。チャネル装置CHはリトライ信号を
受信して切離れてから、次に磁気ディスク制御装置DC
Uよりコマンド要求信号を受信した場合には、直前に発
行したコマンドを再送するようになっている。
【0007】しかる後、シーク及びセットセクタ動作が
完了すると、磁気ディスク装置DEVは動作終了信号を
送り、これにより磁気ディスク制御装置DCUはコマン
ド要求信号をチャネル装置CHに送出する。チャネル装
置CHはコマンド要求を受信すると、直前に発行したサ
ーチIDコマンドSIDを再度発行する。磁気ディスク
制御装置DCUはサーチIDコマンドSIDを受信すれ
ば、磁気ディスク装置DEVにサーチID動作を実行さ
せ、サーチID動作が終了すれば、動作終了信号をチャ
ネル装置CHに送る。チャネル装置CHはサーチIDの
動作終了信号を受信すれば、ライトコマンドWDを発行
する。磁気ディスク制御装置DCUは書き込みコマンド
WDを受信すれば、磁気ディスク装置DEVにデータ書
き込み動作を実行させると共に、データ書き込みの間、
チャネル装置CHを磁気ディスク制御装置から切り離す
ためにリトライ信号をチャネル装置CHに送る。これに
より、チャネル装置CHは磁気ディスク制御装置から一
時的に切り離れる。
完了すると、磁気ディスク装置DEVは動作終了信号を
送り、これにより磁気ディスク制御装置DCUはコマン
ド要求信号をチャネル装置CHに送出する。チャネル装
置CHはコマンド要求を受信すると、直前に発行したサ
ーチIDコマンドSIDを再度発行する。磁気ディスク
制御装置DCUはサーチIDコマンドSIDを受信すれ
ば、磁気ディスク装置DEVにサーチID動作を実行さ
せ、サーチID動作が終了すれば、動作終了信号をチャ
ネル装置CHに送る。チャネル装置CHはサーチIDの
動作終了信号を受信すれば、ライトコマンドWDを発行
する。磁気ディスク制御装置DCUは書き込みコマンド
WDを受信すれば、磁気ディスク装置DEVにデータ書
き込み動作を実行させると共に、データ書き込みの間、
チャネル装置CHを磁気ディスク制御装置から切り離す
ためにリトライ信号をチャネル装置CHに送る。これに
より、チャネル装置CHは磁気ディスク制御装置から一
時的に切り離れる。
【0008】データの書き込みが終了すれば、磁気ディ
スク装置DEVは書き込み終了信号を磁気ディスク制御
装置DCUに送り、これにより磁気ディスク制御装置D
CUはコマンド要求信号をチャネル装置CHに送出す
る。チャネル装置CHはコマンド要求を受信すると、直
前に発行した書き込みコマンドWDを再度発行する。磁
気ディスク制御装置DCUは書き込みコマンドWDを受
信すれば、ただちに動作終了信号をチャネル装置CHに
転送し、一連の書き込み動作が完結する。
スク装置DEVは書き込み終了信号を磁気ディスク制御
装置DCUに送り、これにより磁気ディスク制御装置D
CUはコマンド要求信号をチャネル装置CHに送出す
る。チャネル装置CHはコマンド要求を受信すると、直
前に発行した書き込みコマンドWDを再度発行する。磁
気ディスク制御装置DCUは書き込みコマンドWDを受
信すれば、ただちに動作終了信号をチャネル装置CHに
転送し、一連の書き込み動作が完結する。
【0009】図5は別の書き込みシーケンス説明図であ
り、図4と異なる点は書き込み時にリトライ信号をチャ
ネル装置CHに転送しない点であり、他は同じである。
図6はデータ読み出し時におけるシーケンス説明図であ
り、図5と異なる点はライトコマンドWDがリードコマ
ンドRDになっている点である。かかるデータ書き込
み、読み出しにおいて、磁気ディスク制御装置(I/O
サブシステム)3は内部的に以下のようにコマンドに同
期した転送制御(同期転送制御)を行う。
り、図4と異なる点は書き込み時にリトライ信号をチャ
ネル装置CHに転送しない点であり、他は同じである。
図6はデータ読み出し時におけるシーケンス説明図であ
り、図5と異なる点はライトコマンドWDがリードコマ
ンドRDになっている点である。かかるデータ書き込
み、読み出しにおいて、磁気ディスク制御装置(I/O
サブシステム)3は内部的に以下のようにコマンドに同
期した転送制御(同期転送制御)を行う。
【0010】すなわち、チャネル2aからコマンド
(シーク、セットセクタ)を受信したチャネルアダプタ
5aはリソースマネージャ7に通知し、リソースマネー
ジャがコマンドをキューイングする。ついで、チャネ
ルアダプタ5aからサーチIDコマンドが通知される
と、リソースマネージャ7はリトライ要求をチャネルア
ダプタ5aを介してチャネル2aに送出すると共に、所
定のデバイスアダプタ6aにシーク、セットセクタ動作
を指示し、動作終了によりチャネルアダプタ5aを介し
てチャネル2aにコマンドを要求する。リソースマネ
ージャ7はチャネルからサーチIDを受信すれば、デバ
イスアダプタ6aを介してサーチID動作を指示し、サ
ーチID動作終了により、チャネルアダプタ5aを介し
てサーチID終了をチャネルに通知する。又、サーチ
ID終了により、リソースマネージャ7はチャネルアダ
プタ5aにデータ授受すべきデバイスアダプタ6aを通
知し、又、デバイスアダプタ6aにデータ授受すべきチ
ャネルアダプタ5aを通知する。以後、書き込みの場
合にはチャネルアダプタ5aは指定されたデバイスアダ
プタ6aに直接データを送って磁気ディスクに書き込ま
せ、又、読み出しの場合にはデバイスアダプタ6aは磁
気ディスクから読み出したデータを直接チャネルアダプ
タ5aに送ってチャネル2aに転送させる。
(シーク、セットセクタ)を受信したチャネルアダプタ
5aはリソースマネージャ7に通知し、リソースマネー
ジャがコマンドをキューイングする。ついで、チャネ
ルアダプタ5aからサーチIDコマンドが通知される
と、リソースマネージャ7はリトライ要求をチャネルア
ダプタ5aを介してチャネル2aに送出すると共に、所
定のデバイスアダプタ6aにシーク、セットセクタ動作
を指示し、動作終了によりチャネルアダプタ5aを介し
てチャネル2aにコマンドを要求する。リソースマネ
ージャ7はチャネルからサーチIDを受信すれば、デバ
イスアダプタ6aを介してサーチID動作を指示し、サ
ーチID動作終了により、チャネルアダプタ5aを介し
てサーチID終了をチャネルに通知する。又、サーチ
ID終了により、リソースマネージャ7はチャネルアダ
プタ5aにデータ授受すべきデバイスアダプタ6aを通
知し、又、デバイスアダプタ6aにデータ授受すべきチ
ャネルアダプタ5aを通知する。以後、書き込みの場
合にはチャネルアダプタ5aは指定されたデバイスアダ
プタ6aに直接データを送って磁気ディスクに書き込ま
せ、又、読み出しの場合にはデバイスアダプタ6aは磁
気ディスクから読み出したデータを直接チャネルアダプ
タ5aに送ってチャネル2aに転送させる。
【0011】かかる同期転送制御方式において、サーチ
動作は以下のように行われる。図7はサーチ動作説明図
である。サーチIDの場合には、レコードのうちカウン
ト領域Cのみサーチし、指示されたレコード番号と一致
するか調べ、一致してなければ、キー領域K,データ領
域Dは読み飛ばし(スキップ)、次のレコードのカウン
ト領域を読み出し、指令レコード番号と一致する迄上記
サーチを繰り返す。又、サーチキーの場合には、カウン
ト部を読み取ってキー位置を認識し、ついで、キー部K
をサーチして指示されたキーと一致するか調べ、一致し
てなければ、データ領域Dをスキップし、次のレコード
のカウント領域を読み出して以下、指令キーと一致する
迄上記サーチを繰り返す。以上のように、同期転送制御
におけるサーチ動作においては、サーチIDの場合キー
領域Kとデータ領域Dがスキップされるため、キー領域
あるいはデータ領域に傷が付いて読み出しエラーが発生
する場合にも何等エラーが発生することなく所望のレコ
ードをサーチできる。同様に、サーチキーの場合にはデ
ータ領域がスキップされるため、データ領域に傷が付い
て読み出しエラーが発生する場合にも何等エラーが発生
することなく所望のキー領域をサーチできる。
動作は以下のように行われる。図7はサーチ動作説明図
である。サーチIDの場合には、レコードのうちカウン
ト領域Cのみサーチし、指示されたレコード番号と一致
するか調べ、一致してなければ、キー領域K,データ領
域Dは読み飛ばし(スキップ)、次のレコードのカウン
ト領域を読み出し、指令レコード番号と一致する迄上記
サーチを繰り返す。又、サーチキーの場合には、カウン
ト部を読み取ってキー位置を認識し、ついで、キー部K
をサーチして指示されたキーと一致するか調べ、一致し
てなければ、データ領域Dをスキップし、次のレコード
のカウント領域を読み出して以下、指令キーと一致する
迄上記サーチを繰り返す。以上のように、同期転送制御
におけるサーチ動作においては、サーチIDの場合キー
領域Kとデータ領域Dがスキップされるため、キー領域
あるいはデータ領域に傷が付いて読み出しエラーが発生
する場合にも何等エラーが発生することなく所望のレコ
ードをサーチできる。同様に、サーチキーの場合にはデ
ータ領域がスキップされるため、データ領域に傷が付い
て読み出しエラーが発生する場合にも何等エラーが発生
することなく所望のキー領域をサーチできる。
【0012】又、同期転送制御におけるデータの読み出
しは以下のように行われる。図8はリードCKD(Read
Count Key Data)の説明図である。チャネル2aからリ
ードCKDコマンドが発生すると、チャネルアダプタ5
aはデバイスアダプタ6aにリードCを指示してカウン
ト領域Cを読み出させる。正常に読み出しが行われれ
ば、デバイスアダプタはNE(Normal End)をチャネル
アダプタに送る。チャネルアダプタはNEの受信により
リードKを指示してキー領域Kを読み出させ、同様に正
常読み出しNEの受信によりリードDを指示してデータ
領域Dを読み出させる。この時、データ部Dに傷があっ
て正常にデータを読み取れない場合にはデバイスアダプ
タ6aは読み取りエラーを検出し、センスデータを作成
してチャネルアダプタ5aに通知する。これにより、チ
ャネルアダプタはチャネル2aにエラーステータスを送
ると共に、センスデータを報告する。このように、同期
転送制御では読み取り対象領域に傷があって読み取りエ
ラーが検出されるとエラーステータス、センスデータが
チャネルに通知される。
しは以下のように行われる。図8はリードCKD(Read
Count Key Data)の説明図である。チャネル2aからリ
ードCKDコマンドが発生すると、チャネルアダプタ5
aはデバイスアダプタ6aにリードCを指示してカウン
ト領域Cを読み出させる。正常に読み出しが行われれ
ば、デバイスアダプタはNE(Normal End)をチャネル
アダプタに送る。チャネルアダプタはNEの受信により
リードKを指示してキー領域Kを読み出させ、同様に正
常読み出しNEの受信によりリードDを指示してデータ
領域Dを読み出させる。この時、データ部Dに傷があっ
て正常にデータを読み取れない場合にはデバイスアダプ
タ6aは読み取りエラーを検出し、センスデータを作成
してチャネルアダプタ5aに通知する。これにより、チ
ャネルアダプタはチャネル2aにエラーステータスを送
ると共に、センスデータを報告する。このように、同期
転送制御では読み取り対象領域に傷があって読み取りエ
ラーが検出されるとエラーステータス、センスデータが
チャネルに通知される。
【0013】ところで、同期転送制御方式では、上述の
ようにチャネルアダプタとデバイスアダプタが同期して
データの転送を行うため、データ転送速度が遅い問題が
ある。このため、I/Oサブシステムに中間バッファを
設け、該中間バッファを用いてデータ転送をチャネルア
ダプタとデバイスアダプタで非同期に行って転送速度を
向上させる非同期転送制御方式が提案されている。図9
は同期転送制御方式を実現するためのI/Oサブシステ
ムの構成図であり、図2と同一部分には同一符号を付し
ている。図2と異なる点は中間バッファ10を設けてい
る点である。
ようにチャネルアダプタとデバイスアダプタが同期して
データの転送を行うため、データ転送速度が遅い問題が
ある。このため、I/Oサブシステムに中間バッファを
設け、該中間バッファを用いてデータ転送をチャネルア
ダプタとデバイスアダプタで非同期に行って転送速度を
向上させる非同期転送制御方式が提案されている。図9
は同期転送制御方式を実現するためのI/Oサブシステ
ムの構成図であり、図2と同一部分には同一符号を付し
ている。図2と異なる点は中間バッファ10を設けてい
る点である。
【0014】この非同期転送制御方式においては、セッ
トセクタ動作完了後にデバイスアダプタ6a,6bが磁
気ディスク4a〜4dから1トラックあるいは次のトラ
ック迄のレコード(CKDフォーマットデータ)を先読
みして中間バッファ10に記憶し、チャネルアダプタ5
a、,5bはサーチID、リードコマンドに基づいて中
間バッファ10上で所望のデータをサーチして上位装置
2a,2bに転送するようになっている。
トセクタ動作完了後にデバイスアダプタ6a,6bが磁
気ディスク4a〜4dから1トラックあるいは次のトラ
ック迄のレコード(CKDフォーマットデータ)を先読
みして中間バッファ10に記憶し、チャネルアダプタ5
a、,5bはサーチID、リードコマンドに基づいて中
間バッファ10上で所望のデータをサーチして上位装置
2a,2bに転送するようになっている。
【0015】図10はデバイスアダプタがレコードを磁
気ディスクから中間バッファ10に書き込む場合の説明
図である。デバイスアダプタはセットセクタ動作が終了
すると、直ちに位置付けされている位置より所定範囲の
レコード(CKDフォーマットデータ)を読み取って中
間バッファ10にギャップなく書き込む(図10(a)参
照)。このように、所定範囲のレコードが全て中間バッ
ファ10に書き込まれた場合には、何等問題なく所望の
レコードをサーチして読み取ることができる。尚、CK
Dの全てを中間バッファに書き込むのは、デバイスアダ
プタが処理コマンド(サーチコマンド、リードコマン
ド)で必要としている部分がC,K,Dのどれであるか
を認識できないからである。
気ディスクから中間バッファ10に書き込む場合の説明
図である。デバイスアダプタはセットセクタ動作が終了
すると、直ちに位置付けされている位置より所定範囲の
レコード(CKDフォーマットデータ)を読み取って中
間バッファ10にギャップなく書き込む(図10(a)参
照)。このように、所定範囲のレコードが全て中間バッ
ファ10に書き込まれた場合には、何等問題なく所望の
レコードをサーチして読み取ることができる。尚、CK
Dの全てを中間バッファに書き込むのは、デバイスアダ
プタが処理コマンド(サーチコマンド、リードコマン
ド)で必要としている部分がC,K,Dのどれであるか
を認識できないからである。
【0016】以上のように、所定範囲のレコードが全て
中間バッファに書き込める場合には何等問題はないが、
図10(b)に示すようにデータ領域Dに傷があって読み
取りエラーが発生すると、デバイスアダプタは読み取り
を停止し、以降のレコードを中間バッファ10に格納し
ない。かかる状況の下では、同期転送制御方式で可能で
あったサーチID、サーチキーが不可能となりで、目的
とするレコードやキーをサーチできなくなる。すなわ
ち、非同期転送制御であっても同期転送制御と同一の機
能を有しなければならないが、従来の方式では不可能で
あった。
中間バッファに書き込める場合には何等問題はないが、
図10(b)に示すようにデータ領域Dに傷があって読み
取りエラーが発生すると、デバイスアダプタは読み取り
を停止し、以降のレコードを中間バッファ10に格納し
ない。かかる状況の下では、同期転送制御方式で可能で
あったサーチID、サーチキーが不可能となりで、目的
とするレコードやキーをサーチできなくなる。すなわ
ち、非同期転送制御であっても同期転送制御と同一の機
能を有しなければならないが、従来の方式では不可能で
あった。
【0017】
・非同期転送制御の問題点 以上のように、従来の非同期転送制御においては、デー
タ領域やキー領域に傷等が付いて読み取りエラーが発生
する場合には所定範囲のレコードを全て中間バッファに
書き込むことができず、同期転送制御方式で可能であっ
たサーチID、サーチキーが不可能となり、目的とする
レコードやキーをサーチできない問題があった。
タ領域やキー領域に傷等が付いて読み取りエラーが発生
する場合には所定範囲のレコードを全て中間バッファに
書き込むことができず、同期転送制御方式で可能であっ
たサーチID、サーチキーが不可能となり、目的とする
レコードやキーをサーチできない問題があった。
【0018】・書き込み時のヘッド故障による問題点 ところで、ライトキーデータ(Write Key Data)コマン
ドを実行中に書き込みヘッドが故障する場合がある。例
えば、キー部(キー領域)の書き込みが正常に終了し、次
のデータ部(データ領域)への移動中にヘッドが故障した
場合である。かかる故障が生じると、データ保証上の問
題が生じる。なぜならば、このようなレコードは読み込
みにおいて問題なく読めるため、CPUはキー部が新し
く、データ部が古いレコードを取り扱う事になるからで
ある。
ドを実行中に書き込みヘッドが故障する場合がある。例
えば、キー部(キー領域)の書き込みが正常に終了し、次
のデータ部(データ領域)への移動中にヘッドが故障した
場合である。かかる故障が生じると、データ保証上の問
題が生じる。なぜならば、このようなレコードは読み込
みにおいて問題なく読めるため、CPUはキー部が新し
く、データ部が古いレコードを取り扱う事になるからで
ある。
【0019】・動的経路再結合方式の問題点 又、最近の大型コンピュータシステムにおいては、その
規模の巨大化に伴い、複数の中央処理装置(CPU)で
システムを構成することが通例となっている。かかるシ
ステムでは、複数のCPU間でのデータの共用・データ
の通信が必要になる。このために、システム内で使用さ
れる外部記憶装置を始めとするI/Oサブシステムでは
多数のホストインターフェース(上位インターフェー
ス)を装備することが要求されている。この要求に答え
るためにI/Oサブシステム(磁気ディスク制御装置)
内に複数のチャネルアダプタを装備し、これらチャネル
アダプタをCPUに接続し、又、I/Oサブシステムに
多数のI/Oデバイス(磁気ディスク装置)を接続して
いる。I/Oデバイスにはファイル単位で書き込み、読
み出しを行うため、I/Oデバイスをファイル装置、I
/Oサブシステムをファイル制御装置と呼ぶことがあ
る。
規模の巨大化に伴い、複数の中央処理装置(CPU)で
システムを構成することが通例となっている。かかるシ
ステムでは、複数のCPU間でのデータの共用・データ
の通信が必要になる。このために、システム内で使用さ
れる外部記憶装置を始めとするI/Oサブシステムでは
多数のホストインターフェース(上位インターフェー
ス)を装備することが要求されている。この要求に答え
るためにI/Oサブシステム(磁気ディスク制御装置)
内に複数のチャネルアダプタを装備し、これらチャネル
アダプタをCPUに接続し、又、I/Oサブシステムに
多数のI/Oデバイス(磁気ディスク装置)を接続して
いる。I/Oデバイスにはファイル単位で書き込み、読
み出しを行うため、I/Oデバイスをファイル装置、I
/Oサブシステムをファイル制御装置と呼ぶことがあ
る。
【0020】かかるシステムにおいて、1つのファイル
制御装置配下のファイル装置を頻繁にアクセスする場合
はどうしてもそのファイル制御装置の1つのチャネルア
ダプタにアクセスが集中し、該チャネルアダプタのビジ
ー率(Busy率)が高くなる。その結果、アクセスの応答
も遅くなり、性能低下を生じる。かかる性能低下の防止
方法として、ホスト装置から1台のファイル制御装置へ
のアクセスパス(チャネルアダプタ)を複数設けること
によりアクセスを分散し、パス(チャネルアダプタ)の
ビジー率を下げることが考えられる。かかる考え方を更
に発展させて、アクセスがあったパスとは違うパスでデ
ータ転送する機能(動的経路再結合機能)が提案されて
いる。動的経路再結合機能は、ホスト装置が予めどのパ
スとどのパスが同一ホスト装置に接続されているかをフ
ァイル制御装置に認識させておく(グループを作成す
る)。そして、レコードの位置付けを完了した時(例え
ばサーチID動作終了時)、ホスト装置への動作終了報
告時にリソースマネージャが、どのチャネルアダプタが
同一ホスト装置に接続されているかを調べ(同一グルー
プのチャネルアダプタを探す)、空いている所定のチャ
ネルアダプタにホスト装置への報告を割込みにより行な
わせるものであり、複数のパス(チャネルアダプタ)を
有効に利用できる。
制御装置配下のファイル装置を頻繁にアクセスする場合
はどうしてもそのファイル制御装置の1つのチャネルア
ダプタにアクセスが集中し、該チャネルアダプタのビジ
ー率(Busy率)が高くなる。その結果、アクセスの応答
も遅くなり、性能低下を生じる。かかる性能低下の防止
方法として、ホスト装置から1台のファイル制御装置へ
のアクセスパス(チャネルアダプタ)を複数設けること
によりアクセスを分散し、パス(チャネルアダプタ)の
ビジー率を下げることが考えられる。かかる考え方を更
に発展させて、アクセスがあったパスとは違うパスでデ
ータ転送する機能(動的経路再結合機能)が提案されて
いる。動的経路再結合機能は、ホスト装置が予めどのパ
スとどのパスが同一ホスト装置に接続されているかをフ
ァイル制御装置に認識させておく(グループを作成す
る)。そして、レコードの位置付けを完了した時(例え
ばサーチID動作終了時)、ホスト装置への動作終了報
告時にリソースマネージャが、どのチャネルアダプタが
同一ホスト装置に接続されているかを調べ(同一グルー
プのチャネルアダプタを探す)、空いている所定のチャ
ネルアダプタにホスト装置への報告を割込みにより行な
わせるものであり、複数のパス(チャネルアダプタ)を
有効に利用できる。
【0021】しかし、かかる従来の動的経路再結合方式
では、再結合時に、グループを組んでいる複数のチャネ
ルアダプタのうち空いているチャネルアダプタに割込み
を発生させるものであり、チャネルアダプタのビジー率
(使用されている度合)は考慮されていない。すなわ
ち、従来の動的経路再結合方式では、パスの選択は、起
動時にホスト装置から設定されるパスグループの中から
空いているパス(チャネルアダプタ)を適当に選択する
だけである。、このため、選択されたチャネルアダプタ
(パス)のビジー率が高いと非効率的な資源の使用とな
り、レスポンスの短縮を図ることができない問題があっ
た。
では、再結合時に、グループを組んでいる複数のチャネ
ルアダプタのうち空いているチャネルアダプタに割込み
を発生させるものであり、チャネルアダプタのビジー率
(使用されている度合)は考慮されていない。すなわ
ち、従来の動的経路再結合方式では、パスの選択は、起
動時にホスト装置から設定されるパスグループの中から
空いているパス(チャネルアダプタ)を適当に選択する
だけである。、このため、選択されたチャネルアダプタ
(パス)のビジー率が高いと非効率的な資源の使用とな
り、レスポンスの短縮を図ることができない問題があっ
た。
【0022】障害発生モジュールのリカバリ制御の問題
点 モジュール化されたI/Oサブシステムでは、各モジュ
ールの障害発生を検出してリカバリ処理するモジュール
(サービスアダプタ:Service Adapter)が設けられてい
る。サービスアダプタはモジュールがハ−ドウェア障害
(Check1)になった場合、該モジュールの障害を検出し
てリカバリする。又、サービスアダプタは、リカバリ
処理中、そのモジュールは使用できないという情報及び
リカバリ処理により復旧して動作可能になったという
情報をリソースマネージャに通知する。この通知は各モ
ジュールが共通に使用できるバス(C-BUS)を経由してリ
ソースマネージャに通知される。又、サービスアダプタ
が各モジュールをリカバリ処理するときは、違うバス(S
-BUS)を経由して行なわれる。
点 モジュール化されたI/Oサブシステムでは、各モジュ
ールの障害発生を検出してリカバリ処理するモジュール
(サービスアダプタ:Service Adapter)が設けられてい
る。サービスアダプタはモジュールがハ−ドウェア障害
(Check1)になった場合、該モジュールの障害を検出し
てリカバリする。又、サービスアダプタは、リカバリ
処理中、そのモジュールは使用できないという情報及び
リカバリ処理により復旧して動作可能になったという
情報をリソースマネージャに通知する。この通知は各モ
ジュールが共通に使用できるバス(C-BUS)を経由してリ
ソースマネージャに通知される。又、サービスアダプタ
が各モジュールをリカバリ処理するときは、違うバス(S
-BUS)を経由して行なわれる。
【0023】しかしながら、各モジュールの障害と同時
にサービスアダプタにも障害が発生すると、サービスア
ダプタは障害が発生しているモジュールのリカバリ処理
ができなくなり、リソースマネージャにもリカバリでき
たという通知がされないままになる。特に、サービスア
ダプタが何等かの手段により復旧して障害発生中のモジ
ュールの復旧処理が可能になった場合でも、サービスア
ダプタは自分に発生した障害により、どのモジュールに
障害が発生していたのか忘れてしまし、該モジュールの
復旧をしない。かかる場合には、最悪のケースではシス
テムダウンという重大障害の原因になる。又、サービス
アダプタが障害発生したモジュールの復旧を完了した
後、リソースマネージャに該モジュールの復旧を通知す
る前に、サービスアダプタに障害が発生した場合にもリ
ソースマネージャに復旧通知が出されない。かかる場合
にも、最悪のケースではシステムダウンという重大障害
の原因になる。
にサービスアダプタにも障害が発生すると、サービスア
ダプタは障害が発生しているモジュールのリカバリ処理
ができなくなり、リソースマネージャにもリカバリでき
たという通知がされないままになる。特に、サービスア
ダプタが何等かの手段により復旧して障害発生中のモジ
ュールの復旧処理が可能になった場合でも、サービスア
ダプタは自分に発生した障害により、どのモジュールに
障害が発生していたのか忘れてしまし、該モジュールの
復旧をしない。かかる場合には、最悪のケースではシス
テムダウンという重大障害の原因になる。又、サービス
アダプタが障害発生したモジュールの復旧を完了した
後、リソースマネージャに該モジュールの復旧を通知す
る前に、サービスアダプタに障害が発生した場合にもリ
ソースマネージャに復旧通知が出されない。かかる場合
にも、最悪のケースではシステムダウンという重大障害
の原因になる。
【0024】・障害発生時の問題点 I/Oサブシステムにて検出するエラーは、上位装置よ
りアクセスがあった時のみ上位装置に通知が可能であ
る。すなわち、アクセスとは無関係の内部検出のエラー
(サービスアダプタによる検出エラー、内部診断による
エラー)は、スタートI/O(SIO)時にユニットチ
ェックを報告し、センス情報を刈り取ってもらうことに
より報告している。しかし、この方法ではエラーと無関
係なアクセスにも影響を与える問題がある。又、従来の
I/Oサブシステムで何らかのエラーを検出した時、積
極的に上位装置に通知する手段を持たないため、システ
ムとして重大な障害を上位装置がアクセスするまで報告
できず、未然に障害を防止することができなかった。更
に、報告したエラー内容によるリカバリ方法は上位装置
まかせであった。このため、I/Oサブシステムが必要
とするリカバリがなされるとは限らない問題があった。
又、上位装置の障害により下位装置(I/Oサブシステ
ム)が影響を受け、他系のパスに影響を与えることがあ
る。従来はこのパスをサブシステムが自ら切り離すこと
で他系への悪影響を防止していた。しかし、かかる方法
では上位装置の障害に気ずかず、I/Oサブシステムの
障害と見做されることがあり、的確な障害切り分けに手
間取ったり、上位装置にリカバリの機会を与えることが
できない問題があった。
りアクセスがあった時のみ上位装置に通知が可能であ
る。すなわち、アクセスとは無関係の内部検出のエラー
(サービスアダプタによる検出エラー、内部診断による
エラー)は、スタートI/O(SIO)時にユニットチ
ェックを報告し、センス情報を刈り取ってもらうことに
より報告している。しかし、この方法ではエラーと無関
係なアクセスにも影響を与える問題がある。又、従来の
I/Oサブシステムで何らかのエラーを検出した時、積
極的に上位装置に通知する手段を持たないため、システ
ムとして重大な障害を上位装置がアクセスするまで報告
できず、未然に障害を防止することができなかった。更
に、報告したエラー内容によるリカバリ方法は上位装置
まかせであった。このため、I/Oサブシステムが必要
とするリカバリがなされるとは限らない問題があった。
又、上位装置の障害により下位装置(I/Oサブシステ
ム)が影響を受け、他系のパスに影響を与えることがあ
る。従来はこのパスをサブシステムが自ら切り離すこと
で他系への悪影響を防止していた。しかし、かかる方法
では上位装置の障害に気ずかず、I/Oサブシステムの
障害と見做されることがあり、的確な障害切り分けに手
間取ったり、上位装置にリカバリの機会を与えることが
できない問題があった。
【0025】以上から本発明の目的は、I/Oサブシス
テムである磁気ディスク制御装置の性能を向上すること
である。本発明の別の目的は、非同期転送制御方式であ
っても同期転送制御と同じ機能を実行できる磁気ディス
ク制御及びその制御方法を提供することである。本発明
の別の目的は、データ領域やキー領域に傷等が付いて読
み取りエラーを生じる場合であっても、これら領域のデ
ータを処理の対象としないサーチ動作をエラーの発生な
く行える磁気ディスク制御装置及びその制御方法を提供
することである。本発明の更に別の目的は、レコード書
き込み時にCKDフォーマットでの一部のみ正常に書き
替えられ、他の部分が書き替えられなかった場合でもデ
ータ保証上の問題が生じない磁気ディスク制御装置及び
その制御方法を提供することである。
テムである磁気ディスク制御装置の性能を向上すること
である。本発明の別の目的は、非同期転送制御方式であ
っても同期転送制御と同じ機能を実行できる磁気ディス
ク制御及びその制御方法を提供することである。本発明
の別の目的は、データ領域やキー領域に傷等が付いて読
み取りエラーを生じる場合であっても、これら領域のデ
ータを処理の対象としないサーチ動作をエラーの発生な
く行える磁気ディスク制御装置及びその制御方法を提供
することである。本発明の更に別の目的は、レコード書
き込み時にCKDフォーマットでの一部のみ正常に書き
替えられ、他の部分が書き替えられなかった場合でもデ
ータ保証上の問題が生じない磁気ディスク制御装置及び
その制御方法を提供することである。
【0026】本発明の他の目的は、動的経路再結合方式
において、ビジー率を考慮して効率的な資源利用を図
れ、アクセスに対するレスポンスを短縮できる磁気ディ
スク制御装置及びその制御方法を提供することである。
本発明の別の目的は、サービスアダプタに障害が発生し
た場合、該サービスアダプタの復旧後確実に障害発生中
のモジュールの復旧を行なって、起動することができる
磁気ディスク制御装置及びその制御方法を提供すること
である。本発明の他の目的は、上位装置に磁気ディス
ク制御装置から積極的に障害内容を通知し、又、上位
装置にリカバリ方法を通知し、更に、磁気ディスク制
御装置における動作可能パスの提示をすることにより、
迅速にリカバリを行え、しかも、障害と無関係のアクセ
スに影響を与えない磁気ディスク制御装置及びその制御
方法を提供することである。本発明の別の目的は、上位
装置の障害を該上位装置に通知してリカバリさせること
ができる磁気ディスク制御装置及びその制御方法を提供
することである。
において、ビジー率を考慮して効率的な資源利用を図
れ、アクセスに対するレスポンスを短縮できる磁気ディ
スク制御装置及びその制御方法を提供することである。
本発明の別の目的は、サービスアダプタに障害が発生し
た場合、該サービスアダプタの復旧後確実に障害発生中
のモジュールの復旧を行なって、起動することができる
磁気ディスク制御装置及びその制御方法を提供すること
である。本発明の他の目的は、上位装置に磁気ディス
ク制御装置から積極的に障害内容を通知し、又、上位
装置にリカバリ方法を通知し、更に、磁気ディスク制
御装置における動作可能パスの提示をすることにより、
迅速にリカバリを行え、しかも、障害と無関係のアクセ
スに影響を与えない磁気ディスク制御装置及びその制御
方法を提供することである。本発明の別の目的は、上位
装置の障害を該上位装置に通知してリカバリさせること
ができる磁気ディスク制御装置及びその制御方法を提供
することである。
【0027】
【課題を解決するための手段】図1は本発明の原理説明
図である。20は上位装置としてのCPU、30は磁気
ディスク制御装置等のI/Oサブシステム、40はI/
Oデバイスとしての磁気ディスク装置である。I/Oサ
ブシステムにおいて、31a,31bは上位装置とのイ
ンターフェースを司るチャネルアダプタ(CA)、32
a,32bは磁気ディスク装置とのインターフェースを
司るデバイスアダプタ(DA)、33は全体の資源管理
及び処理動作に関する制御を行うリソースマネージャ
(RM)、34は磁気ディスク20から読み取ったCK
Dフォーマットのデータを記憶する中間バッファ、35
は各種テーブル類を記憶するテーブル記憶部(TS)、
36は各ユニットに発生した障害を検知するサービスア
ダプタであり、各ユニットは相互にバス接続されてい
る。
図である。20は上位装置としてのCPU、30は磁気
ディスク制御装置等のI/Oサブシステム、40はI/
Oデバイスとしての磁気ディスク装置である。I/Oサ
ブシステムにおいて、31a,31bは上位装置とのイ
ンターフェースを司るチャネルアダプタ(CA)、32
a,32bは磁気ディスク装置とのインターフェースを
司るデバイスアダプタ(DA)、33は全体の資源管理
及び処理動作に関する制御を行うリソースマネージャ
(RM)、34は磁気ディスク20から読み取ったCK
Dフォーマットのデータを記憶する中間バッファ、35
は各種テーブル類を記憶するテーブル記憶部(TS)、
36は各ユニットに発生した障害を検知するサービスア
ダプタであり、各ユニットは相互にバス接続されてい
る。
【0028】
・非同期転送制御 デバイスアダプタ32a,32bは位置付け動作(シー
ク、セットセクタ動作)が完了すると、直ちに磁気ディ
スク装置40から読み取ったCKDフォーマットのデー
タを中間バッファ34に記憶し、チャネルアダプタ31
a,31bはサーチIDコマンドにより中間バッファ3
4上で所望のデータをサーチし、リードコマンドにより
該データを中間バッファから読み取って上位装置20に
転送する。磁気ディスク装置40よりCKDフォーマッ
トのデータを読み取って中間バッファ34に書き込む
際、デバイスアダプタ32a〜32bはキー部K又はデ
ータ部Dを正常に読み込めなかった時、エラー停止する
ことなく以下の処理を行う。すなわち、デバイスアダプ
タ32a,32bはエラー内容を示すセンスデータを作
成し、中間バッファ34における前記キー部又はデータ
部を書き込む領域に該センスデータを書き込み、更に、
センスデータが前記領域に書き込まれていることを示す
制御情報Fを作成し、該制御情報を所定位置に書き込
み、以後、次のCKDフォーマットデータを読み取って
中間バッファ34に書き込む。尚、図1ではカウント部
C、キー部K書き込み後に(,)、データ部Dでエ
ラーが発生し、該データ部の代わりにセンスデータを作
成して書き込み()、しかる後制御情報Fを作成、書
き込む場合()が示されている。
ク、セットセクタ動作)が完了すると、直ちに磁気ディ
スク装置40から読み取ったCKDフォーマットのデー
タを中間バッファ34に記憶し、チャネルアダプタ31
a,31bはサーチIDコマンドにより中間バッファ3
4上で所望のデータをサーチし、リードコマンドにより
該データを中間バッファから読み取って上位装置20に
転送する。磁気ディスク装置40よりCKDフォーマッ
トのデータを読み取って中間バッファ34に書き込む
際、デバイスアダプタ32a〜32bはキー部K又はデ
ータ部Dを正常に読み込めなかった時、エラー停止する
ことなく以下の処理を行う。すなわち、デバイスアダプ
タ32a,32bはエラー内容を示すセンスデータを作
成し、中間バッファ34における前記キー部又はデータ
部を書き込む領域に該センスデータを書き込み、更に、
センスデータが前記領域に書き込まれていることを示す
制御情報Fを作成し、該制御情報を所定位置に書き込
み、以後、次のCKDフォーマットデータを読み取って
中間バッファ34に書き込む。尚、図1ではカウント部
C、キー部K書き込み後に(,)、データ部Dでエ
ラーが発生し、該データ部の代わりにセンスデータを作
成して書き込み()、しかる後制御情報Fを作成、書
き込む場合()が示されている。
【0029】かかる状態で、センスデータが記憶される
領域(キー領域、データ領域)をサーチ対象としないサ
ーチ指令が上位装置20から要求された場合、チャネル
アダプタ31a,31bは中間バッファ34上でサーチ
を行うがセンスデータによるエラーを出力せず、所望の
データを検索する。又、センスデータが記憶される領域
を処理対象とするコマンドが上位装置20から入力され
た場合、チャネルアダプタ31a,31bはレコード毎
に制御情報Fに基づいてセンスデータが該領域に書き込
まれているか判断し、書き込まれている場合には、該セ
ンスデータをエラー情報として上位装置20に報告す
る。このようにすれば、非同期転送制御方式であっても
同期転送制御方式と同じ機能を実行することができる。
従って、磁気ディスク装置40のデータ領域やキー領域
に傷等が付いて読み取りエラーを生じる場合であって
も、これら領域のデータを処理の対象としないサーチ動
作をエラーを発生することなく行うことができる。
領域(キー領域、データ領域)をサーチ対象としないサ
ーチ指令が上位装置20から要求された場合、チャネル
アダプタ31a,31bは中間バッファ34上でサーチ
を行うがセンスデータによるエラーを出力せず、所望の
データを検索する。又、センスデータが記憶される領域
を処理対象とするコマンドが上位装置20から入力され
た場合、チャネルアダプタ31a,31bはレコード毎
に制御情報Fに基づいてセンスデータが該領域に書き込
まれているか判断し、書き込まれている場合には、該セ
ンスデータをエラー情報として上位装置20に報告す
る。このようにすれば、非同期転送制御方式であっても
同期転送制御方式と同じ機能を実行することができる。
従って、磁気ディスク装置40のデータ領域やキー領域
に傷等が付いて読み取りエラーを生じる場合であって
も、これら領域のデータを処理の対象としないサーチ動
作をエラーを発生することなく行うことができる。
【0030】・動的経路再結合制御 リソースマネージャ33はテーブル記憶部35に複数上
位装置(CPU)20,20,・・・と各CPUに接続
するチャネルアダプタ(パス)31a,31b・・・と
の対応関係を記憶すると共に、各チャネルアダプタがI
/O処理に係っている度合を示すビジー率を所定時間毎
に算出して各チャネルアダプタに対応させて記憶する。
所定の上位装置からのコマンドに基づいた動作終了後
に、上位装置に割り込む場合、リソースマネージャ33
は該上位装置に接続されているチャネルアダプタの中で
ビジー率が最も小さいチャネルアダプタをテーブル記憶
部35より求め、該チャネルアダプタより割込み信号を
ホスト装置に上げ、以後該チャネルアダプタを介してデ
ータ転送する。このようにすれば、動的経路再結合方式
において、ビジー率を考慮して効率的な資源利用を図
れ、アクセスに対するレスポンスを短縮できる。
位装置(CPU)20,20,・・・と各CPUに接続
するチャネルアダプタ(パス)31a,31b・・・と
の対応関係を記憶すると共に、各チャネルアダプタがI
/O処理に係っている度合を示すビジー率を所定時間毎
に算出して各チャネルアダプタに対応させて記憶する。
所定の上位装置からのコマンドに基づいた動作終了後
に、上位装置に割り込む場合、リソースマネージャ33
は該上位装置に接続されているチャネルアダプタの中で
ビジー率が最も小さいチャネルアダプタをテーブル記憶
部35より求め、該チャネルアダプタより割込み信号を
ホスト装置に上げ、以後該チャネルアダプタを介してデ
ータ転送する。このようにすれば、動的経路再結合方式
において、ビジー率を考慮して効率的な資源利用を図
れ、アクセスに対するレスポンスを短縮できる。
【0031】・書き込み時のヘッド故障に対する制御 リソースマネージャ33はデータ書き込み時に、磁気デ
ィスク装置40の書き込みアドレスをメモリ(図示せ
ず)に記憶し、レコード(CKDフォーマットデータ)
が磁気ディスク装置40に全て正常に書き込まれた場合
には該アドレスを抹消する。一方、一部データ書き込み
後に書き込みエラーが発生した場合には該アドレスを抹
消せず保持する。そして、CKDフォーマットデータの
読み出し時、該読み出しアドレスと一致するアドレスが
メモリに記憶されているか調べ、記憶されている場合に
は上位装置20に対してエラー通知し、記憶されていな
い場合には該アドレスよりCKDフォーマットデータを
読み出す。この場合、メモリを電源が切断されても記憶
内容を消失しない記憶手段で構成する。又、リソースマ
ネージャ33はCKDデータの書き込みが正常に行われ
た時、書き込みアドレスと一致するアドレスがメモリに
記憶されているか調べ、記憶されている場合には該アド
レスをメモリから抹消する。
ィスク装置40の書き込みアドレスをメモリ(図示せ
ず)に記憶し、レコード(CKDフォーマットデータ)
が磁気ディスク装置40に全て正常に書き込まれた場合
には該アドレスを抹消する。一方、一部データ書き込み
後に書き込みエラーが発生した場合には該アドレスを抹
消せず保持する。そして、CKDフォーマットデータの
読み出し時、該読み出しアドレスと一致するアドレスが
メモリに記憶されているか調べ、記憶されている場合に
は上位装置20に対してエラー通知し、記憶されていな
い場合には該アドレスよりCKDフォーマットデータを
読み出す。この場合、メモリを電源が切断されても記憶
内容を消失しない記憶手段で構成する。又、リソースマ
ネージャ33はCKDデータの書き込みが正常に行われ
た時、書き込みアドレスと一致するアドレスがメモリに
記憶されているか調べ、記憶されている場合には該アド
レスをメモリから抹消する。
【0032】このようにすれば、レコード書き込み時に
ヘッド障害によりCKDフォーマットの一部のみ正常に
書き替えられ、他の部分が書き替えられなかった場合で
もデータ保証上の問題が生じない。又、メモリを不揮発
性記憶手段で構成したから電源が切断後、再投入された
場合であっても不当なデータへのアクセスを検出してエ
ラー通知できる。更に、一時的にヘッドに障害が発生し
てあるアドレスのデータが不当な状態になっても、以後
正常に該アドレスのデータが更新された場合にはメモリ
からアドレスを削除することにより以後正常データとし
て扱う事ができる。
ヘッド障害によりCKDフォーマットの一部のみ正常に
書き替えられ、他の部分が書き替えられなかった場合で
もデータ保証上の問題が生じない。又、メモリを不揮発
性記憶手段で構成したから電源が切断後、再投入された
場合であっても不当なデータへのアクセスを検出してエ
ラー通知できる。更に、一時的にヘッドに障害が発生し
てあるアドレスのデータが不当な状態になっても、以後
正常に該アドレスのデータが更新された場合にはメモリ
からアドレスを削除することにより以後正常データとし
て扱う事ができる。
【0033】・障害発生モジュールのリカバリ制御 サービスアダプタ36は定期的に各ユニットに障害が発
生していないかパトロールし、障害発生を検知した場合
には該障害発生ユニットのリカバリ処理を行う。このよ
うに、定期的にサービスアダプタ36がパトロールする
ようにすれば、障害発生中のユニットのリカバリ完了前
に該サービスアダプタ自身に障害が発生し、これにより
障害発生中のユニットを忘れてしまっても、復旧後、パ
トロールする事により障害発生中のユニットを認識で
き、再度リカバリ処理を行うことができる。
生していないかパトロールし、障害発生を検知した場合
には該障害発生ユニットのリカバリ処理を行う。このよ
うに、定期的にサービスアダプタ36がパトロールする
ようにすれば、障害発生中のユニットのリカバリ完了前
に該サービスアダプタ自身に障害が発生し、これにより
障害発生中のユニットを忘れてしまっても、復旧後、パ
トロールする事により障害発生中のユニットを認識で
き、再度リカバリ処理を行うことができる。
【0034】又、サービスアダプタ36は障害発生を検
知した時、障害発生ユニットをリソースマネージャ33
に通知すると共に該ユニットのリカバリ処理を行い、リ
カバリ完了後、リカバリ完了をリソースマネージャに通
知する。リソースマネージャ33は障害発生通知された
ユニットを動作不能状態にし、リカバリ完了通知により
該ユニットを動作可能状態にする。又、リソースマネー
ジャ33は障害発生通知により経過時間を監視し、設定
時間を経過してもリカバリ完了通知がない場合には、サ
ービスアダプタ36に障害発生ユニットのリカバリにつ
いて問い合わせる。サービスアダプタ36は該問い合わ
せに基づいてユニットのリカバリ処理を行って、リカバ
リ完了をリソースマネージャに通知する。このようにす
れば、障害発生ユニットのリカバリ完了前に、サービス
アダプタ自身に障害が発生して障害発生前の事実を忘れ
てしまっても、復旧後、リソースマネージャからの問い
合わせにより障害発生中のユニットを認識でき、再度リ
カバリ処理を行うことができる。
知した時、障害発生ユニットをリソースマネージャ33
に通知すると共に該ユニットのリカバリ処理を行い、リ
カバリ完了後、リカバリ完了をリソースマネージャに通
知する。リソースマネージャ33は障害発生通知された
ユニットを動作不能状態にし、リカバリ完了通知により
該ユニットを動作可能状態にする。又、リソースマネー
ジャ33は障害発生通知により経過時間を監視し、設定
時間を経過してもリカバリ完了通知がない場合には、サ
ービスアダプタ36に障害発生ユニットのリカバリにつ
いて問い合わせる。サービスアダプタ36は該問い合わ
せに基づいてユニットのリカバリ処理を行って、リカバ
リ完了をリソースマネージャに通知する。このようにす
れば、障害発生ユニットのリカバリ完了前に、サービス
アダプタ自身に障害が発生して障害発生前の事実を忘れ
てしまっても、復旧後、リソースマネージャからの問い
合わせにより障害発生中のユニットを認識でき、再度リ
カバリ処理を行うことができる。
【0035】・障害発生の上位装置への通知制御 内部診断によりあるいはサービスアダプタ36による障
害検出パトロールにより障害発生が検出された時,リソ
ースマネージャ33は障害情報にリカバリ方法、障
害内容、動作可能なパス情報等を付加して割込み制御
により上位装置20に報告し、上位装置20は当該リカ
バリ方法に基づいて、あるいは、障害内容に応じたリカ
バリ処理を行い、又、パス情報に基づいてI/Oデバイ
スと該デバイスにアクセス可能なパスとの対応関係を示
すパスグループテーブルの内容を更新し、以後、更新し
たパスグループテーブルに基づいてアクセスするパスを
選択する。更に、リソースマネージャ33は上位装置の
異常を検出した場合には、障害情報にチャネル番号を付
加して上位装置へ報告し、上位装置は該情報に基づいて
指定されたチャネルをリカバリする。このようにすれ
ば、迅速にリカバリを行え、しかも、障害と無関係のア
クセスに影響を与えず、更には、上位装置の障害を該上
位装置に通知してリカバリさせることができる。
害検出パトロールにより障害発生が検出された時,リソ
ースマネージャ33は障害情報にリカバリ方法、障
害内容、動作可能なパス情報等を付加して割込み制御
により上位装置20に報告し、上位装置20は当該リカ
バリ方法に基づいて、あるいは、障害内容に応じたリカ
バリ処理を行い、又、パス情報に基づいてI/Oデバイ
スと該デバイスにアクセス可能なパスとの対応関係を示
すパスグループテーブルの内容を更新し、以後、更新し
たパスグループテーブルに基づいてアクセスするパスを
選択する。更に、リソースマネージャ33は上位装置の
異常を検出した場合には、障害情報にチャネル番号を付
加して上位装置へ報告し、上位装置は該情報に基づいて
指定されたチャネルをリカバリする。このようにすれ
ば、迅速にリカバリを行え、しかも、障害と無関係のア
クセスに影響を与えず、更には、上位装置の障害を該上
位装置に通知してリカバリさせることができる。
【0036】
(a) 非同期転送制御全体の構成 図11は本発明の非同期転送制御の実施例構成図であ
る。図中、20は上位装置としてのCPU、30は磁気
ディスク制御装置等のI/Oサブシステム、40はI/
Oデバイスとしての磁気ディスク装置であり、CKD形
式でデータが書き込まれている。I/Oサブシステムに
おいて、31a,31bは上位装置とのインターフェー
スを司るチャネルアダプタ(CA)、32a,32bは
磁気ディスク装置とのインターフェースを司るデバイス
アダプタ(DA)、33は全体の資源管理及び処理動作
に関する制御を行うリソースマネージャ(RM)、34
は磁気ディスク20から読み取ったCKDフォーマット
のデータを記憶する中間バッファ、35は各種テーブル
類を記憶するテーブル記憶部(TS)、36は各ユニッ
トに発生した障害を検知するサービスアダプタであり、
各ユニットは相互にバス接続されている。
る。図中、20は上位装置としてのCPU、30は磁気
ディスク制御装置等のI/Oサブシステム、40はI/
Oデバイスとしての磁気ディスク装置であり、CKD形
式でデータが書き込まれている。I/Oサブシステムに
おいて、31a,31bは上位装置とのインターフェー
スを司るチャネルアダプタ(CA)、32a,32bは
磁気ディスク装置とのインターフェースを司るデバイス
アダプタ(DA)、33は全体の資源管理及び処理動作
に関する制御を行うリソースマネージャ(RM)、34
は磁気ディスク20から読み取ったCKDフォーマット
のデータを記憶する中間バッファ、35は各種テーブル
類を記憶するテーブル記憶部(TS)、36は各ユニッ
トに発生した障害を検知するサービスアダプタであり、
各ユニットは相互にバス接続されている。
【0037】中間バッファ34にはレコード2のよう
に、読み取りエラーが発生しない場合には、カウント部
C、制御情報部F、キー部K、データ部Dが書き込まれ
る。制御情報部Fは例えば2ビットで構成されており、
キー部K、データ部Dが共に正常に読み取られた場
合”00”となり、キー部Kで読み取りエラーが発生
した場合”01”になり、データ部Dで読み取りエラ
ーが発生した場合”10”となり、両方でエラーが発
生した場合には”11”となる。一方、レコード1のよ
うにデータ部Dにおいて読み取りエラーが発生すると、
カウント部C、制御情報部F(”10”)、キー部K、
センスデータ(センスバイト)が書き込まれる。すなわ
ち、データ部Dで読み取りエラーが発生した場合には、
データDに代わってエラー内容を示す所定バイトのセン
スデータが書き込まれる。この場合、データDの長さ
(カウント部Cより既知)と等しいサイズの領域が中間
バッファ34に確保される。又、同様に、キー部Kにお
いて読み取りエラーが発生すると、カウント部C、制御
情報部F(01)、センスデータ、データ部Dが書き込
まれる。すなわち、キー部Kで読み取りエラーが発生し
た場合には、キー部Kに代わってエラー内容を示す所定
バイトのセンスデータが書き込まれる。
に、読み取りエラーが発生しない場合には、カウント部
C、制御情報部F、キー部K、データ部Dが書き込まれ
る。制御情報部Fは例えば2ビットで構成されており、
キー部K、データ部Dが共に正常に読み取られた場
合”00”となり、キー部Kで読み取りエラーが発生
した場合”01”になり、データ部Dで読み取りエラ
ーが発生した場合”10”となり、両方でエラーが発
生した場合には”11”となる。一方、レコード1のよ
うにデータ部Dにおいて読み取りエラーが発生すると、
カウント部C、制御情報部F(”10”)、キー部K、
センスデータ(センスバイト)が書き込まれる。すなわ
ち、データ部Dで読み取りエラーが発生した場合には、
データDに代わってエラー内容を示す所定バイトのセン
スデータが書き込まれる。この場合、データDの長さ
(カウント部Cより既知)と等しいサイズの領域が中間
バッファ34に確保される。又、同様に、キー部Kにお
いて読み取りエラーが発生すると、カウント部C、制御
情報部F(01)、センスデータ、データ部Dが書き込
まれる。すなわち、キー部Kで読み取りエラーが発生し
た場合には、キー部Kに代わってエラー内容を示す所定
バイトのセンスデータが書き込まれる。
【0038】バッファリング処理 図12は磁気ディスク装置40から中間バッファ34に
CKDフォーマットデータをバッファリングする場合の
説明図である。レコード1を読み取って中間バッファ3
4に書き込む場合、まず、カウント部Cを書き込み、
ついで、キー部Kを読み取り、読み取りエラーが発生
しない場合には、該キー部をそのまま書き込む。しか
る後、データ部Dを読み取り、読み取りエラーが発生し
たか監視し、読み取りエラーが発生していれば、データ
部Dの代わりにセンスデータを作成して書き込み、し
かる後、制御情報Fを作成して制御情報領域に書き込
む。
CKDフォーマットデータをバッファリングする場合の
説明図である。レコード1を読み取って中間バッファ3
4に書き込む場合、まず、カウント部Cを書き込み、
ついで、キー部Kを読み取り、読み取りエラーが発生
しない場合には、該キー部をそのまま書き込む。しか
る後、データ部Dを読み取り、読み取りエラーが発生し
たか監視し、読み取りエラーが発生していれば、データ
部Dの代わりにセンスデータを作成して書き込み、し
かる後、制御情報Fを作成して制御情報領域に書き込
む。
【0039】図13は中間バッファ34へのバッファリ
ング処理の流れ図である。デバイスアダプタ32a,3
2bは位置付け動作(シーク、セットセクタ動作)が完
了すると、直ちに磁気ディスク40から所定範囲(例え
ば次のインデックスマーク迄)のレコードを読み取って
中間バッファ34に書き込むバッファリング処理を開始
する。まず、最初のレコードのカウント部Ciを磁気デ
ィスク装置より読み取って中間バッファ34に格納する
(ステップ101)。ついで、キー部Kiを読み取る。
このKiの読み取りでエラーが発生したか監視し(ステ
ップ102)、エラーが発生してなければ、読み取った
キー部Kiを中間バッファ34に格納する(ステップ1
03)。一方、読み取りエラーが発生していると、デバ
イスアダプタはエラー内容、エラー発生アドレス等を含
むセンスデータを作成し、キー部Kiに代わって中間バ
ッファ34に格納する(ステップ104)。
ング処理の流れ図である。デバイスアダプタ32a,3
2bは位置付け動作(シーク、セットセクタ動作)が完
了すると、直ちに磁気ディスク40から所定範囲(例え
ば次のインデックスマーク迄)のレコードを読み取って
中間バッファ34に書き込むバッファリング処理を開始
する。まず、最初のレコードのカウント部Ciを磁気デ
ィスク装置より読み取って中間バッファ34に格納する
(ステップ101)。ついで、キー部Kiを読み取る。
このKiの読み取りでエラーが発生したか監視し(ステ
ップ102)、エラーが発生してなければ、読み取った
キー部Kiを中間バッファ34に格納する(ステップ1
03)。一方、読み取りエラーが発生していると、デバ
イスアダプタはエラー内容、エラー発生アドレス等を含
むセンスデータを作成し、キー部Kiに代わって中間バ
ッファ34に格納する(ステップ104)。
【0040】しかる後、データ部Diを読み取る。この
Diの読み取りでエラーが発生したか監視し(ステップ
105)、エラーが発生してなければ、読み取ったデー
タ部Diを中間バッファ34に格納する(ステップ10
6)。一方、読み取りエラーが発生していると、デバイ
スアダプタはエラー内容、エラー発生アドレス等を含む
センスデータを作成し、データ部Diに代わって中間バ
ッファ34に格納する(ステップ107)。ついで、キ
ー部、データ部における読み取りエラー発生状況を参照
して制御情報Fiを作成して中間バッファに格納する
(ステップ108)。Fi書き込み後、所定範囲内の全
レコードのバッファリングが終了したか、例えばインデ
ックスマークを検出したかチェックし(ステップ10
9)、検出してなければステップ101に戻り次のレコ
ードのバッファリングを行い、インデックスを検出した
ならバッファリング処理を終了する。
Diの読み取りでエラーが発生したか監視し(ステップ
105)、エラーが発生してなければ、読み取ったデー
タ部Diを中間バッファ34に格納する(ステップ10
6)。一方、読み取りエラーが発生していると、デバイ
スアダプタはエラー内容、エラー発生アドレス等を含む
センスデータを作成し、データ部Diに代わって中間バ
ッファ34に格納する(ステップ107)。ついで、キ
ー部、データ部における読み取りエラー発生状況を参照
して制御情報Fiを作成して中間バッファに格納する
(ステップ108)。Fi書き込み後、所定範囲内の全
レコードのバッファリングが終了したか、例えばインデ
ックスマークを検出したかチェックし(ステップ10
9)、検出してなければステップ101に戻り次のレコ
ードのバッファリングを行い、インデックスを検出した
ならバッファリング処理を終了する。
【0041】サーチID処理 図14はサーチ動作の説明図である。前述のバッファリ
ングが終了した状態で、サーチIDコマンドが上位装置
から入力されると、チャネルアダプタ31a,31bは
中間バッファ33上でカウント部Cのみサーチし(,
に参照)、その他の領域(制御情報領域、キー領域、
データ領域)のデータを読み飛ばす。この結果、たと
え、キー領域あるいはデータ領域にセンスデータが書き
込まれていてもエラー終了することなく、所望のレコー
ドをサーチすることができる。図15はサーチIDにお
ける処理の流れ図である。前述のバッファリングが終了
した状態で、サーチIDコマンドが上位装置から入力さ
れると、チャネルアダプタは最初のレコードのカウント
部を読み出し(ステップ121)、カウント部に含まれ
るレコード番号が指令されているレコード番号と一位し
ているか調べ(ステップ122)、一致していればサー
チ動作を終了し、一致してなければ、キー部、データ部
Dを読み飛ばし(ステップ123)、以後次のレコード
のカウントを読み出して同様の処理を実行する。
ングが終了した状態で、サーチIDコマンドが上位装置
から入力されると、チャネルアダプタ31a,31bは
中間バッファ33上でカウント部Cのみサーチし(,
に参照)、その他の領域(制御情報領域、キー領域、
データ領域)のデータを読み飛ばす。この結果、たと
え、キー領域あるいはデータ領域にセンスデータが書き
込まれていてもエラー終了することなく、所望のレコー
ドをサーチすることができる。図15はサーチIDにお
ける処理の流れ図である。前述のバッファリングが終了
した状態で、サーチIDコマンドが上位装置から入力さ
れると、チャネルアダプタは最初のレコードのカウント
部を読み出し(ステップ121)、カウント部に含まれ
るレコード番号が指令されているレコード番号と一位し
ているか調べ(ステップ122)、一致していればサー
チ動作を終了し、一致してなければ、キー部、データ部
Dを読み飛ばし(ステップ123)、以後次のレコード
のカウントを読み出して同様の処理を実行する。
【0042】データリード処理 図16はデータ読み取り動作の説明図、図17はデータ
読み取り時の処理の流れ図である。サーチID終了後に
上位装置からリードCKD(Read Count Key Data)が指
示されると、チャネルアダプタ31a〜31bはサーチ
されているレコードの先頭からカウント部Cを読み出す
(ステップ141)。ついで、制御情報部Fを読み取
り、該制御情報Fが”00”であるか、換言すれば、キ
ー部あるいはデータ部にセンス情報が書き込まれている
か調べる(ステップ142)。制御情報の内容”00”
であれば、キー部Kを読み出し、ついで、データ部Dを
読み出し(ステップ143、144)、1つのレコード
の読み出し処理を終了する。一方、ステップ142にお
いて、制御情報Fの内容が”00”でなければ、センス
データを読み出し、上位装置にエラーステータスを送る
と共に、センスデータを上位装置に報告し(ステップ1
45)、処理を終了する。
読み取り時の処理の流れ図である。サーチID終了後に
上位装置からリードCKD(Read Count Key Data)が指
示されると、チャネルアダプタ31a〜31bはサーチ
されているレコードの先頭からカウント部Cを読み出す
(ステップ141)。ついで、制御情報部Fを読み取
り、該制御情報Fが”00”であるか、換言すれば、キ
ー部あるいはデータ部にセンス情報が書き込まれている
か調べる(ステップ142)。制御情報の内容”00”
であれば、キー部Kを読み出し、ついで、データ部Dを
読み出し(ステップ143、144)、1つのレコード
の読み出し処理を終了する。一方、ステップ142にお
いて、制御情報Fの内容が”00”でなければ、センス
データを読み出し、上位装置にエラーステータスを送る
と共に、センスデータを上位装置に報告し(ステップ1
45)、処理を終了する。
【0043】尚、制御情報の第1ビットが”1”の場合
にはデータ領域にセンスデータが書き込まれているから
該データ領域よりセンスデータを読み出し、第2ビット
が”1”の場合にはキー領域にセンスデータが書き込ま
れているから該キー領域よりセンスデータを読み出す。
又、リードCD(Read Count Data)のようにキー部Kの
読み込取りを行わない場合にはキー部にセンス情報が書
き込まれていても(制御情報の第2ビット=”1”)エ
ラーとならず、カウント部Cとデータ部Dの読み取りを
行う。又,同様に、リードCK(Read Count Key)のよ
うにデータ部Dの読み込取りを行わない場合にはデータ
部にセンス情報が書き込まれていてもエラーとならず、
カウント部Cとキー部Dの読み取りを行う。以上、非同
期転送方式によりI/Oサブシステム(磁気ディスク制
御装置)を動作させても、直接ディスク装置上で読み込
み処理する同期転送方式と同じ動作を保証できる。
にはデータ領域にセンスデータが書き込まれているから
該データ領域よりセンスデータを読み出し、第2ビット
が”1”の場合にはキー領域にセンスデータが書き込ま
れているから該キー領域よりセンスデータを読み出す。
又、リードCD(Read Count Data)のようにキー部Kの
読み込取りを行わない場合にはキー部にセンス情報が書
き込まれていても(制御情報の第2ビット=”1”)エ
ラーとならず、カウント部Cとデータ部Dの読み取りを
行う。又,同様に、リードCK(Read Count Key)のよ
うにデータ部Dの読み込取りを行わない場合にはデータ
部にセンス情報が書き込まれていてもエラーとならず、
カウント部Cとキー部Dの読み取りを行う。以上、非同
期転送方式によりI/Oサブシステム(磁気ディスク制
御装置)を動作させても、直接ディスク装置上で読み込
み処理する同期転送方式と同じ動作を保証できる。
【0044】(b) 書き込み時のヘッド故障に対するデー
タ書き込み、読み出し制御全体の構成 図18は書き込み時のヘッド故障に対するデータ書き込
み、読み出し制御を実現するI/Oサブシステムの構成
図である。図中、20は上位装置としてのCPU、30
は磁気ディスク制御装置等のI/Oサブシステム、40
はI/Oデバイスとしての磁気ディスク装置であり、C
KD形式でデータが書き込まれている。I/Oサブシス
テムにおいて、31a,31bは上位装置とのインター
フェースを司るチャネルアダプタ(CA)、32a,3
2bは磁気ディスク装置とのインターフェースを司るデ
バイスアダプタ(DA)、33は全体の資源管理及び処
理動作に関する制御を行うリソースマネージャ(R
M)、35は各種テーブル類を記憶するテーブル記憶部
(TS)、36は各ユニットに発生した障害を検知する
サービスアダプタ、37は不揮発性の制御メモリ(バッ
テリーバックアップされたRAMを含む)であり、各ユ
ニットは相互にバス接続されている。
タ書き込み、読み出し制御全体の構成 図18は書き込み時のヘッド故障に対するデータ書き込
み、読み出し制御を実現するI/Oサブシステムの構成
図である。図中、20は上位装置としてのCPU、30
は磁気ディスク制御装置等のI/Oサブシステム、40
はI/Oデバイスとしての磁気ディスク装置であり、C
KD形式でデータが書き込まれている。I/Oサブシス
テムにおいて、31a,31bは上位装置とのインター
フェースを司るチャネルアダプタ(CA)、32a,3
2bは磁気ディスク装置とのインターフェースを司るデ
バイスアダプタ(DA)、33は全体の資源管理及び処
理動作に関する制御を行うリソースマネージャ(R
M)、35は各種テーブル類を記憶するテーブル記憶部
(TS)、36は各ユニットに発生した障害を検知する
サービスアダプタ、37は不揮発性の制御メモリ(バッ
テリーバックアップされたRAMを含む)であり、各ユ
ニットは相互にバス接続されている。
【0045】制御メモリ37には、CKDフォーマット
データを磁気ディスク装置40の所定アドレスCCHH
Rに書き込む際、一部データ(例えばキー部K)の書き
替え後にヘッドに故障が発生して残りの部分(データ部
D)の書き替えができない場合、該アドレスCCHHR
が記憶・保持される。ライトキーデータ(Write Key Da
ta)コマンドを実行中に書き込みヘッドが故障する場合
がある。例えば、キー部(キー領域)の書き込みが正常に
終了し、次のデータ部(データ領域)への移動中にヘッド
が故障した場合である。かかる故障が生じると、データ
保証上の問題が生じる。図19はかかるヘッド障害によ
りデータの一部が新しく、データの一部が古いレコード
を読み出そうとするときエラーを発生して、データを保
証する場合の処理の流れ図である。
データを磁気ディスク装置40の所定アドレスCCHH
Rに書き込む際、一部データ(例えばキー部K)の書き
替え後にヘッドに故障が発生して残りの部分(データ部
D)の書き替えができない場合、該アドレスCCHHR
が記憶・保持される。ライトキーデータ(Write Key Da
ta)コマンドを実行中に書き込みヘッドが故障する場合
がある。例えば、キー部(キー領域)の書き込みが正常に
終了し、次のデータ部(データ領域)への移動中にヘッド
が故障した場合である。かかる故障が生じると、データ
保証上の問題が生じる。図19はかかるヘッド障害によ
りデータの一部が新しく、データの一部が古いレコード
を読み出そうとするときエラーを発生して、データを保
証する場合の処理の流れ図である。
【0046】シーク、セットセクタ、サーチIDによる
位置付け動作終了後に、上位装置よりチャネルアダプタ
31a,31bを介して書き込み又は読み出しコマンド
を受信すると、リソースマネージャ33は書き込みコマ
ンドの場合には書き込みアドレスCCHHRを制御メモ
リ37に格納する(ステップ201〜203)。つい
で、デバイスアダプタ32a,32bは磁気ディスク装
置40にCKDフォーマットデータの書き込みを指示
し、データの書き込みを行わせる(ステップ204)。
この書き込み動作は、チャネルアダプタ31a〜31
bよりカウント部Cの書き込み指示し、正常に書き込
めればキー部Kの書き込みを指示し、ついで、正常に
書き込めればデータ部Dの書き込みを指示し、正常に
書き込めれば書き込み終了を上位装置に通知することに
より行う。かかる書き込み動作において、キー部Kを正
常に書き込んだ後、ヘッドが移動中に障害発生によりデ
ータ部Dの書き込みができなくなると、書き込みエラー
が発生する。デバイスアダプタ32a,32bはかかる
エラーが発生したか監視しており(ステップ205)、
エラーが発生すれば、直ちに書き込みを停止し(異常終
了:ステップ206)、エラーステータスをチャネルア
ダプタを介して上位装置に通知し(ステップ207)、
書き込みを終了する。この場合、制御メモリ37に書き
込まれている書き込みアドレスCCHHRは抹消されず
に記憶、保持される。
位置付け動作終了後に、上位装置よりチャネルアダプタ
31a,31bを介して書き込み又は読み出しコマンド
を受信すると、リソースマネージャ33は書き込みコマ
ンドの場合には書き込みアドレスCCHHRを制御メモ
リ37に格納する(ステップ201〜203)。つい
で、デバイスアダプタ32a,32bは磁気ディスク装
置40にCKDフォーマットデータの書き込みを指示
し、データの書き込みを行わせる(ステップ204)。
この書き込み動作は、チャネルアダプタ31a〜31
bよりカウント部Cの書き込み指示し、正常に書き込
めればキー部Kの書き込みを指示し、ついで、正常に
書き込めればデータ部Dの書き込みを指示し、正常に
書き込めれば書き込み終了を上位装置に通知することに
より行う。かかる書き込み動作において、キー部Kを正
常に書き込んだ後、ヘッドが移動中に障害発生によりデ
ータ部Dの書き込みができなくなると、書き込みエラー
が発生する。デバイスアダプタ32a,32bはかかる
エラーが発生したか監視しており(ステップ205)、
エラーが発生すれば、直ちに書き込みを停止し(異常終
了:ステップ206)、エラーステータスをチャネルア
ダプタを介して上位装置に通知し(ステップ207)、
書き込みを終了する。この場合、制御メモリ37に書き
込まれている書き込みアドレスCCHHRは抹消されず
に記憶、保持される。
【0047】一方、レコードの書き込みが正常に行われ
て書き込みが終了すれば(ステップ208)、デバイス
アダプタは正常終了をリソースマネージャ33に通知す
る。これにより、リソースマネージャ33は制御メモリ
37に書き込んだ書き込みアドレスCCHHRをメモリ
から抹消する(ステップ209)。ついで、リソースマ
ネージャ33は制御メモリ37の他の領域に書き込みア
ドレスと一致するアドレスCCHHRが記憶さているか
調べステップ210)、存在すれば、該アドレスを制御
メモリ37から抹消する(ステップ211)。これによ
り、以前ヘッド障害により正しく磁気ディスク装置40
に書き込まれず、このため不当データアドレスとして制
御メモリ37に記憶されているアドレスが抹消され、以
後該アドレスのデータは正当なものとして取り扱うこと
ができる。これは、書き込みヘッドが一時的な障害で異
常を起したが、再び使用可能になった場合である。
て書き込みが終了すれば(ステップ208)、デバイス
アダプタは正常終了をリソースマネージャ33に通知す
る。これにより、リソースマネージャ33は制御メモリ
37に書き込んだ書き込みアドレスCCHHRをメモリ
から抹消する(ステップ209)。ついで、リソースマ
ネージャ33は制御メモリ37の他の領域に書き込みア
ドレスと一致するアドレスCCHHRが記憶さているか
調べステップ210)、存在すれば、該アドレスを制御
メモリ37から抹消する(ステップ211)。これによ
り、以前ヘッド障害により正しく磁気ディスク装置40
に書き込まれず、このため不当データアドレスとして制
御メモリ37に記憶されているアドレスが抹消され、以
後該アドレスのデータは正当なものとして取り扱うこと
ができる。これは、書き込みヘッドが一時的な障害で異
常を起したが、再び使用可能になった場合である。
【0048】以後、デバイスアダプタ32a〜32bは
チャネルアダプタ31a〜31bを介して書き込み動作
終了をチャネル通知して書き込み処理を終了する。以上
は、書き込みの場合であるが、読み出しコマンドが上位
スイッチより入力してリソースマネージャ33に通知さ
れると、リソースマネージャ33はリードアドレスCC
HHRが制御メモリ37に記憶されているか調べ(ステ
ップ212)、記憶されていなければ、該リードアドレ
スに正当なレコードが記録されているものとみなして、
チャネルアダプタ、デバイスアダプタに読み出し可を通
知する(ステップ213)。これにより、デバイスアダ
プタは磁気ディスク装置40よりレコードを読み取り、
該レコードをチャネルアダプタを介して上位装置に転送
して読み出し処理を終了する(ステップ214)。一
方、リードアドレスと一致するアドレスが制御メモリ3
7に記憶されていれば、該リードアドレスに記録されて
いるデータは不当なデータであるとみなして読み出すこ
となくデータエラー通知を上位装置に送出して読み出し
処理を終了する(ステップ215)。これにより、上位
装置20は異常に気づき、処理を中断、適当なリカバリ
を行うことになる。
チャネルアダプタ31a〜31bを介して書き込み動作
終了をチャネル通知して書き込み処理を終了する。以上
は、書き込みの場合であるが、読み出しコマンドが上位
スイッチより入力してリソースマネージャ33に通知さ
れると、リソースマネージャ33はリードアドレスCC
HHRが制御メモリ37に記憶されているか調べ(ステ
ップ212)、記憶されていなければ、該リードアドレ
スに正当なレコードが記録されているものとみなして、
チャネルアダプタ、デバイスアダプタに読み出し可を通
知する(ステップ213)。これにより、デバイスアダ
プタは磁気ディスク装置40よりレコードを読み取り、
該レコードをチャネルアダプタを介して上位装置に転送
して読み出し処理を終了する(ステップ214)。一
方、リードアドレスと一致するアドレスが制御メモリ3
7に記憶されていれば、該リードアドレスに記録されて
いるデータは不当なデータであるとみなして読み出すこ
となくデータエラー通知を上位装置に送出して読み出し
処理を終了する(ステップ215)。これにより、上位
装置20は異常に気づき、処理を中断、適当なリカバリ
を行うことになる。
【0049】以上のようにすれば、レコード書き込み時
にヘッド障害によりCKDフォーマットの一部のみ正常
に書き替えられ、他の部分が書き替えられなかった場合
でも上位装置が不当なデータを使用する危険を防止で
き、データ保証上の問題が生じない。又、メモリを不揮
発性記憶手段で構成したから電源が再投入された場合で
あっても不当なデータへのアクセスを検出してエラー通
知できる。更に、一時的にヘッドに障害が発生してある
アドレスのデータが不当な状態になっても、正常に該ア
ドレスのデータが更新された場合にはメモリからアドレ
スを削除することにより以後正常データとして扱う事が
できる。
にヘッド障害によりCKDフォーマットの一部のみ正常
に書き替えられ、他の部分が書き替えられなかった場合
でも上位装置が不当なデータを使用する危険を防止で
き、データ保証上の問題が生じない。又、メモリを不揮
発性記憶手段で構成したから電源が再投入された場合で
あっても不当なデータへのアクセスを検出してエラー通
知できる。更に、一時的にヘッドに障害が発生してある
アドレスのデータが不当な状態になっても、正常に該ア
ドレスのデータが更新された場合にはメモリからアドレ
スを削除することにより以後正常データとして扱う事が
できる。
【0050】変形例 以上では不当データのアクセス時にデータエラーを上位
装置に送出した場合であるが、設定回数以上不当なデー
タの書き込みが行われた時、磁気ディスク異常のエラー
フラグを制御メモリ37に記憶しておき、アクセス時に
該エラーフラグが立っている場合には、ディスクエラー
通知を行って磁気ディスク全てにアクセスをできないよ
うにすることもできる。これにより、ヘッドの障害が不
安定な異常状態(正常と異常が不定期に繰り返されるよ
うな状態)において、データの保証をより完全に行うこ
とができる。図20はかかる場合の処理の流れ図であ
り、上位装置よりシークコマンドを受信した時(ステッ
プ231)、リソースマネージャ33はエラーフラグが
立っているか調べ(ステップ232)、立っている場合
にはディスクエラーを上位装置に送出して処理を終了す
る(ステップ233)。一方、エラーフラグが立ってい
ない場合には、シークに応じた処理を行い(ステップ2
34)、位置付け後図19の処理を行う。
装置に送出した場合であるが、設定回数以上不当なデー
タの書き込みが行われた時、磁気ディスク異常のエラー
フラグを制御メモリ37に記憶しておき、アクセス時に
該エラーフラグが立っている場合には、ディスクエラー
通知を行って磁気ディスク全てにアクセスをできないよ
うにすることもできる。これにより、ヘッドの障害が不
安定な異常状態(正常と異常が不定期に繰り返されるよ
うな状態)において、データの保証をより完全に行うこ
とができる。図20はかかる場合の処理の流れ図であ
り、上位装置よりシークコマンドを受信した時(ステッ
プ231)、リソースマネージャ33はエラーフラグが
立っているか調べ(ステップ232)、立っている場合
にはディスクエラーを上位装置に送出して処理を終了す
る(ステップ233)。一方、エラーフラグが立ってい
ない場合には、シークに応じた処理を行い(ステップ2
34)、位置付け後図19の処理を行う。
【0051】(c) 動的経路再結合制御 最近の大型コンピュータシステムにおいては、その規模
の巨大化に伴い、複数の中央処理装置(CPU)でシス
テムを構成することが通例となっている。かかるシステ
ムでは、複数のCPU間でのデータの共用・データの通
信が必要になる。このために、システム内で使用される
外部記憶装置を始めとするI/Oサブシステムでは多数
のホストインターフェース(上位インターフェース)を
装備することが要求されている。この要求に答えるため
にI/Oサブシステム内に複数のチャネルアダプタを装
備し、これらチャネルアダプタとCPU間を多数のパス
で接続している。かかるシステムにおいては、1つのチ
ャネルアダプタにアクセスが集中し、該チャネルアダプ
タのビジー率(Busy率)が高くなり、結果的にアクセス
の応答が遅くなり、性能低下を生じる場合がある。
の巨大化に伴い、複数の中央処理装置(CPU)でシス
テムを構成することが通例となっている。かかるシステ
ムでは、複数のCPU間でのデータの共用・データの通
信が必要になる。このために、システム内で使用される
外部記憶装置を始めとするI/Oサブシステムでは多数
のホストインターフェース(上位インターフェース)を
装備することが要求されている。この要求に答えるため
にI/Oサブシステム内に複数のチャネルアダプタを装
備し、これらチャネルアダプタとCPU間を多数のパス
で接続している。かかるシステムにおいては、1つのチ
ャネルアダプタにアクセスが集中し、該チャネルアダプ
タのビジー率(Busy率)が高くなり、結果的にアクセス
の応答が遅くなり、性能低下を生じる場合がある。
【0052】そこで、ビジー率を下げることによりシス
テム性能を向上する動的経路再結合機能が提案されてい
る。この動的経路再結合機能は、予めどのパスとどのパ
スが同一CPUに接続されているかを認識させておく。
そして、ヘッドの位置付け動作を完了した時(例えばサ
ーチID動作終了時)、CPUへの動作終了報告時にリ
ソースマネージャが、どのチャネルアダプタが同一CP
Uに接続されているかを調べ、空いている所定のチャネ
ルアダプタにCPUへの報告を行なわせるものであり、
複数のパス(チャネルアダプタ)を有効に利用できる。
しかし、かかる従来の動的経路再結合方式では、再結合
時に、グループを組んでいる複数のチャネルアダプタの
うち空いているチャネルアダプタに割込みを発生させる
ものであり、チャネルアダプタのビジー率は考慮されて
おらず、性能改善の効果が小さい。
テム性能を向上する動的経路再結合機能が提案されてい
る。この動的経路再結合機能は、予めどのパスとどのパ
スが同一CPUに接続されているかを認識させておく。
そして、ヘッドの位置付け動作を完了した時(例えばサ
ーチID動作終了時)、CPUへの動作終了報告時にリ
ソースマネージャが、どのチャネルアダプタが同一CP
Uに接続されているかを調べ、空いている所定のチャネ
ルアダプタにCPUへの報告を行なわせるものであり、
複数のパス(チャネルアダプタ)を有効に利用できる。
しかし、かかる従来の動的経路再結合方式では、再結合
時に、グループを組んでいる複数のチャネルアダプタの
うち空いているチャネルアダプタに割込みを発生させる
ものであり、チャネルアダプタのビジー率は考慮されて
おらず、性能改善の効果が小さい。
【0053】図21は本発明の動的経路再結合制御を実
現するI/Oサブシステムの構成図である。21,21
・・・はホスト装置(CPU)であり、それぞれ複数の
チャネル22a,22b,22c・・・を備えている。
30は磁気制御ディスク装置としてのI/Oサブシステ
ム、40a〜40fは磁気ディスク装置(DASD)で
ある。I/Oサブシステム30において、31a〜31
c,31a′〜31c′は上位装置とのインターフェー
スを司るチャネルアダプタ(CA)、32a〜32c,
32a′〜32c′は磁気ディスク装置とのインターフ
ェースを司るデバイスアダプタ(DA)、33は全体の
資源管理及び処理動作に関する制御を行うリソースマネ
ージャ(RM)、35は各種テーブル類を記憶するテー
ブル記憶部(TS)、36a〜36a′は各ユニットに
発生した障害を検知するサービスアダプタであり、各ユ
ニットは相互にバス38a,38a′で接続されてい
る。各バス38a,38a′は図示しないがC-BUS,D-BU
S,S-BUSを有している。C-BUSは各ユニットがメッセージ
通信及び制御情報のアクセスを行う制御用バス、D-BUS
は各ユニットがデータを授受するデータ転送用バス、S-
BUSはサービスモジュール36a,36a′がマスター
になり、各ユニットの状況を管理するサービスバスであ
る。
現するI/Oサブシステムの構成図である。21,21
・・・はホスト装置(CPU)であり、それぞれ複数の
チャネル22a,22b,22c・・・を備えている。
30は磁気制御ディスク装置としてのI/Oサブシステ
ム、40a〜40fは磁気ディスク装置(DASD)で
ある。I/Oサブシステム30において、31a〜31
c,31a′〜31c′は上位装置とのインターフェー
スを司るチャネルアダプタ(CA)、32a〜32c,
32a′〜32c′は磁気ディスク装置とのインターフ
ェースを司るデバイスアダプタ(DA)、33は全体の
資源管理及び処理動作に関する制御を行うリソースマネ
ージャ(RM)、35は各種テーブル類を記憶するテー
ブル記憶部(TS)、36a〜36a′は各ユニットに
発生した障害を検知するサービスアダプタであり、各ユ
ニットは相互にバス38a,38a′で接続されてい
る。各バス38a,38a′は図示しないがC-BUS,D-BU
S,S-BUSを有している。C-BUSは各ユニットがメッセージ
通信及び制御情報のアクセスを行う制御用バス、D-BUS
は各ユニットがデータを授受するデータ転送用バス、S-
BUSはサービスモジュール36a,36a′がマスター
になり、各ユニットの状況を管理するサービスバスであ
る。
【0054】I/Oサブシステム30は中央点線で左右
に対称に構成された二重化構成になっており、リソース
マネージャRM,テーブル記憶部TSは共通モジュール
を構成している。CPU20は第1コントローラ側G0
と第2コントローラ側G1側のチャネルアダプタに適宜
接続され、又、各ディスク装置40a〜40fは第1コ
ントローラ側G0と第2コントローラ側G1からアクセ
ス可能になっている。従って、一方のチャネルアダプタ
あるいはデバイスアダプタに障害が生じてもCPUは他
方のチャネルアダプタ、デバイスアダプタから磁気ディ
スク装置にアクセスすることができる。
に対称に構成された二重化構成になっており、リソース
マネージャRM,テーブル記憶部TSは共通モジュール
を構成している。CPU20は第1コントローラ側G0
と第2コントローラ側G1側のチャネルアダプタに適宜
接続され、又、各ディスク装置40a〜40fは第1コ
ントローラ側G0と第2コントローラ側G1からアクセ
ス可能になっている。従って、一方のチャネルアダプタ
あるいはデバイスアダプタに障害が生じてもCPUは他
方のチャネルアダプタ、デバイスアダプタから磁気ディ
スク装置にアクセスすることができる。
【0055】チャネルアダプタ31a〜31c′、デバ
イスアダプタ32a〜32c′、リソースマネージャ3
3、サービスアダプタ36a,36a′はそれぞれマイ
クロプロセッサで構成されており、おおむね図22に示
す構成を備えている。図において、51はマイクロプロ
セッサ(MPU)、52はRAM構成の制御記憶部(C
S)、53はROM構成の制御記憶部(CS)、54は
内部バスに接続されたドライバ/レシーバ(DV/R
V)、55はバスインターフェースロジック(BI
L)、56は外部インターフェースと接続されたドライ
バ/レシーバ(DV/RV)、57はバッファ又はテー
ブル記憶部(TS)、58は個別LSI(ゲートアレ
イ)である。
イスアダプタ32a〜32c′、リソースマネージャ3
3、サービスアダプタ36a,36a′はそれぞれマイ
クロプロセッサで構成されており、おおむね図22に示
す構成を備えている。図において、51はマイクロプロ
セッサ(MPU)、52はRAM構成の制御記憶部(C
S)、53はROM構成の制御記憶部(CS)、54は
内部バスに接続されたドライバ/レシーバ(DV/R
V)、55はバスインターフェースロジック(BI
L)、56は外部インターフェースと接続されたドライ
バ/レシーバ(DV/RV)、57はバッファ又はテー
ブル記憶部(TS)、58は個別LSI(ゲートアレ
イ)である。
【0056】テーブル記憶部35には各種テーブルが記
憶されているが、動的経路再結合に関係するテーブルと
してパスグループテーブルPGTが記憶されている。図
23は簡略化したパスグループテーブルPGTの説明図
であり、ホスト装置(CPU)に対応させて該ホスト装
置に接続されるチャネルアダプタCA(パス)を記憶す
るものであり、各チャネルアダプタCAに対応させて一
定時間に使用された度合を示すビジー率及びビジー率算
出に必要なI/O処理回数が記憶されている。
憶されているが、動的経路再結合に関係するテーブルと
してパスグループテーブルPGTが記憶されている。図
23は簡略化したパスグループテーブルPGTの説明図
であり、ホスト装置(CPU)に対応させて該ホスト装
置に接続されるチャネルアダプタCA(パス)を記憶す
るものであり、各チャネルアダプタCAに対応させて一
定時間に使用された度合を示すビジー率及びビジー率算
出に必要なI/O処理回数が記憶されている。
【0057】図24は本発明の動的経路再結合制御の処
理の流れ図である。サーチID動作が終了すると(ステ
ップ301)、リソースマネージャ33は動的経路再結
合機能があるか判断し(ステップ302)、なければ動
的経路再結合によらない通常の制御を実行する。動的経
路再結合機能があれば、リソースマネージャ33は最初
のアクセス要求(シーク、セットセクタコマンド等)を
受け付けたチャネルアダプタと同一グループにおいてビ
ジー率が最も小さなチャネルアダプタをパスグループテ
ーブルPGTを参照して求め(ステップ303)、求め
たチャネルアダプタを介してサーチID動作終了の割込
みをホスト装置に通知する(ステップ304)。
理の流れ図である。サーチID動作が終了すると(ステ
ップ301)、リソースマネージャ33は動的経路再結
合機能があるか判断し(ステップ302)、なければ動
的経路再結合によらない通常の制御を実行する。動的経
路再結合機能があれば、リソースマネージャ33は最初
のアクセス要求(シーク、セットセクタコマンド等)を
受け付けたチャネルアダプタと同一グループにおいてビ
ジー率が最も小さなチャネルアダプタをパスグループテ
ーブルPGTを参照して求め(ステップ303)、求め
たチャネルアダプタを介してサーチID動作終了の割込
みをホスト装置に通知する(ステップ304)。
【0058】これにより、ホスト装置は割込みパスより
書き込みコマンドWD又は読み出しコマンドRDを送出
し、チャネルアダプタは該コマンドを受け取る(ステッ
プ305)。読み出しコマンドRDであれば、デバイス
アダプタは所定の磁気ディスク装置よりデータを読み取
り、該データを読み出しコマンドを受け取ったチャネル
アダプタを介して上位装置へ転送する(ステップ306
〜308)。リソースマネージャ33はデータ読み出し
が終了すれば、該チャネルアダプタのI/O処理回数を
1だけカウントアップし(ステップ309)、処理を終
了する。
書き込みコマンドWD又は読み出しコマンドRDを送出
し、チャネルアダプタは該コマンドを受け取る(ステッ
プ305)。読み出しコマンドRDであれば、デバイス
アダプタは所定の磁気ディスク装置よりデータを読み取
り、該データを読み出しコマンドを受け取ったチャネル
アダプタを介して上位装置へ転送する(ステップ306
〜308)。リソースマネージャ33はデータ読み出し
が終了すれば、該チャネルアダプタのI/O処理回数を
1だけカウントアップし(ステップ309)、処理を終
了する。
【0059】一方、ホスト装置からのコマンドが書き込
みコマンドWDであれば、チャネルアダプタはデバイス
アダプタを介してデータを磁気ディスク装置に書き込む
(ステップ306、310、311)。リソースマネー
ジャ33はデータ書き込みが終了すれば、該チャネルア
ダプタのI/O処理回数を1だけカウントアップし(ス
テップ309)、処理を終了する。尚、以上ではデータ
転送に係ったチャネルアダプタのI/O処理回数を1カ
ウントアップしたが、最初のシークコマンドを受け付け
たチャネルアダプタのI/O処理回数も1カウントアッ
プしたり、カウントアップする数を適宜定めることがで
きる。
みコマンドWDであれば、チャネルアダプタはデバイス
アダプタを介してデータを磁気ディスク装置に書き込む
(ステップ306、310、311)。リソースマネー
ジャ33はデータ書き込みが終了すれば、該チャネルア
ダプタのI/O処理回数を1だけカウントアップし(ス
テップ309)、処理を終了する。尚、以上ではデータ
転送に係ったチャネルアダプタのI/O処理回数を1カ
ウントアップしたが、最初のシークコマンドを受け付け
たチャネルアダプタのI/O処理回数も1カウントアッ
プしたり、カウントアップする数を適宜定めることがで
きる。
【0060】リソースマネージャ33は図25に示すよ
うに、一定時間毎にビジー率を次式 ビジー率=(I/O処理回数)/一定時間 により計算して、該ビジー率をパスグループテーブルP
GTの対象項目欄(ビジー率欄)に書き込み、同時にI
/O処理回数を0にクリアする(ステップ351、35
2)。このように、ビジー率を算出し、同一グループ内
のビジー率の低いチャネルアダプタを介してデータ転送
を行うように動的経路再結合制御を行うから、資源の有
効利用が図れ、アクセスに対するレスポンスを短縮で
き、システム性能を向上できる。
うに、一定時間毎にビジー率を次式 ビジー率=(I/O処理回数)/一定時間 により計算して、該ビジー率をパスグループテーブルP
GTの対象項目欄(ビジー率欄)に書き込み、同時にI
/O処理回数を0にクリアする(ステップ351、35
2)。このように、ビジー率を算出し、同一グループ内
のビジー率の低いチャネルアダプタを介してデータ転送
を行うように動的経路再結合制御を行うから、資源の有
効利用が図れ、アクセスに対するレスポンスを短縮で
き、システム性能を向上できる。
【0061】(d) 障害発生モジュールのリカバリ制御 図21に示すように、モジュール化されたI/Oサブシ
ステム(磁気ディスク制御装置)では、各モジュールの
障害発生を検出してリカバリ処理するモジュール(サー
ビスアダプタSA:Service Adapter)36a,36a′
が設けられている。サービスアダプタ36aは第1コン
トローラ側G0のモジュールの障害検出、リカバリ処理
を行い、サービスアダプタ36a′は第2コントローラ
側G1の障害検出、リカバリ処理を行う。共通モジュー
ルについては、サービスアダプ36a,36a′のう
ち、早く立ち上がった方が自分が共通モジュールを担当
する旨を他方に宣言することにより障害検出、リカバリ
処理が行われる。
ステム(磁気ディスク制御装置)では、各モジュールの
障害発生を検出してリカバリ処理するモジュール(サー
ビスアダプタSA:Service Adapter)36a,36a′
が設けられている。サービスアダプタ36aは第1コン
トローラ側G0のモジュールの障害検出、リカバリ処理
を行い、サービスアダプタ36a′は第2コントローラ
側G1の障害検出、リカバリ処理を行う。共通モジュー
ルについては、サービスアダプ36a,36a′のう
ち、早く立ち上がった方が自分が共通モジュールを担当
する旨を他方に宣言することにより障害検出、リカバリ
処理が行われる。
【0062】図26はサービスアダプタに障害が発生し
ていない正常時のリカバリ処理の流れ図である。所定の
モジュールに障害が発生(CHECK1発生)すると(ステップ
601)、サービスアダプタ36aは該障害発生をS-BU
Sを経由して知ることができる(ステップ401)。サー
ビスアダプタ36aは障害発生のモジュールのリカバリ
処理する時、リカバリ処理中該モジュールを使用させな
いために、リソースモジュール33に"HALT OPERATION"
を発行する(ステップ402)。これにより、リソース
マネージャ33は通知されたモジュールをONLINEからOF
FLINEに変更して該モジュールを動作不能状態に設定す
る(ステップ501、502)。尚、モジュール間通信
はC-BUSを経由したコマンドにより行われる。
ていない正常時のリカバリ処理の流れ図である。所定の
モジュールに障害が発生(CHECK1発生)すると(ステップ
601)、サービスアダプタ36aは該障害発生をS-BU
Sを経由して知ることができる(ステップ401)。サー
ビスアダプタ36aは障害発生のモジュールのリカバリ
処理する時、リカバリ処理中該モジュールを使用させな
いために、リソースモジュール33に"HALT OPERATION"
を発行する(ステップ402)。これにより、リソース
マネージャ33は通知されたモジュールをONLINEからOF
FLINEに変更して該モジュールを動作不能状態に設定す
る(ステップ501、502)。尚、モジュール間通信
はC-BUSを経由したコマンドにより行われる。
【0063】サービスアダプタ36aは"HALT OPERATIO
N"発行後、障害モジュールのリカバリ処理をS-BUS経由
で行い(ステップ403,404)、リカバリ処理され
たモジュールはリソースマネージャ33からの動作許可
指示(SET ONLINE)待ちになる(ステップ602、60
3)。すなわち、リソースマネージャ33内ではリカバ
リ処理されたモジュールはOFFLINE状態であり、従って
該モジュールに動作許可の指示が必要である。リカバリ
処理によりモジュールが再度使用できる状態になると、
サービスアダプタ36aはリソースマネージャ33に”
CHANGE MODULE STATUS"コマンドを発行し、該モジュー
ルのリカバリ処理が完了し、使用可能状態になったこと
を通知する(ステップ405)。
N"発行後、障害モジュールのリカバリ処理をS-BUS経由
で行い(ステップ403,404)、リカバリ処理され
たモジュールはリソースマネージャ33からの動作許可
指示(SET ONLINE)待ちになる(ステップ602、60
3)。すなわち、リソースマネージャ33内ではリカバ
リ処理されたモジュールはOFFLINE状態であり、従って
該モジュールに動作許可の指示が必要である。リカバリ
処理によりモジュールが再度使用できる状態になると、
サービスアダプタ36aはリソースマネージャ33に”
CHANGE MODULE STATUS"コマンドを発行し、該モジュー
ルのリカバリ処理が完了し、使用可能状態になったこと
を通知する(ステップ405)。
【0064】リソースマネージャ33は”CHANGE MODUL
E STATUS"コマンドを受信すれば、通知されたモジュー
ルをOFFLINEからONLINEに戻し、"SET ONLINE"コマンド
を該モジュールに発行して動作を許可する(ステップ5
03、504)。モジュールは"SET ONLINE"コマンドの
受信により動作可能になる(ステップ603、60
4)。ところで、リカバリ処理を完了する前に、あるい
はリカバリ処理完了後”CHANGE MODULE STATUS"コマン
ド発行前にサービスアダプタ36aに障害が発生する
と、”CHANGE MODULE STATUS"コマンドを発行できなく
なり、モジュールはいつまでも動作できなくなり、最悪
の場合システムダウンという異常状態となる。通常、障
害の発生したサービスアダプタ36aは他方のサービス
アダプタ36a′のリカバリ処理により復帰して通常の
障害検出、リカバリ処理が可能になる。このように復旧
した場合であっても、サービスアダプタ36aはリカバ
リ処理すべきモジュールや”CHANGE MODULE STATUS"コ
マンドを発行しなければならないということを忘れてし
まい、モジュールはいつまでも動作できなくなり、最悪
の場合システムダウンという異常状態となる。
E STATUS"コマンドを受信すれば、通知されたモジュー
ルをOFFLINEからONLINEに戻し、"SET ONLINE"コマンド
を該モジュールに発行して動作を許可する(ステップ5
03、504)。モジュールは"SET ONLINE"コマンドの
受信により動作可能になる(ステップ603、60
4)。ところで、リカバリ処理を完了する前に、あるい
はリカバリ処理完了後”CHANGE MODULE STATUS"コマン
ド発行前にサービスアダプタ36aに障害が発生する
と、”CHANGE MODULE STATUS"コマンドを発行できなく
なり、モジュールはいつまでも動作できなくなり、最悪
の場合システムダウンという異常状態となる。通常、障
害の発生したサービスアダプタ36aは他方のサービス
アダプタ36a′のリカバリ処理により復帰して通常の
障害検出、リカバリ処理が可能になる。このように復旧
した場合であっても、サービスアダプタ36aはリカバ
リ処理すべきモジュールや”CHANGE MODULE STATUS"コ
マンドを発行しなければならないということを忘れてし
まい、モジュールはいつまでも動作できなくなり、最悪
の場合システムダウンという異常状態となる。
【0065】かかる場合のリカバリ処理として以下の3
つ方法がある。第1の方法は、サービスアダプタに定期
的に各モジュールの障害検出パトロールを実行させる方
法である。このようにすれば、サービスアダプタは復旧
後にもパトロールを行うことになり、パトロールにより
モジュールの障害を発見し、該モジュールをリカバリ処
理して”CHANGE MODULE STATUS"コマンドを発行でき
る。このようにすれば、サービスアダプタが障害により
リカバリ処理すべきモジュールや”CHANGE MODULE STAT
US"コマンドの発行を忘れても、復旧後該モジュールを
リカバリ処理して”CHANGE MODULE STATUS"コマンドを
発行できる。尚、通常は、各モジュールの障害発生と同
時にサービスアダプタがリカバリ処理を行う。
つ方法がある。第1の方法は、サービスアダプタに定期
的に各モジュールの障害検出パトロールを実行させる方
法である。このようにすれば、サービスアダプタは復旧
後にもパトロールを行うことになり、パトロールにより
モジュールの障害を発見し、該モジュールをリカバリ処
理して”CHANGE MODULE STATUS"コマンドを発行でき
る。このようにすれば、サービスアダプタが障害により
リカバリ処理すべきモジュールや”CHANGE MODULE STAT
US"コマンドの発行を忘れても、復旧後該モジュールを
リカバリ処理して”CHANGE MODULE STATUS"コマンドを
発行できる。尚、通常は、各モジュールの障害発生と同
時にサービスアダプタがリカバリ処理を行う。
【0066】第2の方法は、リソースマネージャ33
が"HALT OPERATION"受信後の経過時間を監視し、経過時
間が設定時間を超えた時、サービスアダプタ36aにリ
カバリ処理ができた問い合わせる方法である。この第2
の方法によれば、問い合わせ時にサービスアダプタ36
aが復旧していれば、サービスアダプタ36aは該問い
合わせコマンドで特定されたモジュールにリカバリ処理
を施し、しかる後、”CHANGE MODULE STATUS"コマンド
発行できる。第3の方法は、障害発生モジュールがリカ
バリ処理により復旧した時、以後の経過時間を監視し、
経過時間が設定時間を経過した時にリソースマネージャ
33に動作許可を要求し、リソースマネージャを介して
サービスアダプタにリカバリ処理ができた問い合わせる
方法である。この第3の方法によれば、問い合わせ時に
サービスアダプタ36aが復旧していれば、サービスア
ダプタ36aは該問い合わせコマンドで特定されたモジ
ュールに再度リカバリ処理を施し、しかる後、”CHANGE
MODULE STATUS"コマンド発行する。これにより、モジ
ュールは動作可能になる。
が"HALT OPERATION"受信後の経過時間を監視し、経過時
間が設定時間を超えた時、サービスアダプタ36aにリ
カバリ処理ができた問い合わせる方法である。この第2
の方法によれば、問い合わせ時にサービスアダプタ36
aが復旧していれば、サービスアダプタ36aは該問い
合わせコマンドで特定されたモジュールにリカバリ処理
を施し、しかる後、”CHANGE MODULE STATUS"コマンド
発行できる。第3の方法は、障害発生モジュールがリカ
バリ処理により復旧した時、以後の経過時間を監視し、
経過時間が設定時間を経過した時にリソースマネージャ
33に動作許可を要求し、リソースマネージャを介して
サービスアダプタにリカバリ処理ができた問い合わせる
方法である。この第3の方法によれば、問い合わせ時に
サービスアダプタ36aが復旧していれば、サービスア
ダプタ36aは該問い合わせコマンドで特定されたモジ
ュールに再度リカバリ処理を施し、しかる後、”CHANGE
MODULE STATUS"コマンド発行する。これにより、モジ
ュールは動作可能になる。
【0067】(d-1) 第1のリカバリ方法 図27は第1のリカバリ方法による処理の流れ図であ
る。サービスアダプタ36aは定期的に各モジュールの
障害を検出するためのパトロールを行なっている(ステ
ップ400)。かかる状況で、所定のモジュールに障害
が発生(CHECK1発生)すると(ステップ601)、サービ
スアダプタ36aは該障害発生をパトロールによりS-BU
S経由で知ることができる(ステップ401)。サービス
アダプタ36aはモジュールの障害発生を検出するとモ
ジュールのリカバリ処理中該モジュールを使用させない
ために、リソースモジュール33に"HALT OPERATION"を
発行する(ステップ402)。これにより、リソースマ
ネージャ33は通知されたモジュールをONLINEからOFFL
INEに変更して該モジュールを動作不能状態に設定する
(ステップ501、502)。尚、モジュール間通信はC
-BUSを経由したコマンドにより行われる。
る。サービスアダプタ36aは定期的に各モジュールの
障害を検出するためのパトロールを行なっている(ステ
ップ400)。かかる状況で、所定のモジュールに障害
が発生(CHECK1発生)すると(ステップ601)、サービ
スアダプタ36aは該障害発生をパトロールによりS-BU
S経由で知ることができる(ステップ401)。サービス
アダプタ36aはモジュールの障害発生を検出するとモ
ジュールのリカバリ処理中該モジュールを使用させない
ために、リソースモジュール33に"HALT OPERATION"を
発行する(ステップ402)。これにより、リソースマ
ネージャ33は通知されたモジュールをONLINEからOFFL
INEに変更して該モジュールを動作不能状態に設定する
(ステップ501、502)。尚、モジュール間通信はC
-BUSを経由したコマンドにより行われる。
【0068】サービスアダプタ36aは"HALT OPERATIO
N"発行後、障害モジュールのリカバリ処理をS-BUS経由
で行う(ステップ403)。リカバリ処理中にサービス
アダプタ36aに障害が発生することなくリカバリ処理
が終了すれば(ステップ4040)、リカバリ処理され
たモジュールはリソースマネージャ33からの動作許可
指示(SET ONLINE)待ちになる(図26のステップ60
2、603)。以後、サービスアダプタ36a、リソー
スマネージャ33、障害発生したモジュールは図26と
同一の処理を実行する。一方、リカバリ処理中あるいは
リカバリ処理前にサービスアダプタ36aに障害が発生
すると(ステップ406)、該サービスアダプタ36a
は他のサービスアダプタ36a′のリカバリ処理により
復旧し(ステップ407)、以後ステップ400に戻り
障害検出の定期的パトロールを実行する。。
N"発行後、障害モジュールのリカバリ処理をS-BUS経由
で行う(ステップ403)。リカバリ処理中にサービス
アダプタ36aに障害が発生することなくリカバリ処理
が終了すれば(ステップ4040)、リカバリ処理され
たモジュールはリソースマネージャ33からの動作許可
指示(SET ONLINE)待ちになる(図26のステップ60
2、603)。以後、サービスアダプタ36a、リソー
スマネージャ33、障害発生したモジュールは図26と
同一の処理を実行する。一方、リカバリ処理中あるいは
リカバリ処理前にサービスアダプタ36aに障害が発生
すると(ステップ406)、該サービスアダプタ36a
は他のサービスアダプタ36a′のリカバリ処理により
復旧し(ステップ407)、以後ステップ400に戻り
障害検出の定期的パトロールを実行する。。
【0069】すなわち、サービスアダプタ36aは復旧
後もパトロールを行うことになり、パトロールによりモ
ジュールの障害を発見し、該モジュールをリカバリ処理
して”CHANGE MODULE STATUS"コマンドを発行する。こ
の結果、サービスアダプタ36aが自身の障害によりリ
カバリ処理すべきモジュールや”CHANGE MODULE STATU
S"コマンドの発行を忘れても、復旧後該モジュールをリ
カバリ処理して”CHANGE MODULE STATUS"コマンドを発
行できる。
後もパトロールを行うことになり、パトロールによりモ
ジュールの障害を発見し、該モジュールをリカバリ処理
して”CHANGE MODULE STATUS"コマンドを発行する。こ
の結果、サービスアダプタ36aが自身の障害によりリ
カバリ処理すべきモジュールや”CHANGE MODULE STATU
S"コマンドの発行を忘れても、復旧後該モジュールをリ
カバリ処理して”CHANGE MODULE STATUS"コマンドを発
行できる。
【0070】(d-2) 第2のリカバリ方法 図28は第2のリカバリ方法におけるサービスアダプタ
の処理の流れ図、図29は第2のリカバリ方法における
リソースマネージャの処理の流れ図である。尚、障害発
生モジュールの処理は図26の場合と同一である。 ・サービスアダプタの処理 所定のモジュールに障害が発生(CHECK1発生)すると、サ
ービスアダプタ36aは該障害発生をS-BUSを経由して
認識する(ステップ401)。障害発生を検知しない場
合には、リソースマネージャ33から"REQUEST MODULE
STATUS"コマンドを受信したか調べ(ステップ411)、
常時ステップ401、411を実行する。尚、"REQUEST
MODULE STATUS"コマンドはリソースマネージャ33が
サービスアダプタ36aにリカバリ処理ができたかを問
い合わせるものである。
の処理の流れ図、図29は第2のリカバリ方法における
リソースマネージャの処理の流れ図である。尚、障害発
生モジュールの処理は図26の場合と同一である。 ・サービスアダプタの処理 所定のモジュールに障害が発生(CHECK1発生)すると、サ
ービスアダプタ36aは該障害発生をS-BUSを経由して
認識する(ステップ401)。障害発生を検知しない場
合には、リソースマネージャ33から"REQUEST MODULE
STATUS"コマンドを受信したか調べ(ステップ411)、
常時ステップ401、411を実行する。尚、"REQUEST
MODULE STATUS"コマンドはリソースマネージャ33が
サービスアダプタ36aにリカバリ処理ができたかを問
い合わせるものである。
【0071】サービスアダプタ36aは障害発生を検知
すると、リソースモジュール33に"HALT OPERATION"を
発行し(ステップ402)、ついで、障害モジュールの
リカバリ処理をS-BUS経由で行う(ステップ403)。サ
ービスアダプタ36aに障害がが発生することなくリカ
バリ処理が完了すると(ステップ404)、リソースマ
ネージャ33に”CHANGE MODULE STATUS"コマンドを発
行し、「障害モジュールのリカバリ処理が完了して使用
可能状態になったこと」を通知する(ステップ40
5)。一方、リカバリ処理を完了する前に、あるいはリ
カバリ処理完了後”CHANGE MODULE STATUS"コマンドを
発行する前にサービスアダプタ36aに障害が発生する
と(ステップ406)、”CHANGE MODULE STATUS"コマ
ンドの発行ができなくなる。
すると、リソースモジュール33に"HALT OPERATION"を
発行し(ステップ402)、ついで、障害モジュールの
リカバリ処理をS-BUS経由で行う(ステップ403)。サ
ービスアダプタ36aに障害がが発生することなくリカ
バリ処理が完了すると(ステップ404)、リソースマ
ネージャ33に”CHANGE MODULE STATUS"コマンドを発
行し、「障害モジュールのリカバリ処理が完了して使用
可能状態になったこと」を通知する(ステップ40
5)。一方、リカバリ処理を完了する前に、あるいはリ
カバリ処理完了後”CHANGE MODULE STATUS"コマンドを
発行する前にサービスアダプタ36aに障害が発生する
と(ステップ406)、”CHANGE MODULE STATUS"コマ
ンドの発行ができなくなる。
【0072】サービスアダプタ36aに障害が発生する
と、他のサービスアダプタ36a′のリカバリ処理によ
り復旧し(ステップ407)、以後ステップ401に戻
り、障害発生の検知及び"REQUEST MODULE STATUS"コマ
ンドの受信チェック(ステップ401,402)を行
う。リソースマネージャ33は後述するように、"HALT
OPERATION"受信後の経過時間を監視し、経過時間が設定
時間を超えた時、"REQUEST MODULE STATUS"コマンドを
発行してサービスアダプタ36aに障害発生モジュール
のリカバリ処理ができたか問い合わせてくる。この時点
で、サービスアダプタ36aが復旧していれば、ステッ
プ411において「YES」となり、サービスアダプタ
36aは障害モジュールをリカバリ処理して”CHANGE M
ODULE STATUS"コマンドを発行する。この結果、サービ
スアダプタ36aが自身の障害によりリカバリ処理すべ
きモジュールや”CHANGE MODULE STATUS"コマンドの発
行を忘れても、復旧後該モジュールをリカバリ処理し
て”CHANGE MODULE STATUS"コマンドを発行できる。
と、他のサービスアダプタ36a′のリカバリ処理によ
り復旧し(ステップ407)、以後ステップ401に戻
り、障害発生の検知及び"REQUEST MODULE STATUS"コマ
ンドの受信チェック(ステップ401,402)を行
う。リソースマネージャ33は後述するように、"HALT
OPERATION"受信後の経過時間を監視し、経過時間が設定
時間を超えた時、"REQUEST MODULE STATUS"コマンドを
発行してサービスアダプタ36aに障害発生モジュール
のリカバリ処理ができたか問い合わせてくる。この時点
で、サービスアダプタ36aが復旧していれば、ステッ
プ411において「YES」となり、サービスアダプタ
36aは障害モジュールをリカバリ処理して”CHANGE M
ODULE STATUS"コマンドを発行する。この結果、サービ
スアダプタ36aが自身の障害によりリカバリ処理すべ
きモジュールや”CHANGE MODULE STATUS"コマンドの発
行を忘れても、復旧後該モジュールをリカバリ処理し
て”CHANGE MODULE STATUS"コマンドを発行できる。
【0073】・リソースマネージャの処理 リソースマネージャ33はサービスアダプタ36aから
の"HALT OPERATION"コマンドで障害発生モジュールを通
知されると、該モジュールをONLINEからOFFLINEに変更
して該モジュールを動作不能状態に設定する(ステップ
501、502)。ついで、タイマーをスタートし、経
過時間の計測を開始する(ステップ511、512)。
ついで、リソースマネージャ33はサービスアダプタ3
6aから”CHANGE MODULE STATUS"コマンドを通知され
た監視し(ステップ503)、”CHANGE MODULESTATUS"
コマンドを受信すれば、通知されたモジュールをOFFLIN
EからONLINEに戻し、"SET ONLINE"コマンドを該モジュ
ールに発行して動作を許可する(ステップ504)。”C
HANGE MODULE STATUS"コマンドを受信してなければ、経
過時間が設定時間を越えたか調べ(ステップ513)、
越えていなければ、ステップ512以降の処理を実行す
る。
の"HALT OPERATION"コマンドで障害発生モジュールを通
知されると、該モジュールをONLINEからOFFLINEに変更
して該モジュールを動作不能状態に設定する(ステップ
501、502)。ついで、タイマーをスタートし、経
過時間の計測を開始する(ステップ511、512)。
ついで、リソースマネージャ33はサービスアダプタ3
6aから”CHANGE MODULE STATUS"コマンドを通知され
た監視し(ステップ503)、”CHANGE MODULESTATUS"
コマンドを受信すれば、通知されたモジュールをOFFLIN
EからONLINEに戻し、"SET ONLINE"コマンドを該モジュ
ールに発行して動作を許可する(ステップ504)。”C
HANGE MODULE STATUS"コマンドを受信してなければ、経
過時間が設定時間を越えたか調べ(ステップ513)、
越えていなければ、ステップ512以降の処理を実行す
る。
【0074】しかし、サービスアダプタ36aに障害が
発生した場合には、設定時間を越えても”CHANGE MODUL
E STATUS"コマンドを受信できない。かかる場合には、
ステップ513において「YES」となり、リソースマ
ネージャ33はサービスアダプタ36aに"REQUEST MOD
ULE STATUS"コマンドを発行して障害発生モジュールの
リカバリ処理ができたか問い合わせ(ステップ51
4)、以後、ステップ511以降の処理を実行する。問
い合わせ時点で、サービスアダプタ36aが復旧してい
れば、ステップ411において「YES」となり、サー
ビスアダプタ36aは障害モジュールをリカバリ処理し
て”CHANGE MODULE STATUS"コマンドを発行する。この
結果、ステップ503において「YES」となり、通知
されたモジュールをOFFLINEからONLINEに戻し、"SET ON
LINE"コマンドを該モジュールに発行して動作を許可す
る(ステップ504)。尚、問い合わせ時にサービスア
ダプタ36aが復旧していなければ、上記処理が繰り返
される。
発生した場合には、設定時間を越えても”CHANGE MODUL
E STATUS"コマンドを受信できない。かかる場合には、
ステップ513において「YES」となり、リソースマ
ネージャ33はサービスアダプタ36aに"REQUEST MOD
ULE STATUS"コマンドを発行して障害発生モジュールの
リカバリ処理ができたか問い合わせ(ステップ51
4)、以後、ステップ511以降の処理を実行する。問
い合わせ時点で、サービスアダプタ36aが復旧してい
れば、ステップ411において「YES」となり、サー
ビスアダプタ36aは障害モジュールをリカバリ処理し
て”CHANGE MODULE STATUS"コマンドを発行する。この
結果、ステップ503において「YES」となり、通知
されたモジュールをOFFLINEからONLINEに戻し、"SET ON
LINE"コマンドを該モジュールに発行して動作を許可す
る(ステップ504)。尚、問い合わせ時にサービスア
ダプタ36aが復旧していなければ、上記処理が繰り返
される。
【0075】(d-3) 第3のリカバリ方法 図30は第3のリカバリ方法における障害発しモジュー
ルの処理の流れ図、図31は第3のリカバリ方法におけ
るリソースマネージャの処理の流れ図である。尚、サー
ビスアダプタ36aの処理は図28の場合と同一であ
る。この第3の方法はサービスアダプタ36aがリカバ
リ処理を完了後、”CHANGE MODULE STATU"を発行する前
に障害発生でダウンした場合に適用できる。 ・モジュールの処理 各モジュールは障害発生後、サービスアダプタ36aに
よりリカバリされると(ステップ601、602)、タ
イマーをスタートし、以後の経過時間を計測する(ステ
ップ611、612)。ついで、リソースマネージャ3
3から動作許可の"SET ONLINE"を受信したか調べ、受信
していれば動作可能状態になり(ステップ604)、処
理を終了する。しかし、"SET ONLINE"を受信してなけれ
ば、経過時間が設定時間を越えたか調べ(ステップ61
4)、越えていなければステップ612以降の処理を実
行する。
ルの処理の流れ図、図31は第3のリカバリ方法におけ
るリソースマネージャの処理の流れ図である。尚、サー
ビスアダプタ36aの処理は図28の場合と同一であ
る。この第3の方法はサービスアダプタ36aがリカバ
リ処理を完了後、”CHANGE MODULE STATU"を発行する前
に障害発生でダウンした場合に適用できる。 ・モジュールの処理 各モジュールは障害発生後、サービスアダプタ36aに
よりリカバリされると(ステップ601、602)、タ
イマーをスタートし、以後の経過時間を計測する(ステ
ップ611、612)。ついで、リソースマネージャ3
3から動作許可の"SET ONLINE"を受信したか調べ、受信
していれば動作可能状態になり(ステップ604)、処
理を終了する。しかし、"SET ONLINE"を受信してなけれ
ば、経過時間が設定時間を越えたか調べ(ステップ61
4)、越えていなければステップ612以降の処理を実
行する。
【0076】サービスアダプタ36aに障害が発生した
場合には、設定時間を越えても"SETONLINE"コマンドを
受信できない。かかる場合には、ステップ614におい
て「YES」となり、モジュールはリソースマネージャ
33に"REQUEST SET ONLINE"コマンドを発行して動作許
可を要求し(ステップ615)、ステップ611以降の
処理を実行する。リソースマネージャ33は"REQUEST S
ET ONLINE"コマンドを受信すると、後述するようにサー
ビスアダプタ36aに"REQUEST MODULE STATUS"コマン
ドを発行して障害発生モジュールのリカバリ処理ができ
たか問い合わせる。この問い合わせ時点で、サービスア
ダプタ36aが復旧していれば、ステップ411(図2
8)において「YES」となり、サービスアダプタ36
aは障害モジュールをリカバリ処理して”CHANGE MODUL
E STATUS"コマンドを発行する。この結果、リソースマ
ネージャ33は通知されたモジュールをOFFLINEからONL
INEに戻し、"SET ONLINE"コマンドを該モジュールに発
行する。これにより、ステップ603において、「YE
S」となり、モジュールは動作可能になる(ステップ6
04)。尚、問い合わせ時にサービスアダプタ36aが
復旧していなければ、上記処理が繰り返される。
場合には、設定時間を越えても"SETONLINE"コマンドを
受信できない。かかる場合には、ステップ614におい
て「YES」となり、モジュールはリソースマネージャ
33に"REQUEST SET ONLINE"コマンドを発行して動作許
可を要求し(ステップ615)、ステップ611以降の
処理を実行する。リソースマネージャ33は"REQUEST S
ET ONLINE"コマンドを受信すると、後述するようにサー
ビスアダプタ36aに"REQUEST MODULE STATUS"コマン
ドを発行して障害発生モジュールのリカバリ処理ができ
たか問い合わせる。この問い合わせ時点で、サービスア
ダプタ36aが復旧していれば、ステップ411(図2
8)において「YES」となり、サービスアダプタ36
aは障害モジュールをリカバリ処理して”CHANGE MODUL
E STATUS"コマンドを発行する。この結果、リソースマ
ネージャ33は通知されたモジュールをOFFLINEからONL
INEに戻し、"SET ONLINE"コマンドを該モジュールに発
行する。これにより、ステップ603において、「YE
S」となり、モジュールは動作可能になる(ステップ6
04)。尚、問い合わせ時にサービスアダプタ36aが
復旧していなければ、上記処理が繰り返される。
【0077】・リソースマネージャの処理 リソースマネージャ33はサービスアダプタ36aから
の"HALT OPERATION"コマンドで障害発生モジュールが通
知されると、該モジュールをONLINEからOFFLINEに変更
して該モジュールを動作不能状態に設定する(ステップ
501、502)。ついで、リソースマネージャ33は
サービスアダプタ36aから”CHANGE MODULE STATUS"
コマンドを通知された監視し(ステップ503)、”CH
ANGE MODULESTATUS"コマンドを受信すれば、通知された
モジュールをOFFLINEからONLINEに戻し、"SET ONLINE"
コマンドを該モジュールに発行して動作を許可する(ス
テップ504)。”CHANGE MODULE STATUS"コマンドを
受信してなければ、モジュールから"REQUEST MODULE ST
ATUS"コマンドを受信したか調べ(ステップ521)、
受信してなければ、ステップ503に戻る。しかし、モ
ジュールから"REQUEST MODULE STATUS"コマンドを受信
すれば、リソースマネージャ33はサービスアダプタ3
6aに"REQUEST MODULE STATUS"コマンドを発行して障
害発生モジュールのリカバリ処理ができたか問い合わせ
(ステップ522)、以後、ステップ503以降の処理
を実行する。
の"HALT OPERATION"コマンドで障害発生モジュールが通
知されると、該モジュールをONLINEからOFFLINEに変更
して該モジュールを動作不能状態に設定する(ステップ
501、502)。ついで、リソースマネージャ33は
サービスアダプタ36aから”CHANGE MODULE STATUS"
コマンドを通知された監視し(ステップ503)、”CH
ANGE MODULESTATUS"コマンドを受信すれば、通知された
モジュールをOFFLINEからONLINEに戻し、"SET ONLINE"
コマンドを該モジュールに発行して動作を許可する(ス
テップ504)。”CHANGE MODULE STATUS"コマンドを
受信してなければ、モジュールから"REQUEST MODULE ST
ATUS"コマンドを受信したか調べ(ステップ521)、
受信してなければ、ステップ503に戻る。しかし、モ
ジュールから"REQUEST MODULE STATUS"コマンドを受信
すれば、リソースマネージャ33はサービスアダプタ3
6aに"REQUEST MODULE STATUS"コマンドを発行して障
害発生モジュールのリカバリ処理ができたか問い合わせ
(ステップ522)、以後、ステップ503以降の処理
を実行する。
【0078】問い合わせ時点で、サービスアダプタ36
aが復旧していれば、ステップ411(図28参照)に
おいて「YES」となり、サービスアダプタ36aは障
害モジュールをリカバリ処理して”CHANGE MODULE STAT
US"コマンドを発行する。この結果、ステップ503に
おいて「YES」となり、リソースマネージャ33は通
知されたモジュールをOFFLINEからONLINEに戻し、"SET
ONLINE"コマンドを該モジュールに発行して動作を許可
する(ステップ502)。尚、問い合わせ時にサービス
アダプタ36aが復旧していなければ、上記処理が繰り
返される。 (e) 障害発生時の上位装置への通知、リカバリ制御
aが復旧していれば、ステップ411(図28参照)に
おいて「YES」となり、サービスアダプタ36aは障
害モジュールをリカバリ処理して”CHANGE MODULE STAT
US"コマンドを発行する。この結果、ステップ503に
おいて「YES」となり、リソースマネージャ33は通
知されたモジュールをOFFLINEからONLINEに戻し、"SET
ONLINE"コマンドを該モジュールに発行して動作を許可
する(ステップ502)。尚、問い合わせ時にサービス
アダプタ36aが復旧していなければ、上記処理が繰り
返される。 (e) 障害発生時の上位装置への通知、リカバリ制御
【0079】全体の構成 図32は障害発生時における障害情報の上位装置への通
知、リカバリ制御を説明するためのコンピュータシステ
ムの構成図であり、図21と同一機能部分には同一符号
を付している。又、内部バスは省略している。21、2
1・・CPU、30は磁気ディスク制御装置等のI/O
サブシステム、40a,40a′はI/Oデバイスとし
ての磁気ディスク装置(DEV)である。I/Oサブシ
ステムにおいて、31a〜31d′はチャネルアダプタ
(CA)、32a〜32d′がデバイスアダプタ(D
A)、33はリソースマネージャ(RM)、35はテー
ブル記憶部(TS)、36a,36a′はサービスアダ
プタ(SA)、39はメモリである。
知、リカバリ制御を説明するためのコンピュータシステ
ムの構成図であり、図21と同一機能部分には同一符号
を付している。又、内部バスは省略している。21、2
1・・CPU、30は磁気ディスク制御装置等のI/O
サブシステム、40a,40a′はI/Oデバイスとし
ての磁気ディスク装置(DEV)である。I/Oサブシ
ステムにおいて、31a〜31d′はチャネルアダプタ
(CA)、32a〜32d′がデバイスアダプタ(D
A)、33はリソースマネージャ(RM)、35はテー
ブル記憶部(TS)、36a,36a′はサービスアダ
プタ(SA)、39はメモリである。
【0080】テーブル記憶部35には各種テーブル類が
記憶されており、例えばI/Oデバイス(磁気ディスク
装置)毎のパスグループを示すパスグループテーブルG
PTや物理構成テーブルPST等が記憶されている。パ
スグループテーブルGPTは図33に示すようにデバイ
スに対応させて該デバイスにアクセス可能なチャネルア
ダプタ(パス)を記憶するもので、図の例ではデバイス
DEV0のパスグループはチャネルアダプタCA0/C
A2/CA5/CAnにより構成されている。このパス
グループテーブルGPTはCPUからの"SET PATH GROU
P ID"コマンドによりテーブル記憶部35に設定され
る。
記憶されており、例えばI/Oデバイス(磁気ディスク
装置)毎のパスグループを示すパスグループテーブルG
PTや物理構成テーブルPST等が記憶されている。パ
スグループテーブルGPTは図33に示すようにデバイ
スに対応させて該デバイスにアクセス可能なチャネルア
ダプタ(パス)を記憶するもので、図の例ではデバイス
DEV0のパスグループはチャネルアダプタCA0/C
A2/CA5/CAnにより構成されている。このパス
グループテーブルGPTはCPUからの"SET PATH GROU
P ID"コマンドによりテーブル記憶部35に設定され
る。
【0081】物理構成テーブルPSTはI/Oサブシス
テムの物理構成を示すものであり、図34に示すよう
に、I/Oサブシステムを構成するチャネルアダプタ
(CAi,i=0,1,2,・・・)、各チャネルア
ダプタCAiからアクセス可能なデバイスアダプタ、
各チャネルアダプタCAiからアクセス可能なI/Oデ
バイス等が記憶されている。各CPU21、21、・・
には図35に示す管理テーブルADTが記憶されてお
り、配下のチャネルの構成、各チャネルCHi(i
=0,1,2,・・・)からアクセス可能なI/Oデバ
イス、各I/Oデバイスにアクセス可能なチャネルア
ダプタ(パスグループテーブル)が記憶されている。
テムの物理構成を示すものであり、図34に示すよう
に、I/Oサブシステムを構成するチャネルアダプタ
(CAi,i=0,1,2,・・・)、各チャネルア
ダプタCAiからアクセス可能なデバイスアダプタ、
各チャネルアダプタCAiからアクセス可能なI/Oデ
バイス等が記憶されている。各CPU21、21、・・
には図35に示す管理テーブルADTが記憶されてお
り、配下のチャネルの構成、各チャネルCHi(i
=0,1,2,・・・)からアクセス可能なI/Oデバ
イス、各I/Oデバイスにアクセス可能なチャネルア
ダプタ(パスグループテーブル)が記憶されている。
【0082】障害発生時の上位装置への通知、リカバリ
制御の概略 障害としては、 構成情報の一部が失われた障害、 上位装置からのパスにおいてアクセス不可能なハード
障害、 I/Oサブシステム内部のアクセス不可能なハード障
害、 リカバリ可能な障害、 上位装置の障害 がある。
制御の概略 障害としては、 構成情報の一部が失われた障害、 上位装置からのパスにおいてアクセス不可能なハード
障害、 I/Oサブシステム内部のアクセス不可能なハード障
害、 リカバリ可能な障害、 上位装置の障害 がある。
【0083】構成情報の一部が失われた障害とは、I
/Oサブシステムのテーブル記憶部35に記憶したパス
グループテーブルGPTの一部が失われた場合である。
かかる障害が発生すると、アクセスシーケンス時のリト
ライ要求によりチャネルをI/Oサブシステムから切り
離し(ディスコネクト)、再度接続(リコネクト)する
場合、どのチャネルアダプタ(パス)を介してリコネク
トしてよいか判らず、MIH(ミッシング・インタラプ
ト)と呼ばれるシステムとして重大な障害を生じる。か
かる障害発生時には、I/Oサブシステムのパスグルー
プ情報を上位装置に報告して情報装置にリカバリ処理さ
せる。すなわち、上位装置は自分が管理テーブルADT
内に保持するパスグループテーブルと送られてきたパス
グループテーブルの内容が一致するか判断し、不一致の
場合は、障害によりパスグループテーブルの一部が消失
したものとして、"SET PATH GROUP ID"コマンドをI/
Oサブシステム30に送出してパスグループテーブルG
PTを修復させる。尚、一致する場合にはCPUが自ら
パスを抹消したものであり、障害でないから"SET PATHG
ROUP ID"コマンドを発行しない。
/Oサブシステムのテーブル記憶部35に記憶したパス
グループテーブルGPTの一部が失われた場合である。
かかる障害が発生すると、アクセスシーケンス時のリト
ライ要求によりチャネルをI/Oサブシステムから切り
離し(ディスコネクト)、再度接続(リコネクト)する
場合、どのチャネルアダプタ(パス)を介してリコネク
トしてよいか判らず、MIH(ミッシング・インタラプ
ト)と呼ばれるシステムとして重大な障害を生じる。か
かる障害発生時には、I/Oサブシステムのパスグルー
プ情報を上位装置に報告して情報装置にリカバリ処理さ
せる。すなわち、上位装置は自分が管理テーブルADT
内に保持するパスグループテーブルと送られてきたパス
グループテーブルの内容が一致するか判断し、不一致の
場合は、障害によりパスグループテーブルの一部が消失
したものとして、"SET PATH GROUP ID"コマンドをI/
Oサブシステム30に送出してパスグループテーブルG
PTを修復させる。尚、一致する場合にはCPUが自ら
パスを抹消したものであり、障害でないから"SET PATHG
ROUP ID"コマンドを発行しない。
【0084】の上位装置からのパスにおけるアクセス
不可能なハード障害とは、チャネルアダプタ(パス)に
発生した復旧不可能な障害である。かかる障害発生時に
は、障害発生箇所、物理構成上可能な交代パスを上位装
置に通知し、障害箇所の速やかな切り離し、他に動作可
能な交代パスが存在する時は速やかな組込み、並びに、
コンソールにエラーメッセージの表示を行わせる。の
I/Oサブシステム内部のアクセス不可能なハード障害
とは、内部パスに発生した復旧不可能な障害であり、
′I/Oサブシステム内部に交代パスがないため、動
作不可能なものと、″交代パスがあるため動作可能な
ものがある。前者の例としては、一方のコントロール側
G0,G1のデバイスアダプタが全て壊れた場合であ
り、後者の例としてはコントロール側G0,G1のデバ
イスアダプタの一部が壊れた場合である。かかる障害発
生時には、障害発生箇所を上位装置に通知し、エラーロ
グ(エラー情報の記憶)、アクセス不可能なパスの切り
離し、並びに、コンソールにエラーメッセージの表示を
行わせる。
不可能なハード障害とは、チャネルアダプタ(パス)に
発生した復旧不可能な障害である。かかる障害発生時に
は、障害発生箇所、物理構成上可能な交代パスを上位装
置に通知し、障害箇所の速やかな切り離し、他に動作可
能な交代パスが存在する時は速やかな組込み、並びに、
コンソールにエラーメッセージの表示を行わせる。の
I/Oサブシステム内部のアクセス不可能なハード障害
とは、内部パスに発生した復旧不可能な障害であり、
′I/Oサブシステム内部に交代パスがないため、動
作不可能なものと、″交代パスがあるため動作可能な
ものがある。前者の例としては、一方のコントロール側
G0,G1のデバイスアダプタが全て壊れた場合であ
り、後者の例としてはコントロール側G0,G1のデバ
イスアダプタの一部が壊れた場合である。かかる障害発
生時には、障害発生箇所を上位装置に通知し、エラーロ
グ(エラー情報の記憶)、アクセス不可能なパスの切り
離し、並びに、コンソールにエラーメッセージの表示を
行わせる。
【0085】のリカバリ可能な障害とは、メモリ39
等の診断により検出された障害で、サービスアダプタに
よるリカバリ処理(メモリの初期化)で復旧した障害で
ある。かかる障害が発生した場合には、上位装置に障害
内容を通知し、エラーログを行わせる。の上位装置の
障害とは、上位装置に起因する障害であり、かかる場合
には障害内容とチャネル番号等を通知し、当該情報に基
づいて該当チャネルのリカバリを行わせる。
等の診断により検出された障害で、サービスアダプタに
よるリカバリ処理(メモリの初期化)で復旧した障害で
ある。かかる障害が発生した場合には、上位装置に障害
内容を通知し、エラーログを行わせる。の上位装置の
障害とは、上位装置に起因する障害であり、かかる場合
には障害内容とチャネル番号等を通知し、当該情報に基
づいて該当チャネルのリカバリを行わせる。
【0086】障害発生通知・リカバリ処理 障害は、(a)内部診断により、あるいは(b)サービスアダ
プタ36a.36a′の障害検出パトロールにより、あ
るいは、(c)上位装置から期待する応答が返ってこない
事などにより検出される。かかる障害が検出されるとリ
ソースマネージャ33に通知され、これによりリソース
マネージャ33は障害発生を認識する。また、(d)シス
テムリセットにより内部構成情報(例えばパスグループ
テーブル)の一部を削除した場合にもリソースマネージ
ャは障害発生と認識する。システムリセットは通常シス
テムの立ち上げ時に発行されるもので、システム運用中
に発行されることは稀である。システム運用中にパスグ
ループを組む特定のパスのみにシステムリセットが発行
されるということは、障害によりCPUがシステムリセ
ットを出してパスを切り離す場合か、チャネルとチャネ
ルアダプタ間の障害によりあたかもシステムリセットが
出されたように見えた場合である。前者の場合には何等
問題ないが、後者の場合には内部情報の一部が不当に消
失する。従って、システムリセットにより内部情報の一
部を削除した場合には、リソースマネージャ33は一応
障害発生(システムリセットエラーという)とみなす。
プタ36a.36a′の障害検出パトロールにより、あ
るいは、(c)上位装置から期待する応答が返ってこない
事などにより検出される。かかる障害が検出されるとリ
ソースマネージャ33に通知され、これによりリソース
マネージャ33は障害発生を認識する。また、(d)シス
テムリセットにより内部構成情報(例えばパスグループ
テーブル)の一部を削除した場合にもリソースマネージ
ャは障害発生と認識する。システムリセットは通常シス
テムの立ち上げ時に発行されるもので、システム運用中
に発行されることは稀である。システム運用中にパスグ
ループを組む特定のパスのみにシステムリセットが発行
されるということは、障害によりCPUがシステムリセ
ットを出してパスを切り離す場合か、チャネルとチャネ
ルアダプタ間の障害によりあたかもシステムリセットが
出されたように見えた場合である。前者の場合には何等
問題ないが、後者の場合には内部情報の一部が不当に消
失する。従って、システムリセットにより内部情報の一
部を削除した場合には、リソースマネージャ33は一応
障害発生(システムリセットエラーという)とみなす。
【0087】上記(a),(b)により前記,,の障害が
検出され、(c)によりの障害が検出され、(d)により
の障害が検出される。図36は障害発生時のリソースマ
ネージャの処理の概略フロー図ある。リソースマネージ
ャ33は障害を認識すると、前記〜の障害であるか
を調べる。すなわち、まず、上位装置の障害か調べ(ス
テップ701)、上位装置の障害であれば、障害情報
(障害内容、チャネル番号等)を上位装置に通知する等
の処理3(後述)を行う(ステップ702)。上位装置
の障害でなければ、内部構成情報が消失しているか(シ
ステムリセットエラーが発生しているか)調べ(ステッ
プ703)、システムリセットエラーの場合には後述
するパスグループ再形成のための処理1(後述)を実行
する(ステップ704)。
検出され、(c)によりの障害が検出され、(d)により
の障害が検出される。図36は障害発生時のリソースマ
ネージャの処理の概略フロー図ある。リソースマネージ
ャ33は障害を認識すると、前記〜の障害であるか
を調べる。すなわち、まず、上位装置の障害か調べ(ス
テップ701)、上位装置の障害であれば、障害情報
(障害内容、チャネル番号等)を上位装置に通知する等
の処理3(後述)を行う(ステップ702)。上位装置
の障害でなければ、内部構成情報が消失しているか(シ
ステムリセットエラーが発生しているか)調べ(ステッ
プ703)、システムリセットエラーの場合には後述
するパスグループ再形成のための処理1(後述)を実行
する(ステップ704)。
【0088】システムリセットエラーでない場合には、
リカバリ不可能なパス障害か調べ(ステップ70
5)、リカバリ不可能なパス障害であれば、パス切断、
交代パス組込等に必要な処理2(後述)を実行する(ス
テップ706)。リカバリ不可能なパス障害でなけれ
ば、I/Oサブシステム内でリカバリ不可能な障害か調
べ(ステップ707)、リカバリ可能な障害の場合に
は、上位装置に障害情報(障害内容、ロギング(LO
G)指示等)を送る(ステップ708)。又、障害がリ
カバリ不可能な内部障害の場合には、上位装置に障害
情報(障害内容、コンソールへの障害内容の表示指示
等)を送る(ステップ709)。
リカバリ不可能なパス障害か調べ(ステップ70
5)、リカバリ不可能なパス障害であれば、パス切断、
交代パス組込等に必要な処理2(後述)を実行する(ス
テップ706)。リカバリ不可能なパス障害でなけれ
ば、I/Oサブシステム内でリカバリ不可能な障害か調
べ(ステップ707)、リカバリ可能な障害の場合に
は、上位装置に障害情報(障害内容、ロギング(LO
G)指示等)を送る(ステップ708)。又、障害がリ
カバリ不可能な内部障害の場合には、上位装置に障害
情報(障害内容、コンソールへの障害内容の表示指示
等)を送る(ステップ709)。
【0089】障害情報の構成 上位装置への通知される障害情報は、図37に示すよう
に制御フラグCFGと、物理構成テーブルPSTと、パ
スグループテーブルGPTで構成されている。制御フラ
グCFGは図38に示すように、1バイトで構成されて
おり、ログリクエスト、ディスプレイ表示要求等のリカ
バリ方法及び障害内容を指示するようになっている。リ
カバリ方法、障害内容等に応じて適宜のビットがオンに
設定されて上位装置に送出される。物理構成テーブルP
STは図39に示すように、障害発生前の物理構成(図
34)PST1と、障害発生により各チャネルからアク
セス不可能になったデバイスアダプタ、各チャネルから
アクセス不可能になったデバイスを特定する部分PST
2で構成されている。この部分PST2により障害箇所
を特定できる。パスグループテーブルGPTは図40に
示すように、障害発生前のパスグループテーブルGPT
1と障害(システムリセットエラー)発生後のパスグル
ープテーブルGPT2で構成されている。
に制御フラグCFGと、物理構成テーブルPSTと、パ
スグループテーブルGPTで構成されている。制御フラ
グCFGは図38に示すように、1バイトで構成されて
おり、ログリクエスト、ディスプレイ表示要求等のリカ
バリ方法及び障害内容を指示するようになっている。リ
カバリ方法、障害内容等に応じて適宜のビットがオンに
設定されて上位装置に送出される。物理構成テーブルP
STは図39に示すように、障害発生前の物理構成(図
34)PST1と、障害発生により各チャネルからアク
セス不可能になったデバイスアダプタ、各チャネルから
アクセス不可能になったデバイスを特定する部分PST
2で構成されている。この部分PST2により障害箇所
を特定できる。パスグループテーブルGPTは図40に
示すように、障害発生前のパスグループテーブルGPT
1と障害(システムリセットエラー)発生後のパスグル
ープテーブルGPT2で構成されている。
【0090】処理1(内部構成情報の一部が消失した場
合の処理) 図41は内部構成情報(例えばパスグループテーブル)
の一部が消失した場合の処理(処理1)の説明図であ
る。リソースマネージャ(RM)33はパスグループを
構成している特定パスのみのシステムリセット要求があ
り、他のパスが未だグループを構成している時には、障
害によるシステムリセットであると判断する。そして、
障害発生前のパスグループテーブルGPT1(図40参
照)と障害発生後のパスグループテーブルGPT2を作
成し、障害発生と思われるパス(システムリセットを受
信したパス)以外のパス(チャネルアダプタCA)を決
定し、該チャネルアダプタより障害情報を上位装置(チ
ャネルCH)に送出する。
合の処理) 図41は内部構成情報(例えばパスグループテーブル)
の一部が消失した場合の処理(処理1)の説明図であ
る。リソースマネージャ(RM)33はパスグループを
構成している特定パスのみのシステムリセット要求があ
り、他のパスが未だグループを構成している時には、障
害によるシステムリセットであると判断する。そして、
障害発生前のパスグループテーブルGPT1(図40参
照)と障害発生後のパスグループテーブルGPT2を作
成し、障害発生と思われるパス(システムリセットを受
信したパス)以外のパス(チャネルアダプタCA)を決
定し、該チャネルアダプタより障害情報を上位装置(チ
ャネルCH)に送出する。
【0091】この障害情報のチャネルCHへの通知は以
下の手順により行われる。すなわち、リソースマネージ
ャRMはチャネルアダプタCAにリクエスト・ウイズ・
エラーリカバリ(Request with error recovery)の送出
を要求する。要求を受けたチャネルアダプタCAは、チ
ャネルCHにリクエスト・ウイズ・エラーリカバリ・フ
レームを送出して応答を待つ。チャネルCHはリクエス
ト・ウイズ・エラーリカバリ・フレームを受信すると、
リカバリ方法を含む障害情報の受領を許可するポール・
ウィズ・エラーリカバリを応答する。チャネルアダプタ
CAは応答があったことをリソースマネージャRMに通
知し、チャネルCHに送る障害情報をリソースマネージ
ャRMが管理するテーブル記憶部TSから読み込み、セ
ンド・ユニット・アドレス・ウィズ・エラーリカバリ・
フレームに乗せて送出する。尚、障害情報には図37で
説明した制御フラグCFG、障害発生前後のパスグルー
プテーブルGPT1,GPT2、障害箇所を示す物理構
成テーブルPSTやユニットアドレスが含まれている。
下の手順により行われる。すなわち、リソースマネージ
ャRMはチャネルアダプタCAにリクエスト・ウイズ・
エラーリカバリ(Request with error recovery)の送出
を要求する。要求を受けたチャネルアダプタCAは、チ
ャネルCHにリクエスト・ウイズ・エラーリカバリ・フ
レームを送出して応答を待つ。チャネルCHはリクエス
ト・ウイズ・エラーリカバリ・フレームを受信すると、
リカバリ方法を含む障害情報の受領を許可するポール・
ウィズ・エラーリカバリを応答する。チャネルアダプタ
CAは応答があったことをリソースマネージャRMに通
知し、チャネルCHに送る障害情報をリソースマネージ
ャRMが管理するテーブル記憶部TSから読み込み、セ
ンド・ユニット・アドレス・ウィズ・エラーリカバリ・
フレームに乗せて送出する。尚、障害情報には図37で
説明した制御フラグCFG、障害発生前後のパスグルー
プテーブルGPT1,GPT2、障害箇所を示す物理構
成テーブルPSTやユニットアドレスが含まれている。
【0092】チャネルCHは受信完了後にCPU(オペ
レーティングシステム:OS)に割込み、送られてきた
障害情報を渡すと共に、チャネルアダプタCAに受信が
正常に済んだことを報告してI/Oサブシステム(磁気
ディスク制御装置)に切り離れることを要求する。以
後、OSは図42に示すフローに従ってリカバリ処理す
る。すなわち、OSは、チャネルCHから、送られた障
害情報に含まれる制御フラグCFGを参照して障害がパ
スグループの一部消失に関するものであることを認識す
る(ステップ721)。ついで、OSは内部の管理テー
ブルADTに記憶されているパスグループテーブルと送
られてきたパスグループテーブルGPT2を比較する
(ステップ722)。一致している場合には、OSが自
ら発行したシステムリセットによりI/Oサブシステム
内部のパスグループテーブルGPTの一部が除去された
ものであり、何等障害でなかったものであると認識し
(ステップ723)、リカバリ処理を終了する。
レーティングシステム:OS)に割込み、送られてきた
障害情報を渡すと共に、チャネルアダプタCAに受信が
正常に済んだことを報告してI/Oサブシステム(磁気
ディスク制御装置)に切り離れることを要求する。以
後、OSは図42に示すフローに従ってリカバリ処理す
る。すなわち、OSは、チャネルCHから、送られた障
害情報に含まれる制御フラグCFGを参照して障害がパ
スグループの一部消失に関するものであることを認識す
る(ステップ721)。ついで、OSは内部の管理テー
ブルADTに記憶されているパスグループテーブルと送
られてきたパスグループテーブルGPT2を比較する
(ステップ722)。一致している場合には、OSが自
ら発行したシステムリセットによりI/Oサブシステム
内部のパスグループテーブルGPTの一部が除去された
ものであり、何等障害でなかったものであると認識し
(ステップ723)、リカバリ処理を終了する。
【0093】しかし、不一致の場合にはチャネルとチャ
ネルアダプタ間の障害により、I/Oサブシステム内部
のパスグループテーブルGPTの一部が除去されたもの
であると認識し(ステップ724)、除去されたパスを
パスグループテーブルGPTに組み込むためにコマンド
(SET PATH GROUP ID)をチャネルを介してI/Oサブシ
ステムに送り、正しいパスグループテーブルに修正する
(ステップ725)。
ネルアダプタ間の障害により、I/Oサブシステム内部
のパスグループテーブルGPTの一部が除去されたもの
であると認識し(ステップ724)、除去されたパスを
パスグループテーブルGPTに組み込むためにコマンド
(SET PATH GROUP ID)をチャネルを介してI/Oサブシ
ステムに送り、正しいパスグループテーブルに修正する
(ステップ725)。
【0094】処理2(リカバリ不可能なパス障害が発生
した場合の処理) 図43はリカバリ不可能なパス障害が発生した場合の処
理の流れ図である。上位装置からのパス(チャネルアダ
プタ)でアクセス不可能なハード障害が発生した場合に
は、リソースマネージャ33はI/Oサブシステムの物
理構成テーブルPST1,PST2及び障害発生内容
(制御フラグCFG)を含む障害情報を編集する(ステ
ップ741)。ついで、障害パスに代えて交代可能な物
理パスが存在するか調べ(ステップ742)、存在する
場合には上記障害情報に交代パス情報を含めて障害情報
とする(ステップ743)。ついで、リソースマネージ
ャ33は動作可能なチャネルアダプタCAを選択し(ス
テップ744)、障害情報を図41の手順でチャネルC
Hに送り、チャネルCHは送られてきた障害情報を割込
みによりOSに渡す(ステップ745)。
した場合の処理) 図43はリカバリ不可能なパス障害が発生した場合の処
理の流れ図である。上位装置からのパス(チャネルアダ
プタ)でアクセス不可能なハード障害が発生した場合に
は、リソースマネージャ33はI/Oサブシステムの物
理構成テーブルPST1,PST2及び障害発生内容
(制御フラグCFG)を含む障害情報を編集する(ステ
ップ741)。ついで、障害パスに代えて交代可能な物
理パスが存在するか調べ(ステップ742)、存在する
場合には上記障害情報に交代パス情報を含めて障害情報
とする(ステップ743)。ついで、リソースマネージ
ャ33は動作可能なチャネルアダプタCAを選択し(ス
テップ744)、障害情報を図41の手順でチャネルC
Hに送り、チャネルCHは送られてきた障害情報を割込
みによりOSに渡す(ステップ745)。
【0095】OSは障害情報を参照して障害がリカバリ
不可能なパス障害であると認識する(ステップ75
1)。しかる後、障害発生パスが使用パスであるか調
べ、使用パスの場合には、該パスを切り離し(パスグル
ープテーブルより該当チャネルアダプタCAを削除)、
以後該パスを経由してのアクセスを中止する(ステップ
752)。ついで、交代パスが指示されているか調べ
(ステップ753)、指示されていなければ、障害内容
とパスを切り離したことをコンソールの表示装置に表示
してリカバリ処理を終了する(ステップ754)。しか
し、交代パスが指示されている場合には、該交代パスを
自分のパスグループテーブルに登録すると共に、該交代
パスをI/Oサブシステム内のパスグループテーブルG
PTに組み込むためにコマンド(SET PATH GROUP ID)を
チャネルを介してI/Oサブシステムに送る(ステップ
755)。これにより、以後交代パスを用いてアクセス
が可能となる。以後、障害内容と、パスの切り離し、パ
スの組込みをコンソールの表示装置に表示してリカバリ
処理を終了する(ステップ756)。
不可能なパス障害であると認識する(ステップ75
1)。しかる後、障害発生パスが使用パスであるか調
べ、使用パスの場合には、該パスを切り離し(パスグル
ープテーブルより該当チャネルアダプタCAを削除)、
以後該パスを経由してのアクセスを中止する(ステップ
752)。ついで、交代パスが指示されているか調べ
(ステップ753)、指示されていなければ、障害内容
とパスを切り離したことをコンソールの表示装置に表示
してリカバリ処理を終了する(ステップ754)。しか
し、交代パスが指示されている場合には、該交代パスを
自分のパスグループテーブルに登録すると共に、該交代
パスをI/Oサブシステム内のパスグループテーブルG
PTに組み込むためにコマンド(SET PATH GROUP ID)を
チャネルを介してI/Oサブシステムに送る(ステップ
755)。これにより、以後交代パスを用いてアクセス
が可能となる。以後、障害内容と、パスの切り離し、パ
スの組込みをコンソールの表示装置に表示してリカバリ
処理を終了する(ステップ756)。
【0096】処理3(上位装置に障害が発生した場合の
処理) 図44は上位装置に障害が発生した場合の処理の流れ図
である。リソースマネージャ33は上位装置の障害を検
出すると、障害発生チャネルのチャネル番号を含む障害
情報を作成し(ステップ801)、障害発生チャネルと
同じホスト配下のチャネルに接続されているチャネルア
ダプタCAを求め(ステップ802)、障害情報を該チ
ャネルアダプタCAを介してチャネルに図41に示した
手順で転送し、該チャネルは送られてきた障害情報をホ
ストに渡す(ステップ803)。障害情報を受けとった
ホストは障害情報を参照して障害がチャネルの障害であ
ると認識し(ステップ811)、チャネル番号で指定さ
れたチャネルの内部情報をクリアする(ステップ81
2)。ついで、重度の障害であるか調べ(ステップ81
3)、重度の障害でなければ、セレクティブリセットを
I/Oサブシステムに発行し(ステップ814)、コン
ソールに障害内容を表示後、再度アクセスを行う(ステ
ップ815)。しかし、頻繁に指定されたチャネルに障
害が生じている場合には重度の障害とみなし、セレクテ
ィブリセットを発行しない(ステップ816)。
処理) 図44は上位装置に障害が発生した場合の処理の流れ図
である。リソースマネージャ33は上位装置の障害を検
出すると、障害発生チャネルのチャネル番号を含む障害
情報を作成し(ステップ801)、障害発生チャネルと
同じホスト配下のチャネルに接続されているチャネルア
ダプタCAを求め(ステップ802)、障害情報を該チ
ャネルアダプタCAを介してチャネルに図41に示した
手順で転送し、該チャネルは送られてきた障害情報をホ
ストに渡す(ステップ803)。障害情報を受けとった
ホストは障害情報を参照して障害がチャネルの障害であ
ると認識し(ステップ811)、チャネル番号で指定さ
れたチャネルの内部情報をクリアする(ステップ81
2)。ついで、重度の障害であるか調べ(ステップ81
3)、重度の障害でなければ、セレクティブリセットを
I/Oサブシステムに発行し(ステップ814)、コン
ソールに障害内容を表示後、再度アクセスを行う(ステ
ップ815)。しかし、頻繁に指定されたチャネルに障
害が生じている場合には重度の障害とみなし、セレクテ
ィブリセットを発行しない(ステップ816)。
【0097】リソースマネージャ33はセレクティブリ
セット指令を受信すれば、障害チャネルと接続されてい
るチャネルアダプタの内部情報をリセットする(ステッ
プ821、822)。リソースマネージャ33は障害情
報転送後、一定時間(例えば数秒間)障害発生箇所から
のリセットの通知を待ってもセレクティブリセットが通
知されない場合には(ステップ823)、当該チャネル
アダプタの閉塞を指示する(ステップ824)。尚、通
常はチャネルアダプタは2つのポートを有するから、そ
の閉塞は障害発生の片ポートのみである。以上、本発明
を実施例により説明したが、本発明は請求の範囲に記載
した本発明の主旨に従い種々の変形が可能であり、本発
明はこれらを排除するものではない。
セット指令を受信すれば、障害チャネルと接続されてい
るチャネルアダプタの内部情報をリセットする(ステッ
プ821、822)。リソースマネージャ33は障害情
報転送後、一定時間(例えば数秒間)障害発生箇所から
のリセットの通知を待ってもセレクティブリセットが通
知されない場合には(ステップ823)、当該チャネル
アダプタの閉塞を指示する(ステップ824)。尚、通
常はチャネルアダプタは2つのポートを有するから、そ
の閉塞は障害発生の片ポートのみである。以上、本発明
を実施例により説明したが、本発明は請求の範囲に記載
した本発明の主旨に従い種々の変形が可能であり、本発
明はこれらを排除するものではない。
【0098】
【発明の効果】以上本発明によれば、非同期転送制御方
式であっても同期転送制御方式と同じ機能を実行でき
る。又、本発明によれば、データ領域やキー領域に傷等
が付いて読み取りエラーを生じる場合であっても、これ
ら領域のデータを処理の対象としないサーチ動作をエラ
ーの発生なく行える。更に、本発明によれば、レコード
書き込み時にCKDフォーマットでの一部のみ正常に書
き込まれ、他の部分が書き換えられなかった場合でもデ
ータ保証上の問題が生じない。
式であっても同期転送制御方式と同じ機能を実行でき
る。又、本発明によれば、データ領域やキー領域に傷等
が付いて読み取りエラーを生じる場合であっても、これ
ら領域のデータを処理の対象としないサーチ動作をエラ
ーの発生なく行える。更に、本発明によれば、レコード
書き込み時にCKDフォーマットでの一部のみ正常に書
き込まれ、他の部分が書き換えられなかった場合でもデ
ータ保証上の問題が生じない。
【0099】又、本発明によれば、動的機能再結合方式
において、ビジー率を考慮して効率的な資源利用を図
れ、アクセスに対するレスポンスを短縮でき、システム
の性能を向上することができる。又、本発明によれば、
サービスアダプタに障害が発生した場合、該サービスア
ダプタの復旧後確実に障害発生中のモジュールの復旧を
行なって、起動することができる。更に、本発明によれ
ば、上位装置にI/Oサブシステムから積極的に障害
内容を通知し、又、上位装置にリカバリ方法を通知
し、更に、I/Oサブシステムにおける動作可能パス
の提示をすることにより、障害と無関係のアクセスに影
響を与えず、しかも、迅速にリカバリを行うことがで
き、又、上位装置の障害を上位装置に通知してリカバリ
させることができる。又、本発明によれば、I/Oサブ
システムの性能を向上できる。
において、ビジー率を考慮して効率的な資源利用を図
れ、アクセスに対するレスポンスを短縮でき、システム
の性能を向上することができる。又、本発明によれば、
サービスアダプタに障害が発生した場合、該サービスア
ダプタの復旧後確実に障害発生中のモジュールの復旧を
行なって、起動することができる。更に、本発明によれ
ば、上位装置にI/Oサブシステムから積極的に障害
内容を通知し、又、上位装置にリカバリ方法を通知
し、更に、I/Oサブシステムにおける動作可能パス
の提示をすることにより、障害と無関係のアクセスに影
響を与えず、しかも、迅速にリカバリを行うことがで
き、又、上位装置の障害を上位装置に通知してリカバリ
させることができる。又、本発明によれば、I/Oサブ
システムの性能を向上できる。
【図1】本発明の原理説明図である。
【図2】一般的なI/Oサブシステムの構成図である。
【図3】CKD形式の説明図である。
【図4】データ書き込み時のシーケンス説明図である。
【図5】データ書き込み時の別のシーケンス説明図であ
る。
る。
【図6】データ読み出し時のシーケンス説明図である。
【図7】同期転送制御におけるサーチ動作説明図であ
る。
る。
【図8】同期転送制御におけるデータ読み出し説明図で
ある。
ある。
【図9】非同期転送制御を実現するためのI/Oサブシ
ステムの構成図である。
ステムの構成図である。
【図10】従来の非同期転送制御におけるバッファリン
グ説明図である。
グ説明図である。
【図11】非同期転送制御の実施例構成図である。
【図12】ディスクからの読み込み処理説明図である。
【図13】中間バッファへのバッファリング処理の流れ
図である。
図である。
【図14】上位CPUからのサーチ動作説明図である。
【図15】サーチIDの処理の流れ図である。
【図16】上位CPUからのリード動作説明図である。
【図17】リードCKDの処理の流れ図である。
【図18】ヘッド故障時におけるデータ保証を可能とす
るI/Oサブシステムの構成図である。
るI/Oサブシステムの構成図である。
【図19】データ保証する場合の処理の流れ図である。
【図20】データ保証する場合の別の処理の流れ図であ
る。
る。
【図21】本発明の動的経路再結合機能を実現するI/
Oサブシステムの構成図である。
Oサブシステムの構成図である。
【図22】各ユニットのハードウェア構成図である。
【図23】パスグループテーブルの説明図である。
【図24】本発明の動的経路再結合制御の処理の流れ図
である。
である。
【図25】ビジー率算出の処理フロー図である。
【図26】通常のリカバリの処理の流れ図である。
【図27】第1のリカバリ方法の処理の流れ図である。
【図28】第2のリカバリ方法におけるサービスアダプ
タのリカバリ処理の流れ図である。
タのリカバリ処理の流れ図である。
【図29】第2のリカバリ方法におけるリソースマネー
ジャの処理の流れ図である。
ジャの処理の流れ図である。
【図30】第3のリカバリ方法におけるその他のモジュ
ールの処理の流れ図である。
ールの処理の流れ図である。
【図31】第3のリカバリ方法におけるリソースマネー
ジャの処理の流れ図である。
ジャの処理の流れ図である。
【図32】障害発生時の制御を説明するコンピュータシ
ステムの構成図である。
ステムの構成図である。
【図33】パスグループテーブルの説明図である。
【図34】物理構成テーブルの説明図である。
【図35】CPUが管理する管理テーブルの構成図であ
る。
る。
【図36】障害発生時の処理の概略フロー図である。
【図37】障害情報の説明図である。
【図38】制御フラグの説明図である。
【図39】障害情報に含まれる物理構成テーブルの説明
図である。
図である。
【図40】障害情報に含まれるパスグループテーブルの
説明図である。
説明図である。
【図41】内部構成情報の一部が消失した場合の処理の
説明図である。
説明図である。
【図42】内部構成情報の一部が消失した場合のOSの
処理の流れ図である。
処理の流れ図である。
【図43】リカバリ不可能なパス障害が発生した場合の
処理の流れ図である。
処理の流れ図である。
【図44】上位装置に障害が発生した場合の処理の流れ
図である。
図である。
20・・上位装置としてのCPU 30・・磁気ディスク制御装置等のI/Oサブシステム 31a,31b・・チャネルアダプタ(CA) 32a,32b・・デバイスアダプタ(DA) 33・・リソースマネージャ(RM) 34・・中間バッファ 35・・テーブル記憶部(TS) 36・・サービスアダプタ 40・・I/Oデバイスとしての磁気ディスク装置
───────────────────────────────────────────────────── フロントページの続き (72)発明者 村野 正一 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 石川 準 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 片山 淳 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (56)参考文献 特開 平5−40580(JP,A) 特開 平4−282731(JP,A) 特開 平4−69758(JP,A) 特開 平4−68430(JP,A) 特開 昭61−240319(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06F 3/06
Claims (24)
- 【請求項1】 上位装置とディスク装置の間に設けら
れ、上位装置とのインターフェースを司るチャネルアダ
プタと、ディスク装置とのインターフェースを司るデバ
イスアダプタと、全体の資源管理を行うリソースマネー
ジャと、中間バッファと、各ユニットに発生した障害を
検知してリカバリ処理を行うサービスアダプタを有する
と共にこれらをバス接続し、ディスク装置から読み取っ
たCKDフォーマットのデータを中間バッファに記憶
し、中間バッファ上で所望のデータをサーチして上位装
置に転送するディスク制御装置の制御方法において、 ディスク装置よりCKDフォーマットのデータを中間バ
ッファに書き込む際、ディスク装置よりキー部K又はデ
ータ部Dを正常に読み込めなかった時、エラー内容を示
すセンスデータを作成し、 中間バッファにおける前記キー部又はデータ部を書き込
む領域に該センスデータをキー部あるいはデータ部の代
わりに書き込み、 更に、センスデータが前記領域に書き込まれていること
を示す制御情報を作成し、 該制御情報を所定の位置に書き込むディスク制御装置の
制御方法。 - 【請求項2】 センスデータが記憶される領域をサーチ
対象としないサーチコマンドが上位装置から入力された
場合、センスデータによるエラーを出力せず、サーチを
行う請求項1記載のディスク制御装置の制御方法。 - 【請求項3】 センスデータが記憶される領域を処理対
象とするコマンドが上位装置から入力された場合、 レコード毎に制御情報に基づいてセンスデータが該領域
に書き込まれているか判断し、 書き込まれている場合には、該センスデータをエラー情
報として上位装置に報告する請求項1記載のディスク制
御装置の制御方法。 - 【請求項4】 センスデータがキー領域、データ領域の
いずれに書き込まれているか識別可能に制御情報を作成
し、 処理対象となる領域がキー領域あるいはデータ領域の場
合、レコード毎に制御情報に基づいてセンスデータがキ
ー領域あるいはデータ領域に書き込まれているか判断
し、 書き込まれている場合には、該センスデータをエラー情
報として上位装置に報告する請求項3記載のディスク制
御装置の制御方法。 - 【請求項5】 上位装置とディスク装置の間に設けら
れ、上位装置とのインターフェースを司る複数のチャネ
ルアダプタと、ディスク装置とのインターフェースを司
る複数のデバイスアダプタと、全体の資源管理及び処理
動作に関する制御を行うリソースマネージャと、各ユニ
ットに発生した障害を検知してリカバリ処理を行うサー
ビスアダプタを備えたディスク制御装置の制御方法にお
いて、 上位装置であるホスト装置と該ホスト装置に接続するチ
ャネルアダプタ(パス)との対応関係を記憶すると共
に、 チャネルアダプタがI/O処理に係っている度合を示す
ビジー率を所定時間毎に算出して各チャネルアダプタに
対応させて記憶し、 ホスト装置に対して割り込む場合、該ホスト装置に接続
されているチャネルアダプタの中でビジー率が最も小さ
いチャネルアダプタを求め、 該チャネルアダプタを介して割込み信号をホスト装置に
送出するディスク制御装置の制御方法。 - 【請求項6】 前記割込み信号を出したチャネルアダプ
タを介して書き込みデータ及び読み出しデータをホスト
装置との間で授受する請求項5記載のディスク制御装置
の制御方法。 - 【請求項7】 上位装置とディスク装置の間に設けら
れ、上位装置とのインターフェースを司るチャネルアダ
プタと、ディスク装置とのインターフェースを司るデバ
イスアダプタと、全体の資源管理及び処理動作に関する
制御を行うリソースマネージャと、各ユニットに発生し
た障害を検知してリカバリ処理を行うサービスアダプタ
を備え、上位装置からの書き込みコマンドに基づいてデ
ィスク装置にCKDフォーマットデータを書き込むと共
に、読み出しコマンドに基づいてディスク装置よりCK
Dフォーマットデータを読み出して上位装置に転送する
ディスク制御装置の制御方法において、 データ書き込み時に、ディスク装置の書き込みアドレス
をメモリに記憶し、 CKDフォーマットデータが全て正常に書き込まれた場
合には該アドレスを抹消し、一部書き込み後に書き込み
エラーが発生した場合には該アドレスを抹消せず保持
し、 CKDフォーマットデータの読み出し時、該読み出しア
ドレスと一致するアドレスがメモリに記憶されているか
調べ、 記憶されている場合には上位装置に対してエラー通知
し、記憶されていない場合には該アドレスよりCKDフ
ォーマットデータを読み出すディスク制御装置の制御方
法。 - 【請求項8】 前記メモリを電源が切断されても記憶内
容を消失しない記憶手段で構成する請求項7記載のディ
スク制御装置の制御方法。 - 【請求項9】 CKDデータの書き込みが正常に行われ
た時、書き込みアドレスと一致するアドレスがメモリに
記憶されているか調べ、 記憶されている場合には該アドレスをメモリから抹消す
る請求項7記載のディスク制御装置の制御方法。 - 【請求項10】 上位装置とディスク装置の間に設けら
れ、上位装置とのインターフェースを司る複数のチャネ
ルアダプタと、ディスク装置とのインターフェースを司
る複数のデバイスアダプタと、全体の資源管理及び処理
動作に関する制御を行うリソースマネージャと、各ユニ
ットに発生した障害を検知してリカバリ処理を行うサー
ビスアダプタを有すると共にこれらをバス接続してなる
ディスク制御装置の制御方法において、 サービスアダプタにより定期的に各ユニットに障害が発
生していないかパトロールし、 障害発生を検知した場合には該障害発生ユニットのリカ
バリ処理を行うディスク制御装置の制御方法。 - 【請求項11】 上位装置とディスク装置の間に設けら
れ、上位装置とのインターフェースを司る複数のチャネ
ルアダプタと、ディスク装置とのインターフェースを司
る複数のデバイスアダプタと、全体の資源管理及び処理
動作に関する制御を行うリソースマネージャと、各ユニ
ットに発生した障害を検知してリカバリ処理を行うサー
ビスアダプタを有すると共にこれらをバス接続してなる
ディスク制御装置の制御方法において、 サービスアダプタは障害発生を検知した時、障害発生ユ
ニットをリソースマネージャに通知すると共に該ユニッ
トのリカバリ処理を行い、リカバリ完了後、リカバリ完
了をリソースマネージャに通知し、 リソースマネージャは障害発生通知により、障害発生ユ
ニットを動作不能状態にし、リカバリ完了通知により該
ユニットを動作可能状態にすると共に、障害発生通知後
に設定時間が経過してもリカバリ完了通知がない場合に
は、サービスアダプタに障害発生ユニットのリカバリに
ついて問い合わせ、 サービスアダプタは該問い合わせに基づいてユニットの
リカバリ処理を行って、リカバリ完了をリソースマネー
ジャに通知するディスク制御装置の制御方法。 - 【請求項12】 上位装置とディスク装置の間に設けら
れ、上位装置とのインターフェースを司る複数のチャネ
ルアダプタと、ディスク装置とのインターフェースを司
る複数のデバイスアダプタと、全体の資源管理及び処理
動作に関する制御を行うリソースマネージャと、各ユニ
ットに発生した障害を検知してリカバリ処理を行うサー
ビスアダプタを有し、これらをバス接続してなるディス
ク制御装置の制御方法において、 サービスアダプタは障害発生を検知した時、障害発生ユ
ニットをリソースマネージャに通知すると共に該ユニッ
トのリカバリ処理を行い、リカバリ完了後、リカバリ完
了をリソースマネージャに通知し、 リソースマネージャは障害発生通知により、障害発生ユ
ニットを動作不能状態にし、リカバリ完了通知により動
作可能状態になったことを該ユニットに通知し、 障害発生ユニットはリカバリ後に設定時間が経過しても
動作可能通知がない場合には、リソースマネージャに対
して動作可能通知を要求し、 該要求によりリソースマネージャはサービスアダプタに
障害発生ユニットのリカバリについて問い合わせ、 サービスアダプタは該問い合わせに基づいて、リカバリ
完了をリソースマネージャに通知し、リソースマネージ
ャは動作可能になったことをユニットに通知するディス
ク制御装置の制御方法。 - 【請求項13】 上位装置とディスク装置の間に設けら
れ、上位装置とのインターフェースを司る複数のチャネ
ルアダプタと、ディスク装置とのインターフェースを司
る複数のデバイスアダプタと、全体の資源管理及び処理
動作に関する制御を行うリソースマネージャと、各ユニ
ットに発生した障害を検知するサービスアダプタを有
し、これらをバス接続してなるディスク制御装置の制御
方法において、 内部診断によりあるいはサービスアダプタによる障害検
出パトロールにより障害発生を検出し、 障害が検出された時、障害情報にリカバリ方法を付加し
て上位装置に報告し、 上位装置は当該リカバリ方法に基づいてリカバリ処理す
るディスク制御装置の制御方法。 - 【請求項14】 前記障害情報に障害内容を付加して上
位装置に報告し、 上位装置は障害内容に応じたリカバリ処理を行う請求項
13記載のディスク制御装置の制御方法。 - 【請求項15】 パス障害の場合には、前記障害情報に
交代可能なパス情報を付加して上位装置に報告し、上位
装置は該交代パス情報に基づいてディスク装置と該デバ
イスにアクセス可能なパスとの対応関係を指示するパス
グループテーブルの内容を更新し、 該更新したパスグループテーブルに基づいてアクセスす
るパスを選択する請求項13又は請求項14記載のディ
スク制御装置の制御方法。 - 【請求項16】 上位装置の異常を検出した場合には、
障害情報にチャネル番号を付加して上位装置へ報告し、 上位装置は該情報に基づいて指定されたチャネルをリカ
バリする請求項13又は請求項14記載のディスク制御
装置の制御方法。 - 【請求項17】 上位装置とディスク装置の間に設けら
れ、上位装置とのインターフェースを司るチャネルアダ
プタと、ディスク装置とのインターフェースを司るデバ
イスアダプタと、全体の資源管理及び処理動作に関する
制御を行うリソースマネージャと、ディスク装置から読
み取ったCKDフォーマットのデータを記憶する中間バ
ッファと、各ユニットに発生した障害を検知してリカバ
リ処理を行うサービスアダプタを有し、これらをバスに
接続してなるディスク制御装置において、 デバイスアダプタは、 ディスク装置よりCKDフォーマットのデータを中間バ
ッファに書き込む際、ディスク装置よりキー部K又はデ
ータ部Dを正常に読み込めなかった時、エラー内容を示
すセンスデータを作成するセンスデータ作成手段と、 中間バッファにおける前記キー部又はデータ部の書き込
み領域に該センスデータをキー部あるいはデータ部の代
わりに書き込む書き込み手段と、 センスデータが前記領域に書き込まれていることを示す
制御情報を作成する手段と、 該制御情報を中間バッファの所定の位置に書き込む書き
込み手段を備え、 前記チャネルアダプタは、中間バッファ上で所望のデー
タをサーチして上位装置に転送するデータサーチ/転送
手段を有するディスク制御装置。 - 【請求項18】 前記データサーチ/転送手段は、セン
スデータが記憶される領域をサーチ対象としないサーチ
コマンドが上位装置から入力された場合、センスデータ
によるエラーを出力せずにサーチを行う手段と、 センスデータが記憶される領域を処理対象とするコマン
ドが上位装置から入力された場合、レコード毎に制御情
報に基づいてセンスデータが該領域に書き込まれている
か判断する手段と、 センスデータが書き込まれている場合には、該センスデ
ータをエラー情報として上位装置に報告する手段を有す
る請求項17記載のディスク制御装置。 - 【請求項19】 上位装置とディスク装置の間に設けら
れ、上位装置とのインターフェースを司る複数のチャネ
ルアダプタと、ディスク装置とのインターフェースを司
る複数のデバイスアダプタと、全体の資源管理及び処理
動作に関する制御を行うリソースマネージャと、各ユニ
ットに発生した障害を検知してリカバリ処理を行うサー
ビスアダプタを有し、これらをバスに接続してなるディ
スク制御装置において、 リソースマネージャは、 上位装置であるホスト装置と該ホスト装置に接続するチ
ャネルアダプタ(パス)との対応関係を記憶する手段
と、 チャネルアダプタがI/O処理に係っている度合を示す
ビジー率を所定時間毎に算出して各チャネルアダプタに
対応させて記憶するビジー率算出手段と、 ホスト装置に対して割り込む場合、該ホスト装置に接続
されているチャネルアダプタの中でビジー率が最も小さ
いチャネルアダプタを求める手段と、 該チャネルアダプタを介して割込み信号をホスト装置に
送出させる手段を有するディスク制御装置。 - 【請求項20】 上位装置とディスク装置の間に設けら
れ、上位装置とのインターフェースを司るチャネルアダ
プタと、ディスク装置とのインターフェースを司るデバ
イスアダプタと、全体の資源管理及び処理動作に関する
制御を行うリソースマネージャと、メモリと、各ユニッ
トに発生した障害を検知してリカバリ処理を行うサービ
スアダプタを有し、これらをバスに接続してなるディス
ク制御装置において、 デバイスアダプタは、 上位装置からの書き込みコマンドに基づいてディスク装
置にCKDフォーマットデータを書き込むと共に、読み
出しコマンドに基づいてディスク装置よりCKDフォー
マットデータを読み出すCKDフォーマットデータ読み
/書き手段を備え、 リソースマネージャは、 データ書き込み時に、ディスク装置の書き込みアドレス
をメモリに記憶する手段と、 CKDフォーマットデータが全て正常に書き込まれた場
合には該アドレスをメモリから抹消し、一部書き込み後
に書き込みエラーが発生した場合には該アドレスを抹消
せずメモリに保持する手段と、 CKDフォーマットデータの読み出し時、該読み出しア
ドレスと一致するアドレスがメモリに記憶されているか
調べる一致アドレス検索手段と、 一致するアドレスが記憶されている場合には上位装置に
対してエラー通知し、記憶されていない場合には該アド
レスよりCKDフォーマットデータを読み出すようにデ
バイスアダプタに指示する手段を備えたディスク制御装
置。 - 【請求項21】 上位装置とディスク装置の間に設けら
れ、上位装置とのインターフェースを司る複数のチャネ
ルアダプタと、ディスク装置とのインターフェースを司
る複数のデバイスアダプタと、全体の資源管理及び処理
動作に関する制御を行うリソースマネージャと、各ユニ
ットに発生した障害を検知してリカバリ処理を行うサー
ビスアダプタを有し、これらをバスに接続してなるディ
スク制御装置において、 サービスアダプタは、定期的に各ユニットに障害が発生
していないかパトロールする手段と、 障害発生を検知した場合には該障害発生ユニットのリカ
バリ処理を行うリカバリ手段を有するディスク制御装
置。 - 【請求項22】 上位装置とディスク装置の間に設けら
れ、上位装置とのインターフェースを司る複数のチャネ
ルアダプタと、ディスク装置とのインターフェースを司
る複数のデバイスアダプタと、全体の資源管理及び処理
動作に関する制御を行うリソースマネージャと、各ユニ
ットに発生した障害を検知してリカバリ処理を行うサー
ビスアダプタを有し、これらをバスに接続してなるディ
スク制御装置において、 サービスアダプタは、 障害発生を検知した時、障害発生ユニットをリソースマ
ネージャに通知する手段と、 該障害発生を検知した時、あるいは、リソースマネージ
ャからの問い合わせがあった時、障害発生ユニットのリ
カバリ処理を行う手段と、 リカバリ完了後、リカバリ完了をリソースマネージャに
通知する手段を備え、 リソースマネージャは、 サービスアダプタからの障害発生通知により、障害発生
ユニットを動作不能状態にする手段と、 リカバリ完了通知により障害発生ユニットを動作可能状
態にする手段と、 障害発生通知後の経過時間を監視する手段と、 経過時間が設定時間を越えてもリカバリ完了通知がない
場合には、サービスアダプタに障害発生ユニットのリカ
バリについて問い合わせる手段を備えたディスク制御装
置。 - 【請求項23】 上位装置とディスク装置の間に設けら
れ、上位装置とのインターフェースを司る複数のチャネ
ルアダプタと、ディスク装置とのインターフェースを司
る複数のデバイスアダプタと、全体の資源管理及び処理
動作に関する制御を行うリソースマネージャと、各ユニ
ットに発生した障害を検知してリカバリ処理を行うサー
ビスアダプタを有し、これらをバスに接続してなるディ
スク制御装置において、 サービスアダプタは、 障害発生を検知した時、障害発生ユニットをリソースマ
ネージャに通知する手段と、 該障害発生を検知した時、あるいは、リソースマネージ
ャからの問い合わせがあった時、障害発生ユニットのリ
カバリ処理を行う手段と、 リカバリ完了後、リカバリ完了をリソースマネージャに
通知する手段を備え、 リソースマネージャは、 サービスアダプタからの障害発生通知により、障害発生
ユニットを動作不能状態にする手段と、 リカバリ完了通知により動作可能状態になったことを障
害発生ユニットに通知する手段と、 障害発生ユニットからの要求によりサービスアダプタに
対して障害発生ユニットのリカバリについて問い合わせ
を行う手段を備え、 障害発生ユニットは、 リカバリ後の経過時間を監視する手段と、 経過時間が設定時間を越えてもリソースマネージャから
動作可能通知がない場合、リソースマネージャに対して
動作可能通知を要求する手段を有するディスク制御装
置。 - 【請求項24】 上位装置とディスク装置の間に設けら
れ、上位装置とのインターフェースを司る複数のチャネ
ルアダプタと、ディスク装置とのインターフェースを司
る複数のデバイスアダプタと、全体の資源管理及び処理
動作に関する制御を行うリソースマネージャと、各ユニ
ットに発生した障害を検知してリカバリ処理を行うサー
ビスアダプタを有し、これらをバスに接続してなるディ
スク制御装置において、 内部診断によりあるいはサービスアダプタによる障害検
出パトロールにより障害発生が検出された時、障害内容
及びリカバリ方法を含む障害情報を作成する手段と、 該障害情報を上位装置に報告する手段とを備え、 上位装置は当該リカバリ方法あるいは障害内容に基づい
てリカバリ処理するディスク制御装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5246650A JP2905373B2 (ja) | 1993-10-01 | 1993-10-01 | ディスク制御装置及びその制御方法 |
US08/284,003 US5613066A (en) | 1993-10-01 | 1994-08-01 | Disk controlling method and apparatus for transferring a record from a disk to a host via an intermediate buffer |
US08/759,149 US5878204A (en) | 1993-10-01 | 1996-12-02 | Disk controlling method and apparatus for transferring a record from a disk to a host via an intermediate buffer |
US09/167,650 US6092216A (en) | 1993-10-01 | 1998-10-06 | Disk controlling apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5246650A JP2905373B2 (ja) | 1993-10-01 | 1993-10-01 | ディスク制御装置及びその制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07104947A JPH07104947A (ja) | 1995-04-21 |
JP2905373B2 true JP2905373B2 (ja) | 1999-06-14 |
Family
ID=17151578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5246650A Expired - Fee Related JP2905373B2 (ja) | 1993-10-01 | 1993-10-01 | ディスク制御装置及びその制御方法 |
Country Status (2)
Country | Link |
---|---|
US (3) | US5613066A (ja) |
JP (1) | JP2905373B2 (ja) |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2905373B2 (ja) * | 1993-10-01 | 1999-06-14 | 富士通株式会社 | ディスク制御装置及びその制御方法 |
US6009498A (en) * | 1995-02-16 | 1999-12-28 | Fujitsu Limited | Disk control unit for holding track data in cache memory |
US6101574A (en) * | 1995-02-16 | 2000-08-08 | Fujitsu Limited | Disk control unit for holding track data in non-volatile cache memory |
US5894583A (en) * | 1996-04-09 | 1999-04-13 | International Business Machines Corporation | Variable timeout method for improving missing-interrupt-handler operations in an environment having I/O devices shared by one or more systems |
JPH10232849A (ja) * | 1997-02-19 | 1998-09-02 | Fujitsu Ltd | ディスク制御装置 |
JP3568181B2 (ja) * | 1997-06-23 | 2004-09-22 | 株式会社東芝 | ニューラルネット分析装置、記憶媒体 |
US6393537B1 (en) * | 1998-01-06 | 2002-05-21 | International Business Machines Corporation | Host storage management control of outboard data movement |
US6112311A (en) * | 1998-02-20 | 2000-08-29 | International Business Machines Corporation | Bridge failover system |
US6061750A (en) * | 1998-02-20 | 2000-05-09 | International Business Machines Corporation | Failover system for a DASD storage controller reconfiguring a first processor, a bridge, a second host adaptor, and a second device adaptor upon a second processor failure |
JP4392877B2 (ja) * | 1998-09-18 | 2010-01-06 | 株式会社日立製作所 | ディスクアレイ制御装置 |
JP3745552B2 (ja) * | 1999-02-26 | 2006-02-15 | 富士通株式会社 | 情報記憶装置 |
JP3716126B2 (ja) * | 1999-03-17 | 2005-11-16 | 株式会社日立製作所 | ディスクアレイ制御装置及びディスクアレイ |
US7721948B1 (en) * | 1999-05-25 | 2010-05-25 | Silverbrook Research Pty Ltd | Method and system for online payments |
JP4061563B2 (ja) * | 1999-09-16 | 2008-03-19 | 松下電器産業株式会社 | 磁気ディスク装置、磁気ディスク装置のディスクアクセス方法、及び磁気ディスク装置用ディスクアクセス制御プログラム記録媒体 |
JP4700204B2 (ja) * | 2001-03-07 | 2011-06-15 | 株式会社日立製作所 | ストレージ管理データ制御システム |
JP2003242097A (ja) * | 2002-02-15 | 2003-08-29 | Hitachi Ltd | クロスコール機能を備えるディスク制御装置 |
JP4189171B2 (ja) * | 2002-05-24 | 2008-12-03 | 株式会社日立製作所 | ディスク制御装置 |
US7383381B1 (en) | 2003-02-28 | 2008-06-03 | Sun Microsystems, Inc. | Systems and methods for configuring a storage virtualization environment |
US7290168B1 (en) * | 2003-02-28 | 2007-10-30 | Sun Microsystems, Inc. | Systems and methods for providing a multi-path network switch system |
US7236987B1 (en) | 2003-02-28 | 2007-06-26 | Sun Microsystems Inc. | Systems and methods for providing a storage virtualization environment |
US7447939B1 (en) | 2003-02-28 | 2008-11-04 | Sun Microsystems, Inc. | Systems and methods for performing quiescence in a storage virtualization environment |
US7539924B1 (en) | 2005-11-15 | 2009-05-26 | Western Digital Technologies, Inc. | Disk drive implementing data path protection by encoding large host blocks into sub blocks |
US7647544B1 (en) | 2005-11-22 | 2010-01-12 | Western Digital Technologies, Inc. | Disk drive implementing data path protection without writing the error detection code data to the disk |
JP4606455B2 (ja) | 2007-12-20 | 2011-01-05 | 富士通株式会社 | ストレージ管理装置、ストレージ管理プログラムおよびストレージシステム |
US8108732B2 (en) * | 2008-06-18 | 2012-01-31 | International Business Machines Corporation | Apparatus and method to minimize performance degradation during communication path failure in a data processing system |
US8006027B1 (en) | 2008-09-11 | 2011-08-23 | Western Digital Technologies, Inc. | Method of staging small writes on a large sector disk drive |
US8285965B2 (en) * | 2009-11-20 | 2012-10-09 | Western Digital Technologies, Inc. | Aligning data storage device partition to boundary of physical data sector |
US8397107B1 (en) | 2009-12-11 | 2013-03-12 | Western Digital Technologies, Inc. | Data storage device employing data path protection using both LBA and PBA |
US8443167B1 (en) | 2009-12-16 | 2013-05-14 | Western Digital Technologies, Inc. | Data storage device employing a run-length mapping table and a single address mapping table |
US8194340B1 (en) | 2010-03-18 | 2012-06-05 | Western Digital Technologies, Inc. | Disk drive framing write data with in-line mapping data during write operations |
US8693133B1 (en) | 2010-03-22 | 2014-04-08 | Western Digital Technologies, Inc. | Systems and methods for improving sequential data rate performance using sorted data zones for butterfly format |
US8699185B1 (en) | 2012-12-10 | 2014-04-15 | Western Digital Technologies, Inc. | Disk drive defining guard bands to support zone sequentiality when butterfly writing shingled data tracks |
US8856438B1 (en) | 2011-12-09 | 2014-10-07 | Western Digital Technologies, Inc. | Disk drive with reduced-size translation table |
US8687306B1 (en) | 2010-03-22 | 2014-04-01 | Western Digital Technologies, Inc. | Systems and methods for improving sequential data rate performance using sorted data zones |
US9330715B1 (en) | 2010-03-22 | 2016-05-03 | Western Digital Technologies, Inc. | Mapping of shingled magnetic recording media |
US8756361B1 (en) | 2010-10-01 | 2014-06-17 | Western Digital Technologies, Inc. | Disk drive modifying metadata cached in a circular buffer when a write operation is aborted |
US8954664B1 (en) | 2010-10-01 | 2015-02-10 | Western Digital Technologies, Inc. | Writing metadata files on a disk |
US8793429B1 (en) | 2011-06-03 | 2014-07-29 | Western Digital Technologies, Inc. | Solid-state drive with reduced power up time |
US8990493B1 (en) | 2011-06-30 | 2015-03-24 | Western Digital Technologies, Inc. | Method and apparatus for performing force unit access writes on a disk |
US8756382B1 (en) | 2011-06-30 | 2014-06-17 | Western Digital Technologies, Inc. | Method for file based shingled data storage utilizing multiple media types |
US8671250B2 (en) | 2011-12-15 | 2014-03-11 | Western Digital Technologies, Inc. | Data storage device generating redundancy for data path protection of a parity sector |
US9213493B1 (en) | 2011-12-16 | 2015-12-15 | Western Digital Technologies, Inc. | Sorted serpentine mapping for storage drives |
US8819367B1 (en) | 2011-12-19 | 2014-08-26 | Western Digital Technologies, Inc. | Accelerated translation power recovery |
US8612706B1 (en) | 2011-12-21 | 2013-12-17 | Western Digital Technologies, Inc. | Metadata recovery in a disk drive |
US9063838B1 (en) | 2012-01-23 | 2015-06-23 | Western Digital Technologies, Inc. | Data storage device shifting data chunks of alignment zone relative to sector boundaries |
US8996839B1 (en) | 2012-01-23 | 2015-03-31 | Western Digital Technologies, Inc. | Data storage device aligning partition to boundary of sector when partition offset correlates with offset of write commands |
US8953269B1 (en) | 2014-07-18 | 2015-02-10 | Western Digital Technologies, Inc. | Management of data objects in a data object zone |
US9875055B1 (en) | 2014-08-04 | 2018-01-23 | Western Digital Technologies, Inc. | Check-pointing of metadata |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5553758A (en) * | 1978-10-16 | 1980-04-19 | Nec Corp | Transfer control system for magnetic disk device |
JPS6052459B2 (ja) * | 1980-04-08 | 1985-11-19 | 富士通株式会社 | マイクロプログラム制御方式 |
JPS6041384B2 (ja) * | 1981-12-25 | 1985-09-17 | 富士通株式会社 | 入出力制御方式 |
JPS59111558A (ja) * | 1982-12-17 | 1984-06-27 | Nec Corp | デイスクキヤツシユ装置 |
JPS6162920A (ja) * | 1984-09-05 | 1986-03-31 | Hitachi Ltd | 磁気デイスク装置システム |
JPS6278623A (ja) * | 1985-10-02 | 1987-04-10 | Toshiba Corp | 磁気デイスク装置 |
JPS62176373A (ja) * | 1986-01-30 | 1987-08-03 | Canon Inc | デ−タ変換方式 |
JP2538876B2 (ja) * | 1986-05-20 | 1996-10-02 | 富士通株式会社 | 共通バス構造を持つデ−タ処理装置 |
JPH0727510B2 (ja) * | 1986-08-01 | 1995-03-29 | 富士通株式会社 | 非同期転送制御装置 |
JPS6488677A (en) * | 1987-09-29 | 1989-04-03 | Toshiba Corp | Multiprocessor system |
JPH01195769A (ja) * | 1988-01-30 | 1989-08-07 | Nec Home Electron Ltd | 可変長データの固定長データへの変換方法 |
JP2830218B2 (ja) * | 1989-11-22 | 1998-12-02 | 株式会社日立製作所 | キャッシュ付ディスク制御装置の障害処理方法 |
JPH0423143A (ja) * | 1990-05-18 | 1992-01-27 | Mitsubishi Electric Corp | データの蓄積方式 |
US5210860A (en) * | 1990-07-20 | 1993-05-11 | Compaq Computer Corporation | Intelligent disk array controller |
JP3451099B2 (ja) * | 1991-12-06 | 2003-09-29 | 株式会社日立製作所 | 外部記憶サブシステム |
US5463767A (en) * | 1992-02-24 | 1995-10-31 | Nec Corporation | Data transfer control unit with memory unit fault detection capability |
JP3207955B2 (ja) * | 1992-12-18 | 2001-09-10 | 日置電機株式会社 | 信号入出力回路 |
JP2905373B2 (ja) * | 1993-10-01 | 1999-06-14 | 富士通株式会社 | ディスク制御装置及びその制御方法 |
-
1993
- 1993-10-01 JP JP5246650A patent/JP2905373B2/ja not_active Expired - Fee Related
-
1994
- 1994-08-01 US US08/284,003 patent/US5613066A/en not_active Expired - Lifetime
-
1996
- 1996-12-02 US US08/759,149 patent/US5878204A/en not_active Expired - Lifetime
-
1998
- 1998-10-06 US US09/167,650 patent/US6092216A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US5878204A (en) | 1999-03-02 |
US6092216A (en) | 2000-07-18 |
JPH07104947A (ja) | 1995-04-21 |
US5613066A (en) | 1997-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2905373B2 (ja) | ディスク制御装置及びその制御方法 | |
EP0167540B1 (en) | Processing system tolerant of loss of access to secondary storage | |
US5923876A (en) | Disk fault prediction system | |
US5761411A (en) | Method for performing disk fault prediction operations | |
JP3732869B2 (ja) | 外部記憶装置 | |
US7941693B2 (en) | Disk array apparatus and method for controlling the same | |
US6052797A (en) | Remotely mirrored data storage system with a count indicative of data consistency | |
US6044444A (en) | Remote data mirroring having preselection of automatic recovery or intervention required when a disruption is detected | |
US7055059B2 (en) | Remote data mirroring | |
JP3136036B2 (ja) | ディスク制御装置の制御方法 | |
JP3284963B2 (ja) | ディスクアレイの制御装置及び制御方法 | |
JP3681766B2 (ja) | ディスクアレイ装置 | |
JP3139548B2 (ja) | エラーリトライ方法、エラーリトライシステム及びその記録媒体 | |
JPH09269871A (ja) | ディスクアレイ装置におけるデータ再冗長化方式 | |
JPH1195933A (ja) | ディスクアレイ装置 | |
US7962781B2 (en) | Control method for information storage apparatus, information storage apparatus and computer readable information recording medium | |
JP3254766B2 (ja) | 同一データの多重書き込み方法、データの読み出し方法及びデータ回復方法、並びにそのための制御装置 | |
JP3515495B2 (ja) | ディスク制御装置及びその制御方法 | |
JP3069829B2 (ja) | ディスクアレイ装置 | |
JPH08147112A (ja) | ディスクアレイ装置のエラー回復装置 | |
JPH04360242A (ja) | 二重化システムの系切替装置およびその方法 | |
WO1998041915A1 (fr) | Sous-systeme pour pile de disques | |
JP2815730B2 (ja) | アダプタ及びコンピュータシステム | |
JPH11327695A (ja) | リセット制御方法および情報処理システム | |
JPH0635625A (ja) | ディスクアレイ制御装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19990316 |
|
LAPS | Cancellation because of no payment of annual fees |