JP2010182080A

JP2010182080A - Ｉ／ｏ命令障害回復回路、ｉ／ｏ命令障害回復方法及びｉ／ｏ命令障害回復プログラム

Info

Publication number: JP2010182080A
Application number: JP2009024857A
Authority: JP
Inventors: Koichi Nomura; 晃一野村
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2009-02-05
Filing date: 2009-02-05
Publication date: 2010-08-19
Anticipated expiration: 2029-02-05
Also published as: JP5288331B2

Abstract

【課題】ホスト−ディスク装置間インタフェースでＣＲＣエラー等の軽微な障害が発生した場合、タイムアウト検出による処理遅延を短縮する。
【解決手段】ホストとディスク装置がインタフェースで接続されているシステムにおけるＩ／Ｏ命令障害回復回路が、前記ホストにおいて障害を検出した場合に、当該障害の回数をカウントする。前記ホストが前記ディスク装置にＩ／Ｏ命令を発行した際、その応答を時間監視し、第１の一定時間以内に応答がない場合、その旨を入出力処理手段に通知する。前記ホストが前記ディスク装置にＩ／Ｏ命令を発行した際、その応答を時間監視し、前記第１の一定時間よりも長い時間である第２の一定時間以内に応答がない場合、その旨を前記入出力処理手段に通知する。前記第１の時間監視通知があった場合と、前記第２の時間監視通知があった場合であって前記ＣＲＣエラー類カウンタのカウントアップがあった場合に、障害処理を開始する。
【選択図】図１

Description

本発明はホスト−ディスク装置間インタフェースでのデータ通信においてＣＲＣ（Cyclic Redundancy Check）エラー等の軽微な障害が発生した場合のタイムアウト検出に関する。

ホスト−ディスク装置間インタフェースでのデータ通信においてＣＲＣエラー等の軽微な障害が発生した場合に、その障害を検知するという技術が存在する。

例えば特許文献１に記載の技術では、ホストコンピュータ（ＣＰＵ）が周辺装置の組み込み時に、ＣＰＵから与えられた入出力監視時間よりも実行時間が長いコマンドについてそれぞれの延長時間とＣＰＵに対して監視時間の延長を通知することを示すイベント通知フラグをオンとする。そして、ＣＰＵでのＩ／Ｏ発行時、周辺装置は、コマンドが監視時間の延長を通知するものである場合に、延長時間をＣＰＵに通知し、監視時間延長通知を受けたＣＰＵは監視時間カウンタのカウンタ値を、通知され延長時間に相当する値だけ加算する。また、周辺装置はコマンド実行を終えた時点で延長時間内に終了した場合には監視時間の短縮通知イベントを送信しＣＰＵは時間監視用のカウント値を、前記通知された短縮時間に相当する値だけ減算する。

特開２００１−１４７８６６号公報

もっとも、上述の特許文献１に記載の技術では、ホスト−ディスク装置間インタフェースでのデータ通信においてＣＲＣエラー等の軽微な障害が発生した場合、受信した情報が不定でありどのような指示、応答であるか判断することができない。そのような場合、軽微な障害を検出したポートは、単に障害発生が有ったということをカウントするのみで、積極的な障害処理は実施しないのが通例である。

そして、障害の検出が有ったという異常は、上位層が実施するタイムアウト監視により検出し、その後に障害処理を開始する。そのため、通常１ｓ未満で完了するＩ／Ｏ命令の完了までに数ｓ〜数１０ｓの長い時間が必要となる。結果として、システム全体が遅延してしまう。この際、ディスク装置内部障害発生時を考慮すると通常の応答時間よりの２〜３桁長い応答時間を要する場合があるので、単純に上位層のタイムアウト値を短縮することも出来ない。

そこで、本発明は、ホスト−ディスク装置間インタフェースでＣＲＣエラー等の軽微な障害が発生した場合、タイムアウト検出による処理遅延を短縮することができるＩ／Ｏ命令障害回復回路、Ｉ／Ｏ命令障害回復方法及びＩ／Ｏ命令障害回復プログラムを提供することを目的とする。

本発明の第１の観点によれば、ホストとディスク装置がインタフェースで接続されているシステムにおけるＩ／Ｏ命令障害回復回路において、前記ホストにおいて障害を検出した場合に、当該障害の回数をカウントするＣＲＣ（Cyclic Redundancy Check）エラー類カウンタと、前記ホストが前記ディスク装置にＩ／Ｏ命令を発行した際、その応答を時間監視し、第１の一定時間以内に応答がない場合、その旨を入出力処理手段に通知する第１の時間監視手段と、前記ホストが前記ディスク装置にＩ／Ｏ命令を発行した際、その応答を時間監視し、前記第１の一定時間よりも長い時間である第２の一定時間以内に応答がない場合、その旨を前記入出力処理手段に通知する第２の時間監視手段と、前記第１の時間監視手段から通知があった場合と、前記第２の時間監視手段から通知があった場合であって前記ＣＲＣエラー類カウンタのカウントアップがあった場合に、障害処理を開始する入出力処理手段と、を備えることを特徴とするＩ／Ｏ命令障害回復回路が提供される。

本発明の第２の観点によれば、ホストとディスク装置がインタフェースで接続されているシステムにおけるＩ／Ｏ命令障害回復方法において、前記ホストにおいて障害を検出した場合に、当該障害の回数をカウントするＣＲＣエラー類カウンタを用意するステップと、前記ホストが前記ディスク装置にＩ／Ｏ命令を発行した際、その応答を時間監視し、第１の一定時間以内に応答がない場合、その旨を入出力処理ステップに通知する第１の時間監視ステップと、前記ホストが前記ディスク装置にＩ／Ｏ命令を発行した際、その応答を時間監視し、前記第１の一定時間よりも長い時間である第２の一定時間以内に応答がない場合、その旨を前記入出力処理ステップに通知する第２の時間監視ステップと、前記第１の時間監視ステップにおける通知があった場合と、前記第２の時間監視ステップにおける通知があった場合であって前記ＣＲＣエラー類カウンタのカウントアップがあった場合に、障害処理を開始する入出力処理ステップと、を備えることを特徴とするＩ／Ｏ命令障害回復方法が提供される。

本発明の第３の観点によれば、ホストとディスク装置がインタフェースで接続されているシステムにおけるＩ／Ｏ命令障害回復回路に搭載されるＩ／Ｏ命令障害回復プログラムにおいて、前記ホストにおいて障害を検出した場合に、当該障害の回数をカウントするＣＲＣ（Cyclic Redundancy Check）エラー類カウンタと、前記ホストが前記ディスク装置にＩ／Ｏ命令を発行した際、その応答を時間監視し、第１の一定時間以内に応答がない場合、その旨を入出力処理手段に通知する第１の時間監視手段と、前記ホストが前記ディスク装置にＩ／Ｏ命令を発行した際、その応答を時間監視し、前記第１の一定時間よりも長い時間である第２の一定時間以内に応答がない場合、その旨を前記入出力処理手段に通知する第２の時間監視手段と、前記第１の時間監視手段から通知があった場合と、前記第２の時間監視手段から通知があった場合であって前記ＣＲＣエラー類カウンタのカウントアップがあった場合に、障害処理を開始する入出力処理手段と、を備えるＩ／Ｏ命令障害回復回路としてコンピュータを機能させることを特徴とするＩ／Ｏ命令障害回復プログラムが提供される。

本発明によれば、ホスト−ディスク装置間インタフェースでＣＲＣエラー等の軽微な障害が発生した場合、一定時間が経過した状態で異常を検出し障害処理を起動することが可能であることから、発生したＩ／Ｏ命令の障害処理の開始を早めることができ、システム全体の遅延の防止が可能となる。

本発明の実施形態の基本的構成を表す図である。本発明の実施形態の基本的動作を表す図（１／２）である。本発明の実施形態の基本的動作を表す図（２／２）である。本発明の実施形態の効果について説明するためのフローチャート（１／２）である。本発明の実施形態の効果について説明するためのフローチャート（２／２）である。

次に、本発明の実施形態について図面を用いて詳細に説明する。図１を参照すると本実施形態は、ホスト１００と、ディスク装置２００を有する。ホスト１００と、ディスク装置２００はシリアルインタフェース３００を介して接続されている。

シリアルインタフェース３００は、ファイバチャネルインタフェースに代表されるシリアルインタフェースである。

また、ホスト１００は、中央処理装置１１０と、主記憶装置１２０と、入出力処理装置１３０と、第１の時間監視機構１４１と、第２の時間監視機構１４２と、ＣＲＣエラー類カウンタ１５０と、送受信回路１６０と、を有する。

中央処理装置１１０は、例えばＣＰＵ等でありホスト１００において演算処理を行う。主記憶装置１２０は、中央処理装置１１０直接アクセスすることの出来る記憶装置である。

入出力処理装置１３０は、中央処理装置１１０からのＩ／Ｏ命令によりディスク装置２００とのデータ読み書きを実行する装置である。

また、入出力処理装置１３０は、Ｉ／Ｏ命令の異常を検出するために、ディスク装置からの応答を時間監視する第１の時間監視機構１４１及び第２の時間監視機構１４２を更に有する。加えて、入出力処理装置１３０は、ホスト１００、ディスク装置２００各々の送受信回路が情報伝達する際に検出したＣＲＣエラー等のシリアルインタフェースの障害発生回数を記憶するＣＲＣエラー類カウンタ１５０を有する。

送受信回路１６０は、入出処理装置１３０からの指示によりシリアルインタフェース３００を介してディスク装置２００との情報伝達を行う送受信回路である。

一方、ディスク装置２００は、送受信回路２１０と、ＣＲＣエラー類カウンタ２２０と、ディスク２３０と、ディスク制御装置２４０を有する。

送受信回路２１０は、シリアルインタフェース３００を介してホスト１００との情報伝達を行う回路である。ＣＲＣエラー類カウンタ２２０は、ＣＲＣエラー類カウンタ１５０同様にホスト１００、ディスク装置２００各々の送受信回路が情報伝達する際に検出したＣＲＣエラー等のシリアルインタフェースの障害発生回数を記憶するためのカウンタである。

ディスク２３０は、データを記憶するディスクである。

ディスク制御装置２４０は、送受信回路２１０からの情報によりホストからのＩ／Ｏ命令を解析し、ディスク２３０のデータの読み書きを行う装置である。

次に、図２のフローチャートを参照して、本実施形態の動作について説明する。

まず、ホスト１００内の中央処理装置１１０がディスク装置２００とのデータ転送を実行するために、Ｉ／Ｏ命令を入出力処理装置１１０に指示した際の動作を説明する。

中央処理装置１１０よりＩ／Ｏ命令の実行を指示された入出力処理装置１１０は、その指示を受け付ける（ステップＳ４０１）。

そして入出力処理装置１１０は、ＣＲＣエラー類カウンタ１５０をＩ／Ｏ命令開始前に読み出し内部に記憶しておく（ステップＳ４０２）。

その後、送受信回路１６０に対し、Ｉ／Ｏ命令開始をディスク装置２００に送信するよう指示する。その指示を受けた送受信回路１６０は、シリアルインタフェース３００を介してディスク装置２００にＩ／Ｏ命令開始を送信する（ステップＳ４０３）。送受信回路１６０は、このシリアルインタフェース３００を介して情報伝達する際にＣＲＣエラー等のシリアルインタフェース障害を検出した場合には、ＣＲＣエラー類カウンタ１５０をカウントアップする。

ディスク装置２００内部の送受信回路２１０は、シリアルインタフェース３００を介してホスト１００からのＩ／Ｏ命令開始を受信する。そして、送受信回路２１０は、ディスク制御装置２４０にそれを通知する（ステップＳ４０４）。

通知を受けたディスク制御装置２４０は、ホスト１００から受信したＩ／Ｏ命令を解析し、ディスク２３０のデータの読み書きを実行する。ディスク制御装置２４０は、Ｉ／Ｏ命令の実行が完了すると、Ｉ／Ｏ命令応答をホスト１００に送信するよう送受信回路２１０に指示する（ステップＳ４０５）。この際、送受信回路２１０はシリアルインタフェース３００を介して情報伝達する間にＣＲＣエラー等のシリアルインタフェース障害を検出した場合には、ＣＲＣエラー類カウンタ２２０をカウントアップする。

入出力処理装置１１０は、ディスク装置２００の異常の検出を目的にＩ／Ｏ命令応答が返るまでの時間を監視するため、第１の時間監視機構１４１にディスク装置２００がＩ／Ｏ命令を実行するのに十分な時間（以下、この時間のことを「時間（Ａ）と表記する。」）で監視するよう指示する（ステップＳ４０６）。さらに入出力処理装置１１０は、第２の時間監視機構１４２に前述の時間（Ａ）より短い時間であって、通常Ｉ／Ｏ命令応答が返るまでの時間として十分な時間（以下、この時間のことを「時間（Ｂ）と表記する。」）で監視するよう指示する（ステップＳ４０７）。

その後、入出力処理装置１１０は、送受信回路１６０からの「ディスク装置２００からのＩ／Ｏ命令応答」、第１の時間監視機構１４１からの「第１の時間監視オーバー」、第２の時間監視機構１４２からの「第２の時間監視オーバー」が発生しているかをチェックし続ける。

入出力処理装置１１０はディスク装置２００とのＩ／Ｏ命令が正常に完了した際（ステップＳ４０８においてＹｅｓ）は、送受信回路１６０を介した「ディスク装置２００からのＩ／Ｏ命令応答」を認識し、第１の時間監視機構１４１及び第２の時間監視機構１４２に対し、時間監視の停止を指示する。そして、第１の時間監視機構１４１及び第２の時間監視機構１４２は、その指示を受けて時間監視の停止をする（ステップＳ４０９、ステップＳ４１０）。

最後に、入出力処理装置１１０は中央処理装置１１０に対し、Ｉ／Ｏ命令の正常終了を報告する。

一方（ステップＳ４０８においてＮｏ）、入出力処理装置１１０は第１の時間監視機構１４１により「第１の時間監視オーバー」すなわち一定時間（Ａ）が経過してもディスク装置２００からのＩ／Ｏ命令応答がなかった場合（ステップＳ４１２においてＹｅｓ）、Ｉ／Ｏ命令の異常と判断し、障害処理を起動する（ステップＳ４１５）。

ステップＳ４１２においてＮｏだった場合であって、入出力処理装置１１０は第２の時間監視機構１４２により「第２の時間監視オーバー」すなわち時間（Ｂ）が経過してもディスク装置２００からのＩ／Ｏ命令応答がなかった場合（ステップＳ４１３においてＹｅｓ）、ＣＲＣエラー類カウンタを読み出し、Ｉ／Ｏ命令開始以前に読み出した値と比較する（ステップＳ４１３）。

そして比較の結果に基づいて、Ｉ／Ｏ命令実行中にＣＲＣエラー等が発生したかを確認する。ここで、ＣＲＣエラー等が発生している場合は（ステップＳ４１４においてＹｅｓ）、この障害により一定時間（Ｂ）が経過してもＩ／Ｏ命令の応答がないものと判断し、障害処理を起動する（ステップＳ４１５）。

また、第２の時間監視オーバーをしていない場合（ステップＳ４１２においてＮｏ）と、ＣＲＣエラー等が発生していない場合は（ステップＳ４０４においてＮｏ）、それ以外の事由により応答が遅れているものと判断し、再び「ディスク装置２００からのＩ／Ｏ命令応答」、第１の時間監視機構１４１からの「第１の時間監視オーバー」、第２の時間監視機構１４２からの「第２の時間監視オーバー」が発生しているかをチェックし続ける。

［他の実施形態］
前述の実施形態は、本発明を実現する上でもっとも単純なものである。もっとも前述の実施形態では、シリアルインタフェース３００上の障害をディスク装置２００側の送受信回路２１０が検出した場合に効果が得られないという欠点があるため、以下の２つの実施形態を変形例として説明する。

変形例の一つ目は、入出力処理装置１１０は第２の時間監視機構１４２により「第２の時間監視オーバー」すなわち一定時間（Ｂ）が経過してもディスク装置２００からのＩ／Ｏ命令応答がなかった場合、ＣＲＣエラー類カウンタ１５０を読み出し、Ｉ／Ｏ命令開始以前に読み出した値と比較し、Ｉ／Ｏ命令実行中にＣＲＣエラー等が発生したかを確認する。確認の結果、ＣＲＣエラー等が発生していない場合は、ディスク装置２００に対し該当Ｉ／Ｏ命令が内部で処理中か否かの問合せを行い、ディスク装置２００内部で実行されていないと通知された場合は、シリアルインタフェース３００の障害の発生により、一定時間（Ｂ）が経過してもＩ／Ｏ命令の応答がないものと判断し、障害処理を起動する。

変形例の二つ目は、入出力処理装置１１０は第２の時間監視機構１４２により「第２の時間監視オーバー」すなわち一定時間（Ｂ）が経過してもディスク装置２００からのＩ／Ｏ命令応答がなかった場合、ＣＲＣエラー類カウンタを読み出し、Ｉ／Ｏ命令開始以前に読み出した値と比較し、Ｉ／Ｏ命令実行中にＣＲＣエラー等が発生したかを確認する。確認の結果、ＣＲＣエラー等が発生していない場合は、ディスク装置２００に対しディスク装置２００側ポートのＣＲＣエラー類カウンタの問合せを行う。そして、カウントアップがあった場合はカウントアップした障害検出による影響により、一定時間（Ｂ）が経過してもＩ／Ｏ命令の応答がないものと判断し、障害処理を起動する。

以上説明した、各実施形態はホスト−ディスク装置間インタフェースでＣＲＣエラー等の軽微な障害が発生した場合、一定時間（Ｂ）が経過した状態で異常を検出し障害処理を起動することが可能であるため、影響したＩ／Ｏ命令の障害処理の開始を早めることができシステム全体の遅延が防止できるという効果を奏する。

この点について、図３及び図４のシーケンス図を用いて説明する。

図３は、本実施形態を適用させない場合の動作例である。まず、ホスト１００がディスク装置２００に対してＩ／Ｏ命令の開始を通知する（ステップＡ５０１）。そして、ディスク装置２００がホスト１００に対してＩ／Ｏ命令の応答を通知する（ステップＡ５０２）。なお、図３に示すようにこの処理は、通常１秒未満で完了する。

そして、ＣＲＣエラーが発生し、情報が破棄された場合、ＣＲＣエラーカウンタのカウンタアップのみがなされる（ステップＡ５０３）。

その後、２０秒後にタイムアウトが検出され、Ｉ／Ｏ障害の処理が開始される（ステップＡ５０４）。結果として、障害処理の開始まで２０秒ほどかかることとなる。

次に、図４は、本実施形態を適用させた場合の動作例である。まず、ホスト１００がディスク装置２００に対してＩ／Ｏ命令の開始を通知する（ステップＡ５０１）。そして、ディスク装置２００がホスト１００に対してＩ／Ｏ命令の応答を通知する（ステップＡ５０２）。なお、図３に示すようにこの処理は、通常１秒未満で完了する。

その後、１秒後（一定時間Ｂ）にタイムアウトが検出され、ＣＲＣエラーカウンタのカウンタをチェックする。チェックの結果カウンタアップしているため、Ｉ／Ｏ障害の処理が開始される（ステップＡ５０５）。結果として、障害処理の開始まで１秒ほどで済むこととなる。

更に、本実施形態は、障害の発生原因が、ホスト、ディスク装置、シリアルインタフェースの何れかであるかが判断できることから、より適切な障害処理を起動することが可能であるという効果を奏する。

なお、本発明の実施形態であるホスト及びディスク装置は、ハードウェア、ソフトウェア又はこれらの組合せにより実現することができる。

また、上述した実施形態は、本発明の好適な実施形態ではあるが、上記実施形態のみに本発明の範囲を限定するものではなく、本発明の要旨を逸脱しない範囲において種々の変更を施した形態での実施が可能である。

１００ホスト
１１０中央処理装置
１２０主記憶装置
１３０入出力処理装置
１４１第１の時間監視機構
１４２第２の時間監視機構
１５０、２２０ＣＲＣエラー類カウンタ
１６０、２１０送受信回路
２００ディスク装置
２３０ディスク
２４０ディスク制御装置
３００シリアルインタフェース

Claims

ホストとディスク装置がインタフェースで接続されているシステムにおけるＩ／Ｏ命令障害回復回路において、
前記ホストにおいて障害を検出した場合に、当該障害の回数をカウントするＣＲＣ（Cyclic Redundancy Check）エラー類カウンタと、
前記ホストが前記ディスク装置にＩ／Ｏ命令を発行した際、その応答を時間監視し、第１の一定時間以内に応答がない場合、その旨を入出力処理手段に通知する第１の時間監視手段と、
前記ホストが前記ディスク装置にＩ／Ｏ命令を発行した際、その応答を時間監視し、前記第１の一定時間よりも長い時間である第２の一定時間以内に応答がない場合、その旨を前記入出力処理手段に通知する第２の時間監視手段と、
前記第１の時間監視手段から通知があった場合と、前記第２の時間監視手段から通知があった場合であって前記ＣＲＣエラー類カウンタのカウントアップがあった場合に、障害処理を開始する入出力処理手段と、
を備えることを特徴とするＩ／Ｏ命令障害回復回路。
請求項１に記載のＩ／Ｏ命令障害回復回路において、
前記入出力処理手段が、前記第２の時間監視手段から通知があった場合であって前記ＣＲＣエラー類カウンタのカウントアップがなかった場合に、前記ディスク装置に前記発行したＩ／Ｏ処理が内部で実施されているか否かの問合せを行い、前記ディスク装置内部で実行されていないとの返信が通知された場合は、前記インタフェースにおいて障害が発生していると判断し、当該インタフェースにおける障害について前記障害処理を行うことを特徴とするＩ／Ｏ命令障害回復回路。
請求項１に記載のＩ／Ｏ命令障害回復回路において、
前記ディスク装置が、前記ディスク装置において障害を検出した場合に、当該障害の回数をカウントするＣＲＣエラー類カウンタを更に備え、
前記入出力処理手段が、前記第２の時間監視手段から通知があった場合であって前記ホスト装置が備える前記ＣＲＣエラー類カウンタのカウントアップがなかった場合に、前記ディスク装置が備える前記ＣＲＣエラー類カウンタにカウントアップがあるか問合せを行い、カウントアップがあったとの返信が通知された場合は、当該カウントアップした障害検出による影響であると判断し、当該カウントアップにおける障害について前記障害処理を行うことを特徴とするＩ／Ｏ命令障害回復回路。
請求項１乃至３の何れか１項に記載のＩ／Ｏ命令障害回復回路において、前記ＣＲＣエラー類カウンタが、障害として検出するのはＣＲＣエラーであることを特徴とするＩ／Ｏ命令障害回復回路。
ホストとディスク装置がインタフェースで接続されているシステムにおけるＩ／Ｏ命令障害回復方法において、
前記ホストにおいて障害を検出した場合に、当該障害の回数をカウントするＣＲＣエラー類カウンタを用意するステップと、
前記ホストが前記ディスク装置にＩ／Ｏ命令を発行した際、その応答を時間監視し、第１の一定時間以内に応答がない場合、その旨を入出力処理ステップに通知する第１の時間監視ステップと、
前記ホストが前記ディスク装置にＩ／Ｏ命令を発行した際、その応答を時間監視し、前記第１の一定時間よりも長い時間である第２の一定時間以内に応答がない場合、その旨を前記入出力処理ステップに通知する第２の時間監視ステップと、
前記第１の時間監視ステップにおける通知があった場合と、前記第２の時間監視ステップにおける通知があった場合であって前記ＣＲＣエラー類カウンタのカウントアップがあった場合に、障害処理を開始する入出力処理ステップと、
を備えることを特徴とするＩ／Ｏ命令障害回復方法。
請求項５に記載のＩ／Ｏ命令障害回復方法において、
前記入出力処理ステップにおいて、前記第２の時間監視ステップにおける通知があった場合であって前記ＣＲＣエラー類カウンタのカウントアップがなかった場合に、前記ディスク装置に前記発行したＩ／Ｏ処理が内部で実施されているか否かの問合せを行い、前記ディスク装置内部で実行されていないとの返信が通知された場合は、前記インタフェースにおいて障害が発生していると判断し、当該インタフェースにおける障害について前記障害処理を行うことを特徴とするＩ／Ｏ命令障害回復方法。
請求項５に記載のＩ／Ｏ命令障害回復方法において、
前記ディスク装置が、前記ディスク装置において障害を検出した場合に、当該障害の回数をカウントするＣＲＣエラー類カウンタを用意するステップを更に備え、
前記入出力処理ステップにおいて、前記第２の時間監視ステップにおける通知があった場合であって前記ホスト装置が備える前記ＣＲＣエラー類カウンタのカウントアップがなかった場合に、前記ディスク装置が備える前記ＣＲＣエラー類カウンタにカウントアップがあるか問合せを行い、カウントアップがあったとの返信が通知された場合は、当該カウントアップした障害検出による影響であると判断し、当該カウントアップにおける障害について前記障害処理を行うことを特徴とするＩ／Ｏ命令障害回復方法。
請求項５乃至７の何れか１項に記載のＩ／Ｏ命令障害回復方法において、前記ＣＲＣエラー類カウンタが、障害として検出するのはＣＲＣエラーであることを特徴とするＩ／Ｏ命令障害回復方法。
ホストとディスク装置がインタフェースで接続されているシステムにおけるＩ／Ｏ命令障害回復回路に搭載されるＩ／Ｏ命令障害回復プログラムにおいて、
前記ホストにおいて障害を検出した場合に、当該障害の回数をカウントするＣＲＣ（Cyclic Redundancy Check）エラー類カウンタと、
前記ホストが前記ディスク装置にＩ／Ｏ命令を発行した際、その応答を時間監視し、第１の一定時間以内に応答がない場合、その旨を入出力処理手段に通知する第１の時間監視手段と、
前記ホストが前記ディスク装置にＩ／Ｏ命令を発行した際、その応答を時間監視し、前記第１の一定時間よりも長い時間である第２の一定時間以内に応答がない場合、その旨を前記入出力処理手段に通知する第２の時間監視手段と、
前記第１の時間監視手段から通知があった場合と、前記第２の時間監視手段から通知があった場合であって前記ＣＲＣエラー類カウンタのカウントアップがあった場合に、障害処理を開始する入出力処理手段と、
を備えるＩ／Ｏ命令障害回復回路としてコンピュータを機能させることを特徴とするＩ／Ｏ命令障害回復プログラム。
請求項９に記載のＩ／Ｏ命令障害回復プログラムにおいて、
前記入出力処理手段が、前記第２の時間監視手段から通知があった場合であって前記ＣＲＣエラー類カウンタのカウントアップがなかった場合に、前記ディスク装置に前記発行したＩ／Ｏ処理が内部で実施されているか否かの問合せを行い、前記ディスク装置内部で実行されていないとの返信が通知された場合は、前記インタフェースにおいて障害が発生していると判断し、当該インタフェースにおける障害について前記障害処理を行うことを特徴とするＩ／Ｏ命令障害回復プログラム。
請求項９に記載のＩ／Ｏ命令障害回復プログラムにおいて、
前記ディスク装置が、前記ディスク装置において障害を検出した場合に、当該障害の回数をカウントするＣＲＣエラー類カウンタを更に備え、
前記入出力処理手段が、前記第２の時間監視手段から通知があった場合であって前記ホスト装置が備える前記ＣＲＣエラー類カウンタのカウントアップがなかった場合に、前記ディスク装置が備える前記ＣＲＣエラー類カウンタにカウントアップがあるか問合せを行い、カウントアップがあったとの返信が通知された場合は、当該カウントアップした障害検出による影響であると判断し、当該カウントアップにおける障害について前記障害処理を行うことを特徴とするＩ／Ｏ命令障害回復プログラム。
請求項９乃至１１の何れか１項に記載のＩ／Ｏ命令障害回復プログラムにおいて、前記ＣＲＣエラー類カウンタが、障害として検出するのはＣＲＣエラーであることを特徴とするＩ／Ｏ命令障害回復プログラム。