JP2010182080A - I/o命令障害回復回路、i/o命令障害回復方法及びi/o命令障害回復プログラム - Google Patents

I/o命令障害回復回路、i/o命令障害回復方法及びi/o命令障害回復プログラム Download PDF

Info

Publication number
JP2010182080A
JP2010182080A JP2009024857A JP2009024857A JP2010182080A JP 2010182080 A JP2010182080 A JP 2010182080A JP 2009024857 A JP2009024857 A JP 2009024857A JP 2009024857 A JP2009024857 A JP 2009024857A JP 2010182080 A JP2010182080 A JP 2010182080A
Authority
JP
Japan
Prior art keywords
disk device
time
crc error
failure
response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009024857A
Other languages
English (en)
Other versions
JP5288331B2 (ja
Inventor
Koichi Nomura
晃一 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009024857A priority Critical patent/JP5288331B2/ja
Publication of JP2010182080A publication Critical patent/JP2010182080A/ja
Application granted granted Critical
Publication of JP5288331B2 publication Critical patent/JP5288331B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】ホスト−ディスク装置間インタフェースでCRCエラー等の軽微な障害が発生した場合、タイムアウト検出による処理遅延を短縮する。
【解決手段】ホストとディスク装置がインタフェースで接続されているシステムにおけるI/O命令障害回復回路が、前記ホストにおいて障害を検出した場合に、当該障害の回数をカウントする。前記ホストが前記ディスク装置にI/O命令を発行した際、その応答を時間監視し、第1の一定時間以内に応答がない場合、その旨を入出力処理手段に通知する。前記ホストが前記ディスク装置にI/O命令を発行した際、その応答を時間監視し、前記第1の一定時間よりも長い時間である第2の一定時間以内に応答がない場合、その旨を前記入出力処理手段に通知する。前記第1の時間監視通知があった場合と、前記第2の時間監視通知があった場合であって前記CRCエラー類カウンタのカウントアップがあった場合に、障害処理を開始する。
【選択図】図1

Description

本発明はホスト−ディスク装置間インタフェースでのデータ通信においてCRC(Cyclic Redundancy Check)エラー等の軽微な障害が発生した場合のタイムアウト検出に関する。
ホスト−ディスク装置間インタフェースでのデータ通信においてCRCエラー等の軽微な障害が発生した場合に、その障害を検知するという技術が存在する。
例えば特許文献1に記載の技術では、ホストコンピュータ(CPU)が周辺装置の組み込み時に、CPUから与えられた入出力監視時間よりも実行時間が長いコマンドについてそれぞれの延長時間とCPUに対して監視時間の延長を通知することを示すイベント通知フラグをオンとする。そして、CPUでのI/O発行時、周辺装置は、コマンドが監視時間の延長を通知するものである場合に、延長時間をCPUに通知し、監視時間延長通知を受けたCPUは監視時間カウンタのカウンタ値を、通知され延長時間に相当する値だけ加算する。また、周辺装置はコマンド実行を終えた時点で延長時間内に終了した場合には監視時間の短縮通知イベントを送信しCPUは時間監視用のカウント値を、前記通知された短縮時間に相当する値だけ減算する。
特開2001−147866号公報
もっとも、上述の特許文献1に記載の技術では、ホスト−ディスク装置間インタフェースでのデータ通信においてCRCエラー等の軽微な障害が発生した場合、受信した情報が不定でありどのような指示、応答であるか判断することができない。そのような場合、軽微な障害を検出したポートは、単に障害発生が有ったということをカウントするのみで、積極的な障害処理は実施しないのが通例である。
そして、障害の検出が有ったという異常は、上位層が実施するタイムアウト監視により検出し、その後に障害処理を開始する。そのため、通常1s未満で完了するI/O命令の完了までに数s〜数10sの長い時間が必要となる。結果として、システム全体が遅延してしまう。この際、ディスク装置内部障害発生時を考慮すると通常の応答時間よりの2〜3桁長い応答時間を要する場合があるので、単純に上位層のタイムアウト値を短縮することも出来ない。
そこで、本発明は、ホスト−ディスク装置間インタフェースでCRCエラー等の軽微な障害が発生した場合、タイムアウト検出による処理遅延を短縮することができるI/O命令障害回復回路、I/O命令障害回復方法及びI/O命令障害回復プログラムを提供することを目的とする。
本発明の第1の観点によれば、ホストとディスク装置がインタフェースで接続されているシステムにおけるI/O命令障害回復回路において、前記ホストにおいて障害を検出した場合に、当該障害の回数をカウントするCRC(Cyclic Redundancy Check)エラー類カウンタと、前記ホストが前記ディスク装置にI/O命令を発行した際、その応答を時間監視し、第1の一定時間以内に応答がない場合、その旨を入出力処理手段に通知する第1の時間監視手段と、前記ホストが前記ディスク装置にI/O命令を発行した際、その応答を時間監視し、前記第1の一定時間よりも長い時間である第2の一定時間以内に応答がない場合、その旨を前記入出力処理手段に通知する第2の時間監視手段と、前記第1の時間監視手段から通知があった場合と、前記第2の時間監視手段から通知があった場合であって前記CRCエラー類カウンタのカウントアップがあった場合に、障害処理を開始する入出力処理手段と、を備えることを特徴とするI/O命令障害回復回路が提供される。
本発明の第2の観点によれば、ホストとディスク装置がインタフェースで接続されているシステムにおけるI/O命令障害回復方法において、前記ホストにおいて障害を検出した場合に、当該障害の回数をカウントするCRCエラー類カウンタを用意するステップと、前記ホストが前記ディスク装置にI/O命令を発行した際、その応答を時間監視し、第1の一定時間以内に応答がない場合、その旨を入出力処理ステップに通知する第1の時間監視ステップと、前記ホストが前記ディスク装置にI/O命令を発行した際、その応答を時間監視し、前記第1の一定時間よりも長い時間である第2の一定時間以内に応答がない場合、その旨を前記入出力処理ステップに通知する第2の時間監視ステップと、前記第1の時間監視ステップにおける通知があった場合と、前記第2の時間監視ステップにおける通知があった場合であって前記CRCエラー類カウンタのカウントアップがあった場合に、障害処理を開始する入出力処理ステップと、を備えることを特徴とするI/O命令障害回復方法が提供される。
本発明の第3の観点によれば、ホストとディスク装置がインタフェースで接続されているシステムにおけるI/O命令障害回復回路に搭載されるI/O命令障害回復プログラムにおいて、前記ホストにおいて障害を検出した場合に、当該障害の回数をカウントするCRC(Cyclic Redundancy Check)エラー類カウンタと、前記ホストが前記ディスク装置にI/O命令を発行した際、その応答を時間監視し、第1の一定時間以内に応答がない場合、その旨を入出力処理手段に通知する第1の時間監視手段と、前記ホストが前記ディスク装置にI/O命令を発行した際、その応答を時間監視し、前記第1の一定時間よりも長い時間である第2の一定時間以内に応答がない場合、その旨を前記入出力処理手段に通知する第2の時間監視手段と、前記第1の時間監視手段から通知があった場合と、前記第2の時間監視手段から通知があった場合であって前記CRCエラー類カウンタのカウントアップがあった場合に、障害処理を開始する入出力処理手段と、を備えるI/O命令障害回復回路としてコンピュータを機能させることを特徴とするI/O命令障害回復プログラムが提供される。
本発明によれば、ホスト−ディスク装置間インタフェースでCRCエラー等の軽微な障害が発生した場合、一定時間が経過した状態で異常を検出し障害処理を起動することが可能であることから、発生したI/O命令の障害処理の開始を早めることができ、システム全体の遅延の防止が可能となる。
本発明の実施形態の基本的構成を表す図である。 本発明の実施形態の基本的動作を表す図(1/2)である。 本発明の実施形態の基本的動作を表す図(2/2)である。 本発明の実施形態の効果について説明するためのフローチャート(1/2)である。 本発明の実施形態の効果について説明するためのフローチャート(2/2)である。
次に、本発明の実施形態について図面を用いて詳細に説明する。図1を参照すると本実施形態は、ホスト100と、ディスク装置200を有する。ホスト100と、ディスク装置200はシリアルインタフェース300を介して接続されている。
シリアルインタフェース300は、ファイバチャネルインタフェースに代表されるシリアルインタフェースである。
また、ホスト100は、中央処理装置110と、主記憶装置120と、入出力処理装置130と、第1の時間監視機構141と、第2の時間監視機構142と、CRCエラー類カウンタ150と、送受信回路160と、を有する。
中央処理装置110は、例えばCPU等でありホスト100において演算処理を行う。主記憶装置120は、中央処理装置110直接アクセスすることの出来る記憶装置である。
入出力処理装置130は、中央処理装置110からのI/O命令によりディスク装置200とのデータ読み書きを実行する装置である。
また、入出力処理装置130は、I/O命令の異常を検出するために、ディスク装置からの応答を時間監視する第1の時間監視機構141及び第2の時間監視機構142を更に有する。加えて、入出力処理装置130は、ホスト100、ディスク装置200各々の送受信回路が情報伝達する際に検出したCRCエラー等のシリアルインタフェースの障害発生回数を記憶するCRCエラー類カウンタ150を有する。
送受信回路160は、入出処理装置130からの指示によりシリアルインタフェース300を介してディスク装置200との情報伝達を行う送受信回路である。
一方、ディスク装置200は、送受信回路210と、CRCエラー類カウンタ220と、ディスク230と、ディスク制御装置240を有する。
送受信回路210は、シリアルインタフェース300を介してホスト100との情報伝達を行う回路である。CRCエラー類カウンタ220は、CRCエラー類カウンタ150同様にホスト100、ディスク装置200各々の送受信回路が情報伝達する際に検出したCRCエラー等のシリアルインタフェースの障害発生回数を記憶するためのカウンタである。
ディスク230は、データを記憶するディスクである。
ディスク制御装置240は、送受信回路210からの情報によりホストからのI/O命令を解析し、ディスク230のデータの読み書きを行う装置である。
次に、図2のフローチャートを参照して、本実施形態の動作について説明する。
まず、ホスト100内の中央処理装置110がディスク装置200とのデータ転送を実行するために、I/O命令を入出力処理装置110に指示した際の動作を説明する。
中央処理装置110よりI/O命令の実行を指示された入出力処理装置110は、その指示を受け付ける(ステップS401)。
そして入出力処理装置110は、CRCエラー類カウンタ150をI/O命令開始前に読み出し内部に記憶しておく(ステップS402)。
その後、送受信回路160に対し、I/O命令開始をディスク装置200に送信するよう指示する。その指示を受けた送受信回路160は、シリアルインタフェース300を介してディスク装置200にI/O命令開始を送信する(ステップS403)。送受信回路160は、このシリアルインタフェース300を介して情報伝達する際にCRCエラー等のシリアルインタフェース障害を検出した場合には、CRCエラー類カウンタ150をカウントアップする。
ディスク装置200内部の送受信回路210は、シリアルインタフェース300を介してホスト100からのI/O命令開始を受信する。そして、送受信回路210は、ディスク制御装置240にそれを通知する(ステップS404)。
通知を受けたディスク制御装置240は、ホスト100から受信したI/O命令を解析し、ディスク230のデータの読み書きを実行する。ディスク制御装置240は、I/O命令の実行が完了すると、I/O命令応答をホスト100に送信するよう送受信回路210に指示する(ステップS405)。この際、送受信回路210はシリアルインタフェース300を介して情報伝達する間にCRCエラー等のシリアルインタフェース障害を検出した場合には、CRCエラー類カウンタ220をカウントアップする。
入出力処理装置110は、ディスク装置200の異常の検出を目的にI/O命令応答が返るまでの時間を監視するため、第1の時間監視機構141にディスク装置200がI/O命令を実行するのに十分な時間(以下、この時間のことを「時間(A)と表記する。」)で監視するよう指示する(ステップS406)。さらに入出力処理装置110は、第2の時間監視機構142に前述の時間(A)より短い時間であって、通常I/O命令応答が返るまでの時間として十分な時間(以下、この時間のことを「時間(B)と表記する。」)で監視するよう指示する(ステップS407)。
その後、入出力処理装置110は、送受信回路160からの「ディスク装置200からのI/O命令応答」、第1の時間監視機構141からの「第1の時間監視オーバー」、第2の時間監視機構142からの「第2の時間監視オーバー」が発生しているかをチェックし続ける。
入出力処理装置110はディスク装置200とのI/O命令が正常に完了した際(ステップS408においてYes)は、送受信回路160を介した「ディスク装置200からのI/O命令応答」を認識し、第1の時間監視機構141及び第2の時間監視機構142に対し、時間監視の停止を指示する。そして、第1の時間監視機構141及び第2の時間監視機構142は、その指示を受けて時間監視の停止をする(ステップS409、ステップS410)。
最後に、入出力処理装置110は中央処理装置110に対し、I/O命令の正常終了を報告する。
一方(ステップS408においてNo)、入出力処理装置110は第1の時間監視機構141により「第1の時間監視オーバー」すなわち一定時間(A)が経過してもディスク装置200からのI/O命令応答がなかった場合(ステップS412においてYes)、I/O命令の異常と判断し、障害処理を起動する(ステップS415)。
ステップS412においてNoだった場合であって、入出力処理装置110は第2の時間監視機構142により「第2の時間監視オーバー」すなわち時間(B)が経過してもディスク装置200からのI/O命令応答がなかった場合(ステップS413においてYes)、CRCエラー類カウンタを読み出し、I/O命令開始以前に読み出した値と比較する(ステップS413)。
そして比較の結果に基づいて、I/O命令実行中にCRCエラー等が発生したかを確認する。ここで、CRCエラー等が発生している場合は(ステップS414においてYes)、この障害により一定時間(B)が経過してもI/O命令の応答がないものと判断し、障害処理を起動する(ステップS415)。
また、第2の時間監視オーバーをしていない場合(ステップS412においてNo)と、CRCエラー等が発生していない場合は(ステップS404においてNo)、それ以外の事由により応答が遅れているものと判断し、再び「ディスク装置200からのI/O命令応答」、第1の時間監視機構141からの「第1の時間監視オーバー」、第2の時間監視機構142からの「第2の時間監視オーバー」が発生しているかをチェックし続ける。
[他の実施形態]
前述の実施形態は、本発明を実現する上でもっとも単純なものである。もっとも前述の実施形態では、シリアルインタフェース300上の障害をディスク装置200側の送受信回路210が検出した場合に効果が得られないという欠点があるため、以下の2つの実施形態を変形例として説明する。
変形例の一つ目は、入出力処理装置110は第2の時間監視機構142により「第2の時間監視オーバー」すなわち一定時間(B)が経過してもディスク装置200からのI/O命令応答がなかった場合、CRCエラー類カウンタ150を読み出し、I/O命令開始以前に読み出した値と比較し、I/O命令実行中にCRCエラー等が発生したかを確認する。確認の結果、CRCエラー等が発生していない場合は、ディスク装置200に対し該当I/O命令が内部で処理中か否かの問合せを行い、ディスク装置200内部で実行されていないと通知された場合は、シリアルインタフェース300の障害の発生により、一定時間(B)が経過してもI/O命令の応答がないものと判断し、障害処理を起動する。
変形例の二つ目は、入出力処理装置110は第2の時間監視機構142により「第2の時間監視オーバー」すなわち一定時間(B)が経過してもディスク装置200からのI/O命令応答がなかった場合、CRCエラー類カウンタを読み出し、I/O命令開始以前に読み出した値と比較し、I/O命令実行中にCRCエラー等が発生したかを確認する。確認の結果、CRCエラー等が発生していない場合は、ディスク装置200に対しディスク装置200側ポートのCRCエラー類カウンタの問合せを行う。そして、カウントアップがあった場合はカウントアップした障害検出による影響により、一定時間(B)が経過してもI/O命令の応答がないものと判断し、障害処理を起動する。
以上説明した、各実施形態はホスト−ディスク装置間インタフェースでCRCエラー等の軽微な障害が発生した場合、一定時間(B)が経過した状態で異常を検出し障害処理を起動することが可能であるため、影響したI/O命令の障害処理の開始を早めることができシステム全体の遅延が防止できるという効果を奏する。
この点について、図3及び図4のシーケンス図を用いて説明する。
図3は、本実施形態を適用させない場合の動作例である。まず、ホスト100がディスク装置200に対してI/O命令の開始を通知する(ステップA501)。そして、ディスク装置200がホスト100に対してI/O命令の応答を通知する(ステップA502)。なお、図3に示すようにこの処理は、通常1秒未満で完了する。
そして、CRCエラーが発生し、情報が破棄された場合、CRCエラーカウンタのカウンタアップのみがなされる(ステップA503)。
その後、20秒後にタイムアウトが検出され、I/O障害の処理が開始される(ステップA504)。結果として、障害処理の開始まで20秒ほどかかることとなる。
次に、図4は、本実施形態を適用させた場合の動作例である。まず、ホスト100がディスク装置200に対してI/O命令の開始を通知する(ステップA501)。そして、ディスク装置200がホスト100に対してI/O命令の応答を通知する(ステップA502)。なお、図3に示すようにこの処理は、通常1秒未満で完了する。
そして、CRCエラーが発生し、情報が破棄された場合、CRCエラーカウンタのカウンタアップのみがなされる(ステップA503)。
その後、1秒後(一定時間B)にタイムアウトが検出され、CRCエラーカウンタのカウンタをチェックする。チェックの結果カウンタアップしているため、I/O障害の処理が開始される(ステップA505)。結果として、障害処理の開始まで1秒ほどで済むこととなる。
更に、本実施形態は、障害の発生原因が、ホスト、ディスク装置、シリアルインタフェースの何れかであるかが判断できることから、より適切な障害処理を起動することが可能であるという効果を奏する。
なお、本発明の実施形態であるホスト及びディスク装置は、ハードウェア、ソフトウェア又はこれらの組合せにより実現することができる。
また、上述した実施形態は、本発明の好適な実施形態ではあるが、上記実施形態のみに本発明の範囲を限定するものではなく、本発明の要旨を逸脱しない範囲において種々の変更を施した形態での実施が可能である。
100 ホスト
110 中央処理装置
120 主記憶装置
130 入出力処理装置
141 第1の時間監視機構
142 第2の時間監視機構
150、220 CRCエラー類カウンタ
160、210 送受信回路
200 ディスク装置
230 ディスク
240 ディスク制御装置
300 シリアルインタフェース

Claims (12)

  1. ホストとディスク装置がインタフェースで接続されているシステムにおけるI/O命令障害回復回路において、
    前記ホストにおいて障害を検出した場合に、当該障害の回数をカウントするCRC(Cyclic Redundancy Check)エラー類カウンタと、
    前記ホストが前記ディスク装置にI/O命令を発行した際、その応答を時間監視し、第1の一定時間以内に応答がない場合、その旨を入出力処理手段に通知する第1の時間監視手段と、
    前記ホストが前記ディスク装置にI/O命令を発行した際、その応答を時間監視し、前記第1の一定時間よりも長い時間である第2の一定時間以内に応答がない場合、その旨を前記入出力処理手段に通知する第2の時間監視手段と、
    前記第1の時間監視手段から通知があった場合と、前記第2の時間監視手段から通知があった場合であって前記CRCエラー類カウンタのカウントアップがあった場合に、障害処理を開始する入出力処理手段と、
    を備えることを特徴とするI/O命令障害回復回路。
  2. 請求項1に記載のI/O命令障害回復回路において、
    前記入出力処理手段が、前記第2の時間監視手段から通知があった場合であって前記CRCエラー類カウンタのカウントアップがなかった場合に、前記ディスク装置に前記発行したI/O処理が内部で実施されているか否かの問合せを行い、前記ディスク装置内部で実行されていないとの返信が通知された場合は、前記インタフェースにおいて障害が発生していると判断し、当該インタフェースにおける障害について前記障害処理を行うことを特徴とするI/O命令障害回復回路。
  3. 請求項1に記載のI/O命令障害回復回路において、
    前記ディスク装置が、前記ディスク装置において障害を検出した場合に、当該障害の回数をカウントするCRCエラー類カウンタを更に備え、
    前記入出力処理手段が、前記第2の時間監視手段から通知があった場合であって前記ホスト装置が備える前記CRCエラー類カウンタのカウントアップがなかった場合に、前記ディスク装置が備える前記CRCエラー類カウンタにカウントアップがあるか問合せを行い、カウントアップがあったとの返信が通知された場合は、当該カウントアップした障害検出による影響であると判断し、当該カウントアップにおける障害について前記障害処理を行うことを特徴とするI/O命令障害回復回路。
  4. 請求項1乃至3の何れか1項に記載のI/O命令障害回復回路において、前記CRCエラー類カウンタが、障害として検出するのはCRCエラーであることを特徴とするI/O命令障害回復回路。
  5. ホストとディスク装置がインタフェースで接続されているシステムにおけるI/O命令障害回復方法において、
    前記ホストにおいて障害を検出した場合に、当該障害の回数をカウントするCRCエラー類カウンタを用意するステップと、
    前記ホストが前記ディスク装置にI/O命令を発行した際、その応答を時間監視し、第1の一定時間以内に応答がない場合、その旨を入出力処理ステップに通知する第1の時間監視ステップと、
    前記ホストが前記ディスク装置にI/O命令を発行した際、その応答を時間監視し、前記第1の一定時間よりも長い時間である第2の一定時間以内に応答がない場合、その旨を前記入出力処理ステップに通知する第2の時間監視ステップと、
    前記第1の時間監視ステップにおける通知があった場合と、前記第2の時間監視ステップにおける通知があった場合であって前記CRCエラー類カウンタのカウントアップがあった場合に、障害処理を開始する入出力処理ステップと、
    を備えることを特徴とするI/O命令障害回復方法。
  6. 請求項5に記載のI/O命令障害回復方法において、
    前記入出力処理ステップにおいて、前記第2の時間監視ステップにおける通知があった場合であって前記CRCエラー類カウンタのカウントアップがなかった場合に、前記ディスク装置に前記発行したI/O処理が内部で実施されているか否かの問合せを行い、前記ディスク装置内部で実行されていないとの返信が通知された場合は、前記インタフェースにおいて障害が発生していると判断し、当該インタフェースにおける障害について前記障害処理を行うことを特徴とするI/O命令障害回復方法。
  7. 請求項5に記載のI/O命令障害回復方法において、
    前記ディスク装置が、前記ディスク装置において障害を検出した場合に、当該障害の回数をカウントするCRCエラー類カウンタを用意するステップを更に備え、
    前記入出力処理ステップにおいて、前記第2の時間監視ステップにおける通知があった場合であって前記ホスト装置が備える前記CRCエラー類カウンタのカウントアップがなかった場合に、前記ディスク装置が備える前記CRCエラー類カウンタにカウントアップがあるか問合せを行い、カウントアップがあったとの返信が通知された場合は、当該カウントアップした障害検出による影響であると判断し、当該カウントアップにおける障害について前記障害処理を行うことを特徴とするI/O命令障害回復方法。
  8. 請求項5乃至7の何れか1項に記載のI/O命令障害回復方法において、前記CRCエラー類カウンタが、障害として検出するのはCRCエラーであることを特徴とするI/O命令障害回復方法。
  9. ホストとディスク装置がインタフェースで接続されているシステムにおけるI/O命令障害回復回路に搭載されるI/O命令障害回復プログラムにおいて、
    前記ホストにおいて障害を検出した場合に、当該障害の回数をカウントするCRC(Cyclic Redundancy Check)エラー類カウンタと、
    前記ホストが前記ディスク装置にI/O命令を発行した際、その応答を時間監視し、第1の一定時間以内に応答がない場合、その旨を入出力処理手段に通知する第1の時間監視手段と、
    前記ホストが前記ディスク装置にI/O命令を発行した際、その応答を時間監視し、前記第1の一定時間よりも長い時間である第2の一定時間以内に応答がない場合、その旨を前記入出力処理手段に通知する第2の時間監視手段と、
    前記第1の時間監視手段から通知があった場合と、前記第2の時間監視手段から通知があった場合であって前記CRCエラー類カウンタのカウントアップがあった場合に、障害処理を開始する入出力処理手段と、
    を備えるI/O命令障害回復回路としてコンピュータを機能させることを特徴とするI/O命令障害回復プログラム。
  10. 請求項9に記載のI/O命令障害回復プログラムにおいて、
    前記入出力処理手段が、前記第2の時間監視手段から通知があった場合であって前記CRCエラー類カウンタのカウントアップがなかった場合に、前記ディスク装置に前記発行したI/O処理が内部で実施されているか否かの問合せを行い、前記ディスク装置内部で実行されていないとの返信が通知された場合は、前記インタフェースにおいて障害が発生していると判断し、当該インタフェースにおける障害について前記障害処理を行うことを特徴とするI/O命令障害回復プログラム。
  11. 請求項9に記載のI/O命令障害回復プログラムにおいて、
    前記ディスク装置が、前記ディスク装置において障害を検出した場合に、当該障害の回数をカウントするCRCエラー類カウンタを更に備え、
    前記入出力処理手段が、前記第2の時間監視手段から通知があった場合であって前記ホスト装置が備える前記CRCエラー類カウンタのカウントアップがなかった場合に、前記ディスク装置が備える前記CRCエラー類カウンタにカウントアップがあるか問合せを行い、カウントアップがあったとの返信が通知された場合は、当該カウントアップした障害検出による影響であると判断し、当該カウントアップにおける障害について前記障害処理を行うことを特徴とするI/O命令障害回復プログラム。
  12. 請求項9乃至11の何れか1項に記載のI/O命令障害回復プログラムにおいて、前記CRCエラー類カウンタが、障害として検出するのはCRCエラーであることを特徴とするI/O命令障害回復プログラム。
JP2009024857A 2009-02-05 2009-02-05 I/o命令障害回復回路、i/o命令障害回復方法及びi/o命令障害回復プログラム Expired - Fee Related JP5288331B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009024857A JP5288331B2 (ja) 2009-02-05 2009-02-05 I/o命令障害回復回路、i/o命令障害回復方法及びi/o命令障害回復プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009024857A JP5288331B2 (ja) 2009-02-05 2009-02-05 I/o命令障害回復回路、i/o命令障害回復方法及びi/o命令障害回復プログラム

Publications (2)

Publication Number Publication Date
JP2010182080A true JP2010182080A (ja) 2010-08-19
JP5288331B2 JP5288331B2 (ja) 2013-09-11

Family

ID=42763635

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009024857A Expired - Fee Related JP5288331B2 (ja) 2009-02-05 2009-02-05 I/o命令障害回復回路、i/o命令障害回復方法及びi/o命令障害回復プログラム

Country Status (1)

Country Link
JP (1) JP5288331B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000173152A (ja) * 1998-11-27 2000-06-23 Internatl Business Mach Corp <Ibm> 消費エネルギー低減方法
JP2001228981A (ja) * 2000-02-16 2001-08-24 Hitachi Electronics Eng Co Ltd 記憶媒体ライブラリアレイ装置
JP2002023966A (ja) * 2000-06-30 2002-01-25 Toshiba Corp 転送データを冗長化したディスクシステム
JP2005182104A (ja) * 2003-12-16 2005-07-07 Hitachi Ltd ディスクアレイシステム及びインターフェイス変換装置
JP2008158666A (ja) * 2006-12-21 2008-07-10 Nec Corp ストレージデバイスのマルチパスシステム、その障害箇所特定方法及びプログラム
JP2008171139A (ja) * 2007-01-10 2008-07-24 Hitachi Computer Peripherals Co Ltd ストレージシステムの試験装置及び同試験方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000173152A (ja) * 1998-11-27 2000-06-23 Internatl Business Mach Corp <Ibm> 消費エネルギー低減方法
JP2001228981A (ja) * 2000-02-16 2001-08-24 Hitachi Electronics Eng Co Ltd 記憶媒体ライブラリアレイ装置
JP2002023966A (ja) * 2000-06-30 2002-01-25 Toshiba Corp 転送データを冗長化したディスクシステム
JP2005182104A (ja) * 2003-12-16 2005-07-07 Hitachi Ltd ディスクアレイシステム及びインターフェイス変換装置
JP2008158666A (ja) * 2006-12-21 2008-07-10 Nec Corp ストレージデバイスのマルチパスシステム、その障害箇所特定方法及びプログラム
JP2008171139A (ja) * 2007-01-10 2008-07-24 Hitachi Computer Peripherals Co Ltd ストレージシステムの試験装置及び同試験方法

Also Published As

Publication number Publication date
JP5288331B2 (ja) 2013-09-11

Similar Documents

Publication Publication Date Title
JP6333410B2 (ja) 障害処理方法、関連装置、およびコンピュータ
US11119874B2 (en) Memory fault detection
US9778988B2 (en) Power failure detection system and method
CN105468484A (zh) 用于在存储系统中确定故障位置的方法和装置
WO2013095470A1 (en) Error framework for a microprocessor and system
US20140068350A1 (en) Self-checking system and method using same
WO2012046293A1 (ja) 障害監視装置、障害監視方法及びプログラム
JP2011043957A (ja) 障害監視回路、半導体集積回路及び故障個所特定方法
CN104320308A (zh) 一种服务器异常检测的方法及装置
CN110704228B (zh) 一种固态硬盘异常处理方法及系统
US20140143597A1 (en) Computer system and operating method thereof
JP2010170462A (ja) 障害処理装置および方法
JP2018194336A (ja) 異常検知装置および異常検知方法
JP6408482B2 (ja) プログラマブルデバイス及びこれを用いた電子システム装置
JP5689783B2 (ja) コンピュータ、コンピュータシステム、および障害情報管理方法
JP5288331B2 (ja) I/o命令障害回復回路、i/o命令障害回復方法及びi/o命令障害回復プログラム
JP4954249B2 (ja) 電子端末装置及び電子連動装置
JP6133614B2 (ja) 障害ログ採取装置、障害ログ採取方法、及び、障害ログ採取プログラム
JP6217086B2 (ja) 情報処理装置、エラー検出機能診断方法およびコンピュータプログラム
JP2012108848A (ja) 動作ログ収集システム及びプログラム
JP5440673B1 (ja) プログラマブルロジックデバイス、情報処理装置、被疑箇所指摘方法およびプログラム
JP6087540B2 (ja) 障害トレース装置、障害トレースシステム、障害トレース方法、及び、障害トレースプログラム
WO2014112039A1 (ja) 情報処理装置、情報処理装置制御方法及び情報処理装置制御プログラム
JP2016167107A (ja) 制御装置、バス回路、方法、及び、プログラム
JP5768434B2 (ja) 相互監視システム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100715

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100715

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121026

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130513

R150 Certificate of patent or registration of utility model

Ref document number: 5288331

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130526

LAPS Cancellation because of no payment of annual fees