JP4103141B2 - コンピュータシステム、入出力制御部及び入出力制御プログラム - Google Patents

コンピュータシステム、入出力制御部及び入出力制御プログラム Download PDF

Info

Publication number
JP4103141B2
JP4103141B2 JP2004043425A JP2004043425A JP4103141B2 JP 4103141 B2 JP4103141 B2 JP 4103141B2 JP 2004043425 A JP2004043425 A JP 2004043425A JP 2004043425 A JP2004043425 A JP 2004043425A JP 4103141 B2 JP4103141 B2 JP 4103141B2
Authority
JP
Japan
Prior art keywords
input
output
path
output path
load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004043425A
Other languages
English (en)
Other versions
JP2005234903A (ja
Inventor
正哉 風戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2004043425A priority Critical patent/JP4103141B2/ja
Publication of JP2005234903A publication Critical patent/JP2005234903A/ja
Application granted granted Critical
Publication of JP4103141B2 publication Critical patent/JP4103141B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、コンピュータと周辺装置が複数の入出力経路(I/Oパス)で接続されたコンピュータシステムに関し、特に、障害対処時における入出力の性能が低下する時間を極力短縮できるコンピュータシステム、入出力制御部及び入出力制御プログラムに関する。
コンピュータの周辺装置に対する入出力(I/O)は、複数ある入出力経路を経由して行われるが、いずれかの入出力経路がなんらかの障害で異常終了した場合には、一般に次の2つの方法によって再試行が行われる。
第1の方法は、異常終了した入出力経路を使用して入出力の再試行を行い、一定回数以上の再試行を行っても正常終了を確認できない場合には、他の入出力経路を使用して再試行を行うというものである。他の入出力経路を使用した再試行で正常終了した場合には、異常終了した入出力経路の障害と判定して、当該入出力経路を閉塞する。他の入出力経路を使用した再試行でも正常終了を確認できない場合には、周辺装置そのものの障害と判定して装置を閉塞する。
第2の方法は、異常終了した入出力経路を除くすべての入出力経路を使用して再試行を行う。すべての経路で再試行後も正常終了を確認できない場合には、周辺装置自体の障害と判定して装置を閉塞する。
再試行後にいずれかの経路で正常終了を確認できた場合には、異常終了した入出力経路のエラー発生回数にしきい値を設けておき、エラー発生回数がしきい値を超えた時点で入出力経路の閉塞を行うというものである。
次に、別の障害対処方法の一例が、例えば特開平6−51914号公報(特許文献1)に記載されている。
特許文献1に開示される方法では、各々の入出力経路上に発生した障害の回数を計数するカウンタを設け、カウンタの数値があらかじめ設定した値を越えたときに、各入出力経路毎に閉塞する。これにより、コンピュータの再試行の工数を削減し、システム全体のスループットを向上させることが可能になるというものである。
特開平6−51914号公報
上述した従来の技術は、いずれも以下に述べるような問題点があった。
第1の方法では、異常終了した入出力経路を使用して再試行するため、再試行に成功するまでに長時間を要することがあり、このような場合、再試行で正常終了する迄の間は、コンピュータの入出力性能が長時間にわたり低下するという問題がある。
第2の方法では、異常終了した入出力経路を使用しないで再試行を行うために、正常終了するまでの時間は短い。しかし、異常終了した入出力経路を使い続けるために、エラー発生回数がしきい値を越えるまでは、複数のエラーが発生し、長時間にわたってシステム全体の入出力性能が低下するという問題がある。
また、特許文献1の方法では、各々の経路上に発生した障害の回数を計数するカウンタを設け、カウンタの数値があらかじめ設定した値を越えたときに、各経路毎に閉塞する。この方法においても、第2の方法と同様で、エラー発生回数がしきい値を超えるまでは、長時間にわたってシステム全体の入出力性能が低下するという問題がある。
本発明の第1の目的は、上記従来技術の欠点を解決し、障害対処時における入出力の性能が低下する時間を極力短縮できるコンピュータシステム、入出力制御部及び入出力制御プログラムを提供することにある。
本発明の第2の目的は、固定障害発生の可能性があり、閉塞が必要となる入出力経路を検出することのできる、コンピュータシステム、入出力制御部及び入出力制御プログラムを提供することにある。
上記目的を達成するための本発明は、複数の入出力経路を介してコンピュータと周辺装置が接続され、前記コンピュータにロードされたアプリケーションプログラムから前記周辺装置への入出力要求が行われると、前記入出力経路に対して入出力処理を行うコンピュータシステムにおいて、前記入出力処理が正常終了した場合であって、前記入出力経路における間欠障害による再試行を経ている場合、前記入出力処理が行われた前記入出力経路の負荷を見かけ上最大に設定すると共に、前記再試行の行われた入出力経路を診断対象経路とし、当該入出力経路の状態を調べるための診断用入出力処理を行い、前記診断用入出力処理が正常終了し、かつ診断対象経路としてから一定の時間が経過している場合に、前記再試行の行われた入出力経路を正常な入出力経路と判定し、前記入出力経路の負荷を本来の値に戻すと共に、診断対象経路から削除し、前記診断用入出力処理が異常終了した場合に、前記再試行の行われた入出力経路の閉塞を行うことを特徴とする。
請求項2の本発明のコンピュータシステムは、複数の前記入出力経路毎の負荷状態を示す負荷情報を、入出力経路状態管理テーブルとして備えることを特徴とする。
請求項3の本発明のコンピュータシステムは、前記再試行の行われた入出力経路に対する入出力経路状態管理テーブルの前記負荷情報に、他の入出力経路の負荷に対して最大の値を設定することを特徴とする。
請求項4の本発明のコンピュータシステムは、前記入出力経路に対して入出力処理を行う際に、前記入出力経路状態管理テーブルから取得した前記負荷情報に基づき負荷が最小の入出力経路を選択することを特徴とする。
請求項5の本発明のコンピュータシステムは、前記入出力処理が異常終了した場合、障害のあった前記入出力経路を診断対象経路とし、当該入出力経路の状態を調べるための診断用入出力処理を行うことを特徴とする。
請求項6の本発明のコンピュータシステムは、前記診断用入出力処理が正常終了し、かつ診断対象経路としてから一定の時間が経過している場合に、障害のあった前記入出力経路を正常な入出力経路と判定し、診断対象経路から削除し、前記診断用入出力処理が異常終了した場合に、障害のあった前記入出力経路の閉塞を行うことを特徴とする。
請求項7の本発明の入出力制御部は、複数の入出力経路を介して周辺装置と接続されるコンピュータに備えられ、前記コンピュータにロードされたアプリケーションプログラムから前記周辺装置への入出力要求が行われると、前記入出力経路に対して入出力処理を行う入出力制御部であって、前記入出力処理が正常終了した場合であって、前記入出力経路における間欠障害による再試行を経ている場合、前記入出力処理が行われた前記入出力経路の負荷を見かけ上最大に設定すると共に、前記再試行の行われた入出力経路を診断対象経路とする手段と、前記診断対象経路である入出力経路の状態を調べるための診断用入出力処理を行う手段と、前記診断用入出力処理が正常終了し、かつ診断対象経路としてから一定の時間が経過している場合に、前記再試行の行われた入出力経路を正常な入出力経路と判定し、前記入出力経路の負荷を本来の値に戻すと共に、診断対象経路から削除する手段と、前記診断用入出力処理が異常終了した場合に、前記再試行の行われた入出力経路の閉塞を行う手段とを備えることを特徴とする。
請求項8の本発明の入出力制御部は、複数の前記入出力経路毎の負荷状態を示す負荷情報を、入出力経路状態管理テーブルとして備えることを特徴とする。
請求項9の本発明の入出力制御部は、前記再試行の行われた入出力経路に対する入出力経路状態管理テーブルの前記負荷情報に、他の入出力経路の負荷に対して最大の値を設定することを特徴とする。
請求項10の本発明の入出力制御部は、前記入出力経路に対して入出力処理を行う際に、前記入出力経路状態管理テーブルから取得した前記負荷情報に基づき負荷が最小の入出力経路を選択する入出力経路選択手段と、当該入出力経路選択手段が選択した入出力経路に対して入出力を発行する入出力発行手段と、前記周辺装置での入出力実行結果を受信する入出力結果受信手段を備えることを特徴とする。
請求項11の本発明の入出力制御部は、前記入出力結果受信手段が受信した入出力実行結果が正常終了であるかもしくは異常終了であるかを分析する入出力結果分析手段を備えることを特徴とする。
請求項12の本発明の入出力制御プログラムは、複数の入出力経路を介して周辺装置と接続されたコンピュータ上で実行され、前記入出力経路に対して入出力処理を行う入出力制御プログラムであって、前記入出力処理が正常終了した場合であって、前記入出力経路における間欠障害による再試行を経ている場合、前記入出力処理が行われた前記入出力経路の負荷を見かけ上最大に設定すると共に、前記再試行の行われた入出力経路を診断対象経路とし、当該入出力経路の状態を調べるための診断用入出力処理を行い、前記診断用入出力処理が正常終了し、かつ診断対象経路としてから一定の時間が経過している場合に、前記再試行の行われた入出力経路を正常な入出力経路と判定し、前記入出力経路の負荷を本来の値に戻すと共に、診断対象経路から削除し、前記診断用入出力処理が異常終了した場合に、前記再試行の行われた入出力経路の閉塞を行う機能を前記コンピュータに実行させることを特徴とする。
請求項13の本発明の入出力制御プログラムは、複数の前記入出力経路毎の負荷状態を示す負荷情報を、入出力経路状態管理テーブルとして備える機能を有することを特徴とする。
請求項14の本発明の入出力制御プログラムは、前記再試行の行われた入出力経路に対する入出力経路状態管理テーブルの前記負荷情報に、他の入出力経路の負荷に対して最大の値を設定する機能を有することを特徴とする。
請求項15の本発明の入出力制御プログラムは、前記入出力経路に対して入出力処理を行う際に、前記入出力経路状態管理テーブルから取得した前記負荷情報に基づき負荷が最小の入出力経路を選択する機能を有することを特徴とする。
請求項16の本発明の入出力制御プログラムは、前記入出力処理が異常終了した場合、障害のあった前記入出力経路を診断対象経路とし、当該入出力経路の状態を調べるための診断用入出力処理を行う機能を実行することを特徴とする。
請求項17の本発明の入出力制御プログラムは、前記診断用入出力処理が正常終了し、かつ診断対象経路としてから一定の時間が経過している場合に、障害のあった前記入出力経路を正常な入出力経路と判定し、診断対象経路から削除し、前記診断用入出力処理が異常終了した場合に、障害のあった前記入出力経路の閉塞を行う機能を有することを特徴とする。
本発明のコンピュータシステム、入出力制御部及び入出力制御プログラムによれば、以下の効果が達成される。
第1に、コンピュータと周辺装置が複数の入出力経路で接続されているシステムにおいて、入出力経路の間欠障害の発生が1回であっても、障害発生入出力経路の負荷を見かけ上最大とするため、その使用頻度は低くなり、正常な入出力経路で再試行が行われるようになる。
このため、コンピュータによる再試行の回数が削減され、障害対処時における入出力の性能低下時間を極力短縮することが可能となる。
第2に、間欠障害の発生した入出力経路で障害が再発するかどうかを診断し、再発する場合には固定障害になると判定するために、閉塞が必要となる可能性のある入出力経路を検出することが可能となる。
第3に、間欠障害が発生したが固定障害になる可能性が低い入出力経路については、間欠障害の再発がないことを確認してから使用するため、障害対処時のシステム入出力性能を向上することが可能となる。
以下、本発明の好適な実施例について図面を参照して詳細に説明する。
図1は、本発明の実施例によるコンピュータシステムの構成を示すブロック図である。
図1を参照すると、コンピュータ1は、周辺装置40に対する入出力経路の制御を行う入出力制御部10とアプリケーションプログラム50を備える。
入出力制御部10は、複数の入出力プロセッサ21、22、23、24と複数の周辺処理装置31、32、33、34を介して複数の周辺装置40に接続されている。本実施例では、コンピュータ1から周辺装置40への入出力経路の数を4つとしているが、複数であれば入出力経路の数はこの例に限定されない。
周辺装置40には、例えば外部記憶装置やプリンタ、測定装置等が含まれる。
アプリケーションプログラム50はコンピュータ1にロードして使用する周辺装置40を使用するためのソフトウェアである。アプリケーションプログラム50が入出力制御部10に対して入出力要求を行うと、入出力発行手段11が入出力要求内容を分析して、入出力を発行する対象である周辺装置40を特定する。
本実施例による入出力制御部10は、入出力発行手段11と、入出力経路選択手段12と、入出力結果受信手段13と、入出力結果分析手段14と、入出力結果通知手段15と、入出力経路閉塞手段16と、入出力経路診断手段17と、リトライ入出力発行手段18と、入出力経路管理テーブル19を備える。
この入出力制御部10は、専用のハードウェアとして構成することもできるが、例えば、オぺレーティングシステム(入出力制御プログラム)100をCPU上で実行することで、上記各手段としての機能を実現できる。
入出力発行手段11は、入出力経路選択手段12が選択した入出力経路を使用して入出力を発行することができる。例えば、入出力経路選択手段12が選択した入出力経路が入出力プロセッサ21を経由する経路である場合には、入出力発行手段11によって発行された入出力は、指定された入出力経路上にある入出力プロセッサ21と周辺処理装置31を経由して送信され、周辺装置40で実行される。
入出力経路選択手段12は、入出力経路管理テーブル19の内容に基づき最も負荷の小さい入出力経路を選択することができる。
入出力結果受信手段13は、周辺装置40での入出力実行結果を受信する。
入出力結果分析手段14は、入出力結果受信手段13が受信した入出力実行結果が正常終了か異常終了かを分析する。分析結果は、入出力経路閉塞手段16あるいは入出力経路診断手段17に通知する。
入出力結果通知手段15は、入出力要求に対する入出力実行結果をアプリケーションプログラム50に通知する。
入出力経路閉塞手段16は、入出力経路で固定障害が発生した場合に、当該入出力経路を閉塞して入出力管理経路テーブル19に閉塞情報を登録することができる。
入出力経路診断手段17は一定時間毎に起動され、入出力経路管理テーブル19に登録されている診断処理対象入出力経路に診断用入出力を発行して、当該入出力経路の障害の程度を診断することができる。
診断用入出力とは、周辺装置の状態を確認するための入出力処理であって、周辺装置に対して使う通常の入出力処理とは異なる。診断用入出力が、確認のために装置から読み出す情報には、当該装置の入出力回数、エラー、障害情報等があって、入出力経路の情報も含まれる。ここでは、診断用入出力を専ら入出力経路の状態の調査に使用する。
リトライ入出力発行手段18は、入出力実行結果が異常終了であった場合に、他の入出力経路を使用して入出力の再試行を行うことができる。
入出力経路管理テーブル19には、入出力経路状態管理テーブル19aと装置別入出力経路状態管理テーブル19bの2種類があり、それぞれ各入出力経路の状態情報、各周辺装置への入出力経路の一覧が格納されている。
次に、本実施例による動作を、図を用いて詳細に説明する。
図2は本実施例による入出力発行処理動作を説明するためのフローチャートである。また、図3は本実施例による入出力経路状態管理テーブル19aの一例を示す図であり、図4は本実施例による装置別入出力経路状態管理テーブル19bの一例を示す図である。
以下で、必要に応じて図1、図3及び図4の主要な部分を参照して、図2の説明を行う。
図2を参照すると、最初に、アプリケーションプログラム50が入出力制御部10に対して入出力要求を行うと、入出力発行手段11が入出力要求を受け付ける(ステップ201)。
次に、入出力発行手段11は、入出力要求の内容を分析して入出力発行対象である周辺装置40を特定する(ステップ202)。
さらに、入出力発行手段11は、入出力経路選択手段12に周辺装置40に入出力を行うために使用すべき入出力発行経路を問い合わせる(ステップ203)。
次に、入出力経路選択手段12は、装置別入出力経路状態管理テーブル19bから、入出力発行対象である周辺装置40の周辺装置ID(Identification Number)をキー項目にして、周辺装置40に接続された入出力経路の経路IDを取得し、次に入出力経路状態管理テーブル19aから経路IDをキー項目にして、入出力経路の入出力負荷情報を取得する。このようにして、周辺装置40に接続された入出力経路の内、最も負荷が小さい入出力経路を選択する(ステップ204)。
入出力経路選択手段12は、入出力経路を選択すると、入出力経路状態管理テーブル19aの当該入出力経路の負荷情報を更新して、入出力発行手段11に選択した入出力経路を通知する。
入出力発行手段11は、通知された入出力経路を使用して周辺装置40に対して入出力を発行する。
ここでは、通知された入出力経路が、入出力プロセッサ21を経由する経路であるとして説明を行う。
発行された入出力は、入出力プロセッサ21を経由して周辺装置40に到達する。周辺装置40は入出力を実行し、その結果を周辺処理装置31及び
入出力プロセッサ21を経由して、入出力制御部10に通知する。
このようにして発行された入出力の実行中に間欠障害(一時障害)が発生したために、装置側すなわち入出力プロセッサ21、周辺処理装置31、周辺装置40のいずれかで再試行が行われ、入出力が正常に終了した場合には、入出力制御部10に通知される入出力実行結果に、再試行が行われたことを示す情報が記録される。
再試行に成功しなかった場合、および固定障害が発生した場合には、入出力制御部10に入出力実行結果として異常終了が通知される。
これらの入出力実行結果の受信処理は次のように行われる。
図5は本実施例による入出力実行結果受信処理の動作を説明するためのフローチャートである。なお、必要に応じて、図1、図3の主要な部分を参照する。
図5を参照すると、最初に、入出力結果受信手段13が周辺装置40からの入出力実行結果を受信する(ステップ501)。
入出力結果分析手段14は、実行結果が正常終了であるかをチェックし(ステップ502)、正常終了であれば装置側での再試行が行われていたかどうかをチェックする(ステップ503)。
再試行が行われていない場合には、入出力結果通知手段15は、入出力要求が正常終了したことをアプリケーションプログラム50に通知する(ステップ504)。
次に、装置側での再試行が1回でも行われていた場合には、入出力結果通知手段15は、入出力経路状態管理テーブル19aに診断対象経路であることを登録し(ステップ505)、入出力負荷状態を他の入出力経路よりも大きく見せるように更新する。
診断対象経路であることの登録は、図3の例では経路診断の欄に「必要」と書き込むと共に、入出力負荷の欄の値を最も大きくする。この処置により、装置側での再試行が行われた入出力経路が、入出力発行時に選択される確率が低くなり、結果として当該入出力経路の間欠障害によるシステム入出力性能低下が起こりにくくなる。
診断対象経路に登録された入出力経路に対して行われる診断処理については、図6で述べる。
次に、再試行が行われていた入出力経路が異常終了した場合、入出力経路の固定障害であれば(ステップ506)、入出力経路閉塞手段16は、当該入出力経路を閉塞したことを(ステップ507)、入出力経路状態管理テーブル19aに記録する。
なお、固定障害であることの判定は、例えば、障害の記録に基づいて行うことができる。この場合、障害の持続時間あるいは間欠障害の発生回数を判定の基準とすることができる。
再試行が行われていた入出力経路の閉塞によって、周辺装置40への入出力経路が全て閉塞された場合(ステップ508)、すなわち再試行可能な入出力経路がない場合には、装置閉塞となる(ステップ509)。
入出力結果通知手段15は入出力要求が異常終了したことをアプリケーションプログラム50に通知する。
一方、再試行可能な入出力経路がある場合には、入出力の再試行を行う(ステップ511)。
その後は、入出力結果受信手段13が入出力実行結果として受信する(ステップ501)。
次に、入出力経路の固定障害であると判定できない場合には、入出力結果通知手段15は、入出力経路状態管理テーブル19aに診断対象経路であることを登録し(ステップ510)、入出力経路の負荷を大きく見せるように更新する。
診断対象経路に登録された入出力経路に対して行われる診断処理については、図6で述べる。
以上のように、間欠障害が少なくとも1回発生した入出力経路の負荷を大きく見せるように設定し、アプリケーションプログラム50からの入出力要求があっても、当該経路の使用頻度を下げることで、入出力性能の低下時間を短かくできる。
次に、入出力経路の診断処理について説明する。
図6は本実施例による入出力経路の診断処理の動作を説明するためのフローチャートである。なお、必要に応じて、図1及び図3の主要な部分を参照する。
図6を参照すると、最初に、入出力経路診断手段17は入出力経路管理テーブル19aを参照して、診断対象経路に登録されている入出力経路を探す(ステップ601)。
入出力経路診断手段17は、一定時間毎に起動されており、診断対象入出力経路を見いだすと、入出力発行手段11を使用して当該診断対象入出力経路に診断用入出力を発行する(ステップ602)。
診断用入出力の実行結果は、入出力結果分析手段14で正常終了したかどうかを判断する(ステップ603)。
正常終了した場合には、診断対象として登録してから一定時間が過ぎているか、すなわち観察期間が終了したかをチェックする(ステップ604)。
観察期間が終了していれば間欠障害が再発する可能性が低いと判定し、入出力経路状態管理テーブル19a上から診断対象であることを削除し、入出力経路の負荷も本来の値に戻す(ステップ605)。
また観察期間が終了していなければ、診断対象の未処理入出力経路であるとして(ステップ606)、次回入出力経路診断手段17が起動された際に再度診断を行う。
次に、異常終了した場合には、固定障害であると判定し、入出力経路閉塞手段16を使用して、診断対象入出力経路を閉塞する(ステップ607)。
この結果、周辺装置40への入出力経路が全て閉塞された場合(ステップ608)、すなわち再試行可能な入出力経路がない場合には、装置閉塞となる(ステップ609)。
一方、周辺装置40への入出力経路で再試行可能な場合には未処理経路として(ステップ606)、診断用入出力が発行される(ステップ602)。
以上のように、診断用入出力を発行することで間欠障害の発生した入出力経路が固定障害であるかどうかを判定し、固定障害であると判定できる場合には入出力経路を閉塞できると共に、固定障害であると判定できない場合には、正常入出力経路として再度使用することにより、入出力要求の低下時間を短くできる。
以上説明した実施例によれば、コンピュータと周辺装置が複数の入出力経路で接続されているシステムにおいて、入出力経路の間欠障害の発生回数が1回であっても、障害発生入出力経路の負荷を見かけ上最大とするため、その使用頻度は低くなり、正常な入出力経路で再試行が行われるために、コンピュータによる再試行の回数が削減され、障害対処時のシステム入出力性能低下を極めて短時間とすることが可能となる。
本発明の入出力制御部10は、その動作をハードウェア的に実現することは勿論として、上記した各手段を実行する入出力制御プログラム(例えばオペレーティングシステム(OS))100をコンピュータ1で実行することにより、ソフトウェア的に実現することができる。この入出力制御プログラム100は、磁気ディスク、半導体メモリその他の記録媒体に格納され、その記録媒体からコンピュータ1にロードされ、その動作を制御することにより、上述した各機能を実現する。
上記実施例は、周辺装置が1台の場合について説明したが、周辺装置が複数の場合であっても、装置別に入出力経路状態管理テーブル19aを作成することにより、全く同様に適用することができる。
以上好ましい実施例をあげて本発明を説明したが、本発明は必ずしも、上記実施例に限定されるものでなく、その技術的思想の範囲内において様々に変形して実施することができる。
本発明の実施例によるコンピュータシステムの構成を示すブロック図である。 本発明の実施例による入出力発行処理動作を説明するためのフローチャートである。 本発明の実施例による入出力経路状態管理テーブルの一例を示す図である。 本発明の実施例による装置別入出力経路状態管理テーブルの一例を示す図である。 本発明の実施例による入出力実行結果受信処理の動作を説明するためのフローチャートである。 本発明の実施例による入出力経路の診断処理の動作を説明するためのフローチャートである。
符号の説明
1:コンピュータ
10:入出力制御部
11:入出力発行手段
12:入出力経路選択手段
13:入出力結果受信手段
14:入出力結果分析手段
15:入出力結果通知手段
16:入出力経路閉塞手段
17:入出力経路診断手段
18:リトライ入出力発行手段
19:入出力経路管理テーブル
19a:入出力経路状態管理テーブル
19b:装置別入出力経路状態管理テーブル
21、22、23、24:入出力プロセッサ
31、32、33、34:周辺処理装置
40:周辺装置
50:アプリケーションプログラム
100:入出力制御プログラム

Claims (17)

  1. 複数の入出力経路を介してコンピュータと周辺装置が接続され、前記コンピュータにロードされたアプリケーションプログラムから前記周辺装置への入出力要求が行われると、前記入出力経路に対して入出力処理を行うコンピュータシステムにおいて、
    前記入出力処理が正常終了した場合であって、前記入出力経路における間欠障害による再試行を経ている場合、
    前記入出力処理が行われた前記入出力経路の負荷を見かけ上最大に設定すると共に、前記再試行の行われた入出力経路を診断対象経路とし、当該入出力経路の状態を調べるための診断用入出力処理を行い、
    前記診断用入出力処理が正常終了し、かつ診断対象経路としてから一定の時間が経過している場合に、前記再試行の行われた入出力経路を正常な入出力経路と判定し、前記入出力経路の負荷を本来の値に戻すと共に、診断対象経路から削除し、
    前記診断用入出力処理が異常終了した場合に、前記再試行の行われた入出力経路の閉塞を行うことを特徴とするコンピュータシステム。
  2. 複数の前記入出力経路毎の負荷状態を示す負荷情報を、入出力経路状態管理テーブルとして備えることを特徴とする請求項1に記載のコンピュータシステム。
  3. 前記再試行の行われた入出力経路に対する入出力経路状態管理テーブルの前記負荷情報に、他の入出力経路の負荷に対して最大の値を設定することを特徴とする請求項2に記載のコンピュータシステム。
  4. 前記入出力経路に対して入出力処理を行う際に、前記入出力経路状態管理テーブルから取得した前記負荷情報に基づき負荷が最小の入出力経路を選択することを特徴とする請求項2に記載のコンピュータシステム。
  5. 前記入出力処理が異常終了した場合、障害のあった前記入出力経路を診断対象経路とし、当該入出力経路の状態を調べるための診断用入出力処理を行うことを特徴とする請求項1に記載のコンピュータシステム。
  6. 前記診断用入出力処理が正常終了し、かつ診断対象経路としてから一定の時間が経過している場合に、障害のあった前記入出力経路を正常な入出力経路と判定し、診断対象経路から削除し、
    前記診断用入出力処理が異常終了した場合に、障害のあった前記入出力経路の閉塞を行うことを特徴とする請求項5に記載のコンピュータシステム。
  7. 複数の入出力経路を介して周辺装置と接続されるコンピュータに備えられ、前記コンピュータにロードされたアプリケーションプログラムから前記周辺装置への入出力要求が行われると、前記入出力経路に対して入出力処理を行う入出力制御部であって、
    前記入出力処理が正常終了した場合であって、前記入出力経路における間欠障害による再試行を経ている場合、前記入出力処理が行われた前記入出力経路の負荷を見かけ上最大に設定すると共に、前記再試行の行われた入出力経路を診断対象経路とする手段と、
    前記診断対象経路である入出力経路の状態を調べるための診断用入出力処理を行う手段と、
    前記診断用入出力処理が正常終了し、かつ診断対象経路としてから一定の時間が経過している場合に、前記再試行の行われた入出力経路を正常な入出力経路と判定し、前記入出力経路の負荷を本来の値に戻すと共に、診断対象経路から削除する手段と、
    前記診断用入出力処理が異常終了した場合に、前記再試行の行われた入出力経路の閉塞を行う手段とを備えることを特徴とする入出力制御部。
  8. 複数の前記入出力経路毎の負荷状態を示す負荷情報を、入出力経路状態管理テーブルとして備えることを特徴とする請求項7に記載の入出力制御部。
  9. 前記再試行の行われた入出力経路に対する入出力経路状態管理テーブルの前記負荷情報に、他の入出力経路の負荷に対して最大の値を設定することを特徴とする請求項8に記載の入出力制御部。
  10. 前記入出力経路に対して入出力処理を行う際に、前記入出力経路状態管理テーブルから取得した前記負荷情報に基づき負荷が最小の入出力経路を選択する入出力経路選択手段と、
    当該入出力経路選択手段が選択した入出力経路に対して入出力を発行する入出力発行手段と、
    前記周辺装置での入出力実行結果を受信する入出力結果受信手段を備えることを特徴とする請求項8又は請求項9に記載の入出力制御部。
  11. 前記入出力結果受信手段が受信した入出力実行結果が正常終了であるかもしくは異常終了であるかを分析する入出力結果分析手段を備えることを特徴とする請求項10に記載の入出力制御部。
  12. 複数の入出力経路を介して周辺装置と接続されたコンピュータ上で実行され、前記入出力経路に対して入出力処理を行う入出力制御プログラムであって、
    前記入出力処理が正常終了した場合であって、前記入出力経路における間欠障害による再試行を経ている場合、
    前記入出力処理が行われた前記入出力経路の負荷を見かけ上最大に設定すると共に、前記再試行の行われた入出力経路を診断対象経路とし、当該入出力経路の状態を調べるための診断用入出力処理を行い、
    前記診断用入出力処理が正常終了し、かつ診断対象経路としてから一定の時間が経過している場合に、前記再試行の行われた入出力経路を正常な入出力経路と判定し、前記入出力経路の負荷を本来の値に戻すと共に、診断対象経路から削除し、
    前記診断用入出力処理が異常終了した場合に、前記再試行の行われた入出力経路の閉塞を行う機能を前記コンピュータに実行させることを特徴とする入出力制御プログラム。
  13. 複数の前記入出力経路毎の負荷状態を示す負荷情報を、入出力経路状態管理テーブルとして備える機能を有することを特徴とする請求項12に記載の入出力制御プログラム。
  14. 前記再試行の行われた入出力経路に対する入出力経路状態管理テーブルの前記負荷情報に、他の入出力経路の負荷に対して最大の値を設定する機能を有することを特徴とする請求項13に記載の入出力制御プログラム。
  15. 前記入出力経路に対して入出力処理を行う際に、前記入出力経路状態管理テーブルから取得した前記負荷情報に基づき負荷が最小の入出力経路を選択する機能を有することを特徴とする請求項13に記載の入出力制御プログラム。
  16. 前記入出力処理が異常終了した場合、障害のあった前記入出力経路を診断対象経路とし、当該入出力経路の状態を調べるための診断用入出力処理を行う機能を実行することを特徴とする請求項12に記載の入出力制御プログラム。
  17. 前記診断用入出力処理が正常終了し、かつ診断対象経路としてから一定の時間が経過している場合に、障害のあった前記入出力経路を正常な入出力経路と判定し、診断対象経路から削除し、
    前記診断用入出力処理が異常終了した場合に、障害のあった前記入出力経路の閉塞を行う機能を有することを特徴とする請求項16に記載の入出力制御プログラム。
JP2004043425A 2004-02-19 2004-02-19 コンピュータシステム、入出力制御部及び入出力制御プログラム Expired - Fee Related JP4103141B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004043425A JP4103141B2 (ja) 2004-02-19 2004-02-19 コンピュータシステム、入出力制御部及び入出力制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004043425A JP4103141B2 (ja) 2004-02-19 2004-02-19 コンピュータシステム、入出力制御部及び入出力制御プログラム

Publications (2)

Publication Number Publication Date
JP2005234903A JP2005234903A (ja) 2005-09-02
JP4103141B2 true JP4103141B2 (ja) 2008-06-18

Family

ID=35017800

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004043425A Expired - Fee Related JP4103141B2 (ja) 2004-02-19 2004-02-19 コンピュータシステム、入出力制御部及び入出力制御プログラム

Country Status (1)

Country Link
JP (1) JP4103141B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6390281B2 (ja) * 2014-09-04 2018-09-19 富士通株式会社 情報処理装置、ストレージ制御装置、情報処理プログラム、ストレージ制御プログラムおよび情報処理システム

Also Published As

Publication number Publication date
JP2005234903A (ja) 2005-09-02

Similar Documents

Publication Publication Date Title
US5740357A (en) Generic fault management of a computer system
CN105468484B (zh) 用于在存储系统中确定故障位置的方法和装置
US6343335B1 (en) System for repositioning an I/O device to a predetermined position to retry a program without knowledge of which part of the program caused the retry
EP0505706B1 (en) Alternate processor continuation of the task of a failed processor
US6754853B1 (en) Testing components of a computerized storage network system having a storage unit with multiple controllers
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
US10915393B2 (en) Semiconductor device and failure detection system
WO2014027276A1 (en) Handling intermittent recurring errors in network
CN112256507A (zh) 芯片故障诊断方法、装置、可读存储介质及电子设备
JP7125602B2 (ja) データ処理装置および診断方法
US7590801B1 (en) Identifying suspect disks
US10042670B2 (en) Providing automatic retry of transactions with diagnostics
JP4103141B2 (ja) コンピュータシステム、入出力制御部及び入出力制御プログラム
JP3711871B2 (ja) Pciバスの障害解析容易化方式
US20070277059A1 (en) Storage device, control device, and error reporting method
CN111209129A (zh) 基于amd平台的内存优化方法和装置
US6336194B1 (en) Program products for repositioning an input/output device without knowledge of current positioning of the device
TWI344082B (en) Method for diagnosing system abnormality
JP3342039B2 (ja) ファイルを管理する処理装置
TW200307200A (en) Multiple fault location in a series of devices
JPH11120154A (ja) コンピュータシステムにおけるアクセス制御装置および方法
CN117076183B (zh) 一种错误上报方法、片上系统、计算机设备及存储介质
JPH0561734A (ja) 並列プログラムの非決定的動作テスト方法
JP2004021936A (ja) 情報処理装置の障害処理方法および情報処理装置
US6339799B1 (en) Method of repositioning an I/O device to a predetermined position to retry a program without knowledge of which part of the program caused the retry

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071211

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080303

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080316

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110404

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120404

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120404

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130404

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130404

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140404

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees