JPH03265960A - Channel fault processing system - Google Patents
Channel fault processing systemInfo
- Publication number
- JPH03265960A JPH03265960A JP2066460A JP6646090A JPH03265960A JP H03265960 A JPH03265960 A JP H03265960A JP 2066460 A JP2066460 A JP 2066460A JP 6646090 A JP6646090 A JP 6646090A JP H03265960 A JPH03265960 A JP H03265960A
- Authority
- JP
- Japan
- Prior art keywords
- channel
- input
- output processing
- processing device
- service processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 8
- 238000011990 functional testing Methods 0.000 claims description 7
- 230000010365 information processing Effects 0.000 claims description 3
- 230000005856 abnormality Effects 0.000 abstract 2
- 230000009466 transformation Effects 0.000 abstract 2
- 230000005540 biological transmission Effects 0.000 abstract 1
- 238000001514 detection method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 1
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明はチャネル障害処理方式、特に複数のチャネルを
有する入出力処理装置とサービスプロセッサを有する情
報処理装置におけるチャネル障害処理方式に関する。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a channel failure handling method, particularly to a channel failure handling method in an information processing apparatus having an input/output processing device having a plurality of channels and a service processor.
従来のこの種のチャネル障害処理は、チャネルで障害が
発生したとき、入出力処理装置が障害チャネルを論理的
に切離して障害内容をサービスプロセッサに報告し、サ
ービスプロセッサは、同一チャネル上で発生した障害の
回数をカウントし、一定時間にn回未満の障害発生回数
であるときは、障害チャネルのエラー状態を解除してか
ら、再びそのチャネルを入出力処理装置に組込んでいる
。In conventional channel failure processing, when a failure occurs in a channel, the input/output processing unit logically disconnects the failed channel and reports the details of the failure to the service processor. The number of failures is counted, and if the number of failure occurrences is less than n times in a certain period of time, the error state of the failed channel is released and then the channel is incorporated into the input/output processing device again.
また、一定時間にn回、同一チャネル上で障害が発生し
たときは、固定障害が発生したと判断し、チャネルを入
出力処理装置から切離したままにしていた。Further, when a failure occurs on the same channel n times in a certain period of time, it is determined that a fixed failure has occurred, and the channel is left disconnected from the input/output processing device.
上述した従来のチャネル障害処理方式は、同一チャネル
上でのn回以内の障害は間欠障害として扱い無条件に入
出力処理装置に組み込むので、次のような欠点がある。The above-described conventional channel failure processing method treats failures occurring within n times on the same channel as intermittent failures and unconditionally incorporates them into the input/output processing device, which has the following drawbacks.
第1に、固定障害が発生したチャネルでも、n回の障害
が表面化するまでは、使用し続けるのでデータ化けが発
生する恐れがある。First, even a channel in which a fixed failure has occurred continues to be used until the failure occurs n times, so there is a risk that garbled data may occur.
第2に、一定時間に1回障害が発生しないと固定障害で
あると判断しないので、入出力の負荷が低いチャネルで
固定障害が発生した場合、間欠障害として扱われ、その
チャネルが切離されないことがある。Second, unless a fault occurs once within a certain period of time, it is not determined to be a fixed fault, so if a fixed fault occurs in a channel with a low input/output load, it is treated as an intermittent fault and the channel is not isolated. Sometimes.
第3に、チャネル障害が発生したとき、障害箇所を確認
する為のログが採取されるが、ログ情報だけでは障害の
原因が掴めない場合がある。このような場合、障害原因
をトレースする為に、動作試験を実行して、障害が発生
するパターンを切分けるという方法が考えられるが、障
害発生時のシステム環境が特殊で、その環境でないと障
害が見えないという場合、後で同じ障害を再現させるこ
とが困難になることがある。Third, when a channel failure occurs, a log is collected to confirm the location of the failure, but the cause of the failure may not be grasped from the log information alone. In such a case, in order to trace the cause of the failure, one possible method is to run an operational test and isolate the pattern in which the failure occurs, but the system environment at the time of the failure is special, and unless it is that environment, the failure will occur. If you cannot see the problem, it may be difficult to reproduce the same problem later.
本発明の方式は、複数のチャネルが接続された入出力処
理装置と、サービスプロセッサとを有し、前記サービス
プロセッサが前記入出力処理装置に前記チャネルの状態
設定を指示する機能をもつ情報処理装置におけるチャネ
ル障害処理方式において、
前記チャネルで障害が発生したとき、該チャネルを前記
入出力処理装置から論理的に切離し、前記サービスプロ
セッサにその障害内容を報告する手段と、
iffff−ビスプロセッサがチャネルの障害報告を受
け付けたとき該チャネルの機能試験を行う手段と、
前記機能試験が正常に終了したときは上記障害チャネル
のエラー状態を解除して、前記入出力処理装置に論理的
に接続し、また、前記機能試験でエラーが検出されたと
きは、前記サービスプロセッサにエラー情報を登録し、
該チャネルを切離したままにする手段とを有することを
特徴とする。The method of the present invention provides an information processing device that includes an input/output processing device to which a plurality of channels are connected and a service processor, and the service processor has a function of instructing the input/output processing device to set the state of the channel. In the channel fault handling method, when a fault occurs in the channel, means for logically separating the channel from the input/output processing device and reporting the details of the fault to the service processor; means for performing a functional test of the channel when a fault report is received; and, when the functional test is successfully completed, releasing the error state of the faulty channel and logically connecting it to the input/output processing device; , when an error is detected in the functional test, registering error information in the service processor;
and means for keeping the channel disconnected.
次に、本発明について図面を参照して説明する。 Next, the present invention will be explained with reference to the drawings.
第1図は本発明の一実施例のブロック図である。FIG. 1 is a block diagram of one embodiment of the present invention.
入出力処理部101は入出力処理装置の動作を制御し、
チャネル障害検出部102はチャネル障害が発生したこ
とを検出し、サービスプロセッサにチャネルのエラーロ
グを送出する。チャネル接続部制御部103は入出力処
理装置とチャネル105との間の接続/切離しを行う。The input/output processing unit 101 controls the operation of the input/output processing device,
The channel failure detection unit 102 detects the occurrence of a channel failure and sends a channel error log to the service processor. The channel connection unit control unit 103 connects/disconnects between the input/output processing device and the channel 105.
チャネル接続部104は入出力処理装置とチャネル10
5との間の論理的な接続機構を持ち、チャネル105は
周辺装置と入出力処理装置間のデータ転送を行う。The channel connection unit 104 connects the input/output processing device to the channel 10.
Channel 105 provides data transfer between peripheral devices and input/output processing devices.
ログ登録部106はチャネルのエラーログ及びチャネル
の機能試験(以後T&Dと記述する)実行時のエラー情
報を登録する。T&Dモニタ107はチャネル障害発生
時にそのチャネルに対するT&Dを起動する。T&D実
行部108は指示されたチャネルのT&Dを実行する。The log registration unit 106 registers a channel error log and error information during execution of a channel function test (hereinafter referred to as T&D). The T&D monitor 107 activates T&D for a channel when a channel failure occurs. The T&D execution unit 108 executes T&D of the instructed channel.
障害検出109゜111は障害が発生したチャネル番号
を入出力処理部101とT&Dモニタ107に通知する
。The failure detection unit 109° 111 notifies the input/output processing unit 101 and the T&D monitor 107 of the channel number where the failure has occurred.
ログ送出110はチャネル105のエラーログをチャネ
ル障害検出部102からログ登録部106へ送出する。Log sending 110 sends the error log of channel 105 from channel failure detection section 102 to log registration section 106 .
CH状態設定指示112はT&Dモニタ107から入出
力処理部101ヘチヤネルの状態設定指示を送出する。The CH state setting instruction 112 sends a channel state setting instruction from the T&D monitor 107 to the input/output processing section 101.
次に、本発明のチャネル障害処理方式の動作を説明する
。Next, the operation of the channel failure handling method of the present invention will be explained.
チャネル105で障害が発生すると、そのチャネル番号
がチャネル障害検出部102へ通知される。チャネル障
害検出部102は障害通知を受取ると、チャネル105
のエラーログを読出した後、障害チャネル番号を障害検
出109,111を通して入出力処理部101.T&D
モニタ107へ通知する。そして、チャネルのエラーロ
グをログ送出110を通してログ登録部106に登録す
る。When a failure occurs in channel 105, the channel number is notified to channel failure detection section 102. Upon receiving the failure notification, the channel failure detection unit 102 detects the failure in the channel 105.
After reading the error log of the error log, the fault channel number is sent to the input/output processing unit 101 . T&D
The monitor 107 is notified. Then, the error log of the channel is registered in the log registration unit 106 through the log sending 110.
チャネル障害通知を受信した入出力処理部101は、チ
ャネル接続制御部103に障害チャネルを入出力処理装
置から切離すことを指示し、チャネル接続制御部103
はチャネル接続部104における論理的な接続をOFF
にする。また、T&Dモニタ107はT&D実行部10
8に障害チャネルに対するT&Dの起動を指示する。The input/output processing unit 101 that has received the channel failure notification instructs the channel connection control unit 103 to disconnect the failed channel from the input/output processing device, and the channel connection control unit 103
turns off the logical connection in the channel connection unit 104
Make it. Further, the T&D monitor 107 is the T&D execution unit 10
8 to activate T&D for the faulty channel.
T&Dが終了するとT&D実行部108はT&Dモニタ
107にT&D実行結果を報告する。When the T&D is completed, the T&D execution unit 108 reports the T&D execution results to the T&D monitor 107.
T&Dモニタ107は実行結果をチエツクし、正常終了
ならば、CH状態設定指示112を通して、入出力処理
部101に障害チャネルを組込み使用可能状態にするよ
うに指示する。また異常終了ならば、T&D実行部10
8からエラー情報を取込み、ログ送出113を通してロ
グ登録部106へ登録した後、CH状態設定指示112
を通して入出力処理部101に障害チャネルを切離した
まま使用不可能な状態にするように指示する。The T&D monitor 107 checks the execution result, and if the execution has ended normally, it instructs the input/output processing section 101 to put the faulty channel into a built-in usable state through a CH state setting instruction 112. If the termination is abnormal, the T&D execution unit 10
After fetching error information from 8 and registering it in the log registration unit 106 through log sending 113, CH status setting instruction 112
This command instructs the input/output processing unit 101 to keep the faulty channel disconnected and make it unusable.
入出力処理部101はT&Dモニタ107からチャネル
使用可能状態設定指示を受けると、障害チャネルのエラ
ー状態を解除し、チャネル接続制御部103にチャネル
接続指示出すことにより、障害チャネルを再び入出力処
理装置101に組み込む。When the input/output processing unit 101 receives a channel usable state setting instruction from the T&D monitor 107, it releases the error state of the faulty channel and issues a channel connection instruction to the channel connection control unit 103, thereby making the faulty channel available to the input/output processing device again. 101.
また、T&Dモニタ107からチャネル使用不可能状態
設定指示を受けると、入出力処理部101はチャネルの
状態管理上、障害チャネルを5TOP状態とし、今後、
そのチャネルに向けて発行された入出力要求に対しては
チャネル5TOPの報告で応答する。Further, upon receiving an instruction to set a channel unusable state from the T&D monitor 107, the input/output processing unit 101 sets the faulty channel to the 5TOP state for channel state management, and from now on,
It responds to input/output requests issued to that channel with a report of channel 5 TOP.
以上説明してきた動作を時間経過と関連づけて表したの
が第2図である。FIG. 2 shows the operations described above in relation to the passage of time.
以上説明したように、本発明は、障害が発生したチャネ
ルを一旦、入出力処理装置から切離した後サービスプロ
セッサから、チャネルに対して機能試験を行い、その結
果、正常終了ならばチャネルを再び入出力処理装置に組
込み、異常終了ならばエラー情報をサービスプロセッサ
に登録し、今後そのチャネルを使用不可能状態にする構
成としたため次の効果がある。As explained above, in the present invention, a faulty channel is once disconnected from an input/output processing device, a service processor performs a functional test on the channel, and if the result is normal, the channel is reinserted. The system is built into the output processing device, and if an abnormal termination occurs, error information is registered in the service processor, and the channel is rendered unusable in the future, resulting in the following effects.
第1に、チャネルの全機能を網羅する試験を実行した結
果で、発生した障害が固定か間欠かを判別するので、障
害がn回発生するまでは無条件にチャネルを組み込む方
式で心配されるデータ化けを防ぐことができる。First, the results of tests that cover all functions of the channel determine whether the fault that occurs is fixed or intermittent, so there is no need to worry about the method of unconditionally incorporating the channel until the fault occurs n times. Data corruption can be prevented.
第2に、入出力の負荷が低いチャネルで障害が発生した
場合でも、その障害が固定か間欠かを早期に判別するこ
とができる。Second, even if a fault occurs in a channel with a low input/output load, it is possible to quickly determine whether the fault is fixed or intermittent.
第3に、無人運転のシステムで、特殊なシステム環境が
原因で障害発生したときでも、即時に、かつ自動的にT
&Dを実行し、異常終了すればそのエラー情報をサービ
スプロセッサに登録しておくので、障害が発生してから
長時間経過したときに、障害発生時と全く異なるシステ
ム環境で再現テストを行うことにより、はとんど再現不
可能となる問題を解消することができる。Thirdly, in an unmanned system, even if a failure occurs due to a special system environment, the system can immediately and automatically
If &D is executed and it terminates abnormally, the error information is registered in the service processor, so when a long time has passed since the failure occurred, you can perform a reproduction test in a completely different system environment than when the failure occurred. , can solve problems that are almost impossible to reproduce.
第1図は本発明の一実施例のブロック図、第2図は本発
明の処理方式の動作を時間経過と関連づけて表した図で
ある。
101・・・・・・入出力処理部、102・・・・・・
チャネル障害検出部、103・・・・・・チャネル接続
制御部、104・・・・・・チャネル接続部、105・
・・・・・チャネル、106・・・・・・ログ登録部、
107・・・・・・T&Dモニタ、108・・・・・・
T&D実行部、109・・・・・・障害検出、110・
・・・・・ログ送出、111・・・・・・障害検出、1
12・・・・・・CH状態設定指示。FIG. 1 is a block diagram of an embodiment of the present invention, and FIG. 2 is a diagram showing the operation of the processing method of the present invention in relation to the passage of time. 101... Input/output processing unit, 102...
Channel failure detection unit, 103...Channel connection control unit, 104...Channel connection unit, 105...
...Channel, 106...Log registration section,
107...T&D monitor, 108...
T&D execution unit, 109... Failure detection, 110.
...Log sending, 111...Failure detection, 1
12...CH status setting instruction.
Claims (1)
スプロセッサとを有し、前記サービスプロセッサが前記
入出力処理装置に前記チャネルの状態設定を指示する機
能をもつ情報処理装置におけるチャネル障害処理方式に
おいて、 前記チャネルで障害が発生したとき、該チャネルを前記
入出力処理装置から論理的に切離し、前記サービスプロ
セッサにその障害内容を報告する手段と、 前記サービスプロセッサがチャネルの障害報告を受け付
けたとき該チャネルの機能試験を行う手段と、 前記機能試験が正常に終了したときは上記障害チャネル
のエラー状態を解除して、前記入出力処理装置に論理的
に接続し、また、前記機能試験でエラーが検出されたと
きは、前記サービスプロセッサにエラー情報を登録し、
該チャネルを切離したままにする手段とを有することを
特徴とするチャネル障害処理方式。[Scope of Claims] An information processing device comprising an input/output processing device to which a plurality of channels are connected and a service processor, wherein the service processor has a function of instructing the input/output processing device to set the state of the channel. In the channel fault handling method, when a fault occurs in the channel, means for logically separating the channel from the input/output processing device and reporting the details of the fault to the service processor; means for performing a functional test of the channel when the report is received; and when the functional test is successfully completed, releasing the error state of the faulty channel and logically connecting it to the input/output processing device; When an error is detected in the functional test, registering error information in the service processor;
means for keeping the channel disconnected.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2066460A JPH03265960A (en) | 1990-03-15 | 1990-03-15 | Channel fault processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2066460A JPH03265960A (en) | 1990-03-15 | 1990-03-15 | Channel fault processing system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03265960A true JPH03265960A (en) | 1991-11-27 |
Family
ID=13316405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2066460A Pending JPH03265960A (en) | 1990-03-15 | 1990-03-15 | Channel fault processing system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH03265960A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008262538A (en) * | 2007-01-30 | 2008-10-30 | Hewlett-Packard Development Co Lp | Method and system for handling input/output (i/o) errors |
-
1990
- 1990-03-15 JP JP2066460A patent/JPH03265960A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008262538A (en) * | 2007-01-30 | 2008-10-30 | Hewlett-Packard Development Co Lp | Method and system for handling input/output (i/o) errors |
JP4641546B2 (en) * | 2007-01-30 | 2011-03-02 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー. | Method and system for handling input / output (I / O) errors |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3620527B2 (en) | Failure analysis method for loop interface and system having failure analysis function | |
JPH11203157A (en) | Redundancy device | |
JPH03265960A (en) | Channel fault processing system | |
JP2827713B2 (en) | Redundant device | |
JPH02216542A (en) | Diagnosis execution control system | |
JPS62236056A (en) | Input/output controller for information processing system | |
JP3156987B2 (en) | Bus failure diagnosis method | |
JPS62271153A (en) | Diagnostic system for common bus structure | |
JPS60134942A (en) | Backup system for abnormal state | |
KR100257162B1 (en) | Method and apparatus for supervising relative system in duplex system | |
JPH05224964A (en) | Bus abnormality information system | |
JP2778691B2 (en) | Bus monitoring circuit | |
JPH04243341A (en) | Diagnostic system for data transmitter in loop data transmission system | |
Aitcheson et al. | No. 1 ESS ADF: Maintenance Plan | |
JPH04340630A (en) | Multiprocessor system | |
JPS62105243A (en) | Recovery device for system fault | |
JPS60214052A (en) | Error reporting system | |
JPS60195649A (en) | Error reporting system of microprogram-controlled type data processor | |
JPS61136355A (en) | Remote control system | |
JPH03156646A (en) | Output system for fault information | |
JPH01163859A (en) | Channel fault restoration controller | |
JP2001256081A (en) | Information processor | |
JPH02183852A (en) | Data processor | |
JPS58105358A (en) | Maintenance method of data processor | |
JPH0215351A (en) | Recovery processing system for serious fault in channel system |