JPH03265960A - Channel fault processing system - Google Patents

Channel fault processing system

Info

Publication number
JPH03265960A
JPH03265960A JP2066460A JP6646090A JPH03265960A JP H03265960 A JPH03265960 A JP H03265960A JP 2066460 A JP2066460 A JP 2066460A JP 6646090 A JP6646090 A JP 6646090A JP H03265960 A JPH03265960 A JP H03265960A
Authority
JP
Japan
Prior art keywords
channel
input
output processing
processing device
service processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2066460A
Other languages
Japanese (ja)
Inventor
Shozo Iida
飯田 昌三
Kenji Yahiro
八尋 健次
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Engineering Ltd
Original Assignee
NEC Corp
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Engineering Ltd filed Critical NEC Corp
Priority to JP2066460A priority Critical patent/JPH03265960A/en
Publication of JPH03265960A publication Critical patent/JPH03265960A/en
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PURPOSE:To prevent the transformation of data by separating a faulty channel temporarily from an input/output processor, applying a function test to the channel from a service processor, registering the error information to the service processor if the abnormality is through, and hereafter keeping the channel in an unavailable state. CONSTITUTION:An input/output processing part 101 instructs a channel connection control part 103 to separate a faulty channel from an input/output processor. Thus the part 103 turns off the logical connection at a channel connection part 104. Both a channel error log register part 106 and a channel function test (T&D) monitor 107 check the executing results and fetch the error information from a T&D executing part 108 as long as the abnormality is through. The error information is registered to the part 106 through a log transmission line 113. Then an instruction is given to the part 101 through a CH state setting instruction line 112 to keep the separated faulty channel in an unavailable state. Thus it is possible to prevent the occurrence of the transformation of data.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はチャネル障害処理方式、特に複数のチャネルを
有する入出力処理装置とサービスプロセッサを有する情
報処理装置におけるチャネル障害処理方式に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a channel failure handling method, particularly to a channel failure handling method in an information processing apparatus having an input/output processing device having a plurality of channels and a service processor.

〔従来の技術〕[Conventional technology]

従来のこの種のチャネル障害処理は、チャネルで障害が
発生したとき、入出力処理装置が障害チャネルを論理的
に切離して障害内容をサービスプロセッサに報告し、サ
ービスプロセッサは、同一チャネル上で発生した障害の
回数をカウントし、一定時間にn回未満の障害発生回数
であるときは、障害チャネルのエラー状態を解除してか
ら、再びそのチャネルを入出力処理装置に組込んでいる
In conventional channel failure processing, when a failure occurs in a channel, the input/output processing unit logically disconnects the failed channel and reports the details of the failure to the service processor. The number of failures is counted, and if the number of failure occurrences is less than n times in a certain period of time, the error state of the failed channel is released and then the channel is incorporated into the input/output processing device again.

また、一定時間にn回、同一チャネル上で障害が発生し
たときは、固定障害が発生したと判断し、チャネルを入
出力処理装置から切離したままにしていた。
Further, when a failure occurs on the same channel n times in a certain period of time, it is determined that a fixed failure has occurred, and the channel is left disconnected from the input/output processing device.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

上述した従来のチャネル障害処理方式は、同一チャネル
上でのn回以内の障害は間欠障害として扱い無条件に入
出力処理装置に組み込むので、次のような欠点がある。
The above-described conventional channel failure processing method treats failures occurring within n times on the same channel as intermittent failures and unconditionally incorporates them into the input/output processing device, which has the following drawbacks.

第1に、固定障害が発生したチャネルでも、n回の障害
が表面化するまでは、使用し続けるのでデータ化けが発
生する恐れがある。
First, even a channel in which a fixed failure has occurred continues to be used until the failure occurs n times, so there is a risk that garbled data may occur.

第2に、一定時間に1回障害が発生しないと固定障害で
あると判断しないので、入出力の負荷が低いチャネルで
固定障害が発生した場合、間欠障害として扱われ、その
チャネルが切離されないことがある。
Second, unless a fault occurs once within a certain period of time, it is not determined to be a fixed fault, so if a fixed fault occurs in a channel with a low input/output load, it is treated as an intermittent fault and the channel is not isolated. Sometimes.

第3に、チャネル障害が発生したとき、障害箇所を確認
する為のログが採取されるが、ログ情報だけでは障害の
原因が掴めない場合がある。このような場合、障害原因
をトレースする為に、動作試験を実行して、障害が発生
するパターンを切分けるという方法が考えられるが、障
害発生時のシステム環境が特殊で、その環境でないと障
害が見えないという場合、後で同じ障害を再現させるこ
とが困難になることがある。
Third, when a channel failure occurs, a log is collected to confirm the location of the failure, but the cause of the failure may not be grasped from the log information alone. In such a case, in order to trace the cause of the failure, one possible method is to run an operational test and isolate the pattern in which the failure occurs, but the system environment at the time of the failure is special, and unless it is that environment, the failure will occur. If you cannot see the problem, it may be difficult to reproduce the same problem later.

〔課題を解決するための手段〕[Means to solve the problem]

本発明の方式は、複数のチャネルが接続された入出力処
理装置と、サービスプロセッサとを有し、前記サービス
プロセッサが前記入出力処理装置に前記チャネルの状態
設定を指示する機能をもつ情報処理装置におけるチャネ
ル障害処理方式において、 前記チャネルで障害が発生したとき、該チャネルを前記
入出力処理装置から論理的に切離し、前記サービスプロ
セッサにその障害内容を報告する手段と、 iffff−ビスプロセッサがチャネルの障害報告を受
け付けたとき該チャネルの機能試験を行う手段と、 前記機能試験が正常に終了したときは上記障害チャネル
のエラー状態を解除して、前記入出力処理装置に論理的
に接続し、また、前記機能試験でエラーが検出されたと
きは、前記サービスプロセッサにエラー情報を登録し、
該チャネルを切離したままにする手段とを有することを
特徴とする。
The method of the present invention provides an information processing device that includes an input/output processing device to which a plurality of channels are connected and a service processor, and the service processor has a function of instructing the input/output processing device to set the state of the channel. In the channel fault handling method, when a fault occurs in the channel, means for logically separating the channel from the input/output processing device and reporting the details of the fault to the service processor; means for performing a functional test of the channel when a fault report is received; and, when the functional test is successfully completed, releasing the error state of the faulty channel and logically connecting it to the input/output processing device; , when an error is detected in the functional test, registering error information in the service processor;
and means for keeping the channel disconnected.

〔実施例〕〔Example〕

次に、本発明について図面を参照して説明する。 Next, the present invention will be explained with reference to the drawings.

第1図は本発明の一実施例のブロック図である。FIG. 1 is a block diagram of one embodiment of the present invention.

入出力処理部101は入出力処理装置の動作を制御し、
チャネル障害検出部102はチャネル障害が発生したこ
とを検出し、サービスプロセッサにチャネルのエラーロ
グを送出する。チャネル接続部制御部103は入出力処
理装置とチャネル105との間の接続/切離しを行う。
The input/output processing unit 101 controls the operation of the input/output processing device,
The channel failure detection unit 102 detects the occurrence of a channel failure and sends a channel error log to the service processor. The channel connection unit control unit 103 connects/disconnects between the input/output processing device and the channel 105.

チャネル接続部104は入出力処理装置とチャネル10
5との間の論理的な接続機構を持ち、チャネル105は
周辺装置と入出力処理装置間のデータ転送を行う。
The channel connection unit 104 connects the input/output processing device to the channel 10.
Channel 105 provides data transfer between peripheral devices and input/output processing devices.

ログ登録部106はチャネルのエラーログ及びチャネル
の機能試験(以後T&Dと記述する)実行時のエラー情
報を登録する。T&Dモニタ107はチャネル障害発生
時にそのチャネルに対するT&Dを起動する。T&D実
行部108は指示されたチャネルのT&Dを実行する。
The log registration unit 106 registers a channel error log and error information during execution of a channel function test (hereinafter referred to as T&D). The T&D monitor 107 activates T&D for a channel when a channel failure occurs. The T&D execution unit 108 executes T&D of the instructed channel.

障害検出109゜111は障害が発生したチャネル番号
を入出力処理部101とT&Dモニタ107に通知する
The failure detection unit 109° 111 notifies the input/output processing unit 101 and the T&D monitor 107 of the channel number where the failure has occurred.

ログ送出110はチャネル105のエラーログをチャネ
ル障害検出部102からログ登録部106へ送出する。
Log sending 110 sends the error log of channel 105 from channel failure detection section 102 to log registration section 106 .

CH状態設定指示112はT&Dモニタ107から入出
力処理部101ヘチヤネルの状態設定指示を送出する。
The CH state setting instruction 112 sends a channel state setting instruction from the T&D monitor 107 to the input/output processing section 101.

次に、本発明のチャネル障害処理方式の動作を説明する
Next, the operation of the channel failure handling method of the present invention will be explained.

チャネル105で障害が発生すると、そのチャネル番号
がチャネル障害検出部102へ通知される。チャネル障
害検出部102は障害通知を受取ると、チャネル105
のエラーログを読出した後、障害チャネル番号を障害検
出109,111を通して入出力処理部101.T&D
モニタ107へ通知する。そして、チャネルのエラーロ
グをログ送出110を通してログ登録部106に登録す
る。
When a failure occurs in channel 105, the channel number is notified to channel failure detection section 102. Upon receiving the failure notification, the channel failure detection unit 102 detects the failure in the channel 105.
After reading the error log of the error log, the fault channel number is sent to the input/output processing unit 101 . T&D
The monitor 107 is notified. Then, the error log of the channel is registered in the log registration unit 106 through the log sending 110.

チャネル障害通知を受信した入出力処理部101は、チ
ャネル接続制御部103に障害チャネルを入出力処理装
置から切離すことを指示し、チャネル接続制御部103
はチャネル接続部104における論理的な接続をOFF
にする。また、T&Dモニタ107はT&D実行部10
8に障害チャネルに対するT&Dの起動を指示する。
The input/output processing unit 101 that has received the channel failure notification instructs the channel connection control unit 103 to disconnect the failed channel from the input/output processing device, and the channel connection control unit 103
turns off the logical connection in the channel connection unit 104
Make it. Further, the T&D monitor 107 is the T&D execution unit 10
8 to activate T&D for the faulty channel.

T&Dが終了するとT&D実行部108はT&Dモニタ
107にT&D実行結果を報告する。
When the T&D is completed, the T&D execution unit 108 reports the T&D execution results to the T&D monitor 107.

T&Dモニタ107は実行結果をチエツクし、正常終了
ならば、CH状態設定指示112を通して、入出力処理
部101に障害チャネルを組込み使用可能状態にするよ
うに指示する。また異常終了ならば、T&D実行部10
8からエラー情報を取込み、ログ送出113を通してロ
グ登録部106へ登録した後、CH状態設定指示112
を通して入出力処理部101に障害チャネルを切離した
まま使用不可能な状態にするように指示する。
The T&D monitor 107 checks the execution result, and if the execution has ended normally, it instructs the input/output processing section 101 to put the faulty channel into a built-in usable state through a CH state setting instruction 112. If the termination is abnormal, the T&D execution unit 10
After fetching error information from 8 and registering it in the log registration unit 106 through log sending 113, CH status setting instruction 112
This command instructs the input/output processing unit 101 to keep the faulty channel disconnected and make it unusable.

入出力処理部101はT&Dモニタ107からチャネル
使用可能状態設定指示を受けると、障害チャネルのエラ
ー状態を解除し、チャネル接続制御部103にチャネル
接続指示出すことにより、障害チャネルを再び入出力処
理装置101に組み込む。
When the input/output processing unit 101 receives a channel usable state setting instruction from the T&D monitor 107, it releases the error state of the faulty channel and issues a channel connection instruction to the channel connection control unit 103, thereby making the faulty channel available to the input/output processing device again. 101.

また、T&Dモニタ107からチャネル使用不可能状態
設定指示を受けると、入出力処理部101はチャネルの
状態管理上、障害チャネルを5TOP状態とし、今後、
そのチャネルに向けて発行された入出力要求に対しては
チャネル5TOPの報告で応答する。
Further, upon receiving an instruction to set a channel unusable state from the T&D monitor 107, the input/output processing unit 101 sets the faulty channel to the 5TOP state for channel state management, and from now on,
It responds to input/output requests issued to that channel with a report of channel 5 TOP.

以上説明してきた動作を時間経過と関連づけて表したの
が第2図である。
FIG. 2 shows the operations described above in relation to the passage of time.

〔発明の効果〕〔Effect of the invention〕

以上説明したように、本発明は、障害が発生したチャネ
ルを一旦、入出力処理装置から切離した後サービスプロ
セッサから、チャネルに対して機能試験を行い、その結
果、正常終了ならばチャネルを再び入出力処理装置に組
込み、異常終了ならばエラー情報をサービスプロセッサ
に登録し、今後そのチャネルを使用不可能状態にする構
成としたため次の効果がある。
As explained above, in the present invention, a faulty channel is once disconnected from an input/output processing device, a service processor performs a functional test on the channel, and if the result is normal, the channel is reinserted. The system is built into the output processing device, and if an abnormal termination occurs, error information is registered in the service processor, and the channel is rendered unusable in the future, resulting in the following effects.

第1に、チャネルの全機能を網羅する試験を実行した結
果で、発生した障害が固定か間欠かを判別するので、障
害がn回発生するまでは無条件にチャネルを組み込む方
式で心配されるデータ化けを防ぐことができる。
First, the results of tests that cover all functions of the channel determine whether the fault that occurs is fixed or intermittent, so there is no need to worry about the method of unconditionally incorporating the channel until the fault occurs n times. Data corruption can be prevented.

第2に、入出力の負荷が低いチャネルで障害が発生した
場合でも、その障害が固定か間欠かを早期に判別するこ
とができる。
Second, even if a fault occurs in a channel with a low input/output load, it is possible to quickly determine whether the fault is fixed or intermittent.

第3に、無人運転のシステムで、特殊なシステム環境が
原因で障害発生したときでも、即時に、かつ自動的にT
&Dを実行し、異常終了すればそのエラー情報をサービ
スプロセッサに登録しておくので、障害が発生してから
長時間経過したときに、障害発生時と全く異なるシステ
ム環境で再現テストを行うことにより、はとんど再現不
可能となる問題を解消することができる。
Thirdly, in an unmanned system, even if a failure occurs due to a special system environment, the system can immediately and automatically
If &D is executed and it terminates abnormally, the error information is registered in the service processor, so when a long time has passed since the failure occurred, you can perform a reproduction test in a completely different system environment than when the failure occurred. , can solve problems that are almost impossible to reproduce.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例のブロック図、第2図は本発
明の処理方式の動作を時間経過と関連づけて表した図で
ある。 101・・・・・・入出力処理部、102・・・・・・
チャネル障害検出部、103・・・・・・チャネル接続
制御部、104・・・・・・チャネル接続部、105・
・・・・・チャネル、106・・・・・・ログ登録部、
107・・・・・・T&Dモニタ、108・・・・・・
T&D実行部、109・・・・・・障害検出、110・
・・・・・ログ送出、111・・・・・・障害検出、1
12・・・・・・CH状態設定指示。
FIG. 1 is a block diagram of an embodiment of the present invention, and FIG. 2 is a diagram showing the operation of the processing method of the present invention in relation to the passage of time. 101... Input/output processing unit, 102...
Channel failure detection unit, 103...Channel connection control unit, 104...Channel connection unit, 105...
...Channel, 106...Log registration section,
107...T&D monitor, 108...
T&D execution unit, 109... Failure detection, 110.
...Log sending, 111...Failure detection, 1
12...CH status setting instruction.

Claims (1)

【特許請求の範囲】 複数のチャネルが接続された入出力処理装置と、サービ
スプロセッサとを有し、前記サービスプロセッサが前記
入出力処理装置に前記チャネルの状態設定を指示する機
能をもつ情報処理装置におけるチャネル障害処理方式に
おいて、 前記チャネルで障害が発生したとき、該チャネルを前記
入出力処理装置から論理的に切離し、前記サービスプロ
セッサにその障害内容を報告する手段と、 前記サービスプロセッサがチャネルの障害報告を受け付
けたとき該チャネルの機能試験を行う手段と、 前記機能試験が正常に終了したときは上記障害チャネル
のエラー状態を解除して、前記入出力処理装置に論理的
に接続し、また、前記機能試験でエラーが検出されたと
きは、前記サービスプロセッサにエラー情報を登録し、
該チャネルを切離したままにする手段とを有することを
特徴とするチャネル障害処理方式。
[Scope of Claims] An information processing device comprising an input/output processing device to which a plurality of channels are connected and a service processor, wherein the service processor has a function of instructing the input/output processing device to set the state of the channel. In the channel fault handling method, when a fault occurs in the channel, means for logically separating the channel from the input/output processing device and reporting the details of the fault to the service processor; means for performing a functional test of the channel when the report is received; and when the functional test is successfully completed, releasing the error state of the faulty channel and logically connecting it to the input/output processing device; When an error is detected in the functional test, registering error information in the service processor;
means for keeping the channel disconnected.
JP2066460A 1990-03-15 1990-03-15 Channel fault processing system Pending JPH03265960A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2066460A JPH03265960A (en) 1990-03-15 1990-03-15 Channel fault processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2066460A JPH03265960A (en) 1990-03-15 1990-03-15 Channel fault processing system

Publications (1)

Publication Number Publication Date
JPH03265960A true JPH03265960A (en) 1991-11-27

Family

ID=13316405

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2066460A Pending JPH03265960A (en) 1990-03-15 1990-03-15 Channel fault processing system

Country Status (1)

Country Link
JP (1) JPH03265960A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008262538A (en) * 2007-01-30 2008-10-30 Hewlett-Packard Development Co Lp Method and system for handling input/output (i/o) errors

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008262538A (en) * 2007-01-30 2008-10-30 Hewlett-Packard Development Co Lp Method and system for handling input/output (i/o) errors
JP4641546B2 (en) * 2007-01-30 2011-03-02 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. Method and system for handling input / output (I / O) errors

Similar Documents

Publication Publication Date Title
JP3620527B2 (en) Failure analysis method for loop interface and system having failure analysis function
JPH11203157A (en) Redundancy device
JPH03265960A (en) Channel fault processing system
JP2827713B2 (en) Redundant device
JPH02216542A (en) Diagnosis execution control system
JPS62236056A (en) Input/output controller for information processing system
JP3156987B2 (en) Bus failure diagnosis method
JPS62271153A (en) Diagnostic system for common bus structure
JPS60134942A (en) Backup system for abnormal state
KR100257162B1 (en) Method and apparatus for supervising relative system in duplex system
JPH05224964A (en) Bus abnormality information system
JP2778691B2 (en) Bus monitoring circuit
JPH04243341A (en) Diagnostic system for data transmitter in loop data transmission system
Aitcheson et al. No. 1 ESS ADF: Maintenance Plan
JPH04340630A (en) Multiprocessor system
JPS62105243A (en) Recovery device for system fault
JPS60214052A (en) Error reporting system
JPS60195649A (en) Error reporting system of microprogram-controlled type data processor
JPS61136355A (en) Remote control system
JPH03156646A (en) Output system for fault information
JPH01163859A (en) Channel fault restoration controller
JP2001256081A (en) Information processor
JPH02183852A (en) Data processor
JPS58105358A (en) Maintenance method of data processor
JPH0215351A (en) Recovery processing system for serious fault in channel system