JP2730209B2 - I / O control method - Google Patents

I / O control method

Info

Publication number
JP2730209B2
JP2730209B2 JP1243916A JP24391689A JP2730209B2 JP 2730209 B2 JP2730209 B2 JP 2730209B2 JP 1243916 A JP1243916 A JP 1243916A JP 24391689 A JP24391689 A JP 24391689A JP 2730209 B2 JP2730209 B2 JP 2730209B2
Authority
JP
Japan
Prior art keywords
input
output
channel
path
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1243916A
Other languages
Japanese (ja)
Other versions
JPH03105540A (en
Inventor
憲司 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1243916A priority Critical patent/JP2730209B2/en
Publication of JPH03105540A publication Critical patent/JPH03105540A/en
Application granted granted Critical
Publication of JP2730209B2 publication Critical patent/JP2730209B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔概要〕 チャネル障害対策においてシステムリセットをする過
程の中で,障害チャネル配下の入出力装置を停止させる
時間を短縮させる入出力制御方式に関し, 障害チャネルと接続されたパス以外の入出力パスを持
つ入出力装置に対しては,チャネル障害対策処理部と入
出力要求処理部において障害入出力パスを認識し,チャ
ネルを制御するハードウェアであるI/Oプロセッサーに
障害入出力パスを選択しないように通知することによ
り,チャネル障害対策中でも入出力要求を実行させ,チ
ャネル障害によりシステムが停止する事を防止する事を
目的とし, 複数の入出力装置と,該複数の入出力装置の各々に対
して設けられた複数の入出力パスと,該入出力パス上に
あって入出力装置を制御するチャネルとを備え,該入出
力装置が,どのチャネルを使うかの選択をする入出力パ
ス選択を,チャネルを制御するハードウェアであるI/O
プロセッサーが行なう計算機システムにおいて,チャネ
ル障害を検出するチャネル障害検出部と,チャネル障害
の解析をし,その対策処理を行うチャネル障害対策処理
部と,入出力要求を実行する入出力要求処理部と,入出
力装置とチャネルとが接続していて,入出力要求の発行
を受け付けられる入出力パスにはオンを,受け付けられ
ない入出力パスにはオフを設定してある入出力要求発行
許可マスクと,障害を起こしている入出力パスにはオン
を,それ以外はオフを設定してある障害発生マスクを入
出力装置の情報として記憶している装置情報記憶部とを
有し,チャネル障害が発生すると,上記チャネル障害検
出部が障害を検出して,上記チャネル障害対策処理部に
障害を通知し,該チャネル障害対策処理部はチャネル障
害の解析処理を行い,障害入出力パスを検出するととも
に,上記入出力要求処理部はユーザプログラムからの入
出力要求を受け付けて,上記装置情報記憶部から入出力
要求発行許可マスクがオンであり,同時に障害発生マス
クがオフである入出力パスを設定して,該入出力要求を
I/Oプロセッサーに対して行うデータ処理装置を備える
ように構成する。
DETAILED DESCRIPTION OF THE INVENTION [Overview] An I / O control method for reducing the time required to stop an I / O device under a failed channel in the process of resetting the system in response to a channel failure, and relates to a path connected to the failed channel. For an I / O device that has an I / O path other than, the channel failure countermeasure processing unit and the I / O request processing unit recognize the failed I / O path and input a failure to the I / O processor that is the hardware that controls channels. By notifying the selection of the output path, the I / O request is executed even during the countermeasure for the channel failure, and the purpose is to prevent the system from being stopped due to the channel failure. A plurality of input / output paths provided for each of the output devices; and channels on the input / output paths for controlling the input / output devices. The output device selects the input / output path to select which channel to use, and the I / O is the hardware that controls the channel.
In a computer system performed by a processor, a channel failure detection unit that detects a channel failure, a channel failure countermeasure processing unit that analyzes a channel failure and performs countermeasure processing, an input / output request processing unit that executes an input / output request, An I / O request issuance permission mask in which an I / O device and a channel are connected and an I / O path that can accept issuance of I / O requests is set to ON and an I / O path that is not accepted is set to OFF; A device information storage unit that stores a failure occurrence mask in which an I / O path in which a failure has occurred is set to ON and an OFF otherwise is stored as information of an I / O device; The channel failure detection unit detects the failure and notifies the channel failure countermeasure processing unit of the failure, and the channel failure countermeasure processing unit performs a channel failure analysis process. The I / O request processing unit receives the I / O request from the user program, and the I / O request issuance permission mask is turned on from the device information storage unit. Set an I / O path that is off, and
It is configured to have a data processing device for the I / O processor.

〔産業上の利用分野〕[Industrial applications]

本発明は,チャネル障害対策においてシステムリセッ
トをする過程の中で,障害チャネル配下の入出力装置を
停止させる時間を短縮させる入出力制御方式に関する。
The present invention relates to an input / output control method for reducing the time for stopping input / output devices under a failed channel in the course of performing a system reset as a countermeasure for a channel failure.

近年のコンピュータシステムにおいてCPUの処理速度
の高速化に伴い,入出力装置の高速化が要求されてい
る。また,高信頼性システムの要求に伴い,障害装置の
早期検出とシステムによる早期回復が要求されている。
2. Description of the Related Art In recent computer systems, with an increase in the processing speed of a CPU, an increase in the speed of an input / output device has been required. Further, with the demand for a highly reliable system, early detection of a faulty device and early recovery by the system are required.

〔従来の技術〕[Conventional technology]

このため,入出力装置のパス選択をハード側にオフロ
ードすることにより,入出力パスの自動選択機能と入出
力要求の待ち管理機能をソフトウェアから開放し,CPUの
オーバヘッドを削減するシステムが提供されているが,
チャネル障害時におけるパス選択方式がないため,障害
チャネル配下の全入出力装置をチャネル障害対策処理が
完了するまでの間停止する必要があった。
Therefore, by offloading the I / O device path selection to the hardware side, a system is provided that releases the I / O path automatic selection function and the I / O request wait management function from software and reduces CPU overhead. But
Since there is no path selection method at the time of a channel failure, all input / output devices under the failed channel have to be stopped until the channel failure countermeasure processing is completed.

第2図に,入出力制御のハードウェア構成図を示す。 FIG. 2 shows a hardware configuration diagram of the input / output control.

図中,84と85と86と87はチャネルであり,90,91,92は入
出力装置であり,93はチャネル85に繋がる入出力装置90
の入出力パスであり,94はチャネル84に繋がる入出力装
置90の入出力パスである。95はチャネル86につながる入
出力装置90の入出力パスであり,96はチャネル87につな
がる入出力装置90の入出力パスである。88はチャネル8
4,85の制御をする入出力制御装置であり,89はチャネル8
6,87の制御をする入出力制御装置である。79はデータ処
理装置であり全体の処理を司る所である。80はチャネル
障害対策処理部であり,81は入出力要求処理部であり,82
は装置情報記憶部である。83はI/Oプロセッサーであ
り,入出力パスの選択をするハードウェアである。ここ
で,入出力パスは入出力をする際に経由するパスであ
り,チャネルがその間に介在する時は,チャネルパスと
言う呼称になる。尚,本図での計算機システムは,チャ
ネルと入出力装置との経路が動的に接続及び再接続され
るシステムである。このシステムでは,チャネル資源の
有効利用のためにディスク等が機械的動作を実行してい
る間,チャネルとの接続を切り離し,チャネルが他の仕
事をできるようになっている。更に,ディスク等がチャ
ネルと再接続する際には,その入出力操作を開始したシ
ステムと接続されている全てのチャネル経路の中から使
用可能なものが選択される。これを動的再結合機能(DP
R機能)という。
In the figure, 84, 85, 86, and 87 are channels, 90, 91, and 92 are input / output devices, and 93 is an input / output device 90 connected to the channel 85.
Reference numeral 94 denotes an input / output path of the input / output device 90 connected to the channel 84. Reference numeral 95 denotes an input / output path of the input / output device 90 connected to the channel 86, and reference numeral 96 denotes an input / output path of the input / output device 90 connected to the channel 87. 88 is channel 8
An input / output controller that controls 4,85, 89 is channel 8
It is an input / output control device that controls 6,87. Reference numeral 79 denotes a data processing device which controls the entire processing. 80 is a channel failure countermeasure processing unit, 81 is an input / output request processing unit, and 82
Denotes a device information storage unit. Reference numeral 83 denotes an I / O processor, which is hardware for selecting an input / output path. Here, the input / output path is a path through which input / output is performed, and when a channel is interposed therebetween, it is called a channel path. Note that the computer system in this figure is a system in which paths between channels and input / output devices are dynamically connected and reconnected. In this system, the connection with the channel is disconnected while the disk or the like is performing a mechanical operation for effective use of the channel resource, so that the channel can perform other work. Further, when a disk or the like is reconnected to a channel, a usable one is selected from all channel paths connected to the system that has started the input / output operation. This is called the dynamic recombination function (DP
R function).

第6図は,従来の技術の機能ブロック図である。まず
通常時の入出力処理について第2図のハードウェア構成
に沿って説明する。
FIG. 6 is a functional block diagram of a conventional technique. First, the normal input / output processing will be described with reference to the hardware configuration of FIG.

図中,101はチャネル障害検出部であり,チャネル障害
の発生を検出する。102は入出力統計方式による固定障
害検出部であり,主としてソフト障害を検出する。103
は入出力要求で,ユーザプログラムの入出力要求であ
る。104はチャネル障害対策処理部であり,105は入出力
要求処理部であり,106は装置情報記憶部であり,107はIO
P(I/Oプロセッサー)である。108は一般入出力要求のQ
uiesce部であり,入出力要求を一時的に静止させる。10
9は実行中入出力要求回収部であり,実行中の入出力を
停止させ待ち行列に入れる。110はリザーブパス切り替
え部であり,入出力情報の別の入出力パスに移す。111
はシステムリセット発行部であり,障害チャネル配下の
全入出力パス情報をリセットする。112はシステムリセ
ット解析部であり,システムリセットの結果を解析す
る。113はパスグループ再確立部であり,障害入出力パ
スを健全なパスグループに復帰させる。114は一般入出
力要求のQuiesce解除部であり,障害チャネル配下の入
出力要求の静止を解除する。115はリスタート要求部で
あり,待ちキュー上の入出力要求の再開をする。116は
入出力要求受け付け部であり,ユーザプログラムの入出
力要求を受け付ける。117はCCW作成部であり,チャネル
に入出力要求をする命令を作成する。118は入出力要求
発行依頼マスク決定部であり,上記パス群をパラメータ
にして入出力要求をする。121は入出力要求待ち管理部
であり,先行要求があると当該入出力要求を待たせる。
120はスタータス解析部であり,入出力の実行結果を解
析する。122は要求元への通知部であり,該実行結果を
ユーザプログラムに通知する。123は入出力要求再試行
部であり,実行結果が異常の時は再実行する。124はサ
ブチャネル番号で,入出力装置の番号が格納されてい
る。125はQuiesce制御情報で,入出力要求Quiesce部108
で静止された入出力要求の情報が格納されている。126
はリザーブ情報であり,ある入出力装置が持っている入
出力に関する情報である。128は入出力依頼マスクであ
り,入出力が可能な入出力パスが格納されている。129
はパスグループ情報であり,IOP107に入出力要求をする
際のパスグループが格納されている。131は起動パス選
択部であり,パスグループの中から実際に入出力をする
パスを選択する。132は入出力起動部であり,入出力要
求をチャネルに対して行う。133は動的パス再結合処理
部で,DPR機能を行う。
In the figure, reference numeral 101 denotes a channel failure detection unit which detects the occurrence of a channel failure. Reference numeral 102 denotes a fixed fault detection unit based on the input / output statistical method, which mainly detects a soft fault. 103
Is an input / output request, which is an input / output request of a user program. 104 is a channel failure countermeasure processing unit, 105 is an input / output request processing unit, 106 is a device information storage unit, and 107 is an IO
P (I / O processor). 108 is the general input / output request Q
The uiesce section temporarily stops input / output requests. Ten
Reference numeral 9 denotes an executing I / O request collection unit that stops the executing I / O and places it in a queue. Reference numeral 110 denotes a reserved path switching unit which transfers the input / output information to another input / output path. 111
Is a system reset issuing unit that resets all input / output path information under the failed channel. Reference numeral 112 denotes a system reset analysis unit that analyzes a result of the system reset. Reference numeral 113 denotes a path group re-establishment unit that returns a failed input / output path to a sound path group. Reference numeral 114 denotes a general input / output request quiesce canceling unit which cancels the quiescing of the input / output request under the faulty channel. A restart request unit 115 restarts an input / output request on the waiting queue. An input / output request receiving unit 116 receives an input / output request of a user program. Reference numeral 117 denotes a CCW creation unit that creates an instruction for making an input / output request to a channel. Reference numeral 118 denotes an input / output request issuance request mask determination unit, which makes an input / output request using the path group as a parameter. Reference numeral 121 denotes an input / output request waiting management unit, which waits for the input / output request when there is a preceding request.
Reference numeral 120 denotes a status analysis unit that analyzes an execution result of input / output. Reference numeral 122 denotes a notification unit for notifying the request source, and notifies the user program of the execution result. Reference numeral 123 denotes an input / output request retry unit, which re-executes when the execution result is abnormal. Reference numeral 124 denotes a subchannel number in which the number of an input / output device is stored. Reference numeral 125 denotes Quiesce control information.
The information of the input / output request quiesced in the table is stored. 126
Is reserved information, which is information relating to input / output possessed by a certain input / output device. Reference numeral 128 denotes an input / output request mask, which stores input / output paths that allow input / output. 129
Is path group information, which stores a path group when an I / O request is made to the IOP 107. Reference numeral 131 denotes an activation path selection unit that selects a path to be actually input / output from a path group. Reference numeral 132 denotes an input / output activation unit that issues an input / output request to a channel. Reference numeral 133 denotes a dynamic path reconnection processing unit which performs a DPR function.

尚,第6図中,第2図の処理と同一の処理をしている
ものがあるので以下に記す。第6図のチャネル障害対策
処理部104と第2図のチャネル障害対策処理部80は同一
のものである。これを104と80は同一と表す。以下同様
に105と79,106と82,107と83は同一である。
It should be noted that some processes in FIG. 6 are the same as those in FIG. 2 and are described below. The channel failure countermeasure processing unit 104 in FIG. 6 and the channel failure countermeasure processing unit 80 in FIG. 2 are the same. This indicates that 104 and 80 are the same. Similarly, 105 and 79, 106 and 82, and 107 and 83 are the same.

以上の構成で,通常の入出力要求があると,入出力要
求処理部105は,この入出力要求を受け付ける。CCW作成
部117でユーザが作成したCCWにシステムCCWを付加し,
入出力要求発行依頼マスク決定部118で入出力要求発行
依頼マスク(LPM)を設定し,入出力要求発行部119で入
出力要求(SSCH命令)を発行する。例えば,入出力装置
90に対する入出力要求の場合,当該装置に対して入出力
要求の発行が可能なパスは4本(93,94,95,96)存在
し,異常がなければこれらすべての入出力パスはオンラ
イン状態である。この場合,装置情報記憶部106の入出
力装置90に関する入出力依頼マスク128は,上述の4本
のパスに対応するマスクビットがオンとなっている。ま
た,入出力装置のパス選択をハードウェア側にオフロー
ドしたシステムにおいては,入出力装置は通常パスグル
ープを保持している。上述の4本のパスが当該装置のパ
スグループであり,動的パス再結合機能(DPR機能)に
より,このグループ内のどのパスを使用して再結合して
もよいようになっている。なお,このパスグループ情報
はハード側は入出力制御装置88が記憶している。
With the above configuration, when there is a normal input / output request, the input / output request processing unit 105 receives this input / output request. The CCW creation unit 117 adds the system CCW to the CCW created by the user,
The input / output request issuance request mask determination unit 118 sets an input / output request issuance request mask (LPM), and the input / output request issuance unit 119 issues an input / output request (SSCH instruction). For example, input / output devices
For I / O requests to 90, there are four paths (93,94,95,96) that can issue I / O requests to the device, and if there is no error, all of these I / O paths are online. It is. In this case, in the input / output request mask 128 for the input / output device 90 in the device information storage unit 106, the mask bits corresponding to the above-described four paths are on. In a system in which the path selection of the input / output device is offloaded to the hardware, the input / output device normally holds a path group. The above-mentioned four paths are a path group of the device, and a dynamic path reconnection function (DPR function) may be used to reconnect using any path in this group. The path group information is stored in the input / output control device 88 on the hardware side.

入出力要求処理部105では,入出力装置90に対して先
行要求がないかチェックし,もし既に入出力要求を実行
中であれば,入出力要求待ち管理部121で,当該要求を
待たせる。先行要求がなけば,入出力要求発行依頼マス
クを設定して入出力要求を発行する。
The input / output request processing unit 105 checks whether there is any preceding request to the input / output device 90. If the input / output request is already being executed, the input / output request wait management unit 121 causes the request to wait. If there is no preceding request, an I / O request issuance request is issued by setting an I / O request issuance request mask.

IOPがこの入出力要求を受け付けると,IOPは当該入出
力装置に対する起動パスを選択する。IOPは入出力装置
がどのチャネルに接続されているか認識しており,要求
された入出力装置に繋がるチャネルに対して順次起動を
かけていく。チャネルが他の入出力装置に対する入出力
要求を実行中の場合は,チャネル使用中となるが,この
場合ソフトウェアには通知せず,IOP内で次のチャネルを
選択し,再度起動を試みる。
When the IOP receives the input / output request, the IOP selects a boot path for the input / output device. The IOP recognizes which channel the input / output device is connected to, and sequentially activates the channel connected to the requested input / output device. If the channel is executing an I / O request to another I / O device, the channel is in use. In this case, the software is not notified, the next channel is selected in the IOP, and an attempt is made to start again.

入出力処理が完了すると,I/O割り込みがソフトウェア
に通知される。入出力要求処理部は,入出力要求の終了
状態とデバイスステータスを得るために,ステータスを
刈り取り(TSCH命令),解析を行う。入出力要求が正常
に終了していれば,要求元に正常終了を通知する。一
方,入出力要求が異常終了した場合,この異常状態を入
出力統計方式による固定障害検出部102に通知した後,
この入出力要求の再試行(ERP)をする。一定回数の再
試行を行っても正常終了しない場合は,入出力要求元に
対して,入出力処理が異常終了した旨を通知する。
When the input / output processing is completed, an I / O interrupt is notified to software. The input / output request processing unit cuts the status (TSCH instruction) and analyzes it to obtain the end state of the input / output request and the device status. If the I / O request has been completed normally, the request source is notified of the normal completion. On the other hand, if the I / O request ends abnormally, this abnormal state is notified to the fixed failure detection unit 102 using the I / O statistical method, and then
Retry (ERP) this I / O request. If the retry is not completed normally even after a certain number of retries, the I / O request source is notified that the I / O processing has ended abnormally.

次に,チャネル障害時における従来の技術での処理を
説明する。
Next, a description will be given of processing by a conventional technique when a channel failure occurs.

入出力装置に関する障害の検出には2種類ある。1つ
はハードウェアからマシンチェック割り込みにより通知
される重度のチャネル障害であり,1つは,統計的にシス
テム内で発生した入出力エラーを累積し,障害箇所を特
定するものである。
There are two types of fault detection for input / output devices. One is a severe channel failure notified from hardware by a machine check interrupt, and the other is to statistically accumulate input / output errors that have occurred in the system and identify the location of the failure.

入出力系のマシンチェック割り込みが報告されると,
チャネル障害検出部101は,STCRW命令を発行しステータ
スを刈り取り,どのチャネルの障害であるかを解析す
る。また,入出力統計方式による固定障害検出部では,
特定のチャネルだけ入出力エラーの発生頻度が高いと,
当該チャネルを障害であると判断する。こうして障害チ
ャネルを特定し,チャネル障害対策処理部104をスケジ
ュールする。例えば,マシンチェック割り込みにより,
チャネル84が障害であると通知されたと仮定する。
When an I / O machine check interrupt is reported,
The channel failure detection unit 101 issues an STCRW instruction, cuts the status, and analyzes which channel has a failure. In addition, in the fixed failure detection unit using the input / output statistical method,
If I / O errors occur frequently only for specific channels,
The channel is determined to be faulty. In this way, the failed channel is specified, and the channel failure countermeasure processing unit 104 is scheduled. For example, a machine check interrupt
Assume that channel 84 has been notified of a failure.

チャネル障害対策処理部104では,まず障害チャネル8
4配下の全入出力装置90,91,92が以降一般入出力要求を
受け付けても実行しないようにQuiesce部108で入出力要
求の静止処理を行い,待ちキュー上で待たせる。
In the channel failure countermeasure processing unit 104, first, the failure channel 8
4. The Quiesce unit 108 performs a quiesce process on the input / output request so that all the input / output devices 90, 91, and 92 under the control do not execute the general input / output request thereafter, and waits on the waiting queue.

次に,実行中入出力要求回収部109で現在実行中の入
出力装置に対して,HSCH命令を発行し,入出力要求を停
止させる。これはデータ転送中にシステムリセット(RC
HP命令)を発行すると,データの保証がとれないためで
ある。実行中だった入出力要求は強制的に終了させら
れ、擬似入出力エラーの形で再試行を待つことになる。
Next, the executing I / O request collection unit 109 issues an HSCH instruction to the currently executing I / O device to stop the I / O request. This is a system reset (RC
Issuing the HP instruction does not guarantee the data. The I / O request that was being executed will be forcibly terminated and will wait for a retry in the form of a pseudo I / O error.

また,チャネル障害対策処理部104が発行するHSCH命
令は,当該入出力装置が入出力要求静止中でも実行可能
なように制御してある。即ち,入出力要求静止中は,一
般入出力要求は待たされるが,チャネル障害対策処理部
104の入出力要求については実行可能なようにレベル制
御をしているのである。
Further, the HSCH instruction issued by the channel failure countermeasure processing unit 104 is controlled so that the HSCH instruction can be executed even while the input / output device is in the input / output request state. That is, while the I / O request is quiesced, the general I / O request is waited, but the channel failure countermeasure processing unit
The level control is performed so that the input / output request of 104 can be executed.

更に,当該入出力装置がリザーブを保持している場合
には,システムリセットによりリザーブ情報を失うこと
がないように,リザーブパス切り替え部110で別の入出
力パスにリザーブ情報を移す。これはURコマンドを別パ
スから実行することにより行う。なお,パスグループが
存在する場合は,システムリセットにより自動的にシス
テムリセット発行パスはグループから脱退させられ,残
りのパスグループにリザーブ情報が移るしくみになって
いるので,この場合はURコマンドを発行する必要はな
い。
Furthermore, when the input / output device holds the reserve, the reserve path switching unit 110 transfers the reserve information to another input / output path so that the reserve information is not lost due to the system reset. This is done by executing the UR command from another path. If a path group exists, the system reset automatically causes the system reset issue path to be withdrawn from the group, and reserve information is transferred to the remaining path groups. In this case, issue a UR command. do not have to.

以上の準備が完了した後,システムリセット発行部11
1でシステムリセットを障害チャネルに対して発行す
る。この命令により,障害チャネル及びチャネルに繋が
る配下の全入出力装置のチャネルパス経路がリセットさ
れる。
After the above preparations are completed, the system reset issuing unit 11
1 issues a system reset to the failed channel. With this instruction, the channel paths of the faulty channel and all the subordinate I / O devices connected to the channel are reset.

システムリセットの完了はシステムリセット解析部11
2でマシンチェック割り込みで通知される。システムリ
セットに成功すると,システムリセットの発行により脱
退させられた障害チャネルパスは健全なパスに戻ったの
で,再度パスグループに組み込むため,パスグループ再
確立部113でこの障害パスを指定してESTABLISHのI/Oを
発行する。この場合,入出力要求処理部105は,パス指
定がされていると,このパスを入出力要求発行依頼マス
ク128とし,且つ動的再結合(DPR)機能を禁止するため
に,SMPRコマンドを付加する。
Completion of system reset is performed by the system reset analysis unit 11.
It is notified by a machine check interrupt at 2. If the system reset succeeds, the failed channel path that has been withdrawn by issuing the system reset has returned to a healthy path. To incorporate the failed channel path into the path group again, the path group reestablishing unit 113 specifies this failed path and sets ESTABLISH. Issue I / O. In this case, if the path is specified, the input / output request processing unit 105 sets the path as the input / output request issue request mask 128 and adds the SMPR command to prohibit the dynamic reconnection (DPR) function. I do.

パスグループの再確立処理完了後,一般入出力要求の
Quiesce解除部114で障害チャネル配下の全入出力装置の
入出力要求の静止を解除し,一般入出力要求も実行可能
な状態にする。次に,リスタート要求部115で全入出力
装置に対してリスタート処理をスケジュールし,待ちキ
ュー上の入出力要求を実行する。この時点でパスグルー
プも障害前の状態に復帰しているので,通常時の入出力
処理と同じになる。
After the path group re-establishment process is completed,
The quiesce canceling unit 114 cancels the quiesce of the I / O requests of all the I / O devices under the failed channel, and makes the general I / O requests executable. Next, the restart request unit 115 schedules a restart process for all the input / output devices, and executes the input / output requests on the waiting queue. At this point, since the path group has also returned to the state before the failure, the input / output processing is the same as the normal input / output processing.

〔発明が解決しようとする課題〕[Problems to be solved by the invention]

以上のように,従来の技術では障害チャネル配下の入
出力装置にページングの対象となるデータセットを格納
している磁気ディスクのようなシステムに重要でアクセ
ス頻度の高い物が存在すると,この入出力装置に対する
入出力要求は障害チャネルの対策処理が完了するまで待
たされることになり,この間システムが停止する可能性
があるという問題が生じていた。
As described above, according to the conventional technology, if there is an important and frequently accessed object in a system such as a magnetic disk storing a data set to be paging in an input / output device under a failure channel, An input / output request to the device is waited until the countermeasure processing for the failed channel is completed, and during this time, there is a problem that the system may be stopped.

本発明は,障害チャネルと接続されたパス以外の入出
力パスを持つ入出力装置に対しては,チャネル障害対策
処理部と入出力要求処理部において障害入出力パスを認
識し,チャネルを制御するハードウェアであるI/Oプロ
セッサーに障害入出力パスを選択しないように通知する
ことにより,チャネル障害対策中でも入出力要求を実行
させ,チャネル障害によりシステムが停止する事を防止
する事を目的とする。
According to the present invention, for an I / O device having an I / O path other than the path connected to the failed channel, the channel failure countermeasure processing unit and the I / O request processing unit recognize the failed I / O path and control the channel. The purpose is to notify the hardware I / O processor not to select a failed I / O path so that I / O requests can be executed even during countermeasures against channel failures, thereby preventing the system from being stopped due to channel failures. .

〔課題を解決するための手段〕 第1図は,本発明の原理説明図である。[Means for Solving the Problems] FIG. 1 is a diagram illustrating the principle of the present invention.

図中,1はチャネル障害対策処理部であり,チャネル7
の障害を調査し,その対策処理を行う。2は入出力要求
処理部であり,チャネル障害時に,入出力要求を行う。
3は装置情報記憶部であり,入出力要求を発行しても良
い入出力パスと良くない入出力パスを表示する入出力要
求発行許可マスク4と障害が発生している入出力パスを
表示する障害発生マスク5とを有し,入出力装置の情報
を記憶している。6は以上全体の処理をするデータ処理
装置である。8は入出力装置であり,9は入出力パスであ
り,チャネル7が入出力装置8を制御する際の経路にな
る。10はI/Oプロセッサーで入出力パスの選択をするハ
ードウェアである。11はチャネル障害検出部であり,チ
ャネル障害の検出をする。
In the figure, reference numeral 1 denotes a channel failure countermeasure processing unit,
Investigate any failures and take countermeasures. Reference numeral 2 denotes an input / output request processing unit that makes an input / output request when a channel fails.
Reference numeral 3 denotes an apparatus information storage unit, which displays an I / O request issuance permission mask 4 for displaying an I / O path which may or may not issue an I / O request and an I / O path in which a failure has occurred. It has a fault occurrence mask 5 and stores information on input / output devices. Reference numeral 6 denotes a data processing device that performs the entire processing described above. Reference numeral 8 denotes an input / output device, 9 denotes an input / output path, and serves as a path when the channel 7 controls the input / output device 8. Reference numeral 10 denotes hardware for selecting an input / output path by an I / O processor. Reference numeral 11 denotes a channel failure detection unit that detects a channel failure.

尚,第1図中,第2図と同一のものがあるので以下に
示す。第1図中のチャネル障害対策処理部1と第2図の
チャネル障害対策処理部80は同一である。これを略して
1と80は同一と表す。以下同様にして2と81,3と82,6と
79,10と83は同一である。
1 are the same as those in FIG. 2 and are shown below. The channel failure countermeasure processing unit 1 in FIG. 1 and the channel failure countermeasure processing unit 80 in FIG. 2 are the same. For simplicity, 1 and 80 are the same. Similarly, 2 and 81, 3 and 82, 6
79, 10 and 83 are identical.

以上の構成で,チャネル障害が発生すると,データ処
理装置6の中のチャネル障害検出部11がチャネル障害対
策処理部1に障害を通知する。チャネル障害対策処理部
1は障害チャネル配下の入出力装置8を一時的に停止さ
せ,装置情報記憶部3に入出力装置8ごとに障害入出力
パスを障害発生マスク5に記憶させ,障害対策中である
旨を表示する。この後,障害チャネル配下の全入出力装
置8に対して実行中の入出力要求の回収をする。この
後,入出力要求の停止を解除し,入出力要求のリスター
トを入出力要求処理部2に依頼する。入出力要求処理部
2は,入出力要求可能なパスを検出し,入出力装置への
入出力要求を入出力可能なパスをパラメータにして行
う。次に,チャネル障害対策処理部1はシステムリセッ
トを発行する。次に,障害発生マスクをリセットし,障
害対策処理中表示をオフにする。
With the above configuration, when a channel failure occurs, the channel failure detection unit 11 in the data processing device 6 notifies the channel failure countermeasure processing unit 1 of the failure. The channel failure countermeasure processing unit 1 temporarily stops the input / output device 8 under the fault channel, stores the fault input / output path in the device information storage unit 3 in the fault occurrence mask 5 for each input / output device 8, Is displayed. Thereafter, the input / output requests being executed for all the input / output devices 8 under the failed channel are collected. Thereafter, the suspension of the I / O request is released, and the I / O request processing unit 2 is requested to restart the I / O request. The input / output request processing unit 2 detects an input / output requestable path and performs an input / output request to the input / output device using the input / output path as a parameter. Next, the channel failure countermeasure processing unit 1 issues a system reset. Next, the fault occurrence mask is reset, and the display during the fault countermeasure processing is turned off.

〔作用〕[Action]

以上のように,本発明では,障害が発生した入出力パ
スを障害発生マスクとして装置情報記憶部に記憶させ,
入出力要求発行許可マスクと該障害発生マスクとによっ
て入出力が可能なパスを決定し,この入出力可能なパス
を引数にしてシステムリセット発行時に入出力要求を行
う事により,チャネル障害対策処理部が障害チャネルに
対してシステムリセットを発行し対策処理を実行中で
も,他の入出力パスを使用して入出力要求の実行が可能
となる。
As described above, according to the present invention, a failure input / output path is stored in the device information storage unit as a failure occurrence mask.
The I / O request issue permission mask and the fault occurrence mask determine a path through which I / O can be performed, and an I / O request is issued when a system reset is issued using the I / O-enabled path as an argument. Can issue an I / O request using another I / O path even while issuing a system reset to the failed channel and executing countermeasure processing.

〔実施例〕〔Example〕

第3図に本発明の一実施例の機能ブロック図を示す。
ただし,斜線の引かれたボックスは従来の技術と異なっ
た部分を示す。
FIG. 3 shows a functional block diagram of one embodiment of the present invention.
However, the hatched boxes indicate different parts from the conventional technology.

第3図は,第6図とほぼ同じなので,従来の技術に比
して本発明で変更したものについて説明する。
FIG. 3 is substantially the same as FIG. 6, and therefore, a description will be given of a modified example of the present invention as compared with the prior art.

45が障害対策中表示と障害発生パスマスクの設定部で
あり,チャネル障害時に設定されるものである。53は障
害対策中解除と障害発生パスマスクのリセット部であ
り,障害が解除した時に行われる処理である。56はSMPR
コマンド付加部であり,入出力要求のあったチャネルに
データを返すものである。58は障害発生パスマスクと排
他的論理和をとる処理部であり,障害中において入出力
要求可能なパスを設定する。71は障害対策処理表示であ
り,チャネル障害がおこっている事を示す。72は障害発
生パスマスクであり,障害をおこしているパスを示す。
Numeral 45 is a setting section for the display of the in-progress countermeasure and the path mask of the fault occurrence, which is set when a channel fault occurs. Numeral 53 denotes a reset unit for resetting during failure countermeasures and for resetting a faulty path mask, and is performed when the fault is cleared. 56 is SMPR
A command addition unit that returns data to the channel for which input / output has been requested. Reference numeral 58 denotes a processing unit that performs an exclusive OR operation with the faulty path mask, and sets a path that can be input / output requested during the fault. A failure countermeasure processing display 71 indicates that a channel failure has occurred. Reference numeral 72 denotes a failure path mask, which indicates a path in which a failure has occurred.

尚,第3図中,第6図と同一のものがあるので以下に
示す。例えば,第3図のチャネル障害検出部37と第6図
のチャネル障害検出部101とは同一である。これを略し
て37と101は同一と表す。以下同様に38と102,39と103,4
4と108,46と109,47と110,48と114,49と115,50と111,51
と112,52と113,54と116,55と117,57と118,59と119,61と
121,60と120,62と122,63と123,64と124,65と125,66と12
6,68と128,69と129,73と131,74と132,75と133は同一で
ある。全体の機能として,40と104,41と105,42と106,43
と107がそれぞれ同一機能のものとして対応している。
Note that, in FIG. 3, the same components as those in FIG. 6 are shown below. For example, the channel failure detection unit 37 in FIG. 3 is the same as the channel failure detection unit 101 in FIG. For simplicity, 37 and 101 are the same. Similarly, 38 and 102, 39 and 103, 4
4 and 108, 46 and 109, 47 and 110, 48 and 114, 49 and 115, 50 and 111, 51
And 112,52 and 113,54 and 116,55 and 117,57 and 118,59 and 119,61
121,60 and 120,62 and 122,63 and 123,64 and 124,65 and 125,66 and 12
6,68 and 128, 69 and 129, 73 and 131, 74 and 132, 75 and 133 are the same. As a whole function, 40 and 104, 41 and 105, 42 and 106, 43
And 107 have the same function.

ここでは,第2図のハードウェア構成図に即して本発
明により改善された部分を中心に説明する。
Here, a description will be given mainly of a portion improved by the present invention with reference to the hardware configuration diagram of FIG.

尚,第3図中,第2図の処理と同一のものがあるの
で,混乱を避けるために以下に記す。第3図のチャネル
障害対策処理部40と第2図のチャネル障害対策処理部80
は同一である。これを略して40と80は同一と書き表わ
す。以下同様にして41と81,42と82,43と83は同一であ
る。
Note that, in FIG. 3, there is the same processing as that in FIG. 2, so that it is described below to avoid confusion. The channel failure countermeasure processing unit 40 of FIG. 3 and the channel failure countermeasure processing unit 80 of FIG.
Are the same. For short, 40 and 80 are written as the same. Similarly, 41 and 81, 42 and 82, and 43 and 83 are the same.

第3図の構成の下で,チャネル障害対策処理部40で
は,まず障害チャネル84配下の全入出力装置90,91,92が
以降一般入出力要求を受け付けても実行しないように待
ちキューに待たせて,一般入出力要求のQuiesce部44
で,入出力要求の静止処理を行う。次に,障害チャネル
配下の全装置に対して,障害対策中表示と障害発生パス
マスクの設定部45で障害対策中表示と障害発生パスマス
ク(42,71,72)の設定をしておく。次に,実行中入出力
要求回収部46で現在実行中の入出力装置に対して,入出
力要求を停止させる。実行中だった入出力要求は強制的
に終了させられ,擬似入出力エラーの形で再試行を待つ
ことになる。次に,リザーブパス切り替え部47で当該入
出力装置が保持しているリザーブ情報66を別の入出力パ
スに移す。
In the configuration of FIG. 3, the channel failure countermeasure processing unit 40 first waits in a wait queue so that all the input / output devices 90, 91, and 92 under the failure channel 84 will not execute even if they receive a general input / output request thereafter. The quiesce part 44 of the general input / output request
Then, the input / output request is quiesced. Next, for all the devices under the failure channel, the display for failure recovery and the setting of the failure path mask 45 are set for the display for failure recovery and the failure path masks (42, 71, 72). Next, the executing input / output request collection unit 46 stops the input / output request for the currently executing input / output device. The I / O request that was being executed will be forcibly terminated and will wait for a retry in the form of a pseudo I / O error. Next, the reserved path switching unit 47 transfers the reserved information 66 held by the input / output device to another input / output path.

以上の準備が完了した時点で、障害チャネルパス以外
のオンラインパスから入出力要求を実行することが可能
となる。これはシステムリセットの影響範囲が障害チャ
ネルとチャネルに繋がる配下の全入出力装置のチャネル
経路パスだからである。ここで,障害チャネル84に対し
てシステムリセット発行中に,障害チャネル配下の入出
力装置90に対して,障害チャネルとは別のチャネルを使
用したパス95を使用して,入出力要求を実行することを
考える。一般入出力要求のQuiesce解除部48で障害チャ
ネル配下の全入出力装置の入出力要求の静止を解除し,
一般入出力要求も実行可能な状態にし,リスタート要求
部49で全入出力装置に対してリスタート処理をスケジュ
ールする。これにより待ちキュー上の入出力要求が実行
される。
When the above preparation is completed, it is possible to execute an input / output request from an online path other than the failed channel path. This is because the range affected by the system reset is the channel path of all the input / output devices under the failure channel and the subordinate channels. Here, while a system reset is issued to the failed channel 84, an I / O request is executed to the I / O device 90 under the failed channel using the path 95 using a channel different from the failed channel. Think about it. The quiesce release unit 48 for general I / O requests releases the quiesce of I / O requests of all I / O devices under the failed channel,
The general input / output request is also made executable, and the restart request unit 49 schedules restart processing for all input / output devices. As a result, an input / output request on the waiting queue is executed.

入出力要求処理部41では,当該入出力装置が障害対策
処理中であると,SMPRコマンド付加部56でSMPRコマンド
を付加し,動的再結合を禁止する。次に,障害発生パス
マスクと排他的論理和を取る処理部58で現在入出力要求
発行可能であると考えている入出力依頼マスク(この時
点では入出力装置90の入出力依頼マスク68は4本の入出
力パス93,94,95,96の全てに対応するビットがオンにな
っている。)と,チャネル障害対策処理部40が設定した
障害発生パスマスクと排他的論理和をとり,障害チャネ
ルパスを選択しないようにする。
In the input / output request processing unit 41, if the input / output device is in the process of taking measures against a failure, the SMPR command adding unit 56 adds an SMPR command to prohibit dynamic reconnection. Next, an I / O request mask that is currently considered to be able to issue an I / O request in the processing unit 58 that takes an exclusive OR with the faulty path mask (at this time, there are four I / O request masks 68 of the I / O device 90). The bits corresponding to all of the input / output paths 93, 94, 95, and 96 are turned on.) And the failure path mask set by the channel failure countermeasure processing unit 40 are exclusive-ORed, and the failure channel path is taken. Do not select.

こうして入出力装置90に対して,入出力発行依頼マス
ク(入出力パス93,95,96に対応するビットがオン)の状
態でIOPに入出力要求を依頼する。IOPでは,この3本の
パスの中から1つのパスを選択し起動をかける。また,
再結合時もSMPRコンドが付加されているため,起動をか
けたパスと同じパスで再結合させる。ここで,もし3本
のパスで入出力要求を依頼し,SMPRコマンドを付加しな
かったとしたら,入出力制御装置88は依然として4本の
パスでパスグループを形成していると信じているため,
障害チャネルパス94で再結合する可能性がある。この場
合,当該パスでシステムリセットとぶつかると,この入
出力要求の完了割り込みが喪失してしまう。
Thus, the I / O device 90 is requested to make an I / O request to the IOP with the I / O issuance request mask (the bits corresponding to the I / O paths 93, 95, and 96 are on). In the IOP, one of the three paths is selected and activated. Also,
At the time of reconnection, the SMPR command is added, so reconnection is performed using the same path as the path that was started. Here, if the I / O request is requested through three paths and the SMPR command is not added, the I / O controller 88 still believes that the path group is formed by the four paths.
There is a possibility of rejoining on the failed channel path 94. In this case, if the path encounters a system reset, the completion interrupt of the input / output request is lost.

このように障害チャネル配下の全装置に対して一般入
出力要求の実行を許した状態で,システムリセット発行
部50で非同期に障害チャネルに対してシステムリセット
を発行する。システムリセットに成功すると,パスグル
ープ再確立部52でシステムリセットの発行により脱退さ
せられた障害チャネルパスは健全なパスに戻ったので,
再度パスグループに組み込むため,この障害パス94を指
定してESTABLISHのI/Oを発行する。パスグループの再確
立の完了後,障害対策中解除と障害発生パスマスクのリ
セット部53で障害対策処理中の表示を解除し,障害発生
パスマスクをリセットする。以降は,入出力要求処理部
41は,障害対策処理中ではないので通常の入出力処理を
行うことになる。
As described above, the system reset issuance unit 50 asynchronously issues a system reset to the failed channel in a state where execution of the general input / output request is permitted to all devices under the failed channel. If the system reset is successful, the failed channel path that has been withdrawn by issuing the system reset in the path group reestablishment unit 52 has returned to a healthy path.
ESTABLISH I / O is issued by specifying this faulty path 94 so that it can be included in the path group again. After the reestablishment of the path group is completed, the display during the troubleshooting is canceled by the resetting unit 53 and the faulty path mask is reset. Hereafter, the I / O request processing unit
No. 41 performs normal input / output processing since the failure countermeasure processing is not being performed.

次に,第4図に装置情報記憶部の詳細図を示す。 Next, FIG. 4 shows a detailed view of the device information storage unit.

第4図中,151は1台の入出力装置情報に関する装置情
報記憶部である。以下1台の入出力装置情報に関して,1
52は障害対策処理中表示部であり,ここがオンの時は障
害処理中であり,オフの時は障害対策を行っていないと
いう事である。153は入出力要求発行許可マスクであ
り,入出力要求の発行をして良いチャネルパスとしては
いけないチャネルパスとを示す。マスク値が1のパスは
入出力要求発行可能であり,0のパスは発行不可能である
事を示す。154は障害発生マスクであり,障害の起こっ
たチャネルパスを示す。155はマスクAで入出力要求発
行許可マスクの例である。156はマスクBで障害発生マ
スクの例である。マスクAとマスクBの排他的論理和を
とる事により障害チャネルパスから入出力要求を発行し
ないように制御できる。
In FIG. 4, reference numeral 151 denotes a device information storage unit relating to information of one input / output device. In the following, regarding one I / O device information, 1
Reference numeral 52 denotes a failure countermeasurement processing display section. When this is on, the fault is being processed, and when it is off, no failure countermeasure is being taken. Reference numeral 153 denotes an I / O request issuance permission mask, which indicates a channel path that is not allowed to issue an I / O request. A path with a mask value of 1 indicates that an input / output request can be issued, and a path with a mask value of 0 indicates that the path cannot be issued. Reference numeral 154 denotes a failure occurrence mask, which indicates a failed channel path. Reference numeral 155 denotes a mask A, which is an example of an input / output request issuance permission mask. Reference numeral 156 denotes a mask B, which is an example of a failure occurrence mask. By taking the exclusive OR of the mask A and the mask B, it is possible to control not to issue an input / output request from the failed channel path.

最後に,本発明の処理と従来技術の処理の違いをタイ
ムチャートによって示す。
Finally, the difference between the processing of the present invention and the processing of the prior art is shown by a time chart.

第5図は,障害処理のタイムチャート図である。第5
図の上部は,従来の技術による障害処理のタイムチャー
ト図であり,下部は本発明による障害処理のタイムチャ
ート図である。
FIG. 5 is a time chart of the failure processing. Fifth
The upper part of the figure is a time chart of the failure processing according to the conventional technique, and the lower part is a time chart of the failure processing according to the present invention.

第5図の障害処理の図は,第2図の構成図でのチャネ
ル84とチャネル85の動作を示している。タイムチャート
は,チャネル84に障害が起こってから障害が復旧するま
での処理を示している。各処理ステップの詳細は既に説
明をしたので省略する。図に示すように従来技術では,
チャネル84に障害が発生してからその障害が復旧しリス
タートするまでの間,処理は中断状態となるが,本発明
では,入出力処理部がI/O要求を発行し,健全なチャネ
ル85が入出力処理を開始してからは通常の処理を再開で
きる。即ち,本発明では,入出力処理の再開が従来技術
に比して著しく早まる。
The fault processing diagram of FIG. 5 shows the operation of the channels 84 and 85 in the configuration diagram of FIG. The time chart shows processing from the occurrence of a failure in the channel 84 to the recovery from the failure. The details of each processing step have already been described, and a description thereof will be omitted. As shown in the figure,
The processing is suspended from the occurrence of a failure in the channel 84 until the failure is recovered and restarted. However, in the present invention, the I / O processing unit issues an I / O request and the After the start of the input / output processing, the normal processing can be resumed. That is, in the present invention, the resumption of the input / output processing is remarkably quicker than in the related art.

〔発明の効果〕〔The invention's effect〕

以上のように,本発明によればチャネル障害が発生し
ても,障害チャネル配下の入出力装置に対する入出力要
求の実行を,障害チャネルの回復処理をしている間にも
行う事が可能となり,システムにおいて入出力処理の高
速化に寄与する所が大きい。
As described above, according to the present invention, even if a channel failure occurs, it is possible to execute an I / O request to an I / O device under the failed channel even during the recovery process of the failed channel. This greatly contributes to speeding up the input / output processing in the system.

【図面の簡単な説明】[Brief description of the drawings]

第1図は,本発明の原理説明図であり, 第2図は,入出力制御のハードウェア構成図であり, 第3図は,本発明の一実施例の機能ブロック図であり, 第4図は,装置情報記憶部の詳細図であり, 第5図は,障害処理のタイムチャート図であり, 第6図は,従来の技術の機能ブロック図である。 第1図中, 1はチャネル障害対策処理部であり,2は入出力要求処理
部であり,3は装置情報記憶部であり,4は入出力要求発行
許可マスクであり,5は障害発生マスクであり,6はデータ
処理装置であり,7はチャネルであり,8は入出力装置であ
り,9は入出力パスであり,10はI/Oプロセッサー(IOP)
であり,11はチャネル障害検出部である。
FIG. 1 is a diagram for explaining the principle of the present invention, FIG. 2 is a hardware configuration diagram of input / output control, FIG. 3 is a functional block diagram of an embodiment of the present invention, and FIG. FIG. 5 is a detailed diagram of a device information storage unit. FIG. 5 is a time chart of a failure process. FIG. 6 is a functional block diagram of a conventional technique. In FIG. 1, 1 is a channel failure countermeasure processing unit, 2 is an I / O request processing unit, 3 is a device information storage unit, 4 is an I / O request issuance permission mask, and 5 is a failure occurrence mask. , 6 is a data processing device, 7 is a channel, 8 is an input / output device, 9 is an input / output path, and 10 is an I / O processor (IOP).
And 11 is a channel failure detection unit.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】入出力要求を実行する入出力要求処理部
(2)と, 複数の入出力装置(8)と,該入出力装置(8)を制御
するチャネル(7)と、該複数の入出力装置(8)と該
チャネル(7)の各々に対して設けられた入出力パス
(9)と、 該入出力要求の可および不可のパスを記憶する装置情報
記憶部(3)と、 入出力要求に対してどの入出力パスを使用するかを選択
するI/Oプロセッサー(10)とを有する計算機システム
において、 チャネルの障害を検出するチャネル障害検出部(11)
と,チャネルの障害の解析をしてその対策処理を行うチ
ャネル障害対策処理部(1)とを設け、 入出力障害が発生すると,上記チャネル障害検出部(1
1)が障害を検出して,上記チャネル障害対策処理部
(1)に障害を通知し,該チャネル障害対策処理部
(1)はチャネル障害の解析を行い,障害となった入出
力パスを上記装置情報記憶部(3)に記憶し、 上記入出力要求処理部(2)はユーザプログラムからの
入出力要求を受け付けて,上記装置情報記憶部(3)を
参照して入出力処理を継続し, 同時に上記チャネル障害対策処理部(1)は障害発生パ
スを中断して障害パス上の入出力命令を解除し,リスタ
ート要求処理を実行して、回復したパスを上記装置情報
記憶部(3)に記憶させ入出力処理命令を続行させるこ
とを特徴とする入出力制御方式。
An input / output request processing unit for executing an input / output request; a plurality of input / output devices; a channel for controlling the input / output device; An input / output path (9) provided for each of the input / output device (8) and the channel (7); a device information storage unit (3) for storing paths for which the input / output requests are allowed and disabled; In a computer system having an I / O processor (10) for selecting which I / O path to use for an I / O request, a channel failure detector (11) for detecting a channel failure
And a channel failure countermeasure processing unit (1) for analyzing channel faults and performing countermeasure processing. When an input / output fault occurs, the channel fault detection unit (1) is used.
1) detects the failure and notifies the channel failure countermeasure processing unit (1) of the failure. The channel failure countermeasure processing unit (1) analyzes the channel failure and identifies the failed input / output path as described above. The input / output request processing unit (2) receives the input / output request from the user program, and continues the input / output processing by referring to the device information storage unit (3). At the same time, the channel failure countermeasure processing unit (1) interrupts the faulty path, releases the I / O command on the failed path, executes a restart request process, and stores the recovered path in the device information storage unit (3). ), The input / output processing instruction is continued.
JP1243916A 1989-09-20 1989-09-20 I / O control method Expired - Lifetime JP2730209B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1243916A JP2730209B2 (en) 1989-09-20 1989-09-20 I / O control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1243916A JP2730209B2 (en) 1989-09-20 1989-09-20 I / O control method

Publications (2)

Publication Number Publication Date
JPH03105540A JPH03105540A (en) 1991-05-02
JP2730209B2 true JP2730209B2 (en) 1998-03-25

Family

ID=17110922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1243916A Expired - Lifetime JP2730209B2 (en) 1989-09-20 1989-09-20 I / O control method

Country Status (1)

Country Link
JP (1) JP2730209B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7454533B2 (en) 2004-02-06 2008-11-18 Nec Corporation Redundant path control apparatus and redundant path control method

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2591002B2 (en) * 1988-01-11 1997-03-19 日本電気株式会社 Information processing device

Also Published As

Publication number Publication date
JPH03105540A (en) 1991-05-02

Similar Documents

Publication Publication Date Title
JP2552651B2 (en) Reconfigurable dual processor system
JP3196004B2 (en) Failure recovery processing method
JPH05181823A (en) Method and apparatus for controlling block in block partitioning type process environment
JP4315016B2 (en) System switching method for computer system
US5983359A (en) Processor fault recovering method for information processing system
JP2730209B2 (en) I / O control method
JP2021002144A (en) Information processing device, control method of information processing device, and control program of information processing device
JPH02294739A (en) Fault detecting system
JP2823230B2 (en) How to continue processing
JPH06274354A (en) Method and system for control of operation of destructive hardware
JPH10116261A (en) Check point restarting method for parallel computer system
JPS6146543A (en) Fault processing system of transfer device
JP2814988B2 (en) Failure handling method
JPH1049394A (en) System and method for processing fault
JPH0411890B2 (en)
JP3153977B2 (en) Information processing device
JPH03156646A (en) Output system for fault information
JPS63255742A (en) Data processor
JPS60171544A (en) Self-diagnosis device for abnormality of computer system
JPS63200242A (en) System switching system for hot stand-by system
JPS584365B2 (en) Reset control system
JPH08328989A (en) Managing system for input/output controller
JP2000353104A (en) Data backup system and its method
JPS61101845A (en) Test system of information processor
JPH02188863A (en) Multiprocessor system