JPH10275116A - Computer system - Google Patents

Computer system

Info

Publication number
JPH10275116A
JPH10275116A JP9078652A JP7865297A JPH10275116A JP H10275116 A JPH10275116 A JP H10275116A JP 9078652 A JP9078652 A JP 9078652A JP 7865297 A JP7865297 A JP 7865297A JP H10275116 A JPH10275116 A JP H10275116A
Authority
JP
Japan
Prior art keywords
input
computer system
output device
output
management table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9078652A
Other languages
Japanese (ja)
Inventor
Hisashi Kato
尚志 加藤
Takashi Hatada
貴史 畑田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP9078652A priority Critical patent/JPH10275116A/en
Publication of JPH10275116A publication Critical patent/JPH10275116A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To allow the computer system to operate adaptively to a fault state without stopping the computer system even if a fault occurs in an input/output device by determining whether or not an input/output request of the input/output device is outputted by referring to a device management table. SOLUTION: A RAS process part 2 receives error detection signal from input/output devices 6a to 6c and performs necessary processes. The device management table 3 holds the states of the input/output devices 6a to 6c which can be changed according to a signal from the RAS process part 2. Device drivers 4a to 4c determine whether or not input/output requests are outputted according to the states of the input/output devices 6a to 6c by referring to the device management table 3. Consequently, even if a fault occurs in one of the input/output devices 6a to 6c, the computer system 1 can be placed in operation according to the fault state without being stopped.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、入出力装置を備
えた計算機システムに係り、特に入出力装置に障害が発
生した場合の処理機構を有する計算機システムに関する
ものである。
The present invention relates to a computer system having an input / output device, and more particularly to a computer system having a processing mechanism when a failure occurs in an input / output device.

【0002】[0002]

【従来の技術】従来から、計算機システムが入出力装置
の障害発生を検知した場合には、その計算機システムは
原因を特定して対応処理を行っている。この処理方法と
しては主に以下の2つの方法が用いられている。
2. Description of the Related Art Conventionally, when a computer system detects the occurrence of a failure in an input / output device, the computer system specifies the cause and performs a corresponding process. As this processing method, the following two methods are mainly used.

【0003】第1の処理方法としては、例えば「PCI
SYSTEM ARCHITECTURE(PCIシ
ステムアーキテクチャ)」(1995年2月:Addi
son−Wesley Publishing Com
pany(アジソンウェスリー出版社)ISBN 0−
201−40993−3)のChapter10(第1
0章)「Error Detection and H
andling(エラー検出及び処理)」に記載された
ものがある。
As a first processing method, for example, “PCI
SYSTEM ARCHITECTURE (PCI System Architecture) "(February 1995: Addi)
son-Wesley Publishing Com
pany (Addison Wesley Publishing Company) ISBN 0-
201-40993-3) Chapter 10 (first
Chapter 0) "Error Detection and H
and (error detection and processing).

【0004】図18はこの文献に開示されたような入出
力装置からのエラー通知処理方式の構成を示すブロック
図である。図18において、181は計算機システム、
185は計算機システム181のPCIバス、6d及び
6eはPCIバス185に接続されたハードディスクや
ディスプレイ等の入出力装置である。計算機システム1
81は、入出力装置6d,6eからのエラーを通知する
割り込み信号を検出して対応する処理を実施するオペレ
ーションシステム(以下、OSと表記する)184を有
している。
FIG. 18 is a block diagram showing a configuration of a method of processing an error notification from an input / output device as disclosed in this document. In FIG. 18, reference numeral 181 denotes a computer system;
185 is a PCI bus of the computer system 181, and 6d and 6e are input / output devices such as a hard disk and a display connected to the PCI bus 185. Computer system 1
81 has an operation system (hereinafter referred to as OS) 184 that detects an interrupt signal for notifying an error from the input / output devices 6d and 6e and performs a corresponding process.

【0005】次に動作について説明する。この方式によ
れば、PCIバス185に接続された入出力装置6dま
たは6eからエラー割り込み信号が入力された場合に
は、OS184はこのエラー割り込み信号に対処するた
めに、それぞれの計算機システム181で規定された所
定の処理を実行する。この方式のPCIバスの規定で
は、PCIバス185を介してのエラー割り込みに対す
る統一的な処理は指定されておらず、各計算機システム
181毎の前記所定の処理に任されており、この所定の
処理としてはシステム停止処置がとられる場合がある。
Next, the operation will be described. According to this method, when an error interrupt signal is input from the input / output device 6d or 6e connected to the PCI bus 185, the OS 184 specifies in each computer system 181 to cope with the error interrupt signal. The specified processing is performed. In the specification of the PCI bus of this system, unified processing for an error interrupt via the PCI bus 185 is not specified, but is left to the predetermined processing for each computer system 181. In some cases, the system is stopped.

【0006】入出力装置の障害発生時の第2の処理方法
としては、例えば特開平8−171520号公報に記載
されたものがある。図19はこの第2の処理方法を示す
フローチャートである。
As a second processing method when a failure occurs in an input / output device, for example, there is a method described in Japanese Patent Application Laid-Open No. 8-171520. FIG. 19 is a flowchart showing the second processing method.

【0007】この方法によれば、アプリケーションプロ
グラムが起動され(ステップA1)、I/O装置である
かメモリであるか、あるいはどのアドレスに対応するパ
ッケージ番号のI/O装置またはメモリであるかを示し
たパラメータを用意し(ステップA2)、共通サブルー
チンに引き渡す(ステップA3)。共通サブルーチン
は、引き渡されたパラメータを障害索引テーブルに格納
するとともに、I/O装置やメモリに対してアクセスを
行う関数を起動する(ステップA4)。関数は、該当す
るI/O装置あるいはメモリに対してアクセスをしに行
く(ステップA5)が、アクセスしたパッケージに障害
があったとすると、NMI(Non Maskable
Interrupt)を発生させるXack Tim
e Outが発生する(ステップA6)。
According to this method, an application program is started (step A1), and it is determined whether the device is an I / O device or a memory, or to which address the package number corresponds to the I / O device or the memory. The indicated parameters are prepared (step A2) and passed to the common subroutine (step A3). The common subroutine stores the passed parameters in the failure index table and activates a function for accessing the I / O device and the memory (step A4). The function goes to access the corresponding I / O device or memory (step A5), but if there is a failure in the accessed package, the NMI (Non Maskable) is used.
Xack Tim that generates (Interrupt)
e Out occurs (step A6).

【0008】Xack Time Outが発生する
と、共通サブルーチンは、これを検知し(ステップA
7)、共通サブルーチン内に保持されていた障害索引テ
ーブルを検索し(ステップA8)、Xack Time
Outが起こった時のアクセス先のアドレスから、対
応するパッケージ番号を検出し、検出したパッケージ番
号をパラメータ情報として共通サブルーチンコールし
(ステップA9)、アプリケーションプログラムに引き
渡す。
When the Xack Time Out occurs, the common subroutine detects this (step A).
7) Retrieve the failure index table held in the common subroutine (step A8), and check the Xack Time
The corresponding package number is detected from the address of the access destination when Out occurs, a common subroutine call is made using the detected package number as parameter information (step A9), and the application program is passed to the application program.

【0009】[0009]

【発明が解決しようとする課題】従来の計算機システム
は以上のように構成されているので、第1の処理方法で
は、入出力装置6dまたは6eに障害が発生したという
エラー割り込みをOS184が受け付けた場合には無条
件にシステムを停止させてしまい、以後の処理ができな
くなってしまうという課題があった。
Since the conventional computer system is configured as described above, in the first processing method, the OS 184 receives an error interrupt indicating that a failure has occurred in the input / output device 6d or 6e. In such a case, there is a problem that the system is unconditionally stopped, and subsequent processing cannot be performed.

【0010】一方、第2の処理方法では、障害が発生し
た場合に障害索引テーブルを利用して故障パッケージを
検出することにより、故障パッケージを容易に確認で
き、計算機システムを停止させることなく障害対策が可
能になるかもしれない。しかし、障害索引テーブルの作
成は、計算機システムの設計段階で行わなければなら
ず、計算機システムの動作状況や入出力装置の構成を予
め全て予測して障害索引テーブルを設計段階で作成する
ことは極めて困難であるという課題がある。また、計算
機システムの設計が変更された場合に障害索引テーブル
の内容が陳腐化してしまう可能性も多く、計算機システ
ムの設計変更への柔軟性に欠けるという課題も存在す
る。
On the other hand, in the second processing method, when a failure occurs, the failure package is detected by using the failure index table, so that the failure package can be easily confirmed, and the failure measures can be taken without stopping the computer system. May be possible. However, the failure index table must be created at the computer system design stage, and it is extremely difficult to predict the operation status of the computer system and the configuration of the input / output devices in advance and create the failure index table at the design stage. There is a problem that it is difficult. Further, when the design of the computer system is changed, the contents of the failure index table often become stale, and there is a problem that the design of the computer system is not flexibly changed.

【0011】この発明は上記のような課題を解決するた
めになされたもので、入出力装置に障害が発生しても計
算機システムを停止させることなく障害状況に対応して
計算機システムを動作させることができ、また、計算機
システム全体の動作を統括的に管理することにより計算
機システムの設計変更が容易に行える計算機システムを
得ることを目的とする。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-described problems, and it is an object of the present invention to operate a computer system in response to a failure situation without stopping the computer system even if a failure occurs in an input / output device. It is another object of the present invention to provide a computer system capable of easily changing the design of the computer system by comprehensively managing the operation of the entire computer system.

【0012】また、この発明は、デバイスドライバの構
成を容易にすることのできる計算機システムを得ること
を目的とする。
Another object of the present invention is to provide a computer system capable of easily configuring a device driver.

【0013】さらに、この発明は、入出力装置に障害が
発生した場合に、入出力要求の結果を待っているプロセ
スがいつまでもその応答を待ち続けることを回避させ、
その先の処理を続行することのできる計算機システムを
得ることを目的とする。
Further, according to the present invention, when a failure occurs in an input / output device, it is possible to prevent a process waiting for a result of an input / output request from continuing to wait for a response forever,
It is an object of the present invention to obtain a computer system capable of continuing the subsequent processing.

【0014】さらに、この発明は、入出力装置に障害が
発生した場合に、その障害が計算機システムの他の部分
に拡散することを防止できる計算機システムを得ること
を目的とする。
Another object of the present invention is to provide a computer system which can prevent a failure from spreading to other parts of the computer system when a failure occurs in an input / output device.

【0015】さらに、この発明は、障害が起こり得る可
能性の高い機能に対する入出力要求を事前に回避するこ
とができ、動作の安定性の高い計算機システムを得るこ
とを目的とする。
A further object of the present invention is to provide a computer system which can avoid an input / output request for a function having a high possibility of occurrence of a failure in advance and has a high operation stability.

【0016】さらに、この発明は、障害発生の危険性が
高い入出力装置の正常動作を再確認でき、必要以上に機
能縮退させることなく安定して計算機システムの動作を
継続することができる計算機システムを得ることを目的
とする。
Further, according to the present invention, it is possible to reconfirm the normal operation of the input / output device having a high risk of occurrence of a failure, and to continue the operation of the computer system stably without unnecessarily deteriorating the functions. The purpose is to obtain.

【0017】さらに、この発明は、PCI−PCIブリ
ッジに障害が発生した場合に、障害が計算機システムの
他の部分へと拡散することを防止することができる計算
機システムを得ることを目的とする。
Another object of the present invention is to provide a computer system capable of preventing a failure from spreading to other parts of the computer system when a failure occurs in a PCI-PCI bridge.

【0018】さらに、この発明は、入出力装置に障害が
発生した後に計算機システムが動作し続けるために最適
な方法を実行できる計算機システムを得ることを目的と
する。
Still another object of the present invention is to provide a computer system capable of executing an optimal method for keeping the computer system operating after a failure occurs in an input / output device.

【0019】さらに、この発明は、管理処理のための情
報アクセス、プログラムの作成及びメンテナンスが容易
な計算機システムを得ることを目的とする。
Still another object of the present invention is to provide a computer system which can easily access information for management processing, create and maintain a program.

【0020】さらに、この発明は、リセット処理の対象
に応じた形式でリセット処理を行うことができ、計算機
システム全体の動作に問題を与えることなくリセット処
理ができる計算機システムを得ることを目的とする。
A further object of the present invention is to provide a computer system capable of performing a reset process in a format according to a target of the reset process and performing the reset process without giving a problem to the operation of the entire computer system. .

【0021】[0021]

【課題を解決するための手段】請求項1記載の発明に係
る計算機システムは、入出力装置からのエラー検出信号
を受け付けて必要な処理を実施するRAS処理部と、こ
のRAS処理部からの信号に応じて変更可能な各入出力
装置の状態を保持するデバイス管理テーブルと、このデ
バイス管理テーブルを参照して入出力装置の状態に応じ
て入出力要求を出力するか否かを決定するデバイスドラ
イバとを備えたものである。
According to a first aspect of the present invention, there is provided a computer system which receives an error detection signal from an input / output device and performs necessary processing, and a signal from the RAS processing unit. Device management table that holds the status of each input / output device that can be changed according to the status of the input / output device, and a device driver that determines whether to output an input / output request according to the status of the input / output device with reference to the device management table It is provided with.

【0022】請求項2記載の発明に係る計算機システム
は、デバイス管理テーブルに入出力装置に対して要求を
出しているプロセスを識別するための情報を記録する欄
を設けたものである。
In the computer system according to the present invention, a column for recording information for identifying a process issuing a request to the input / output device is provided in the device management table.

【0023】請求項3記載の発明に係る計算機システム
は、特定の入出力装置とそれを利用し続けながら動作す
るプロセスとの関連を保持するデバイス利用テーブルを
設けたものである。
According to a third aspect of the present invention, there is provided a computer system provided with a device use table which holds a relation between a specific input / output device and a process which operates while using the input / output device.

【0024】請求項4記載の発明に係る計算機システム
は、デバイス管理テーブルに各入出力装置の物理的な接
続位置の情報を記録する欄を設けたものである。
According to a fourth aspect of the present invention, there is provided a computer system in which a column for recording information of a physical connection position of each input / output device is provided in a device management table.

【0025】請求項5記載の発明に係る計算機システム
は、RAS処理部が、障害が発生した装置と同じ物理的
な接続位置にある他の機能が正常に動作するか否かを確
認する機能を有するものである。
According to a fifth aspect of the present invention, in the computer system, the RAS processing unit has a function of confirming whether or not another function at the same physical connection position as the failed device operates normally. Have

【0026】請求項6記載の発明に係る計算機システム
は、計算機システムの複数のバスの、それぞれの関係を
示す構成情報を保持するためのバス構成テーブルを備え
たものである。
According to a sixth aspect of the present invention, there is provided a computer system including a bus configuration table for holding configuration information indicating a relationship between a plurality of buses of the computer system.

【0027】請求項7記載の発明に係る計算機システム
は、デバイス管理テーブルに入出力装置に障害が発生し
た場合に実施すべき処理を指定する情報を記録する欄を
設けたものである。
According to a seventh aspect of the present invention, there is provided a computer system in which a field for recording information for designating a process to be executed when a failure occurs in an input / output device is provided in a device management table.

【0028】請求項8記載の発明に係る計算機システム
は、デバイス管理テーブルが、計算機システムに接続さ
れたPCIバスの構成に従ったツリー構造をなすような
データ形式に、接続されている入出力装置の情報を格納
するものである。
[0028] In the computer system according to the present invention, the input / output devices connected to the device management table in a data format having a tree structure according to a configuration of a PCI bus connected to the computer system. Is stored.

【0029】請求項9記載の発明に係る計算機システム
は、リセット処理の対象が入出力装置かPCI−PCI
ブリッジかを判別する判別手段と、この判別手段の判別
結果に応じた形式でリセット処理を行うリセット手段と
を備えたものである。
In the computer system according to the ninth aspect of the present invention, the target of the reset processing is an input / output device or a PCI-PCI
It is provided with a discriminating means for discriminating a bridge, and a reset means for performing a reset process in a format according to the discrimination result of the discriminating means.

【0030】[0030]

【発明の実施の形態】以下、この発明の実施の一形態を
説明する。 実施の形態1.図1はこの発明の実施の形態1による計
算機システムを示す構成図であり、図において、1は計
算機システム、6a,6b,6cは計算機システム1に
接続された入出力装置で、6aはハードディスク(以
後、I/O装置Aとする)、6bは通信用端末機(以
後、I/O装置Bとする)、6cはディスプレイ(以
後、I/O装置Cとする)である。なお、以後I/O装
置A6a,B6b,C6cを入出力装置6と総称する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described below. Embodiment 1 FIG. FIG. 1 is a configuration diagram showing a computer system according to Embodiment 1 of the present invention. In the figure, reference numeral 1 denotes a computer system, 6a, 6b, and 6c denote input / output devices connected to the computer system 1, and 6a denotes a hard disk ( Hereinafter, I / O device A), 6b are communication terminals (hereinafter I / O device B), and 6c is a display (hereinafter I / O device C). Hereinafter, the I / O devices A6a, B6b, C6c are collectively referred to as the input / output device 6.

【0031】また、2は入出力装置6からのエラー割り
込み信号を受けて信頼性、可用性及び保守性を保つため
に必要な処理を実施するRAS処理部、3は入出力装置
6の状態を記憶するためのデバイス管理テーブルで、入
出力装置6を特定するための情報3aとその状態3bと
を保持する。
Reference numeral 2 denotes an RAS processing unit which receives an error interrupt signal from the input / output device 6 and performs processing necessary for maintaining reliability, availability and maintainability, and 3 stores the state of the input / output device 6. In the device management table, information 3a for specifying the input / output device 6 and its status 3b are held.

【0032】さらに、4a,4b,4cはそれぞれI/
O装置A6a,B6b,C6cを操作するためのI/O
装置A用デバイスドライバ,I/O装置B用デバイスド
ライバ,I/O装置C用デバイスドライバである。な
お、以後I/O装置A用デバイスドライバ4a,I/O
装置B用デバイスドライバ4b,I/O装置C用デバイ
スドライバ4cをデバイスドライバ4と総称する。5は
RAS処理部2と入出力装置6とを接続するPCIバス
である。
Further, 4a, 4b, and 4c are I /
I / O for operating O devices A6a, B6b, C6c
A device driver for device A, a device driver for I / O device B, and a device driver for I / O device C. The device driver 4a for the I / O device A, the I / O device
The device driver 4b for the device B and the device driver 4c for the I / O device C are generically referred to as a device driver 4. Reference numeral 5 denotes a PCI bus that connects the RAS processing unit 2 and the input / output device 6.

【0033】なお、デバイス管理テーブル3は、計算機
システム1の起動時にPCIの規約に従ってPCIバス
5のコンフィギュレーションを実施する過程で初期化さ
れる。この初期化時にデバイス管理テーブル3に含まれ
る情報は周知の通常の手法により入手できるので、デバ
イス管理テーブル3の構成手順についての説明は省略
し、デバイス管理テーブル3は予め用意されているもの
とする。
The device management table 3 is initialized when the computer system 1 is started up in the process of configuring the PCI bus 5 in accordance with the PCI regulations. Since the information included in the device management table 3 at the time of this initialization can be obtained by a well-known ordinary technique, the description of the configuration procedure of the device management table 3 is omitted, and the device management table 3 is prepared in advance. .

【0034】次に動作についてRAS処理部2の処理を
示す図2のフローチャートとデバイスドライバ4の処理
を示す図3のフローチャートとを参照しながら説明す
る。
Next, the operation will be described with reference to the flowchart of FIG. 2 showing the processing of the RAS processing section 2 and the flowchart of FIG. 3 showing the processing of the device driver 4.

【0035】I/O装置A6a,B6b,C6cのいず
れかから障害発生のエラー割り込みが発生すると、その
割り込みはPCIバス5を介してRAS処理部2に通知
される。通知を受けたRAS処理部2は図2に示すフロ
ーチャートに従って、まず最初にどの入出力装置6に障
害が発生したか特定する障害発生装置の特定を行い(ス
テップST1)、障害発生装置が特定できたか否かを判
断する(ステップST2)。
When an error interrupt of a failure occurs from any of the I / O devices A6a, B6b, C6c, the interrupt is notified to the RAS processing unit 2 via the PCI bus 5. In response to the notification, the RAS processing unit 2 first specifies a faulty device for specifying which input / output device 6 has failed according to the flowchart shown in FIG. 2 (step ST1), and can identify the faulty device. It is determined whether or not it has been performed (step ST2).

【0036】障害発生装置が特定できなかった場合に
は、障害発生装置が特定できないことをこの計算機シス
テムの管理者に通知して(ステップST4)、処理動作
を終了する。この管理者への通知は、I/O装置C6c
上への表示、I/O装置A6a中への記録等により障害
発生装置が特定できなかった事実を保存することにより
なされる。障害発生装置が特定できた場合には、デバイ
ス管理テーブル3の該当するI/O装置の状態3bをN
Gに変更して(ステップST3)、処理動作を終了す
る。図1のデバイス管理テーブル3の例ではI/O装置
B6bに障害が発生してNGが記録されている。
If the faulty device cannot be identified, the computer system administrator is notified that the faulty device cannot be identified (step ST4), and the processing operation is terminated. This notification to the administrator is sent to the I / O device C6c.
This is done by storing the fact that the faulty device could not be identified by the display on the top, the recording in the I / O device A6a, and the like. If the faulty device can be identified, the status 3b of the corresponding I / O device in the device management table 3 is set to N
G (step ST3), and the processing operation ends. In the example of the device management table 3 in FIG. 1, a failure has occurred in the I / O device B6b, and NG is recorded.

【0037】一方、上記のRAS処理部2の動作とは非
同期で、デバイスドライバ4は図3のフローチャートに
従い動作する。入出力装置6への入出力要求を受け付け
た(ステップST5)デバイスドライバ4は、これから
アクセスする入出力装置6に該当するデバイス管理テー
ブル3の状態3bを参照し(ステップST6)、状態3
bを確認する(ステップST7)。この時に、入出力装
置6の状態3bがOK(すなわち当該入出力装置へのア
クセスが可能な状態)である場合にはそのまま入出力装
置6への入出力処理を実施し(ステップST8)、OK
以外(すなわち当該入出力装置6へのアクセスが可能で
ない状態)の場合では入出力処理を中断する(ステップ
ST9)ことにより障害が発生した入出力装置6への実
際のアクセスを回避する。
On the other hand, the device driver 4 operates according to the flowchart of FIG. 3 asynchronously with the operation of the RAS processing unit 2. The device driver 4 that has received the input / output request to the input / output device 6 (step ST5) refers to the state 3b of the device management table 3 corresponding to the input / output device 6 to be accessed (step ST6), and
b is confirmed (step ST7). At this time, if the state 3b of the input / output device 6 is OK (that is, a state in which access to the input / output device is possible), the input / output processing to the input / output device 6 is directly performed (step ST8), and
In other cases (that is, in a state where access to the input / output device 6 is not possible), the input / output processing is interrupted (step ST9) to avoid actual access to the input / output device 6 in which a failure has occurred.

【0038】以上のように、この実施の形態1によれ
ば、障害が発生した入出力装置6だけを計算機システム
1から切り離すことができ、計算機システム1の縮退運
転が可能になるという効果が得られる。また、入出力装
置6の障害発生時の処理をRAS処理部2で一括し、そ
の状態をデバイス管理テーブル3内に保持することによ
って計算機システム1全体の動作を統括的に管理するこ
とが可能になるという効果が得られる。更に、デバイス
ドライバ4単体に障害対応機能を加える必要がなくなる
ために、デバイスドライバ4の構成が容易になるという
効果も得られる。
As described above, according to the first embodiment, only the failed input / output device 6 can be separated from the computer system 1, and the effect that the computer system 1 can be degraded is obtained. Can be In addition, the RAS processing unit 2 collectively performs processing when a failure occurs in the input / output device 6 and holds the state in the device management table 3 so that the overall operation of the computer system 1 can be managed in a comprehensive manner. Is obtained. Further, since it is not necessary to add a failure handling function to the device driver 4 alone, an effect that the configuration of the device driver 4 is simplified can be obtained.

【0039】実施の形態2.図4はこの発明の実施の形
態2による計算機システムを示す構成図であり、図にお
いて、図1に示した実施の形態1の構成要素と同一の構
成要素には同一符号を付し、その説明を省略する。
Embodiment 2 FIG. 4 is a configuration diagram showing a computer system according to Embodiment 2 of the present invention. In the figure, the same components as those of Embodiment 1 shown in FIG. Is omitted.

【0040】この実施の形態2においては、デバイス管
理テーブル3Aは、入出力装置6を特定するための情報
3aとその状態3bとの他に、入出力装置6に現在アク
セス要求を出しているアプリケーションソフト等のプロ
セスを識別する番号3cを記録している。この点以外の
構成は実施の形態1と同一である。
In the second embodiment, the device management table 3A includes, in addition to the information 3a for specifying the input / output device 6 and its status 3b, the application that is currently issuing an access request to the input / output device 6. A number 3c for identifying a process such as software is recorded. The configuration other than this is the same as that of the first embodiment.

【0041】次に動作について、RAS処理部2の処理
動作を示す図5のフローチャートとデバイスドライバ4
の処理動作を示す図6のフローチャートとを参照しなが
ら、説明する。図5のフローチャートと図6のフローチ
ャートとにおいては、それぞれ図2のフローチャートと
図3のフローチャートとにおけるステップと同一の処理
を行うステップには同一のステップ番号を付し、その詳
細な説明を省略する。
Next, regarding the operation, the flowchart of FIG.
This will be described with reference to the flowchart of FIG. In the flowchart of FIG. 5 and the flowchart of FIG. 6, steps that perform the same processing as the steps in the flowchart of FIG. 2 and the flowchart of FIG. 3 are assigned the same step numbers, and detailed description thereof will be omitted. .

【0042】デバイスドライバ4は、図6のフローチャ
ートに示すように、入出力要求を受け付け(ステップS
T5)、デバイス管理テーブル3Aを参照し(ステップ
ST6)、各入出力装置6にアクセスすることが可能か
どうかを判断する(ステップST7)。
The device driver 4 accepts an input / output request as shown in the flowchart of FIG.
T5) With reference to the device management table 3A (step ST6), it is determined whether or not each of the input / output devices 6 can be accessed (step ST7).

【0043】ここでアクセス可能である場合には、デバ
イス管理テーブル3のアクセス要求を出しているプロセ
スを識別する番号3cとして、アクセス要求を発行した
プロセスの識別番号を記録して(ステップST11)、
入出力処理を実施する(ステップST8)。この後、処
理が正常に終了してきた時には記録したプロセスの識別
番号3cをデバイス管理テーブル3から削除する(ステ
ップST12)。
If the access is possible, the identification number of the process that issued the access request is recorded as the number 3c for identifying the process that issued the access request in the device management table 3 (step ST11).
An input / output process is performed (step ST8). Thereafter, when the processing is completed normally, the recorded process identification number 3c is deleted from the device management table 3 (step ST12).

【0044】一方、デバイス管理テーブル3の装置の状
態3bがOK以外(すなわちアクセス不可能な状態)の
場合には入出力処理を中断し(ステップST9)、障害
発生装置からのエラー割り込みをRAS処理部2に通知
する。
On the other hand, if the status 3b of the device in the device management table 3 is other than OK (that is, an inaccessible status), the input / output process is interrupted (step ST9), and an error interrupt from the faulty device is processed by RAS. Notify part 2.

【0045】また、入出力装置6から障害発生のエラー
割り込み通知を受け付けたRAS処理部2では、図5に
示すフローチャートに従って、障害発生装置を特定し
(ステップST1)、特定できた場合には(ステップS
T2)、デバイス管理テーブル3Aの該当する装置の状
態3bをNGに変更した(ステップST3)後に、デバ
イス管理テーブル3Aのアクセス要求を出しているプロ
セスを識別する番号3cを記録している部位からアクセ
ス要求を発行したプロセスを検出して、入出力処理が異
常終了したことを当該プロセスに通知する(ステップS
T10)。
Further, the RAS processing unit 2 which has received the error interrupt notification of the occurrence of the fault from the input / output device 6 specifies the faulty device in accordance with the flowchart shown in FIG. 5 (step ST1). Step S
T2) After changing the status 3b of the corresponding device in the device management table 3A to NG (step ST3), access from the part of the device management table 3A where the number 3c identifying the process issuing the access request is recorded. The process that issued the request is detected, and the process is notified that the input / output processing has abnormally ended (step S
T10).

【0046】以上のように、この実施の形態2によれ
ば、計算機システム1の入出力装置6に障害が発生した
場合に、障害が発生した入出力装置にアクセス要求して
いたプロセスに対して、その要求が正常終了しないこと
を通知することが可能になるという効果が得られる。
As described above, according to the second embodiment, when a failure occurs in the input / output device 6 of the computer system 1, the process requesting access to the failed input / output device is performed. Thus, it is possible to notify that the request does not end normally.

【0047】実施の形態3.図7はこの発明の実施の形
態3による計算機システムを示す構成図であり、図にお
いて、図1の実施の形態1の構成要素と同一の構成要素
には同一符号を付し、その説明を省略する。
Embodiment 3 FIG. 7 is a configuration diagram showing a computer system according to Embodiment 3 of the present invention. In the figure, the same components as those of Embodiment 1 of FIG. 1 are denoted by the same reference numerals, and description thereof will be omitted. I do.

【0048】図7において、7は特定の入出力装置7a
もしくは7bとそれを定期的に利用し続けるプロセス名
7cとの関係を保持するデバイス利用テーブルである。
デバイス利用テーブル7に保持される情報を具体例をあ
げて改めて説明する。例えばUNIXをOSとして用い
ている計算機を想定した場合には、図7におけるデバイ
ス利用テーブル7の1行目に示されるように、I/O装
置A6aであるハードディスクを繰り返しアクセスする
デーモンプロセスとしてsyncerコマンドやsys
logdコマンドがあることを示している。どちらのプ
ロセスも計算機システムが正常動作をしている間は起動
されていて、ある一定周期かイベント駆動によってI/
O装置A6aに対してアクセスし続けるものであり、I
/O装置A6aの異常はそれらプロセスの動作に著しい
影響を及ぼすものである。
In FIG. 7, reference numeral 7 denotes a specific input / output device 7a.
Alternatively, it is a device use table that holds a relationship between 7b and a process name 7c that keeps using it regularly.
The information held in the device usage table 7 will be described again with a specific example. For example, assuming a computer using UNIX as the OS, as shown in the first row of the device usage table 7 in FIG. 7, the syncer command is used as a daemon process for repeatedly accessing the hard disk as the I / O device A6a. And sys
This indicates that there is a logd command. Both processes are started while the computer system is operating normally, and the I / O is performed at a certain period or by event driving.
O device A6a is continuously accessed, and I
An abnormality in the / O device A6a has a significant effect on the operation of these processes.

【0049】なお、デバイス利用テーブル7は計算機シ
ステム1の設計者もしくは管理者等が事前に定義し用意
されていることを想定しており、ここでは既に存在する
ものとする。図7中のそれ以外の構成要素は実施の形態
1の構成要素と同一である。また、デバイスドライバ4
はその表記を省略してある。
It is assumed that the device usage table 7 is defined and prepared in advance by the designer or administrator of the computer system 1, and it is assumed that the device usage table 7 already exists. The other components in FIG. 7 are the same as the components of the first embodiment. Also, device driver 4
Is abbreviated.

【0050】次に動作について、図8のRAS処理部2
の処理を示すフローチャートを参照しながら説明する。
入出力装置6から障害発生のエラー割り込み信号を受け
付けたRAS処理部2では、図8に示すフローチャート
に従って、障害発生装置を特定し(ステップST1)、
特定できた場合には(ステップST2)、デバイス管理
テーブル3の該当する装置の状態3bをNG(ステップ
ST3)に変更した後に、デバイス利用テーブル7に障
害発生した入出力装置7aもしくは7bが存在するか否
かを確認する(ステップST13)。確認の結果、存在
しない場合にはそのまま処理を終了するが、存在する場
合にはデバイス利用テーブル7内のその入出力装置6を
定期的に利用し続けるプロセス名7cを入手し、そのプ
ロセスが起動されていたならばその動作を停止するよう
に命令を発行して(ステップST14)、RAS処理部
2の動作を終了する。
Next, regarding the operation, the RAS processing unit 2 shown in FIG.
A description will be given with reference to a flowchart showing the processing.
The RAS processing unit 2 that has received the error interrupt signal indicating that a failure has occurred from the input / output device 6 identifies the failure generating device according to the flowchart shown in FIG. 8 (step ST1).
If it can be identified (step ST2), after changing the status 3b of the corresponding device in the device management table 3 to NG (step ST3), the faulty input / output device 7a or 7b exists in the device usage table 7. It is confirmed whether or not this is the case (step ST13). As a result of the confirmation, if it does not exist, the process is terminated as it is, but if it does exist, the process name 7c that regularly uses the input / output device 6 in the device use table 7 is obtained, and the process is started. If so, an instruction is issued to stop the operation (step ST14), and the operation of the RAS processing unit 2 ends.

【0051】以上のように、この実施の形態3によれ
ば、計算機システム1Bの特定の入出力装置6に対して
入出力要求を出し続けるプロセスが、そのプロセスが正
常動作するための前提となる入出力装置6に障害が発生
した場合に、異常終了することが明らかな入出力要求を
することを事前に回避し、障害が計算機システム1Bの
他の部分へと拡散することを防止することができるとい
う効果が得られる。
As described above, according to the third embodiment, the process of continuously issuing an input / output request to a specific input / output device 6 of the computer system 1B is a prerequisite for the normal operation of the process. When a failure occurs in the input / output device 6, it is possible to avoid in advance making an I / O request that is apparently abnormally terminated, and to prevent the failure from spreading to other parts of the computer system 1B. The effect that it can be obtained is obtained.

【0052】実施の形態4.図9はこの発明の実施の形
態4による計算機システムを示す構成図であり、図にお
いて、図1の実施の形態1の構成要素と同一の構成要素
には同一符号を付し、その説明を省略する。また、デバ
イスドライバ4はその表記を省略してある。
Embodiment 4 FIG. FIG. 9 is a configuration diagram showing a computer system according to Embodiment 4 of the present invention. In the figure, the same components as those of Embodiment 1 of FIG. 1 are denoted by the same reference numerals, and description thereof will be omitted. I do. The notation of the device driver 4 is omitted.

【0053】図9において、この実施の形態4のデバイ
ス管理テーブル3BはI/O装置C6c,I/O装置A
8a,I/O装置B8bを特定するための情報3aとそ
の状態3bとの他に、I/O装置C6c,I/O装置A
8a,I/O装置B8bの入出力装置のバス番号・デバ
イス番号3dとを記録している。8は入出力装置で、1
つの入出力装置に2つのI/O装置A8a,I/O装置
B8bの機能を有する。PCIの規約では1つの入出力
装置内に複数(便宜上2つとする)の異なる機能を有す
る入出力装置を実装することが認められており、これら
はバス番号とデバイス番号が同一の値となる。
In FIG. 9, the device management table 3B according to the fourth embodiment includes an I / O device C6c and an I / O device A.
8a, information 3a for specifying the I / O device B 8b and its state 3b, an I / O device C6c, an I / O device A
8a, the bus number and the device number 3d of the input / output device of the I / O device B8b are recorded. 8 is an input / output device and 1
One input / output device has the functions of two I / O devices A8a and I / O device B8b. According to the PCI regulations, it is recognized that a plurality of (two for convenience) input / output devices having different functions are mounted in one input / output device, and these have the same bus number and device number.

【0054】なお、入出力装置8のバス番号・デバイス
番号3dとは計算機システム1Cの起動時のバスコンフ
ィギュレーション時に決定され、この過程で入手可能な
ものであるので、ここではデバイス管理テーブル3Bの
構成手順についての説明は省略し、デバイス管理テーブ
ル3Bは用意されているものとする。図9中のそれ以外
の構成要素は実施の形態1の構成要素と同一である。
The bus number / device number 3d of the input / output device 8 is determined at the time of the bus configuration at the time of starting the computer system 1C and can be obtained in this process. The description of the configuration procedure is omitted, and the device management table 3B is prepared. The other components in FIG. 9 are the same as the components of the first embodiment.

【0055】次に動作について、図10のRAS処理部
2の処理を示すフローチャートを参照しながら説明す
る。I/O装置C6cまたはI/O装置A8aもしくは
I/O装置B8bから障害発生のエラー割り込み信号を
受け付けたRAS処理部2では、図10に示すフローチ
ャートに従って、障害発生装置を特定し(ステップST
1)、特定できた場合には(ステップST2)、デバイ
ス管理テーブル3Bの該当する入出力装置の状態3bを
NGに変更した(ステップST3)後に、デバイス管理
テーブル3Bのバス番号・デバイス番号3dを参照して
障害が発生した装置と同じバス番号とデバイス番号とを
持つエントリがないかどうかを確認する(ステップST
15)。確認の結果、存在しない場合にはそのまま処理
を終了するが、存在する場合にはその装置の状態3bも
NGへと変更して(ステップST16)、処理を終了す
る。
Next, the operation will be described with reference to a flowchart showing the processing of the RAS processing section 2 in FIG. The RAS processing unit 2, which has received the error interrupt signal of the occurrence of the failure from the I / O device C6c or the I / O device A8a or the I / O device B8b, specifies the failure occurrence device according to the flowchart shown in FIG.
1) If it can be specified (step ST2), the state 3b of the corresponding input / output device in the device management table 3B is changed to NG (step ST3), and then the bus number / device number 3d of the device management table 3B is changed. It is checked whether there is an entry having the same bus number and device number as the failed device by referring to (step ST).
15). As a result of the confirmation, if the device does not exist, the process is terminated. If the device is present, the status 3b of the device is also changed to NG (step ST16), and the process is terminated.

【0056】以上のように、この実施の形態4によれ
ば、計算機システム1Cに接続される1つの入出力装置
が複数の異なる機能をもっている場合においても、その
うちのいずれかの機能において障害が発見された場合
に、同じ入出力装置上の他の機能についても併せて入出
力要求を受け付けないようにでき、これにより、障害が
検知されてなくて正常動作しているようにみえるが障害
が起こりうる可能性の高い機能に対する入出力要求を事
前に回避することが可能となり、計算機システム1の動
作の安定性を高められるという効果が得られる。
As described above, according to the fourth embodiment, even when one input / output device connected to the computer system 1C has a plurality of different functions, a failure is found in any of the functions. In this case, other functions on the same I / O device can also be prevented from accepting I / O requests, so that it appears that the system is operating normally without a failure being detected, but a failure occurs. An input / output request for a function having a high possibility of being obtained can be avoided in advance, and the effect of increasing the stability of the operation of the computer system 1 can be obtained.

【0057】実施の形態5.図11はこの発明の実施の
形態5による計算機システムのRAS処理部2の処理を
示すフローチャートである。この実施の形態の構成は、
図9に示した実施の形態4の構成と同一である。
Embodiment 5 FIG. 11 is a flowchart showing processing of the RAS processing unit 2 of the computer system according to Embodiment 5 of the present invention. The configuration of this embodiment is as follows.
The configuration is the same as that of the fourth embodiment shown in FIG.

【0058】I/O装置A8aもしくはB8bから障害
発生のエラー割り込み信号を受け付けたRAS処理部2
では、図11に示すフローチャートに従って、障害発生
装置の特定をし(ステップST1)、特定できた場合に
は(ステップST2)、デバイス管理テーブル3Bの該
当する装置の状態3bをNGに変更した(ステップST
3)後に、デバイス管理テーブル3Bのバス番号・デバ
イス番号3dを参照して障害が発生した装置と同じバス
番号とデバイス番号とを持つエントリがないかどうかを
確認する(ステップST15)。確認の結果、存在しな
い場合にはそのまま処理を終了するが、存在する場合に
はその装置が正常に動作しているか否かを調査する(ス
テップST17)。調査の結果、正常であることが確認
された場合には(ステップST18)そのまま処理を終
了するが、そうでなかった場合にはその装置の状態3b
もNGへと変更して(ステップST19)、処理を終了
する。
RAS processing unit 2 which has received an error interrupt signal indicating that a failure has occurred from I / O device A8a or B8b
In accordance with the flowchart shown in FIG. 11, the faulty device is specified (step ST1). If the faulty device can be specified (step ST2), the status 3b of the corresponding device in the device management table 3B is changed to NG (step ST2). ST
3) Later, it is checked whether there is an entry having the same bus number and device number as the failed device by referring to the bus number / device number 3d of the device management table 3B (step ST15). As a result of the check, if the device does not exist, the process is terminated as it is. If the device exists, it is checked whether the device is operating normally (step ST17). As a result of the check, if it is confirmed that the device is normal (step ST18), the process is terminated as it is.
Is changed to NG (step ST19), and the process ends.

【0059】以上のように、この実施の形態5によれ
ば、正常動作が可能かどうか確認することで、障害発生
の危険性が高い装置の正常動作を再確認でき、必要以上
に機能縮退させることなく安定して計算機システムの動
作を継続することができる効果が得られる。
As described above, according to the fifth embodiment, by confirming whether or not normal operation is possible, it is possible to reconfirm the normal operation of a device having a high risk of occurrence of a failure, and to reduce the function more than necessary. The advantage is that the operation of the computer system can be stably continued without any problem.

【0060】実施の形態6.図12はこの発明の実施の
形態6による計算機システムの構成図であり、図におい
て、図1の実施の形態1の構成要素と同一の構成要素に
は同一符号を付し、その説明を省略する。また、デバイ
スドライバ4はその表記を省略してある。
Embodiment 6 FIG. FIG. 12 is a configuration diagram of a computer system according to Embodiment 6 of the present invention. In the figure, the same components as those of Embodiment 1 of FIG. 1 are denoted by the same reference numerals, and description thereof will be omitted. . The notation of the device driver 4 is omitted.

【0061】この実施の形態6のデバイス管理テーブル
3Cは、各入出力装置6に障害が発生した場合に実行す
べき後処理を指定するためのアドレス3eを記録してい
る。なお、この障害が発生した場合に実行すべき後処理
を指定するためのアドレス3eはデバイスドライバ4も
しくは他のプログラムから自由に設定変更が可能なもの
である。図中のそれ以外の構成要素は実施の形態1の構
成要素と同一である。
The device management table 3C according to the sixth embodiment records an address 3e for designating post-processing to be executed when a failure occurs in each input / output device 6. The address 3e for designating post-processing to be executed when this failure occurs can be freely changed by the device driver 4 or another program. The other components in the figure are the same as the components of the first embodiment.

【0062】次に動作について、図13のRAS処理部
2の処理を示すフローチャートを参照しながら説明す
る。入出力装置6から障害発生のエラー割り込み信号を
受け付けたRAS処理部2では、図13に示すフローチ
ャートに従って、障害発生装置を特定し(ステップST
1)、特定できた場合には(ステップST2)、デバイ
ス管理テーブル3Cの該当する装置の状態3bをNGに
変更した(ステップST3)後に、デバイス管理テーブ
ル3Cの装置に障害が発生した場合に実行すべき後処理
を指定するためのアドレス3eが指定されているかを確
認する(ステップST20)。確認の結果、アドレス3
eが存在しない場合にはそのまま処理を終了するが、存
在する場合には実行すべき後処理のアドレス3eに指定
された対応処理を実行して(ステップST21)処理を
終了する。
Next, the operation will be described with reference to a flowchart showing the processing of the RAS processing unit 2 in FIG. The RAS processing unit 2, which has received the error interrupt signal indicating that a failure has occurred from the input / output device 6, specifies the failure generating device according to the flowchart shown in FIG.
1) If it can be specified (step ST2), after the status 3b of the corresponding device in the device management table 3C is changed to NG (step ST3), it is executed when a failure occurs in the device in the device management table 3C. It is confirmed whether the address 3e for specifying the post-processing to be performed is specified (step ST20). As a result of confirmation, address 3
If e does not exist, the process is terminated as it is, but if it does exist, the corresponding process specified in the post-processing address 3e to be executed is executed (step ST21), and the process ends.

【0063】以上のように、この実施の形態6によれ
ば、計算機システム1Dの入出力装置6に障害が発生し
た場合に、障害が発生した装置毎に必要となる後処理を
各装置毎に容易かつ自由に定義できるようになり、入出
力装置6に障害が発生した後に計算機システムが動作し
続けるために最適な方法を実行できるようになる効果が
得られる。
As described above, according to the sixth embodiment, when a failure occurs in the input / output device 6 of the computer system 1D, post-processing required for each failed device is performed for each device. Since the definition can be made easily and freely, an effect is obtained that an optimal method can be executed to keep the computer system operating after a failure occurs in the input / output device 6.

【0064】実施の形態7.図14はこの発明の実施の
形態7による計算機システムの構成図であり、図におい
て、図9の実施の形態2の構成要素と同一の構成要素に
は同一符号を付し、その説明を省略する。また、デバイ
スドライバ4はその表記を省略してある。
Embodiment 7 FIG. FIG. 14 is a configuration diagram of a computer system according to Embodiment 7 of the present invention. In the figure, the same components as those of Embodiment 2 of FIG. 9 are denoted by the same reference numerals, and description thereof is omitted. . The notation of the device driver 4 is omitted.

【0065】図14において、9は計算機システム1E
上のホストバスで、10aはホストバス9とPCIバス
5aとを接続するためのホストブリッジA、10bはホ
ストバス9とPCIバス5bとを接続するためのホスト
ブリッジBである。なお、ホストブリッジA10a,B
10bを総称してホストブリッジ10と称する。ちなみ
に、前記の実施の形態ではホストバス9とホストブリッ
ジ10とを意識する必要がなかったので、図示及び説明
を省略してあった。
In FIG. 14, reference numeral 9 denotes a computer system 1E.
In the upper host bus, 10a is a host bridge A for connecting the host bus 9 and the PCI bus 5a, and 10b is a host bridge B for connecting the host bus 9 and the PCI bus 5b. Note that host bridges A10a, B
10b is generally referred to as a host bridge 10. By the way, in the above-mentioned embodiment, since it is not necessary to consider the host bus 9 and the host bridge 10, illustration and description are omitted.

【0066】11aはPCIバス5bとPCIバス5c
とを接続するPCI−PCIブリッジa、11bはPC
Iバス5bとPCIバス5dとを接続するPCI−PC
Iブリッジb、11cはPCIバス5dとPCIバス5
eとを接続するPCI−PCIブリッジcである。な
お、PCI−PCIブリッジa11a,b11b,c1
1cを総称してPCI−PCIブリッジ11と称し、P
CIバス5a,5b,5c,5dを総称してPCIバス
5と称する。12はPCIバス5間の接続関係を記録し
たバス構成テーブルで、1つのエントリにはPCI−P
CIブリッジ11を識別するデバイス番号12a、その
PCI−PCIブリッジ11の1次側PCIバス(計算
機本体に近い側)の番号12b、2次側PCIバス(計
算機本体から遠い側)の番号12c、PCI−PCIブ
リッジ11自身の状態12dを示す項目からなる。
11a is a PCI bus 5b and a PCI bus 5c.
And the PCI-PCI bridges a and 11b connecting the
PCI-PC connecting I bus 5b and PCI bus 5d
The I bridges b and 11c are connected to the PCI bus 5d and the PCI bus 5
e to a PCI-PCI bridge c. The PCI-PCI bridges a11a, b11b, c1
1c are collectively referred to as a PCI-PCI bridge 11,
The CI buses 5a, 5b, 5c, and 5d are collectively referred to as a PCI bus 5. Reference numeral 12 denotes a bus configuration table in which connection relationships between the PCI buses 5 are recorded.
The device number 12a for identifying the CI bridge 11, the number 12b of the primary PCI bus (closer to the computer main body) of the PCI-PCI bridge 11, the number 12c of the secondary PCI bus (farther from the computer main body), and the PCI -An item indicating the state 12d of the PCI bridge 11 itself.

【0067】なお、上記のバス構成はPCIの規約に従
っているものであり、PCIバスの番号付けはコンフィ
ギュレーション実行時に設定され、1次側バス及び2次
側バスの番号もこの時に入手可能であるので、バス構成
テーブル12の構成手順についてはその説明を省略し、
バス構成テーブル12は用意されているものとする。図
中のそれ以外の構成要素は実施の形態2の構成要素と同
一である。
The above bus configuration conforms to the PCI rules. The numbering of the PCI bus is set at the time of execution of the configuration, and the numbers of the primary bus and the secondary bus are also available at this time. Therefore, description of the configuration procedure of the bus configuration table 12 is omitted, and
It is assumed that the bus configuration table 12 is prepared. The other components in the figure are the same as those of the second embodiment.

【0068】次に動作について、図15のRAS処理部
2の処理を示すフローチャートを参照しながら説明す
る。入出力装置6もしくはPCI−PCIブリッジ11
から障害発生のエラー割り込み信号を受け付けたRAS
処理部2では、図15に示すフローチャートに従って、
障害発生装置を特定し(ステップST1)、特定できた
場合には(ステップST2)、その装置が入出力装置6
であるかPCI−PCIブリッジ11であるかを調べる
(ステップST22)。調べた結果、入出力装置6であ
る場合には、デバイス管理テーブル3Bの該当する装置
の状態3bをNGに変更(ステップST3)して終了す
る。PCI−PCIブリッジ11である場合には、バス
構成テーブル12の障害が発生したPCI−PCIブリ
ッジ11に該当する装置の状態12dをNGに変更し、
更にその2次側に存在するバス番号12cを調べる。
Next, the operation will be described with reference to the flowchart showing the processing of the RAS processing section 2 in FIG. I / O device 6 or PCI-PCI bridge 11
RAS that has received an error interrupt signal indicating that a fault has occurred
In the processing unit 2, according to the flowchart shown in FIG.
The faulty device is specified (step ST1), and if the faulty device is specified (step ST2), the device is set to the input / output device
Or the PCI-PCI bridge 11 is checked (step ST22). As a result of the check, if the input / output device 6 is found, the status 3b of the corresponding device in the device management table 3B is changed to NG (step ST3), and the process ends. In the case of the PCI-PCI bridge 11, the status 12d of the device corresponding to the failed PCI-PCI bridge 11 in the bus configuration table 12 is changed to NG,
Further, the bus number 12c existing on the secondary side is checked.

【0069】このバス番号12cを基にして、デバイス
管理テーブル3Bにエントリがある各入出力装置6が障
害が発生したPCI−PCIブリッジ11の2次側に接
続されているかをバス番号12cとデバイス番号12a
とを記録したバス番号・デバイス番号3dを参照して調
べ、2次側にある場合には入出力装置6の状態3bをN
Gとして記録して(ステップST23)終了する。
Based on the bus number 12c, it is determined whether each input / output device 6 having an entry in the device management table 3B is connected to the secondary side of the PCI-PCI bridge 11 in which the fault has occurred. Number 12a
Is checked with reference to the bus number / device number 3d in which the status 3b of the input / output device 6 is N.
G is recorded (step ST23), and the processing ends.

【0070】以上のように、この実施の形態7によれ
ば、複数のPCIバスを備えた計算機システムにおい
て、PCIバス間を接続するPCI−PCIブリッジに
障害が発生した場合に、そのPCI−PCIブリッジよ
り先に接続されている入出力装置への入出力要求をする
ことを事前に回避し、障害が計算機システムの他の部分
へと拡散することを防止することができる効果が得られ
る。
As described above, according to the seventh embodiment, in a computer system having a plurality of PCI buses, when a failure occurs in the PCI-PCI bridge connecting the PCI buses, the PCI-PCI bridge This makes it possible to avoid in advance making an input / output request to an input / output device connected before the bridge, and to prevent the failure from spreading to other parts of the computer system.

【0071】実施の形態8.図16はこの発明による実
施の形態8の計算機システムを示す構成図で、図におい
て、図14の実施の形態7の構成要素と同一の構成要素
には同一符号を付し、その説明を省略する。また、デバ
イスドライバ4はその表記を省略してある。
Embodiment 8 FIG. FIG. 16 is a block diagram showing a computer system according to the eighth embodiment of the present invention. In the figure, the same components as those of the seventh embodiment shown in FIG. . The notation of the device driver 4 is omitted.

【0072】図16において、13は実施の形態7にお
けるデバイス管理テーブル3Bとバス構成テーブル12
とに記録された情報を基に作成したデバイス管理テーブ
ルツリー(デバイス管理テーブル)である。デバイス管
理テーブルツリー13は、ホストバス9、ホストブリッ
ジA10a,B10b、PCI−PCIブリッジa11
a,b11b,c11c、I/O装置A8a,B6b等
をそれぞれ一塊のデータとしてメモリ中に格納し(以
後、この各一塊のデータをノードと称する)、各ノード
間の接続関係を示すデータを前記一塊のデータ中に付加
したものである。このデバイス管理テーブルツリー13
を構成するために必要な情報はPCIのコンフィギュレ
ーションの過程で入手できる情報であるので、ここでは
構成手順については記述しない。図中のそれ以外の構成
要素は実施の形態7の構成要素と同一である。
In FIG. 16, reference numeral 13 denotes a device management table 3B and a bus configuration table 12 according to the seventh embodiment.
3 is a device management table tree (device management table) created based on the information recorded in (1) and (2). The device management table tree 13 includes a host bus 9, host bridges A10a and B10b, and a PCI-PCI bridge a11.
a, b11b, c11c, I / O devices A8a, B6b, etc. are respectively stored in the memory as a set of data (hereinafter, each set of data is referred to as a node), and data indicating a connection relationship between the nodes is stored in the memory. This is added to a block of data. This device management table tree 13
Since the information necessary to configure the information is information that can be obtained in the process of PCI configuration, the configuration procedure is not described here. The other components in the figure are the same as the components of the seventh embodiment.

【0073】次に動作について、実施の形態7の図15
のフローチャートを参照しながら説明する。入出力装置
6もしくはPCI−PCIブリッジ11から障害発生の
エラー割り込み信号を受け付けたRAS処理部2では、
図15に示すフローチャートに従って、障害発生装置を
特定し(ステップST1)、特定できた場合には(ステ
ップST2)、その装置が入出力装置6のバス番号及び
デバイス番号に従ってデバイス管理テーブルツリー13
を該当する装置のノードまで探索する。このノード内で
障害発生した装置がPCI−PCIブリッジ11である
か否かを調べる(ステップST22)。調べた結果、入
出力装置6である場合には、デバイス管理テーブルツリ
ー13の該当する装置の状態をNGに変更(ステップS
T3)して終了する。PCI−PCIブリッジである場
合には、デバイス管理テーブルツリー13の該当する装
置の状態をNGにした後、更にそのノードより先の子の
ノードを全て探索して各ノードに記録されている入出力
装置6の状態をNGとして記録して(ステップST2
3)終了する。このことにより、障害発生したPCIブ
リッジの2次側にある全ての装置への入出力要求を停止
できることになる。
Next, the operation will be described with reference to FIG.
This will be described with reference to the flowchart of FIG. In the RAS processing unit 2 which has received an error interrupt signal indicating that a failure has occurred from the input / output device 6 or the PCI-PCI bridge 11,
According to the flowchart shown in FIG. 15, the faulty device is specified (step ST1). If the faulty device can be specified (step ST2), the device is determined by the device management table tree 13 according to the bus number and device number of the input / output device 6.
To the node of the corresponding device. It is checked whether or not the device in which the failure has occurred in this node is the PCI-PCI bridge 11 (step ST22). As a result of the check, if the input / output device 6 is found, the status of the corresponding device in the device management table tree 13 is changed to NG (step S
T3) and ends. In the case of a PCI-PCI bridge, the status of the corresponding device in the device management table tree 13 is set to NG, and further, all the child nodes ahead of the node are searched, and the input / output recorded in each node is The state of the device 6 is recorded as NG (step ST2).
3) End. As a result, input / output requests to all devices on the secondary side of the failed PCI bridge can be stopped.

【0074】以上のように、この実施の形態8によれ
ば、複数のPCIバスを備えた計算機システムにおい
て、各入出力装置6を管理するための情報をバスの構成
状態に対応した形式にすることによって、複雑なバス構
成を持つ計算機システムであっても、管理処理のため情
報アクセスが容易になり、プログラムに誤りが含まれる
可能性が減少し、特定のバスとそれ以下の入出力装置と
いったバス構成上の一部分を指定する等の処理が迅速に
行えるようになるという効果が得られる。
As described above, according to the eighth embodiment, in a computer system having a plurality of PCI buses, information for managing each input / output device 6 is in a format corresponding to the configuration state of the bus. As a result, even in a computer system having a complicated bus configuration, information access becomes easy due to management processing, the possibility of errors being included in a program is reduced, and a specific bus and an input / output device below it are used. An effect is obtained that processing such as designating a part on the bus configuration can be performed quickly.

【0075】実施の形態9.図17はこの発明による実
施の形態9の計算機システムのリセット処理動作を示す
フローチャートである。この実施の形態9の構成は図1
6に示す実施の形態8の構成と同一である。
Embodiment 9 FIG. FIG. 17 is a flowchart showing a reset processing operation of the computer system according to the ninth embodiment of the present invention. The configuration of the ninth embodiment is shown in FIG.
The configuration is the same as that of the eighth embodiment shown in FIG.

【0076】ある装置(入出力装置6でもPCI−PC
Iブリッジ11でもよい)に障害が発生し、管理者の指
示またはRAS処理部2の指示(この場合には、予めデ
バイス管理テーブルツリー13中に障害発生時のリセッ
ト処理が指定されている)により、障害発生装置に対し
てリセット処理が要求された(ステップST24)場
合、デバイス管理テーブルツリー13内をリセット要求
された装置のバス番号およびデバイス番号を基に該当す
る装置のノードまで探索する。
A certain device (the input / output device 6 is also a PCI-PC
A failure occurs in the I-bridge 11), and an instruction from the administrator or an instruction from the RAS processing unit 2 (in this case, a reset process when a failure occurs is specified in the device management table tree 13 in advance). When the reset processing is requested to the faulty device (step ST24), the device management table tree 13 is searched for the node of the corresponding device based on the bus number and the device number of the device whose reset is requested.

【0077】次に、このノード内でリセット要求を受け
た装置が入出力装置6かPCI−PCIブリッジ11で
あるかを調べる(ステップST25)。調べた結果、P
CI−PCIブリッジ11である場合には、そのノード
以下、つまり2次側に位置する、全ての装置の状態をリ
セット待ち状態にして入出力要求を受け付けないように
する(ステップST26)。
Next, it is checked whether the device which has received the reset request in this node is the input / output device 6 or the PCI-PCI bridge 11 (step ST25). As a result of examination, P
In the case of the CI-PCI bridge 11, the state of all devices located below the node, that is, on the secondary side, is set to a reset waiting state so as not to accept an input / output request (step ST26).

【0078】この処理が終了した後に、リセット要求を
受けた装置自身の状態をリセット実施中に変更して(ス
テップST27)、すなわち新規の入出力要求を受け付
けないようにして、リセット処理を実施する(ステップ
ST28)。リセット処理が終了した後にその結果をデ
バイス管理テーブルツリー13内に記録する(ステップ
ST29)。
After this processing is completed, the state of the apparatus which has received the reset request is changed to the state of executing reset (step ST27), that is, the new input / output request is not accepted and the reset processing is executed. (Step ST28). After the reset process is completed, the result is recorded in the device management table tree 13 (step ST29).

【0079】次に、リセットの対象となる装置の種類を
調べ(ステップST30)、入出力装置6であった場合
には処理を終了し、PCI−PCIブリッジ11であ
り、かつ正常にリセット処理が終了した場合には、その
ノード以下の全ての装置に関するデバイス管理テーブル
13の状態を元に戻して(ステップST31)終了す
る。
Next, the type of the device to be reset is checked (step ST 30). If the device is the input / output device 6, the process is terminated, the PCI-PCI bridge 11, and the reset process is performed normally. If the processing has been completed, the state of the device management table 13 relating to all the devices under that node is restored (step ST31), and the processing ends.

【0080】なお、PCI−PCIブリッジ11がリセ
ット対象であった場合には、その装置の2次側に接続さ
れる全ての装置のリセットを実施するようにすること
も、計算機システム全体の安定性を確保するためには有
効である。また、この実施の形態9のリセット処理の動
作は図14に示されるようにデバイス管理テーブル3と
バス構成テーブル12とを持つような入出力管理方式に
おいても適用可能である。
When the PCI-PCI bridge 11 is to be reset, resetting of all devices connected to the secondary side of the device can be performed, or the stability of the entire computer system can be improved. It is effective to secure Further, the operation of the reset process of the ninth embodiment can be applied to an input / output management system having a device management table 3 and a bus configuration table 12 as shown in FIG.

【0081】以上のように、この実施の形態9によれ
ば、複数のPCIバスを備えた計算機システムにおい
て、リセット処理を実行しようとする入出力装置がバス
の末端となる入出力装置であっても、バスの中間構成要
素であるPCI−PCIブリッジであっても、計算機シ
ステム全体の動作に問題を与えることなくリセット処理
が行えるようになる効果が得られる。
As described above, according to the ninth embodiment, in a computer system having a plurality of PCI buses, the input / output device for which reset processing is to be executed is the input / output device at the end of the bus. However, even in the case of a PCI-PCI bridge which is an intermediate component of the bus, an effect that reset processing can be performed without giving a problem to the operation of the entire computer system can be obtained.

【0082】[0082]

【発明の効果】以上のように、請求項1記載の発明によ
れば、計算機システム中にデバイスドライバから参照可
能でエラー信号割り込み処理で変更が可能なデバイス管
理テーブルを設けるように構成したので、計算機システ
ムが動作中に入出力装置に障害が発生した場合に、その
障害発生デバイスだけを切り離した縮退運転を可能にで
き、また入出力装置の障害発生時の処理をRAS処理部
で一括し、その状態をデバイス管理テーブル内に保持す
ることによって、計算機システム全体の動作を統括的に
管理することが可能になり、更にデバイスドライバ単体
に障害対応機能を加える必要がなくなるためにデバイス
ドライバの構成が容易になる効果がある。
As described above, according to the first aspect of the present invention, the computer system is provided with the device management table which can be referred to from the device driver and can be changed by the error signal interrupt processing. When a failure occurs in an input / output device while the computer system is operating, a degraded operation in which only the failed device can be separated can be performed, and processing at the time of occurrence of a failure in the input / output device is collectively performed by a RAS processing unit. By maintaining the state in the device management table, the operation of the entire computer system can be managed in an integrated manner. Further, since it is not necessary to add a failure handling function to the device driver alone, the configuration of the device driver is reduced. This has the effect of being easier.

【0083】請求項2記載の発明によれば、デバイス管
理テーブルにアクセス要求を発行しているプロセスを識
別するための情報を記録する欄を設けるように構成した
ので、計算機システムの入出力装置に障害が発生した場
合に、障害が発生した装置にアクセス要求していたプロ
セスに対して、その要求が正常終了しないことを通知す
ることが可能になり、入出力要求の結果を待っているプ
ロセスがいつまでもその応答を待ち続けることを回避さ
せ、その先の処理を続けることができるようになる効果
がある。
According to the second aspect of the present invention, since the device management table is provided with a column for recording information for identifying the process which has issued the access request, the input / output device of the computer system is provided. When a failure occurs, it is possible to notify the process that has requested access to the failed device that the request is not completed normally, and the process that is waiting for the result of the I / O request can be notified. There is an effect that it is possible to avoid waiting for the response indefinitely, and to continue the subsequent processing.

【0084】請求項3記載の発明によれば、特定の入出
力装置とその入出力装置を繰り返し利用し続けるプロセ
ス名との関係を保持するデバイス利用テーブルを設ける
ように構成したので、計算機システムの特定の入出力装
置に対して入出力要求を出し続けるプロセスが、そのプ
ロセスが正常動作するための前提となる入出力装置に障
害が発生した場合に、異常終了することが明らかな入出
力要求をすることを事前に回避し、障害が計算機システ
ムの他の部分へと拡散することを防止することができる
効果がある。
According to the third aspect of the present invention, a device use table is provided to hold a relationship between a specific input / output device and a process name that keeps using the input / output device repeatedly. A process that continues to issue I / O requests to a specific I / O device issues an I / O request that is apparently abnormally terminated if a failure occurs in the I / O device that is the prerequisite for the process to operate normally. This prevents the failure from spreading to other parts of the computer system.

【0085】請求項4記載の発明によれば、デバイス管
理テーブルに入出力装置の物理的な接続位置の情報を記
録する欄を設けるように構成したので、計算機システム
に接続される1つの入出力装置が複数の異なる機能をも
っている場合においても、そのうちのいずれかの機能に
おいて障害が発見された場合に、同じ入出力装置上の他
の機能についても併せて入出力要求を受け付けないよう
にでき、障害が検知されてなくて正常動作しているよう
にみえるが障害が起こりうる可能性の高い機能に対する
入出力要求を事前に回避することが可能となり、計算機
システムの動作の安定性を高められる効果がある。
According to the fourth aspect of the present invention, since the device management table is provided with a column for recording information on the physical connection position of the input / output device, one input / output device connected to the computer system is provided. Even when a device has a plurality of different functions, if a failure is found in any one of the functions, it is possible to prevent input / output requests for other functions on the same input / output device as well, It is possible to avoid input / output requests for functions that seem to be operating normally without detection of a failure but are likely to cause a failure in advance, thereby improving the stability of operation of the computer system. There is.

【0086】請求項5記載の発明によれば、RAS処理
部に障害が発生した装置と同じ物理的な接続位置にある
他の機能が正常に動作するか否かを確認する機能を設け
るように構成したので、計算機システムに接続される1
つの入出力装置が複数の異なる機能をもっている場合に
おいても、そのうちのいずれかの機能において障害が発
見された場合に、同じ入出力装置上の他の機能について
正常動作が可能かどうか確認することで、障害発生の危
険性が高い装置の正常動作を再確認でき、必要以上に機
能縮退させることなく安定して計算機システムの動作を
継続することができる効果がある。
According to the fifth aspect of the present invention, the RAS processing unit is provided with a function of confirming whether or not another function at the same physical connection position as the failed device operates normally. Since it is configured, 1 connected to the computer system
Even if one I / O device has a plurality of different functions, if a failure is found in any of the functions, it is possible to confirm whether the other functions on the same I / O device can operate normally. Thus, the normal operation of the device having a high risk of occurrence of a failure can be confirmed again, and the operation of the computer system can be stably continued without deteriorating the function more than necessary.

【0087】請求項6記載の発明によれば、複数のバス
のそれぞれの関係を示す構成情報を保持するバス構成テ
ーブルを設けるように構成したので、複数のPCIバス
を備えた計算機システムにおいて、PCIバス間を接続
するPCI−PCIブリッジに障害が発生した場合に、
そのPCI−PCIブリッジより先に接続されている入
出力装置への入出力要求をすることを事前に回避し、障
害が計算機システムの他の部分へと拡散することを防止
することができる効果がある。
According to the sixth aspect of the present invention, since the bus configuration table for holding the configuration information indicating the relationship between each of the plurality of buses is provided, the computer system having the plurality of PCI buses has When a failure occurs in the PCI-PCI bridge connecting the buses,
It is possible to avoid in advance making an I / O request to an I / O device connected earlier than the PCI-PCI bridge, and to prevent a failure from spreading to other parts of the computer system. is there.

【0088】請求項7記載の発明によれば、デバイス管
理テーブルに入出力装置に障害が発生した場合に実施す
べき処理を指定する情報を記録する欄を設けるように構
成したので、計算機システムの入出力装置に障害が発生
した場合に、障害が発生した入出力装置毎に必要となる
後処理を各入出力装置毎に容易かつ自由に定義できるよ
うになり、入出力装置に障害が発生した後に計算機シス
テムが動作し続けるために最適な方法を実行できるよう
になる効果がある。
According to the seventh aspect of the present invention, the device management table is provided with a column for recording information for designating processing to be performed when a failure occurs in the input / output device. When an I / O device fails, post-processing required for each failed I / O device can be defined easily and freely for each I / O device. There is an effect that an optimum method for keeping the computer system operating can be executed later.

【0089】請求項8記載の発明によれば、デバイス管
理テーブルがバスの構成に従ったツリー構造をなすよう
なデータ形式に入出力装置の情報を格納するように構成
したので、複数のPCIバスを備えた計算機システムに
おいて、デバイスを管理するための情報をバスの構成状
態を意識した形式にすることで、複雑なバス構成を持つ
計算機システムであっても、管理処理のための情報アク
セスが容易になり、プログラムに誤りが含まれる可能性
が減少し、また、特定のバスとそれ以下の入出力装置と
いったバス構成上の一部分を指定する等の処理が迅速に
行えるようになる効果がある。
According to the invention of claim 8, the device management table is configured to store the information of the input / output device in a data format having a tree structure according to the configuration of the bus. In a computer system equipped with, the information for managing devices is in a format that is aware of the bus configuration state, so that even computer systems with complicated bus configurations can easily access information for management processing. As a result, there is an effect that the possibility that an error is included in the program is reduced, and processing such as designating a part of a bus configuration such as a specific bus and an input / output device thereunder is quickly performed.

【0090】請求項9記載の発明によれば、リセット対
象を判別してその結果に応じた形式でリセット処理を行
うように構成したので、複数のPCIバスを備えた計算
機システムにおいて、リセット処理を実行しようとする
入出力装置がPCIバスの末端となる入出力装置であっ
ても、PCIバスの中間構成要素であるPCI−PCI
ブリッジであっても、計算機システム全体の動作に問題
を与えることなくリセット処理が行えるようになる効果
がある。
According to the ninth aspect of the present invention, since the reset target is determined and the reset processing is performed in a format according to the result, the reset processing is performed in a computer system having a plurality of PCI buses. Even if the input / output device to be executed is the input / output device at the end of the PCI bus, the PCI-PCI which is an intermediate component of the PCI bus is used.
Even with a bridge, there is an effect that reset processing can be performed without giving a problem to the operation of the entire computer system.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 この発明の実施の形態1による計算機システ
ムを示す構成図である。
FIG. 1 is a configuration diagram showing a computer system according to Embodiment 1 of the present invention.

【図2】 この発明の実施の形態1のRAS処理部の動
作を示すフローチャートである。
FIG. 2 is a flowchart showing an operation of the RAS processing unit according to the first embodiment of the present invention.

【図3】 この発明の実施の形態1のデバイスドライバ
の動作を示すフローチャートである。
FIG. 3 is a flowchart showing an operation of the device driver according to the first embodiment of the present invention.

【図4】 この発明の実施の形態2による計算機システ
ムを示す構成図である。
FIG. 4 is a configuration diagram showing a computer system according to a second embodiment of the present invention.

【図5】 この発明の実施の形態2のRAS処理部の動
作を示すフローチャートである。
FIG. 5 is a flowchart showing an operation of the RAS processing unit according to the second embodiment of the present invention.

【図6】 この発明の実施の形態2のデバイスドライバ
の動作を示すフローチャートである。
FIG. 6 is a flowchart showing an operation of the device driver according to the second embodiment of the present invention.

【図7】 この発明の実施の形態3による計算機システ
ムを示す構成図である。
FIG. 7 is a configuration diagram showing a computer system according to Embodiment 3 of the present invention.

【図8】 この発明の実施の形態3のRAS処理部の動
作を示すフローチャートである。
FIG. 8 is a flowchart illustrating an operation of a RAS processing unit according to Embodiment 3 of the present invention.

【図9】 この発明の実施の形態4による計算機システ
ムを示す構成図である。
FIG. 9 is a configuration diagram showing a computer system according to Embodiment 4 of the present invention.

【図10】 この発明の実施の形態4のRAS処理部の
動作を示すフローチャートである。
FIG. 10 is a flowchart showing an operation of a RAS processing unit according to Embodiment 4 of the present invention.

【図11】 この発明の実施の形態5のRAS処理部の
動作を示すフローチャートである。
FIG. 11 is a flowchart showing an operation of the RAS processing unit according to the fifth embodiment of the present invention.

【図12】 この発明の実施の形態6による計算機シス
テムを示す構成図である。
FIG. 12 is a configuration diagram showing a computer system according to Embodiment 6 of the present invention.

【図13】 この発明の実施の形態6のRAS処理部の
動作を示すフローチャートである。
FIG. 13 is a flowchart showing an operation of the RAS processing unit according to the sixth embodiment of the present invention.

【図14】 この発明の実施の形態7による計算機シス
テムを示す構成図である。
FIG. 14 is a configuration diagram showing a computer system according to Embodiment 7 of the present invention.

【図15】 この発明の実施の形態7のRAS処理部の
動作を示すフローチャートである。
FIG. 15 is a flowchart showing an operation of the RAS processing unit according to the seventh embodiment of the present invention.

【図16】 この発明の実施の形態8による計算機シス
テムを示す構成図である。
FIG. 16 is a configuration diagram showing a computer system according to Embodiment 8 of the present invention.

【図17】 この発明の実施の形態9のRAS処理部の
動作を示すフローチャートである。
FIG. 17 is a flowchart showing the operation of the RAS processing unit according to Embodiment 9 of the present invention.

【図18】 従来の計算機システムを示す構成図であ
る。
FIG. 18 is a configuration diagram showing a conventional computer system.

【図19】 従来の他の計算機システムの動作を示すフ
ローチャートである。
FIG. 19 is a flowchart showing the operation of another conventional computer system.

【符号の説明】[Explanation of symbols]

1,1A,1B,1C,1D,1E,1F 計算機シス
テム、2 RAS処理部、3,3A,3B,3C デバ
イス管理テーブル、4a I/O装置A用デバイスドラ
イバ(デバイスドライバ)、4b I/O装置B用デバ
イスドライバ(デバイスドライバ)、4c I/O装置
C用デバイスドライバ(デバイスドライバ)、6a I
/O装置A(入出力装置)、6b I/O装置B(入出
力装置)、6c I/O装置C(入出力装置)、7 デ
バイス利用テーブル、8 入出力装置、8a I/O装
置A(入出力装置)、8b I/O装置B(入出力装
置)、12 バス構成テーブル、13 デバイス管理テ
ーブルツリー(デバイス管理テーブル)。
1, 1A, 1B, 1C, 1D, 1E, 1F Computer system, 2 RAS processing unit, 3, 3A, 3B, 3C device management table, 4a I / O device A device driver (device driver), 4b I / O Device driver for device B (device driver), 4c I / O Device driver for device C (device driver), 6a I
I / O device A (input / output device), 6b I / O device B (input / output device), 6c I / O device C (input / output device), 7 device utilization table, 8 input / output device, 8a I / O device A (Input / output device), 8b I / O device B (input / output device), 12 bus configuration table, 13 device management table tree (device management table).

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 入出力装置からのエラー検出信号を受け
付けて必要な処理を実施するRAS処理部と、 該RAS処理部からの信号に応じて変更可能な各入出力
装置の状態を保持するデバイス管理テーブルと、 該デバイス管理テーブルを参照して入出力装置の状態に
応じて入出力要求を出力するか否かを決定するデバイス
ドライバとを備えたことを特徴とする計算機システム。
An RAS processing unit that receives an error detection signal from an input / output device and performs necessary processing, and a device that holds a state of each input / output device that can be changed according to a signal from the RAS processing unit A computer system comprising: a management table; and a device driver that determines whether to output an input / output request in accordance with a state of an input / output device with reference to the device management table.
【請求項2】 デバイス管理テーブルに入出力装置に対
して要求を出しているプロセスを識別するための情報を
記録する欄を設けたことを特徴とする請求項1記載の計
算機システム。
2. The computer system according to claim 1, wherein a column for recording information for identifying a process issuing a request to the input / output device is provided in the device management table.
【請求項3】 特定の入出力装置とそれを利用し続けな
がら動作するプロセスとの関連を保持するデバイス利用
テーブルを設けたことを特徴とする請求項1記載の計算
機システム。
3. The computer system according to claim 1, further comprising a device use table for holding a relation between a specific input / output device and a process that operates while continuing to use the specific input / output device.
【請求項4】 デバイス管理テーブルに各入出力装置の
物理的な接続位置の情報を記録する欄を設けたことを特
徴とする請求項1記載の計算機システム。
4. The computer system according to claim 1, wherein a column for recording information on a physical connection position of each input / output device is provided in the device management table.
【請求項5】 RAS処理部が、障害が発生した装置と
同じ物理的な接続位置にある他の機能が正常に動作する
か否かを確認する機能を有することを特徴とする請求項
4記載の計算機システム。
5. The RAS processing unit has a function of confirming whether or not another function at the same physical connection position as the failed device operates normally. Computer system.
【請求項6】 計算機システムの複数のバスの、それぞ
れの関係を示す構成情報を保持するためのバス構成テー
ブルを備えたことを特徴とする請求項4記載の計算機シ
ステム。
6. The computer system according to claim 4, further comprising a bus configuration table for holding configuration information indicating a relationship between each of a plurality of buses of the computer system.
【請求項7】 デバイス管理テーブルに入出力装置に障
害が発生した場合に実施すべき処理を指定する情報を記
録する欄を設けたことを特徴とする請求項1記載の計算
機システム。
7. The computer system according to claim 1, wherein a column for recording information for specifying a process to be executed when a failure occurs in the input / output device is provided in the device management table.
【請求項8】 デバイス管理テーブルが、計算機システ
ムのPCIバスの構成に従ったツリー構造をなすような
データ形式に、接続されている入出力装置の情報を格納
することを特徴とする請求項1記載の計算機システム。
8. The device management table according to claim 1, wherein the information of the connected input / output device is stored in a data format having a tree structure according to a configuration of a PCI bus of the computer system. Computer system as described.
【請求項9】 リセット処理の対象が入出力装置かPC
I−PCIブリッジかを判別する判別手段と、該判別手
段の判別結果に応じた形式でリセット処理を行うリセッ
ト手段とを備えたことを特徴とする請求項1記載の計算
機システム。
9. The target of reset processing is an input / output device or a PC
2. The computer system according to claim 1, further comprising: a determination unit that determines whether the bridge is an I-PCI bridge; and a reset unit that performs a reset process in a format according to a determination result of the determination unit.
JP9078652A 1997-03-28 1997-03-28 Computer system Pending JPH10275116A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9078652A JPH10275116A (en) 1997-03-28 1997-03-28 Computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9078652A JPH10275116A (en) 1997-03-28 1997-03-28 Computer system

Publications (1)

Publication Number Publication Date
JPH10275116A true JPH10275116A (en) 1998-10-13

Family

ID=13667802

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9078652A Pending JPH10275116A (en) 1997-03-28 1997-03-28 Computer system

Country Status (1)

Country Link
JP (1) JPH10275116A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100454278C (en) * 2006-01-19 2009-01-21 联想(北京)有限公司 Control method for accessing computer system and I/0 ports

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100454278C (en) * 2006-01-19 2009-01-21 联想(北京)有限公司 Control method for accessing computer system and I/0 ports

Similar Documents

Publication Publication Date Title
EP1099164B1 (en) Method and program for processing administrative requests of a distributed network application executing in a clustered computing environment
US7062676B2 (en) Method and system for installing program in multiple system
US6343338B1 (en) System and method for synchronizing disparate processing modes and for controlling access to shared resources
EP1131715B1 (en) Distributed transactional processing system and method
JP2706602B2 (en) Interrupt retry reduction device
JPH1063437A (en) Method for integrating storage array control function, and program storag device
JP4874165B2 (en) Multiprocessor system and access right setting method in multiprocessor system
CA2177022A1 (en) Customer information control system and method with temporary storage queuing functions in a loosely coupled parallel processing environment
US7461217B2 (en) Arrangement and method for update of configuration cache data
US7536694B2 (en) Exception handling in a multiprocessor system
JPH10275116A (en) Computer system
JP4487756B2 (en) Computer system and system monitoring program
JP4001850B2 (en) Techniques for validating reinitialized channel-to-channel connections
EP1895427B1 (en) Data processing system, data processing apparatus, and data processing method
EP3428799B1 (en) Data access device and access error notification method
JPS59154700A (en) Data processing system
KR100299193B1 (en) Apparatus and method for controlling i/o operations in backward recovery type computer systems
JP2937857B2 (en) Lock flag release method and method for common storage
US20060259757A1 (en) Method, apparatus and computer program product for implementing initial program load in a computer system
GB2342472A (en) Process monitoring in a computer system
JPH0553889A (en) File access processing system for plural os
JP3340284B2 (en) Redundant system
JPH0319574B2 (en)
JP2008108131A (en) Computer system, computer protection method, computer protection program
JPH02153437A (en) Output message recovery system

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040330