JPH05134998A - Multiprocessor system - Google Patents

Multiprocessor system

Info

Publication number
JPH05134998A
JPH05134998A JP3300243A JP30024391A JPH05134998A JP H05134998 A JPH05134998 A JP H05134998A JP 3300243 A JP3300243 A JP 3300243A JP 30024391 A JP30024391 A JP 30024391A JP H05134998 A JPH05134998 A JP H05134998A
Authority
JP
Japan
Prior art keywords
fault
fault detection
processor
group
processors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3300243A
Other languages
Japanese (ja)
Inventor
Masato Nakamura
真人 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP3300243A priority Critical patent/JPH05134998A/en
Publication of JPH05134998A publication Critical patent/JPH05134998A/en
Pending legal-status Critical Current

Links

Landscapes

  • Advance Control (AREA)
  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)

Abstract

PURPOSE:To detect the faults of all the processors by dividing plural processors into plural fault detection groups, and connecting a device which detects and processes the fault of the whole system based on fault information from a fault detection processor in each group to a system bus. CONSTITUTION:The plural processors 2 are divided into the plural fault detection groups 3 at every processor related functionally, and the processor that becomes the core of each fault detection group 3 is designated as the fault detection processor 2a which detects the fault in the group. The fault information I1 from the fault detection processor 2a is sent to a fault information processor 4 connected to the system bus 1, and the fault of the whole system can be detected and processed. Thereby, it is possible to detect the faults of all the processors 2, and to suppress burden from increasing since it is enough to process the fault information from the fault detection processor 2a in each group 3.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、自己障害診断機能を備
えた複数個のプロセッサをシステムバスで結合して成る
マルチプロセッサシステム、特にシステム全体の障害監
視,片肺運転,停止,自動一括再起動等のフォールトト
レランス(故障許容)機能を備えたマルチプロセッサシ
ステムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a multiprocessor system in which a plurality of processors having a self-fault diagnosis function are connected by a system bus. The present invention relates to a multiprocessor system having a fault tolerance (fault tolerance) function such as startup.

【0002】[0002]

【従来の技術】マルチプロセッサシステムは、その信頼
性を高めるために、個々のプロセッサの自己障害診断機
能だけでなく、システム全体の障害監視,片肺運転,停
止,自動一括再起動等のフォールトトレランス機能を備
える必要がある。
2. Description of the Related Art In order to improve the reliability of a multiprocessor system, not only the self-fault diagnosis function of each processor but also fault tolerance of the whole system such as fault monitoring, single lung operation, stop, automatic batch restart, etc. It is necessary to have a function.

【0003】図5は、この種のフォールトトレランス機
能を備えたマルチプロセッサシステムの従来例を示すブ
ロック図である(特開昭64−55669号公報)。
FIG. 5 is a block diagram showing a conventional example of a multiprocessor system having a fault tolerance function of this type (Japanese Patent Laid-Open No. 64-55669).

【0004】図のように、自己障害診断機能を備えた複
数個のプロセッサ21,22,23、およびこれらのプ
ロセッサ21,22,23からの指令で動作するディス
プレイ,プリンタ,外部記憶装置等の入出力チャネルポ
ート(I/Och.)24〜27が、システムバス28
によって結合されている。またこのシステムバス28に
は、システム監視装置29(以下、監視装置29と略
す)が接続されている。そのシステム監視装置29は、
障害診断カウンタ30(以下、カウンタ30と略す)を
備えており、システムがスタートした後、一定周期でこ
のカウンタ30をインクリメントさせる。
As shown in the figure, a plurality of processors 21, 22, 23 having a self-diagnosis function, and a display, a printer, an external storage device and the like which operate according to commands from these processors 21, 22, 23 are installed. The output channel ports (I / Och.) 24 to 27 are connected to the system bus 28.
Are joined by. A system monitoring device 29 (hereinafter abbreviated as monitoring device 29) is connected to the system bus 28. The system monitoring device 29
A failure diagnosis counter 30 (hereinafter abbreviated as counter 30) is provided, and the counter 30 is incremented at a constant cycle after the system starts.

【0005】このマルチプロセッサシステムでは、全て
のプロセッサ21,22,23のうちのいくつか、例え
ばプロセッサ21と22が、重要プロセッサとして予め
指定されている。この重要プロセッサは、他のプロセッ
サが障害を起こしてもこのプロセッサが正常であればシ
ステム動作を継続し得るような、システムの中枢となる
プロセッサである。
In this multiprocessor system, some of all the processors 21, 22, 23, for example, the processors 21 and 22 are designated in advance as important processors. This important processor is a core processor of the system that can continue the system operation if this processor is normal even if another processor fails.

【0006】上記構成のマルチプロセッサシステムにお
いて、電源投入時には監視装置29が、全てのプロセッ
サ21,22,23および入出力チャネルポート24〜
27に対してリセット信号S1を送る。すると全てのプ
ロセッサ21,22,23は、そのリセット信号S1を
受けた段階で自身を初期化していっせいに動作を開始す
る。また、重要プロセッサ21,22は、自身の健在を
示すアライブ信号S2を、監視装置29へ一定周期で出
力する。
In the multiprocessor system having the above-mentioned structure, when the power is turned on, the monitoring device 29 causes all the processors 21, 22, 23 and the input / output channel ports 24.about.
A reset signal S1 is sent to 27. Then, all the processors 21, 22, 23 initialize themselves at the stage of receiving the reset signal S1 and simultaneously start the operation. In addition, the important processors 21 and 22 output the alive signal S2 indicating the existence of their own health to the monitoring device 29 in a constant cycle.

【0007】監視装置29は、重要プロセッサ21,2
2からアライブ信号S2を受けた時点でカウンタ30を
リセットする。しかし全ての重要プロセッサ21,22
で障害が発生し、いずれの重要プロセッサ21,22か
らもアライブ信号S2が送られてこなくなった場合に
は、監視装置29はカウンタ30をインクリメントさせ
続ける。
The monitoring device 29 includes important processors 21 and 2.
When the alive signal S2 is received from 2, the counter 30 is reset. But all the important processors 21, 22
In the case where a failure occurs and the alive signal S2 is not sent from any of the important processors 21 and 22, the monitoring device 29 continues to increment the counter 30.

【0008】そして監視装置29は、アライブ信号S2
を受けずに、カウンタ30の値が、予め設定された許容
値を超えた場合には、システム障害、つまりシステムと
しての動作が継続不可能な事態が発生したと認識し、リ
セット信号S1を出力する。これにより、全てのプロセ
ッサ21,22,23が自身を初期化して再スタートす
ることになる。
The monitoring device 29 then sends the alive signal S2.
If the value of the counter 30 exceeds the preset allowable value without being received, it is recognized that a system failure, that is, a situation in which the operation of the system cannot be continued has occurred, and the reset signal S1 is output. To do. As a result, all the processors 21, 22, 23 will initialize themselves and restart.

【0009】ただし重要プロセッサ21,22のうちい
ずれかが健在で、アライブ信号S2を出力している場合
には、監視装置29がカウンタ30を一定周期でリセッ
トさせるために、リセット信号S1が出力されることは
なく、よってシステムとしての動作が継続する。
However, when one of the important processors 21 and 22 is alive and outputs the alive signal S2, the reset signal S1 is output so that the monitoring device 29 resets the counter 30 at a constant cycle. Therefore, the operation of the system continues.

【0010】[0010]

【発明が解決しようとする課題】しかしながら、上記従
来のマルチプロセッサシステムでは、重要プロセッサ2
1,22に指定されていないプロセッサ23で発生した
障害は検出されないという問題があった。全てのプロセ
ッサ21,22,23を重要プロセッサに指定すると、
監視装置29が処理すべきアライブ信号S2が増加し、
監視装置29にかかる負荷が非常に大きくなってしま
う。
However, in the above conventional multiprocessor system, the important processor 2 is used.
There is a problem that a failure that occurs in the processor 23 not designated as No. 1 or 22 is not detected. If all processors 21, 22, 23 are designated as important processors,
The alive signal S2 to be processed by the monitoring device 29 increases,
The load on the monitoring device 29 becomes very large.

【0011】本発明は、上記問題を解決するためになさ
れたもので、システム上重要なプロセッサはもちろん、
その他のプロセッサについても障害を検出することがで
き、しかも障害を検出し処理する装置への負荷の増大を
抑えたマルチプロセッサシステムを得ることを目的とす
る。
The present invention has been made in order to solve the above-mentioned problems, and not only a system important processor but also
It is an object of the present invention to obtain a multiprocessor system capable of detecting a failure in other processors as well as suppressing an increase in load on a device for detecting and processing the failure.

【0012】[0012]

【課題を解決するための手段】上記目的を達成するため
に、本発明に係るマルチプロセッサシステムでは、複数
個のプロセッサを、機能的に関連づけられるプロセッサ
ごとに複数の障害検出グループに分けるとともに、その
各障害検出グループの中枢となるプロセッサを、それぞ
れのグループ内の障害を検出する障害検出プロセッサに
指定する。更に、システムバスに、上記各障害検出グル
ープの障害検出プロセッサからの障害情報に基づいてシ
ステム全体の障害を検出し処理する障害情報処理装置を
接続する。
To achieve the above object, in a multiprocessor system according to the present invention, a plurality of processors are divided into a plurality of fault detection groups for each processor functionally associated with each other, and The central processor of each failure detection group is designated as a failure detection processor that detects a failure in each group. Further, a fault information processing device that detects and processes a fault in the entire system based on the fault information from the fault detection processor of each fault detection group is connected to the system bus.

【0013】[0013]

【作用】上記構成のマルチプロセッサシステムでは、障
害検出プロセッサに指定されたシステム上重要なプロセ
ッサについてはもちろん、その他のプロセッサについて
も、それぞれの障害検出グループの障害検出プロセッサ
を介し、障害情報処理装置によって障害が検出される。
つまりシステムを構成する全てのプロセッサについて、
機能別の障害検出グループごとに障害を検出することが
できる。
In the multiprocessor system having the above configuration, not only the system-important processor designated as the fault detection processor but also other processors are processed by the fault information processing device via the fault detection processors of the respective fault detection groups. The fault is detected.
In other words, for all processors that make up the system,
A fault can be detected for each fault detection group according to function.

【0014】また、障害を検出し処理する障害情報処理
装置は、各障害検出グループの障害検出プロセッサから
の障害情報を処理すればよいため、この障害情報処理装
置への負荷の増大が抑えられる。
Further, since the fault information processing device for detecting and processing the fault only needs to process the fault information from the fault detection processor of each fault detection group, the load on this fault information processing device can be suppressed.

【0015】[0015]

【実施例】以下、図面に基づいて本発明の実施例を説明
する。
Embodiments of the present invention will be described below with reference to the drawings.

【0016】実施例1 図1は、本発明に係るマルチプロセッサシステムの実施
例1を示すブロック図である。
First Embodiment FIG. 1 is a block diagram showing a first embodiment of a multiprocessor system according to the present invention.

【0017】図のようにこのマルチプロセッサシステム
では、システムバス1で結合された、自己障害診断機能
を備えた複数個のプロセッサ2が、機能的に関連づけら
れるプロセッサごとに複数の障害検出グループ3に分け
られている。それとともに、各障害検出グループ3の中
枢となるプロセッサが、障害検出プロセッサ2aに指定
されている。この障害検出プロセッサ2aは、それぞれ
の障害検出グループ3内の障害を検出して、障害発生信
号とプロセッサ認識データとを含む障害情報I1を出力
する。
As shown in the figure, in this multiprocessor system, a plurality of processors 2 having a self-fault diagnosis function, which are connected by a system bus 1, are assigned to a plurality of fault detection groups 3 for each processor which is functionally related. It is divided. At the same time, the central processor of each failure detection group 3 is designated as the failure detection processor 2a. The fault detection processor 2a detects a fault in each fault detection group 3 and outputs fault information I1 including a fault occurrence signal and processor recognition data.

【0018】また、システムバス1には障害情報処理装
置4が接続されている。この障害情報処理装置4は、上
記各障害検出グループ3の障害検出プロセッサ2aから
の障害情報I1に基づいてシステム全体の障害を検出し
処理するもので、図2のブロック図に示すように、グル
ープ別障害情報格納部5と、障害情報収集コントロール
部6と、障害情報処理部7とから構成されている。
A fault information processing device 4 is connected to the system bus 1. This fault information processing device 4 detects and processes a fault of the entire system based on the fault information I1 from the fault detection processor 2a of each fault detection group 3, and as shown in the block diagram of FIG. It is composed of a different fault information storage unit 5, a fault information collection control unit 6, and a fault information processing unit 7.

【0019】上記構成において、各障害検出グループ3
の障害検出プロセッサ2aは、障害検出グループ3内の
他のプロセッサ2に対し、システムバス1を介してポー
リングを行うことによって、それぞれの障害検出グルー
プ3内の障害を検出する。つまり、障害検出プロセッサ
2aからポーリングシーケンスを受けた他のプロセッサ
2は、障害の有無をポーリング信号Sによって障害検出
プロセッサ2aへ知らせる。そして障害検出プロセッサ
2aは、そのポーリング信号Sにより障害の発生を認知
した際には、障害情報I1を障害情報処理装置4へ送
る。また障害検出プロセッサ2a自身に障害が発生した
場合には、その障害検出プロセッサ2aが直ちに障害情
報I1を障害情報処理装置4へ送る。
In the above configuration, each failure detection group 3
The fault detection processor 2a of 1 detects the fault in each fault detection group 3 by polling the other processors 2 in the fault detection group 3 via the system bus 1. That is, the other processors 2 that have received the polling sequence from the fault detection processor 2a inform the fault detection processor 2a of the presence or absence of a fault by the polling signal S. When the fault detection processor 2a recognizes the occurrence of a fault by the polling signal S, it sends fault information I1 to the fault information processing device 4. Further, when a failure occurs in the failure detection processor 2a itself, the failure detection processor 2a immediately sends the failure information I1 to the failure information processing device 4.

【0020】障害情報処理装置4では、いずれかの障害
検出グループ3の障害検出プロセッサ2aから障害情報
I1が送られてくると、グループ別障害情報格納部5が
その障害情報I1を格納する。次いで障害情報収集コン
トロール部6が、障害の発生しているプロセッサ2から
直接、障害の内容についての情報をシステムバス1を通
して収集する。そして障害情報処理部7が、その収集さ
れた情報に基づいて、発生している障害に対する適当な
処理を判断し、その処理に必要なデータとリセット信号
とを含む障害処理情報I2を各障害検出グループ3のプ
ロセッサ2へ送って、障害に対する処理を行う。こうし
てフォールトトレランス機能が働くことになる。
In the fault information processing device 4, when the fault information I1 is sent from the fault detection processor 2a of one of the fault detection groups 3, the fault information storage section 5 for each group stores the fault information I1. Next, the fault information collection control unit 6 directly collects information about the fault content from the faulty processor 2 through the system bus 1. Then, the failure information processing unit 7 determines appropriate processing for the failure that has occurred based on the collected information, and detects failure processing information I2 including data necessary for the processing and a reset signal for each failure. It is sent to the processor 2 of the group 3 to perform processing for the failure. In this way, the fault tolerance function works.

【0021】上述のように、このマルチプロセッサシス
テムでは、障害検出プロセッサ2aに指定されたシステ
ム上重要なプロセッサについてはもちろん、その他のプ
ロセッサ2についても、それぞれの障害検出グループ3
の障害検出プロセッサ2aを介して障害を検出すること
ができる。つまりシステムを構成する全てのプロセッサ
2について、機能別の障害検出グループ3ごとに障害を
検出することができる。しかもシステム上重大な障害で
ある障害検出プロセッサ2aの障害に対しては、その障
害検出プロセッサ2aが直ちに障害情報I1を障害情報
処理装置4へ送るため、即時に対応することが可能であ
る。即ち、障害検出グループ3内の一つのプロセッサ2
に発生した障害に対し、そのプロセッサ2の障害検出グ
ループ3内における重要度に応じて対応することができ
る。
As described above, in this multiprocessor system, not only the system-important processor designated as the fault detection processor 2a but also the other processors 2 have their fault detection groups 3 respectively.
The fault can be detected through the fault detection processor 2a. In other words, it is possible to detect a failure for each function-dependent failure detection group 3 for all the processors 2 configuring the system. Moreover, a failure of the failure detection processor 2a, which is a serious failure in the system, can be immediately dealt with because the failure detection processor 2a immediately sends the failure information I1 to the failure information processing device 4. That is, one processor 2 in the failure detection group 3
It is possible to deal with the failure that has occurred in 1) according to the importance of the processor 2 in the failure detection group 3.

【0022】更に、障害を検出し処理する障害情報処理
装置4は、各障害検出グループ3の障害検出プロセッサ
2aからの障害情報I1を処理すればよいため、この障
害情報処理装置4への負荷の増大が抑えられる。
Further, since the fault information processing device 4 for detecting and processing the fault has only to process the fault information I1 from the fault detection processor 2a of each fault detection group 3, the load on the fault information processing device 4 is reduced. The increase is suppressed.

【0023】実施例2 図3は、本発明に係るマルチプロセッサシステムの実施
例2を示すブロック図である。
Second Embodiment FIG. 3 is a block diagram showing a second embodiment of the multiprocessor system according to the present invention.

【0024】図のようにこの実施例2の場合には、上記
実施例1のようにして分けられた各障害検出グループ3
内のプロセッサ2どうしが、障害検出専用バス8で接続
されている。そして各障害検出グループ3の障害検出プ
ロセッサ2aは、障害検出グループ3内の他のプロセッ
サ2に対し、この障害検出専用バス8を介してポーリン
グを行うことによって、それぞれの障害検出グループ3
内の障害を検出する。このように、障害検出専用バス8
を設けることにより、障害検出のためにシステムバス1
を使用する頻度を減らして、システム全体の性能の低下
を抑えることができる。
As shown in the figure, in the case of the second embodiment, each failure detection group 3 divided as in the first embodiment.
The internal processors 2 are connected to each other through a fault detection dedicated bus 8. Then, the fault detection processor 2a of each fault detection group 3 polls the other processors 2 in the fault detection group 3 via the fault detection dedicated bus 8 so that each fault detection group 3
To detect a fault within. In this way, the fault detection dedicated bus 8
By providing the system bus 1 for fault detection
It is possible to reduce the frequency of using, and suppress the deterioration of the performance of the entire system.

【0025】実施例3 図4は、本発明に係るマルチプロセッサシステムの実施
例3を示すブロック図である。
Third Embodiment FIG. 4 is a block diagram showing a third embodiment of the multiprocessor system according to the present invention.

【0026】図のようにこのマルチプロセッサシステム
では、障害検出グループ3の形成方法が上記二つの実施
例1,2と異なる。即ち、システムバス1で結合された
複数個のプロセッサ2は、機能的に関連づけられるプロ
セッサごとに、最上位の障害検出グループから最下位の
障害検出グループまで、上位のグループが下位のグルー
プを包含した形で複数の障害検出グループ3に分けられ
ている。これらの障害検出グループ3は、上位のものほ
ど、システム上、より重要な機能を有するものとする。
そして各障害検出グループ3の中枢となるプロセッサ
が、それぞれの障害検出グループ3内の障害を検出する
障害検出プロセッサに指定されている。この実施例3の
場合、障害検出グループ3として、最上位の障害検出グ
ループ3aと、中間の準障害検出グループ3bと、最下
位の準々障害検出グループ3cとが形成されるととも
に、各グループ3a,3b,3cのプロセッサ2の一つ
がそれぞれ、障害検出プロセッサ2a,準障害検出プロ
セッサ2b,準々障害検出プロセッサ2cに指定されて
いる。
As shown in the figure, in this multiprocessor system, the method of forming the fault detection group 3 is different from that of the above two embodiments 1 and 2. In other words, the plurality of processors 2 connected by the system bus 1 include lower groups, from the highest failure detection group to the lowest failure detection group, for each processor that is functionally related. It is divided into a plurality of failure detection groups 3 in the form. It is assumed that the higher the fault detection group 3, the more important the system has in function.
The central processor of each failure detection group 3 is designated as the failure detection processor that detects a failure in each failure detection group 3. In the case of the third embodiment, as the failure detection group 3, a highest failure detection group 3a, an intermediate quasi-failure detection group 3b, and a lowest quasi-fault failure detection group 3c are formed, and each group 3a, One of the processors 2 of 3b and 3c is designated as the fault detection processor 2a, the quasi-fault detection processor 2b, and the quasi-quarter fault detection processor 2c, respectively.

【0027】また、上記各障害検出グループ3a,3
b,3c内のプロセッサ2どうしは、下位のグループが
存在すればその下位のグループの障害検出プロセッサと
共に障害検出専用バス9,10,11で接続されてい
る。つまり最上位の障害検出グループ3a内のプロセッ
サ2どうしは、準障害検出グループ3bの準障害検出プ
ロセッサ2bと共に障害検出専用バス9で接続され、準
障害検出グループ3bのプロセッサ2どうしは、準々障
害検出グループ3cの準々障害検出プロセッサ2cと共
に準障害検出専用バス10で接続されている。そして最
下位の準々障害検出グループ3cのプロセッサ2どうし
は、準々障害検出専用バス11で接続されている。
Further, each of the fault detection groups 3a, 3 described above
If there is a lower group, the processors 2 in b and 3c are connected to the fault detection processors of the lower group by fault detection dedicated buses 9, 10, and 11. That is, the processors 2 in the highest-level failure detection group 3a are connected together with the quasi-failure detection processor 2b in the quasi-failure detection group 3b through the failure detection dedicated bus 9, and the processors 2 in the quasi-failure detection group 3b are detected in the quasi-failure detection. The quasi-fault detection processor 2c of the group 3c is connected to the quasi-fault detection dedicated bus 10. The processors 2 of the lowest quarter-fault detection group 3c are connected by a quarter-fault detection dedicated bus 11.

【0028】更に、システムバス1には、上記二つの実
施例1,2と同様に、システム全体の障害を検出し処理
する障害情報処理装置4が接続されている。
Further, the system bus 1 is connected to a fault information processing device 4 for detecting and processing a fault in the entire system, as in the above-described first and second embodiments.

【0029】上記構成のマルチプロセッサシステムで
は、各障害検出グループ3a,3b,3cの障害検出プ
ロセッサ2a,2b,2cが、各障害検出専用バス9,
10,11を介してポーリングを行うことにより、最終
的に最上位の障害検出グループ3aの障害検出プロセッ
サ2aが、各グループ3a,3b,3c内の障害を検出
し、障害情報処理装置4へ障害情報I1を出力する。そ
して障害情報処理装置4が、その最上位の障害検出グル
ープ3aの障害検出プロセッサ2aからの障害情報I1
に基づき、上記実施例1で説明したように障害処理情報
I2を各障害検出グループ3a,3b,3cのプロセッ
サ2へ送って、障害に対する処理を行うことになる。
In the multiprocessor system having the above-mentioned configuration, the fault detection processors 2a, 2b, 2c of the fault detection groups 3a, 3b, 3c have the fault detection dedicated buses 9,
By polling via 10 and 11, the fault detection processor 2a of the highest fault detection group 3a finally detects the fault in each of the groups 3a, 3b and 3c, and the fault information processing device 4 is faulted. The information I1 is output. Then, the fault information processing device 4 receives the fault information I1 from the fault detection processor 2a of the highest fault detection group 3a.
Based on the above, the fault processing information I2 is sent to the processor 2 of each fault detection group 3a, 3b, 3c as described in the first embodiment, and the process for the fault is performed.

【0030】この実施例3におけるマルチプロセッサシ
ステムの場合には、機能別に分けられた各障害検出グル
ープ3a,3b,3cが階層的に構成されたことによ
り、システム内の一つのプロセッサ2に発生した障害に
対し、そのプロセッサ2が属するグループ3の機能のシ
ステム内における重要度に応じて、またグループ3内に
おけるそのプロセッサ2の重要度に応じて対応すること
が可能になる。
In the case of the multiprocessor system according to the third embodiment, each fault detection group 3a, 3b, 3c classified by function is hierarchically constructed, so that it occurs in one processor 2 in the system. The failure can be dealt with according to the importance of the function of the group 3 to which the processor 2 belongs in the system and according to the importance of the processor 2 in the group 3.

【0031】また、システム全体の障害を検出し処理す
る障害情報処理装置4は、最上位の障害検出グループ3
aの障害検出プロセッサ2aからの障害情報I1だけを
処理すればよいため、この障害情報処理装置4への負荷
は、上記二つの実施例1,2の場合よりさらに小さく抑
えられる。
Further, the fault information processing device 4 for detecting and processing the fault of the entire system is the fault detection group 3 at the highest level.
Since it is necessary to process only the fault information I1 from the fault detection processor 2a of a, the load on the fault information processing device 4 can be further suppressed as compared with the cases of the above two embodiments 1 and 2.

【0032】[0032]

【発明の効果】以上説明したとおり、本発明に係るマル
チプロセッサシステムによれば、システム上重要なプロ
セッサはもちろん、その他のプロセッサについても障害
を検出することができ、しかも障害を検出し処理する装
置への負荷の増大を抑えることができる。
As described above, according to the multiprocessor system of the present invention, it is possible to detect a fault not only in a system-important processor but also in another processor, and a device for detecting and processing the fault. It is possible to suppress an increase in the load on the.

【0033】更に、システム内の一つのプロセッサに発
生した障害に対し、そのプロセッサの重要度に応じた対
応が可能になる。
Furthermore, it becomes possible to deal with a failure occurring in one processor in the system according to the importance of the processor.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施例1を示すブロック図である。FIG. 1 is a block diagram showing a first embodiment of the present invention.

【図2】障害情報処理装置の構成を示すブロック図であ
る。
FIG. 2 is a block diagram showing a configuration of a fault information processing device.

【図3】本発明の実施例2を示すブロック図である。FIG. 3 is a block diagram showing a second embodiment of the present invention.

【図4】本発明の実施例3を示すブロック図である。FIG. 4 is a block diagram showing a third embodiment of the present invention.

【図5】従来例を示すブロック図である。FIG. 5 is a block diagram showing a conventional example.

【符号の説明】[Explanation of symbols]

1 システムバス 2 プロセッサ 2a,2b,2c 障害検出プロセッサ 3(3a,3b,3c) 障害検出グループ 4 障害情報処理装置 8,9,10,11 障害検出専用バス 1 System Bus 2 Processors 2a, 2b, 2c Fault Detection Processor 3 (3a, 3b, 3c) Fault Detection Group 4 Fault Information Processing Device 8, 9, 10, 11 Fault Dedicated Bus

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 自己障害診断機能を備えた複数個のプロ
セッサをシステムバスで結合して成るマルチプロセッサ
システムにおいて、 上記複数個のプロセッサを、機能的に関連づけられるプ
ロセッサごとに複数の障害検出グループに分けるととも
に、その各障害検出グループの中枢となるプロセッサ
を、それぞれのグループ内の障害を検出する障害検出プ
ロセッサに指定し、 上記システムバスに、上記各障害検出グループの障害検
出プロセッサからの障害情報に基づいてシステム全体の
障害を検出し処理する障害情報処理装置を接続したこと
を特徴とするマルチプロセッサシステム。
1. A multiprocessor system in which a plurality of processors having a self-fault diagnosis function are coupled by a system bus, wherein the plurality of processors are grouped into a plurality of fault detection groups for each processor functionally associated with each other. In addition to dividing, specify the central processor of each fault detection group as the fault detection processor that detects the fault in each group, and specify the fault information from the fault detection processor of each fault detection group on the system bus. A multiprocessor system characterized in that a failure information processing device for detecting and processing a failure of the entire system based on the system is connected.
【請求項2】 自己障害診断機能を備えた複数個のプロ
セッサをシステムバスで結合して成るマルチプロセッサ
システムにおいて、 上記複数個のプロセッサを、機能的に関連づけられるプ
ロセッサごとに複数の障害検出グループに分けるととも
に、その各障害検出グループの中枢となるプロセッサ
を、それぞれのグループ内の障害を検出する障害検出プ
ロセッサに指定し、かつ上記各障害検出グループ内のプ
ロセッサどうしを障害検出専用バスで接続し、 上記システムバスに、上記各障害検出グループの障害検
出プロセッサからの障害情報に基づいてシステム全体の
障害を検出し処理する障害情報処理装置を接続したこと
を特徴とするマルチプロセッサシステム。
2. In a multiprocessor system in which a plurality of processors having a self-fault diagnosis function are connected by a system bus, the plurality of processors are grouped into a plurality of fault detection groups for each processor functionally associated with each other. In addition to dividing, specify the central processor of each fault detection group as a fault detection processor that detects a fault in each group, and connect the processors in each fault detection group with a fault detection dedicated bus, A multiprocessor system characterized in that a fault information processing device for detecting and processing a fault of the entire system based on fault information from a fault detection processor of each fault detection group is connected to the system bus.
【請求項3】 自己障害診断機能を備えた複数個のプロ
セッサをシステムバスで結合して成るマルチプロセッサ
システムにおいて、 上記複数個のプロセッサを、機能的に関連づけられるプ
ロセッサごとに、最上位の障害検出グループから最下位
の障害検出グループまで、上位のグループが下位のグル
ープを包含した形で複数の障害検出グループに分けると
ともに、その各障害検出グループの中枢となるプロセッ
サを、それぞれのグループ内の障害を検出する障害検出
プロセッサに指定し、かつ上記各障害検出グループ内の
プロセッサどうしを下位のグループの障害検出プロセッ
サと共に障害検出専用バスで接続し、 上記システムバスに、上記最上位の障害検出グループの
障害検出プロセッサからの障害情報に基づいてシステム
全体の障害を検出し処理する障害情報処理装置を接続し
たことを特徴とするマルチプロセッサシステム。
3. A multiprocessor system in which a plurality of processors having a self-fault diagnosis function are connected by a system bus, and the highest level fault detection is performed for each processor functionally associated with the plurality of processors. From the group to the lowest fault detection group, the upper group divides the lower groups into multiple fault detection groups, and the central processor of each fault detection group is used to identify the faults in each group. Specify the fault detection processor to detect and connect the processors in each fault detection group together with the fault detection processors of the lower groups with the fault detection dedicated bus, and connect the system bus to the fault of the top fault detection group. Detects faults in the entire system based on fault information from the detection processor. Multiprocessor system characterized by connecting the fault information processing apparatus for processing.
JP3300243A 1991-11-15 1991-11-15 Multiprocessor system Pending JPH05134998A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3300243A JPH05134998A (en) 1991-11-15 1991-11-15 Multiprocessor system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3300243A JPH05134998A (en) 1991-11-15 1991-11-15 Multiprocessor system

Publications (1)

Publication Number Publication Date
JPH05134998A true JPH05134998A (en) 1993-06-01

Family

ID=17882435

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3300243A Pending JPH05134998A (en) 1991-11-15 1991-11-15 Multiprocessor system

Country Status (1)

Country Link
JP (1) JPH05134998A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06348664A (en) * 1993-06-04 1994-12-22 Nec Corp Controller for computer system constituted of plural cpus provided with different instruction characteristics
JP2000010822A (en) * 1998-06-25 2000-01-14 Yokogawa Electric Corp Down detecting device for decentralized object
JP2009037448A (en) * 2007-08-02 2009-02-19 Nec Computertechno Ltd Fault detection device, fault detection method, and fault detection program
US7502956B2 (en) 2004-07-22 2009-03-10 Fujitsu Limited Information processing apparatus and error detecting method
WO2010021040A1 (en) * 2008-08-21 2010-02-25 富士通株式会社 Information processing apparatus and method for controlling information processing apparatus

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06348664A (en) * 1993-06-04 1994-12-22 Nec Corp Controller for computer system constituted of plural cpus provided with different instruction characteristics
JP2000010822A (en) * 1998-06-25 2000-01-14 Yokogawa Electric Corp Down detecting device for decentralized object
US7502956B2 (en) 2004-07-22 2009-03-10 Fujitsu Limited Information processing apparatus and error detecting method
JP2009037448A (en) * 2007-08-02 2009-02-19 Nec Computertechno Ltd Fault detection device, fault detection method, and fault detection program
WO2010021040A1 (en) * 2008-08-21 2010-02-25 富士通株式会社 Information processing apparatus and method for controlling information processing apparatus
US8423699B2 (en) 2008-08-21 2013-04-16 Fujitsu Limited Information processing apparatus and method for controlling information processing apparatus
JP5516402B2 (en) * 2008-08-21 2014-06-11 富士通株式会社 Information processing apparatus and information processing apparatus control method

Similar Documents

Publication Publication Date Title
JPS6347849A (en) Mode switching system
JPH05134998A (en) Multiprocessor system
JP2538876B2 (en) Data processing device with common bus structure
JPS60100231A (en) System constitution control system of information processor
JPS62236056A (en) Input/output controller for information processing system
JPH113293A (en) Computer system
JPH05204692A (en) Failure detecting/separating system for information processor
JPS6213700B2 (en)
JPH05314086A (en) Fault data sampling system
JPH05158843A (en) Fault segmenting system for communication interface
JPH05120161A (en) Peripheral controller
JPH05100885A (en) Fault detecting system for information processing system having shared storage device
JPH08331162A (en) Token passing ring fault detection system
JPH02148146A (en) Fault detecting device for information processor
JPH04336632A (en) Fault detection system for shared storage system
JPH0118460B2 (en)
JPH05233578A (en) Faulty device degeneration method
JPH08286956A (en) Fault logging system
JPWO2008072350A1 (en) System monitoring apparatus and monitoring method using dual timer
JPS6184743A (en) Logic package incorporating diagnostic circuit
JPS62232040A (en) Fault detecting system
JPS6244847A (en) System supervising method
JPH09138757A (en) Fault detection method for computer system
JPH01216438A (en) Fault informing system
JPH0229145A (en) Ema trace system