JPS63191240A - Multi-processor system - Google Patents

Multi-processor system

Info

Publication number
JPS63191240A
JPS63191240A JP62024306A JP2430687A JPS63191240A JP S63191240 A JPS63191240 A JP S63191240A JP 62024306 A JP62024306 A JP 62024306A JP 2430687 A JP2430687 A JP 2430687A JP S63191240 A JPS63191240 A JP S63191240A
Authority
JP
Japan
Prior art keywords
processor
signal
interrupt
fault
faulty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62024306A
Other languages
Japanese (ja)
Inventor
Kazuo Nakanishi
中西 和男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nissin Electric Co Ltd
Original Assignee
Nissin Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nissin Electric Co Ltd filed Critical Nissin Electric Co Ltd
Priority to JP62024306A priority Critical patent/JPS63191240A/en
Publication of JPS63191240A publication Critical patent/JPS63191240A/en
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

PURPOSE:To prevent the total discontinuation of a multi-processor system by separating logically only a processor having a fault from the system CONSTITUTION:When a processor P has a fault among plural processors, a fault occurrence signal is delivered to a system state monitor signal line from the processor P. An optional processor monitoring the state of said signal line decides the occurrence of the fault with detection of the fault occurrence signal. A processor detecting means calls successively other processors to detect and specify a faulty one and gives the control commands to the faulty processor for stopping, resetting, interruption inhibiting actions, etc., based on the address signal of an address bus (a) and the data of a data bus (d). Thus the faulty processor stops the operation of a CPU, etc., resets each part and inhibits the interruptions supplied from an input/output control part, etc., based on the given control commands. Then the faulty processor is separated logically from a multi-processor system.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、複数のプロセッサを共通バスにより結合し
て構成されたマルチプロセッサシステムに関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a multiprocessor system configured by connecting a plurality of processors via a common bus.

〔従来の技術〕[Conventional technology]

マルチプロセッサシステムは、たとえば第4図に示すよ
うな構成になって2す、複数個のプロセッサ(Pl)、
(Pり、・・・、 (Pガ)(以下総称して(Plとす
る)がアドレスバス・データバス・コントロールバス等
からなる共通バス(B)により有機的に結合されるとと
もに、この共通バス[B)に複数個の入出力制御部(I
OQ )−(IOCm)、 −、(IOCm)(以下総
称して(IOC)とする)および共通メモIJ (M)
が接続され、個々のプロセッサ(1’)がもつ処理能力
以上の処理能力を提供できるようになっている。
A multiprocessor system has a configuration as shown in FIG. 4, for example, and includes a plurality of processors (Pl),
(Pri, ..., (Pga) (hereinafter collectively referred to as (Pl)) are organically connected by a common bus (B) consisting of an address bus, data bus, control bus, etc., and this common Multiple input/output control units (I
OQ) - (IOCm), -, (IOCm) (hereinafter collectively referred to as (IOC)) and common memo IJ (M)
are connected to each other to provide processing power greater than that of each individual processor (1').

ところで、前記マルチプロセッサシステムでは、複数の
プロセッサ(P)のうち1つのプロセッサ(1’lに障
害が発生すると、該プロセッサ(Plの暴走等によリシ
ステム全体が誤動作する危険があるため、従来より、他
の正常なプロセッサがこの状況を検出してシステムを停
止させること、およびこのような障害発生状況を短時間
に修復するために障害発生プロセッサを特定することが
行なわれている。
By the way, in the multiprocessor system, if a failure occurs in one processor (1'l) among the plurality of processors (P), there is a risk that the entire system will malfunction due to runaway of that processor (Pl, etc.). Therefore, other normal processors detect this situation and stop the system, and the faulty processor is identified in order to repair such a faulty situation in a short time.

たとえば、前者の場合、第5図に示すように、共通バス
(Hlに、@プロセッサ(月が接続されるシステム状態
監視信号線(s)およびリセット信号W(rlを設け、
両信号線(sl 、 (ri ’ir:それぞれプルア
ップ抵抗量を介して正電源端子(+■)に接続し、両信
号線(S)。
For example, in the former case, as shown in FIG.
Both signal lines (sl, (ri'ir) are connected to the positive power supply terminal (+■) through pull-up resistors, respectively, and both signal lines (S).

frl eハイレベル(以下「ハイ」という)に保持し
ている。
frl e is maintained at a high level (hereinafter referred to as "high").

そして、任意のプロセッサ(月に障害が発生し、これが
各プロセッサ(P)毎の障害検出子役により検出される
と、該手段より「ハイ」の障害発生信号が出力され、オ
ープンコレクタ型のドライバfl+で信号線(81がロ
ウレベル(以下「ロウ」という)にドライブされる。
When a failure occurs in any processor (month) and this is detected by the failure detection child actor of each processor (P), a "high" failure occurrence signal is output from the means, and the open collector type driver fl+ The signal line (81) is driven to a low level (hereinafter referred to as "low").

したがって、信号線(S)の状態を監視している各プロ
セッサ(Piでは、信号線(Slが「ロウ」になること
により、第1ノット回路(2Iより「ハイ」の障害検出
信号が出力され、該信号によりランプ、 LED。
Therefore, in each processor (Pi) that monitors the state of the signal line (S), when the signal line (Sl) becomes "low", a "high" fault detection signal is output from the first knot circuit (2I). , Lamp, LED according to the signal.

ブザー等の表示・報知手段が駆動さn、オペレータ等の
人間に障害発生を知らせるようにしている。
A display/notification means such as a buzzer is activated to notify a human such as an operator of the occurrence of a failure.

さらに、前記任意のプロセッサ(P)では、障害発生信
号と障害検出信号とのアンドにより第lアンド回路(3
)より「ハイ」のリセット指令信号が出力され、オープ
ンコレクタ盛出力のノア回路f41’z介してリセット
信号線(「)が「ハイ」から10ワ」にドライブされる
Furthermore, in the arbitrary processor (P), the l-th AND circuit (3
) outputs a "high" reset command signal, and the reset signal line () is driven from "high" to 10 watts via the open collector output NOR circuit f41'z.

この結果、各プロセッサ(P)では、信号air)が「
ロウ」になることにより、第2ノット回路(5)より「
ハイ」の信号が出力され、このとき、リセット回路より
パワーオンリセットの「ハイ」の信号が出力されること
がなく、第3ノット回路16)より「ハイ」の信号が出
力され続けるため、第2アンド回路(7)より「ハイ」
のリセット信号がそれぞれのリセット回路へ出力され、
各プロセッサ(Plは動作を停止する。
As a result, in each processor (P), the signal air) is "
By becoming “low”, the second knot circuit (5)
At this time, the reset circuit does not output the power-on reset "high" signal, and the third knot circuit 16) continues to output the "high" signal. “High” from 2-AND circuit (7)
A reset signal is output to each reset circuit,
Each processor (Pl stops operating.

また、佐者の場合は、−例として第6図に示すように構
成される。
In addition, in the case of a player, the configuration is as shown in FIG. 6 as an example.

すなわち、複数のプロセッサ(P)のうち1つのプロセ
ッサfP)に障害が発生すると、このプロセッサ(杓は
m1述と同様にして障害発生信号を出力してオープンコ
レクタ型のドライバfll ’iオンにし、システム状
態監視信号1(s)’krロウ」にドライブする。
That is, when a fault occurs in one processor (fP) among the plurality of processors (P), this processor (P) outputs a fault occurrence signal in the same manner as described in m1 and turns on the open collector driver fll'i. System status monitoring signal 1(s) is driven to 'kr low'.

すると、複数のプロセッサIP)のうち障害を3こして
いないプロセッサ(Plの1つが、インバータ■を介し
、信号線(8+が「ロウ」にドライブされたことを検出
し、これによってCP U (s+に割込みがかかり、
該CP U (83が障害発生プロセッサ()’l k
特定するプログラムを実行し、つきのように動作する。
Then, one of the processors (Pl) that is not faulty among the plurality of processors (IP) detects that the signal line (8+) is driven to "low" via the inverter (2), and as a result, the CPU (s+ is interrupted,
The CPU (83 is the faulty processor ()'l k
Execute the specified program and operate as if it were attached.

すなわち、前記正常なプロセッサ旧の1つは。That is, the normal processor old one.

まず、自分以外の各プロセッサfPlのそれぞれのゲー
ト回rI&c(zのアドレスデータi Il[次送出し
、各プロセッサ(卸ヲ呼び出す。
First, each gate circuit rI&c(z) of each processor fPl other than itself is sent, and each processor (output is called).

し友がって、各プロセッサ(Plでは、共通バス同金a
成するアドレスバス(al上のアドレスデータをアドレ
スデコーダ口υに取り込み、自己のゲート回路32に与
えられ友アドレスデータを取り込んだとき、ゲート回路
C(2に呼出信号を出力し、これによりゲート回路(至
)が開かれる。
Accordingly, each processor (Pl) uses a common bus
When the address data on the address bus (al), which is formed by the (to) is opened.

この比め、障害プロセッサ(Plが呼び出されると。In comparison, when the fault processor (Pl) is called.

そのゲート回路32ヲ通して前記障害発生信号が共通バ
ス(Bl ’!e構成するデータバスtdl上に送出さ
れるから、正常プロセッサ[Plでは、送出したアドレ
スデータとデータバスfdl上の障害発生信号とにより
11Wプロセツサ(E’l−検出する。
Through the gate circuit 32, the fault occurrence signal is sent onto the data bus tdl constituting the common bus (Bl'!e), so that the normal processor [Pl] receives the sent address data and the fault occurrence signal on the data bus fdl. The 11W processor (E'l-detects).

このようにして、障害の発生したプロセッサ(P)を特
定するようにしている。
In this way, the faulty processor (P) is identified.

〔発明が解決しようとする問題点」 ところが、前記従来の構成では、システム内の一部の障
害、すなわち任意のプロセッサ(P)の障害によってシ
ステム全体が停止してしまうことになり、平均故障間隔
であるM’H3F(mean time bet −w
een failure)が低−ドし、システムの機能
の時間的安定性、すなわち信頼性が低下する入点がある
[Problems to be Solved by the Invention] However, in the conventional configuration, the entire system stops due to a failure in a part of the system, that is, a failure in any processor (P), and the mean time between failures decreases. M'H3F(mean time bet -w
There is a point at which the temporal stability, or reliability, of the system's functionality decreases.

一方、平均修復時間であるMTTR(mean tim
eto repair)は、既述したRW発生プロセッ
サ金特定する手段によって十分小さくできるが、MTB
FとMTTR,と金柑いて表わされる可用率(MT h
l F/(MTBF+MTTJ)を上げるためには、前
述のMTBF”k大きくしなければならない。
On the other hand, the mean repair time (MTTR)
eto repair) can be made sufficiently small by the above-mentioned means of specifying the RW generation processor cost, but MTB
F and MTTR, the availability rate (MT h
In order to increase lF/(MTBF+MTTJ), the aforementioned MTBF''k must be increased.

ところで、現存するマルチプロセッサシステムは、特定
のアプリケーション(tとえば流体解析などの数値計算
等)に対する処理スピードを上げることを目的としてい
るため、汎用のオペレーティングシステムの構築が難か
しく、複数のプロセッサのうちいずれかのプロセッサに
障害が発生した場合のシステムの誤動作を未然に防止す
るために、既述の如<MTBFの低下、つまり可用率の
低下を@認した上でシステム全体を停止せざるを得なか
った。
By the way, existing multiprocessor systems aim to increase processing speed for specific applications (for example, numerical calculations such as fluid analysis), making it difficult to build a general-purpose operating system and using multiple processors. In order to prevent system malfunctions in the event of a failure in one of the processors, it is necessary to stop the entire system after acknowledging the drop in MTBF, that is, the drop in availability, as described above. I didn't get it.

しかし、最近では、マイクロプロセッサの機能向上と低
価格化とによりマルチプロセッサシステムの構築が容易
になりつつあり、これによって、一般的な(汎用)アプ
リケーションにもマルチプロセッサシステムを適用する
ことが要求されるようになってきて旧り、それに伴ない
マルチプロセッサシステムの可用率を上げることが要求
されるようになってきた。
However, in recent years, it has become easier to construct multiprocessor systems due to improved functionality and lower prices of microprocessors, and as a result, it has become necessary to apply multiprocessor systems to general (general-purpose) applications. With this trend, there has been a need to increase the availability of multiprocessor systems.

この発明は、前記の点に留意してなされたものであり、
障害が発生したプロセッサをシステム全体を停止するこ
となくシステムから論理的に切り離し、システム全体に
障害が波及しない手段を提供しようとするものである。
This invention was made with the above points in mind,
The objective is to logically disconnect a faulty processor from the system without stopping the entire system, and to provide a means to prevent the fault from spreading to the entire system.

〔問題点全解決するための手段〕[Means to solve all problems]

この発明は、複数のプロセッサを共通バスにより結合す
るとともに、前記共通バスに入出力制御部旧よび共通メ
モリ等を接続し、かつ、前記いずれかのプロセッサに障
害が発生した場合に障害発生のプロセッサを特定し得る
よう構成してなるマルチプロセッサシステムに耶いて、 niJ記共通バスを構成するアドレスバスのアドレス信
号および前記共通バスを構成するデータバスのデータに
もとずいて前記障害発生のプロセッサに停止、リセット
、割込み禁止等の制御指令を与える手段と、前記各プロ
セッサに設けられ前記共通バスを介して前記入出力制御
部等から入力される割込みを前記任意のプロセッサから
の割込み禁止の制御指令により禁止する手段とを備えた
ことを特徴とするものである。
This invention connects a plurality of processors by a common bus, connects an old input/output control unit, a common memory, etc. to the common bus, and when a failure occurs in any of the processors, the processor Based on the address signal of the address bus constituting the common bus and the data of the data bus constituting the common bus, means for giving control commands such as stop, reset, and interrupt prohibition; and a control command for disabling interrupts from any of the processors provided in each of the processors and input from the input/output control unit or the like via the common bus. The invention is characterized in that it includes a means for prohibiting the above.

〔作用〕[Effect]

したがって、この発明によれば、複数のプロセッサのう
ち1つのプロセッサに障害が発生すると、公知の手段、
たとえば障害が発生したプロセッサよりシステム状態監
視信号線に障害発生信号が出力され、この信号線の状態
を監視している任意のプロセッサで前記障害発生信号の
検出により障害発生を判断し、続いて他の各プロセッサ
を順次呼び出して障害発生のプロセッサを検出するよう
な手段により、障害発生プロセッサを特定し、アドレス
バスのアドレス信号とデータバスのデータにもとずいて
障害発生のプロセッサに停止、リセット、割込み禁止等
の制御指令を与える。
Therefore, according to the present invention, when a failure occurs in one of the plurality of processors, the known means
For example, a fault occurrence signal is output from a faulty processor to a system status monitoring signal line, and any processor monitoring the state of this signal line determines that a fault has occurred by detecting the fault occurrence signal, and then The faulty processor is identified by sequentially calling each processor in order to detect the faulty processor, and the faulty processor is stopped, reset, or stopped based on the address signal on the address bus and the data on the data bus. Gives control commands such as disabling interrupts.

この結果、障害発生のプロセッサは、与えられた制御指
令により、CPU等の停止や各部のリセット、さらに入
出力制御部等からの割込みを禁止し。
As a result, the faulty processor stops the CPU, resets each part, and prohibits interrupts from the input/output control part, etc., according to the control command given.

当該プロセッサがシステムから論理的に切り離される。The processor is logically separated from the system.

な8、障害発生のプロセッサに入力されるべき入出力制
御部等からの割込みは、たとえば的記庄意のプロセッサ
の指令により、狗のプロセッサが取り扱うことになる。
8. Interrupts from the input/output control unit, etc. that should be input to the faulty processor are handled by the dog processor, for example, according to instructions from the designated processor.

〔実施例1 つぎに、この発明を、そのl実施例を示した第1図ない
し第8図とともに詳細に説明する。
[Embodiment 1] Next, the present invention will be explained in detail with reference to FIGS. 1 to 8 showing embodiments thereof.

まず、第1因は、アドレスバス(a)、データバス+d
l 、 コントロールバス(C1、割込みバス(il 
zよびシステム状態監視信号線(S)よりなる共通バス
+H1によって結合された複数のプロセッサ旧のうち、
1つのプロセッサ(Plの要部を示している。
First, the first factor is address bus (a), data bus +d
l, control bus (C1, interrupt bus (il)
Among the plurality of processors connected by a common bus +H1 consisting of z and system status monitoring signal line (S),
The main parts of one processor (Pl) are shown.

同図に2いて、(8)はCPUであり、そのデータ端子
、アドレス端子葛よびリード・ライト等のコントロール
端子がそれぞれバスバッファ(9)、C0,tll11
21はアンド回路であり、一方の入力端子に各プロセッ
サ(Pl毎に設けられた障害検出手段からの「ハイ」の
障害発生信号が入力され、出力端子がオープンコレクタ
型のドライバfl+ ?介して信号線(S)に接続され
ている。03は出力端子がアンド回路+121の他方の
入力端子に接続された第1制御回路であり、通常は「ハ
イ」の信号を出力し、電源投入時のパワーオンリセット
信号または後述の第2制御回路からの障害出力停止信号
が入力された時のみ「ロウ」の信号を出力する。
2 in the same figure, (8) is a CPU whose data terminals, address terminals, and control terminals such as read/write are bus buffers (9), C0, and tll11, respectively.
21 is an AND circuit, one input terminal receives a "high" fault occurrence signal from the fault detection means provided for each processor (Pl), and the output terminal receives the signal via an open collector type driver fl+? It is connected to the line (S).03 is the first control circuit whose output terminal is connected to the other input terminal of the AND circuit +121, and normally outputs a "high" signal, and the power is turned on when the power is turned on. It outputs a "low" signal only when an on-reset signal or a fault output stop signal from a second control circuit, which will be described later, is input.

■は信号線[51の状態を監視し障害発生信号、すなわ
ち信号!+31の「ロウ」の状態を検出して障害検出信
号を出力する検出回路であり、電源投入直後の自己診断
時に出力される「ロウ」の障害検出制御信号により障害
発生信号の検出を禁止する以外は、常時検出状態にある
。(+61は第2制御回路であり、横出回路圓からの障
害検出信号や後述の割込みゲート回路からの割込み要求
信号が入力され、各入力信号の入力に応じてCP U 
(81の割込み端子に割込み信号が人力される。
■ Monitors the status of the signal line [51 and indicates a fault occurrence signal, that is, a signal! This is a detection circuit that detects the "low" state of +31 and outputs a fault detection signal, and does not prohibit the detection of fault occurrence signals using the "low" fault detection control signal that is output during self-diagnosis immediately after power is turned on. is always in the detection state. (+61 is a second control circuit, into which a fault detection signal from the Yokode circuit and an interrupt request signal from an interrupt gate circuit (to be described later) are input, and the CPU is controlled according to the input of each input signal.
(An interrupt signal is manually input to the interrupt terminal 81.

ここで、第2制御回路圃は、たとえば、検出回路041
からの障害検出信号2割込みゲート回路か、らの割込み
要求信号等の複数の割込みのための信号線がそれぞれ接
続されたオア回路3よびラッチ回路よりなり、オア回路
の出力がCl’ U fg1の割込み端子に入力される
とともに、ラッチ回路でラッチされたデータがデータバ
ス上に入力される構成になってどり、任意の割込みのた
めの信号がオア回路を介してCP U fg)に入力さ
れると、CPU +81からの割込み応答信号によって
ラッチ回路が割込みのための信号線の状態をラッチし、
CP [J fg1が割込み信号によって実行する割込
み処理プログラムでラッチされたデータを読み取り、割
込み要因。
Here, the second control circuit field is, for example, the detection circuit 041
It consists of an OR circuit 3 and a latch circuit to which signal lines for multiple interrupts such as a failure detection signal 2 interrupt gate circuit or an interrupt request signal from The configuration is such that the data latched by the latch circuit is input to the data bus as well as being input to the interrupt terminal, and the signal for any interrupt is input to the CPU (fg) via the OR circuit. Then, the latch circuit latches the state of the signal line for interrupt according to the interrupt response signal from CPU +81,
CP [J Reads the data latched by the interrupt processing program executed by fg1 in response to the interrupt signal, and determines the cause of the interrupt.

すなわち障害検出信号か刷込み要求信号か等を判定する
仕組みになっている。
In other words, the system is designed to determine whether the signal is a fault detection signal or an imprint request signal.

あるいは、この第2制御回路(15)は、複数の割込み
の几めの信号線がそれぞれ接続されたオア回路およびプ
ライオリティエンコーダとこのエンコーダ出力をデータ
バス上に出力するゲート回路とからなり、任意のあるい
は任意数の割込みのための信号がオア回路を介してCP
 U fg)に人力されると、CP U fg1からの
割込み応答信号によってゲート回路が開かれ、CP U
 (81がエンコーダ出力をデータバスから読み収り、
割込み処理プログラムを選択して実行し、優先順位の高
い割込み要求上受は付ける仕組みになっている。
Alternatively, the second control circuit (15) is composed of an OR circuit to which a plurality of interrupt signal lines are respectively connected, a priority encoder, and a gate circuit that outputs the encoder output onto the data bus, Alternatively, signals for any number of interrupts can be routed to the CP via an OR circuit.
When the CPU fg1 is manually operated, the gate circuit is opened by the interrupt response signal from the CPU fg1, and the CPU
(81 reads the encoder output from the data bus,
It selects and executes an interrupt processing program, and accepts interrupt requests with higher priority.

な8、ある種のCPUでは割込み要求受付端子を複数有
してどり、このようなCPUe使用ししかもその端子数
以下の割込み要求しか存在しないような場合には、各割
込みのための信号線がそれぞれ受付端子に接続され、前
述したような第2電IJ疵回路(16)は不要となる。
8. Some types of CPU have multiple interrupt request reception terminals, and when using such a CPU and there are fewer interrupt requests than the number of terminals, the signal line for each interrupt is The second electric IJ defect circuit (16), which is connected to the reception terminal, as described above, becomes unnecessary.

ところで、各プロセッサCP+に8けるC ]’ U 
(81では、彼程、詳述するが、障害検出信号の割込み
が入力すれると、アドレスバス(al上にアドレスデー
タを送出して他の各プロセッサ(月ヲ順次呼び出し、障
害発生のプロセッサ(Plt−データバス(dl上のデ
ータにより検出するとともに、該障害発生のプロセッサ
(P)に対して、停止、リセット、割込み禁止等の制御
指令データをデータバスtdl上に送出する機能金有し
ている◎ aeは割込みバス[iJ上の入出力割込み信号を受けて
第2制御回路Q51に割込み要求信号を出力する割込み
ゲート回路であり、いま、第2図に示すように、この柚
マルチプロセッサシステムに5個の入用力制御m (,
1(JC−ご(IOCs)が設けられているとすると、
割込みバス(iJは各入用力制御g1i (IUCl)
〜(IOCs)毎の5本の割込み要求線よりなり、各プ
ロセッサfP)には、各要求線毎の5個の刷込みゲート
回路(16θ〜(!りが備えられる。
By the way, each processor CP+ has 8 digits C ]' U
(This will be explained in detail in 81, but when the failure detection signal interrupt is input, the address data is sent out on the address bus (al) and the other processors are sequentially called, and the faulty processor ( Plt-data bus (dl) It has a function that detects the failure based on data on the data bus (dl) and sends control command data such as stop, reset, and interrupt prohibition to the faulty processor (P) over the data bus tdl. ◎ ae is an interrupt gate circuit that receives an input/output interrupt signal on the interrupt bus [iJ and outputs an interrupt request signal to the second control circuit Q51. 5 input force controls m (,
1 (JC-go (IOCs)) is provided,
Interrupt bus (iJ is each input input control g1i (IUCl)
It consists of five interrupt request lines for each ~(IOCs), and each processor fP is provided with five imprinted gate circuits (16θ~(!ri) for each request line.

そして1通常、1つの入出力側脚部(IOC)からの割
込みは、1つのプロセッサ(P)が受は付け、他のプロ
セッサ+1’l fl受は付けないように設定されるた
め、各プロセッサ(1’lでは、割込み制御回路(17
1より出力される割込み制御信号により各割込みゲート
(ロ)路(161)〜(16s)の開、閉が制御され、
各プロセッサ(Plに3いて予め設定された割込みのみ
ft受は付けるようにしている。
1 Normally, interrupts from one input/output leg (IOC) are set to be accepted by one processor (P) and not accepted by the other processors, so each processor (In 1'l, the interrupt control circuit (17
The opening and closing of each interrupt gate (b) path (161) to (16s) is controlled by the interrupt control signal output from 1,
Only interrupts set in advance in each processor (Pl) are allowed to receive ft.

賭はアドレスデコーダであり、各プロセッサ(1’1毎
のデコーダ賭は、障害検出信号の割込みを受は付けた任
意のプロセッサ田)のC)’ U f8]より出力され
たアドレスデータを取り込み、自分のプロセッサtl’
lに対するアドレスデータについて、後述のゲ−ト回路
または第3制御回路に呼出信号を出力する。すなわち、
システムの構築時に、各プロセッサ(P)毎のゲート回
路および第3制御回路にそれぞれ予めアドレスが設定さ
れ、前記任意のプロセッサ(PlのC)’ U (81
より各プロセッサ(月のゲート回路。
The decoder is an address decoder, which takes in the address data output from C)' U f8] of each processor (the decoder for each 1'1 is any processor that accepts the interrupt of the failure detection signal), my processor tl'
Regarding the address data for 1, a call signal is output to a gate circuit or a third control circuit, which will be described later. That is,
When constructing the system, addresses are set in advance for the gate circuit and third control circuit for each processor (P),
More each processor (Mon gate circuit.

第3制御回路のアドレスデータが出力されることにより
、これに該当するゲート回路、第3制御回路にデコーダ
賭より呼出信号が出力される。
When the address data of the third control circuit is output, a calling signal is output from the decoder to the corresponding gate circuit and the third control circuit.

+191はデコーダ(181からの呼出信号により開と
なり前記障害発生信号をデータバスCdl上に送出する
ゲート回路、ωはデコーダαaからの呼出信号のタイミ
ングでデータバスCdl上の制御指令データを取り込む
とともに保持しかつ解析する第3制御回路であり、ff
114 ?Jul指令データの解析に応じて、Cl’ 
U f81等に停止信号、他の各回路にリセット信号、
i1制御回路031に障害出力停止信号2割込みゲート
回Mt161に入出力割込みの入力?禁止する割込み禁
止信号をそれぞれ出力する。
+191 is a gate circuit which is opened by a call signal from the decoder (181) and sends out the fault occurrence signal onto the data bus Cdl, and ω takes in and holds the control command data on the data bus Cdl at the timing of the call signal from the decoder αa. and the third control circuit to be analyzed, ff
114? According to the analysis of Jul command data, Cl'
Stop signal to U f81 etc., reset signal to each other circuit,
Failure output stop signal to i1 control circuit 031 2 Interrupt gate input of input/output interrupt to Mt161? Outputs each interrupt disable signal to be disabled.

つぎに、前記実施例の動作について説明する。Next, the operation of the embodiment will be explained.

まず、電源投入後、各プロセッサ[Plはそれぞれプロ
セッサ自身の初期化を行ない、パワーオンリセット信号
金弟1制6flIロ路OJおよび第3制御(ロ)路−に
出力し、第1 ?1lII御IgJ路(13からの「ロ
ウ」の信号によりアンド回路a2gよびドライバ+Il
i介して信号)Y#tSlをIJ IJ−スするととも
に、第3制御回路四からのすべての信号出力を停止させ
る。
First, after the power is turned on, each processor (Pl) initializes itself and outputs a power-on reset signal to the first control (6flI) path (OJ) and the third control (b) path. 1lII control IgJ path (by the "low" signal from 13, AND circuit a2g and driver +Il
The signal Y#tSl is passed through IJ IJ-, and all signal outputs from the third control circuit 4 are stopped.

続いて、イニシャルプログラムをロードし、システムと
して動作を開始する。
Next, the initial program is loaded and the system starts operating.

このとき、イニシャルプログラムに8いて、各入出力制
御部(IOCI)〜(IOCs)のそれぞれの割込みを
取り扱うプロセッサ旧が決定され、各プロセッサ(Pl
にどいて、その割込み制御部1I60ηからの割込み制
御信号により6割込みゲートIP!回路06.)〜(1
6s)がそれぞれ開閉制御され、1つの入出力制御部(
IOC)からの割込みを1つのプロセッサfP)のみが
受は付けるように設定される。
At this time, the processor old that handles each interrupt of each input/output control unit (IOCI) to (IOCs) is determined in the initial program, and
Then, the 6th interrupt gate IP! is activated by the interrupt control signal from the interrupt control unit 1I60η. Circuit 06. )~(1
6s) are controlled to open and close, respectively, and one input/output control section (
Only one processor fP) is set to accept interrupts from the IOC).

このようにして動作を開始したシステムに8いて、複数
のプロセッサ田)のうち1つのプロセッサtl’lに障
害が発生すると、その障害を生じたプロセッサ(以下障
害プロセッサという)(P)に2いて、障害発生信号が
出力され、このとき、第1制御回路(131からは前記
初期化ののち「ハイ」の信号が出力されているため、障
害発生信号はアンド回路azを介してドライバ+11に
入力され、信号線(Slがドライバil+によって「ロ
ウ」にドライブされる。
In a system that has started operating in this way, if one of the multiple processors (tl'l) fails, the failed processor (hereinafter referred to as the failed processor) (P) , a fault occurrence signal is output, and at this time, since the "high" signal has been output from the first control circuit (131) after the initialization, the fault occurrence signal is input to the driver +11 via the AND circuit az. and the signal line (Sl) is driven "low" by the driver il+.

そして、複数のプロセッサ(1’lのうち、障害を2こ
していないプロセッサ(Plの1つ(以下検出プロセッ
サ(?という)が、検出回路a41および第2制御回路
a51を介してC、)’ U f81で信号線fs+が
「ロウ」にドライブされ友ことを検出すると、該CP 
U (81はそれまで実行していたプログラムを停止し
、第8図のプログラムを呼び出し、実行する。
Then, among the plurality of processors (1'l), one of the processors (Pl) (hereinafter referred to as the detection processor (?)) which is not faulty is C, through the detection circuit a41 and the second control circuit a51. When Uf81 detects that the signal line fs+ is driven low, the corresponding CP
U (81 stops the program that has been running up to that point, calls and executes the program shown in FIG. 8.

すなわち、検出プロセッサ(劫は、まず、自分以外の各
プロセッサ(月のそれぞれのゲート回路(191のアド
レスデータe 1111次送出し、各プロセッサ(Pl
 k呼び出す。
That is, the detection processor (Kalpa) first sends out the address data e 1111 of each processor other than itself (each gate circuit (191),
Call k.

したがって、各プロセッサ(P)では、アドレスバスf
a)上のアドレスデータをアドレスデコーダ(181に
収り込み、自己のゲート回路畑に与えられたアドレスデ
ータを取り込んだとき、ゲート回路Q91に呼出信号を
出力し、これによりゲート回路時が開かれる。
Therefore, in each processor (P), the address bus f
a) When the above address data is stored in the address decoder (181) and the address data given to its own gate circuit field is taken in, a call signal is output to the gate circuit Q91, thereby opening the gate circuit. .

このため、障害プロセッサIP)が呼び出されると、そ
のゲート回路Q9’?通して前記障害発生信号がデータ
バスCdl上に送出されるから、検出プロセッサ(P)
では、送出したアドレスデータとデータバスCdl上の
障害発生信号とにより障害プロセッサ(杓ヲ検出する(
ステップ■)。
Therefore, when the faulty processor IP) is called, its gate circuit Q9'? Since the fault occurrence signal is sent onto the data bus Cdl through the detection processor (P)
Now, we will detect a faulty processor based on the sent address data and the fault occurrence signal on the data bus Cdl.
Step ■).

な2、前記障害プロセッサ(坊ヲ検出する動作は、従来
技術で説明し友ことと基本的に同じである。
2. The operation of detecting a faulty processor is basically the same as that described in the prior art.

つきに、検出プロセッサ(酌は、検出した障害プロセッ
サ(劫に対して、その第3制御回路四のアドレスデータ
とともに停止、リセット等の制御指令のデータをデータ
バスCdl上に送出する(ステップ■)。
At that time, the detection processor sends control command data such as stop and reset to the detected faulty processor along with the address data of its third control circuit 4 onto the data bus Cdl (step 2). .

したがって、障害プロセッサ(1’)では、アドレスデ
コーダ賭に収り込んだアドレスデータによって第3制御
回路−に呼出信す全出力し、第3制御回路■はこの呼出
信号によってデータバスCdl上のデータ、すなわち制
御指令データ全敗り込み、これれ保持するとともに解析
し、CP U +81等に停止信号を出力するとともに
、他の回路、装置にリセット信号を出力し、さらにj8
1制御回路03に障害出力停止信号を出力する。
Therefore, in the faulty processor (1'), the address data stored in the address decoder outputs all outputs to call the third control circuit, and the third control circuit receives the data on the data bus Cdl by this calling signal. , that is, all control command data is lost, it is held and analyzed, a stop signal is output to CPU +81, etc., a reset signal is output to other circuits and devices, and further j8
1 A fault output stop signal is output to the control circuit 03.

ここで、W11制御回路+13は障害出力停止信号によ
って「ロウ」の信号を出力するようになるので、アンド
tg fluz ’1介してドライバfl+の厖励が停
止され、信号#H3lが「ハイ」の状態に戻る。この状
態は検出プロセッサ(約によって検出されるので、該プ
ロセッサ(P)は障害プロセッサ(P)が正しく制御さ
れていることを確認できることになる。
Here, the W11 control circuit +13 outputs a "low" signal in response to the fault output stop signal, so the drive of the driver fl+ is stopped via the AND tg fluz '1, and the signal #H3l becomes "high". Return to state. Since this condition is detected by the detecting processor (P), the processor (P) can confirm that the faulty processor (P) is correctly controlled.

つぎに、検出プロセッサ(月は、障害プロセッサ(Pi
が入出力制御部(IOC)からの割込みを扱ってい友か
どうかを判断しくステップ■)、 Noであれば、障害
プロセッサ(P)が論理的にシステムから切り離されて
いることになるので、ステップ■に移行し、LED表示
器、プリンタ、コンソール・ターミナル等、何らかの表
示・報知手段を駆動し、どのプロセッサ(P)に障害が
発生し友かを表示し、オペレータ等の人間に障害発生を
知らせる。
Next, the detection processor (Mon) is the fault processor (Pi).
Determine whether or not the processor (P) handles interrupts from the input/output control unit (IOC). Shift to ■, drive some kind of display/notification means such as an LED display, printer, console/terminal, etc., display which processor (P) has a problem and which processor (P) has a problem, and notify humans such as operators of the problem. .

また、ステップ■の判断でYESの条件が成立すると、
つぎに、障害プロセッサ(P)に対して、第3制#回路
団のアドレスデータとともに割込み禁止の制御指令デー
タ金出力する(ステップ■)。
Also, if the condition of YES is satisfied in step ■,
Next, control command data for inhibiting interrupts is outputted to the faulty processor (P) together with the address data of the third system # circuit group (step 2).

この、結果、障害プロセッサtP)では、第3制御向路
四で制御指令データを保持・解析して割込みゲート1g
l路uOに割込み禁止信号が出力されることになるため
、入出力割込みの取り扱いが禁止され、システムから論
理的に切り離されたことになる。
As a result, the fault processor tP) holds and analyzes the control command data in the third control path 4 and interrupts the interrupt gate 1g.
Since an interrupt prohibition signal is output to path uO, handling of input/output interrupts is prohibited, and the system is logically disconnected from the system.

その債、検出プロセッサ(P)は、障害プロセッサ(P
)が扱っていた入出力制御部(IOC)からの割込みを
新たにどのプロセッサが扱うか全決定する(ステップ■
)。この決定は、通常、入出力割込みに関して予備のプ
ロセッサ(P)に対して行なわれ、予備のプロセッサが
ない場合は任意に決定される。
In that case, the detection processor (P) is the faulty processor (P
) is used to handle interrupts from the input/output control unit (IOC).
). This determination is normally made for a spare processor (P) for input/output interrupts, and is arbitrarily determined if there is no spare processor.

そして、検出プロセッサ(P)は、自己がIirたに割
込みを扱うこととなったかどうか全判断しくステップ■
)、YESであれば、当該CPU fs+は自己の割込
み制御回路071に対して設定信号全出力しくステップ
■)、新たに仮うこととなった割込みの入出力制御部(
IOC)に対応する割込みゲート回路α61ヲ開dJI
illし、ステップ■に移行する。
Then, the detection processor (P) performs step II to determine whether or not it is supposed to handle interrupts.
), if YES, the CPU fs+ outputs all the setting signals to its own interrupt control circuit 071 (Step ■), and the newly provisional interrupt input/output control unit (
Interrupt gate circuit α61 corresponding to IOC) opens dJI
ill, and move on to step ■.

また、ステップ■の判断がNOであれば、決定されたプ
ロセッサ(PlのC)’ U (81に対して設定指令
のデータを出力しくステップ■)、そのCPU (81
に割込み制御回路(+71を介して該当の割込みゲート
回路Oaヲ開制御させ、ステップ■に移行する。゛この
ようにして%第3図に示し几プログラムを終了した検出
プロセッサ()′)のCPU(83は、再び自己のプロ
グラムを開始し、障害プロセッサ(Pl e切り離し友
状態で、システムは停止することなく動作を継続するこ
とになる。
Further, if the judgment in step ■ is NO, the determined processor (C of Pl)'U (step ■) to output the data of the setting command to 81,
The interrupt control circuit (+71) controls the opening of the corresponding interrupt gate circuit Oa, and the process moves to step (2).The CPU of the detection processor ()', which has thus completed the program shown in FIG. (83 starts its own program again, and the system continues to operate without stopping in the faulty processor (Ple disconnection state).

また、このシステムの動作状態に3いて、切り離され之
プロセッサ(坊以外の他のプロセッサ(P)にI章害が
発生すると、前述した動作によって肖該障否プロセッサ
(P)がシステムから論理的に切り離され、システムと
して正常に動作する。
In addition, if this system is in an operating state and a problem occurs in another processor (P) other than the disconnected processor (P), the affected processor (P) will be logically removed from the system by the above-mentioned operation. It is isolated and operates normally as a system.

すなわち、共通バス(B) を介してn個のプロセッサ
IPIが結合されたマルチプロセッサシステムに8いて
、(n−1)個までのプロセッサ(P)に障害が発生し
動作不能に至ったとしても、システム全体が停止するこ
とはなく、動作を継続することになる。
In other words, even if there is a multiprocessor system in which n processors IPI are connected via a common bus (B), and up to (n-1) processors (P) fail and become inoperable. , the entire system will not stop and will continue to operate.

な葛、実施例では、複数の各プロセッサ(Plにそれぞ
れ、信号StS+が「ロウ」にドライブされたことを検
出する検出回路1141i設け、それぞれのC1’U(
8)にiia図のプログラムを実行する機能を有するよ
うにしたが、任意のプロセッサ(P)にのみ検出回路1
141等を設けるようにしてもよく、この場合、この任
意のプロセッサ(Plが1個であると該プロセッサ(L
’lの障害発生時にシステムが暴走等により誤動作を起
こすため、2個以上の任意のプロセッサtp+に検出回
路I等を設けるようにすれはよい。
In the embodiment, each of the plurality of processors (Pl) is provided with a detection circuit 1141i that detects that the signal StS+ is driven to "low", and the respective C1'U(
8) has the function of executing the program shown in Figure IIA, but the detection circuit 1 is only installed in an arbitrary processor (P).
141 etc. may be provided, and in this case, if this arbitrary processor (Pl is one), the processor (L
Since the system may malfunction due to runaway or the like when a failure occurs in 'l, it is better to provide a detection circuit I or the like to two or more arbitrary processors tp+.

[発明の効果] 以上のように、この発明のマルチプロセッサシステムに
よると、複数のプロセッサのうちのいずれかに障害が発
生しても、この猷讐奮発生したプロセッサのみを論理的
にシステムから切り離すことができるtめ、障害がシス
テム全体に波及することを防止でき、システム全体が停
止することはなく、信頼性が飛催的に向上するものであ
る。
[Effects of the Invention] As described above, according to the multiprocessor system of the present invention, even if a failure occurs in any one of the plurality of processors, only the processor in which the failure occurs can be logically separated from the system. As a result, failures can be prevented from spreading to the entire system, the entire system will not stop, and reliability will be dramatically improved.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図ないし第3図はこの発明のマルチプロセッサシス
テムの1実施例金示し、第1図は1つのプロセッサの要
部のブロック図、第2図は第1図の一部の詳細なブロッ
ク図、第3因は動作説明用のフローチャート、第4図は
一般のマルチプロセッサシステムの構成図、第5図は従
来のマルチプロセッサシステムの一部のブロック図、第
6図は従来の他のマルチプロセッサシステムの一部のブ
ロック図である。 CP+、  CP+)(PFI) ・・・プロセッサ、
(IOC)、 (IOC,)〜(IOCm)・・・入出
力制御部、(M)・・・共通メモリ、iBl・・共通バ
ス、IsI・・・システム状態監視信号線、il+・・
・ドライバ、(8)・・CPU、 L12・・・検出回
路、Q61 、 (16+ )〜(165)・・・割込
みゲート回路。 代理人 弁理士 藤 1)龍太部 第 2 図 チ          力 傑 第4図 第5図 1!J6図
1 to 3 show one embodiment of the multiprocessor system of the present invention, FIG. 1 is a block diagram of the main parts of one processor, and FIG. 2 is a detailed block diagram of a part of FIG. 1. , the third factor is a flowchart for explaining the operation, FIG. 4 is a block diagram of a general multiprocessor system, FIG. 5 is a block diagram of a part of a conventional multiprocessor system, and FIG. 6 is a diagram of another conventional multiprocessor system. FIG. 2 is a block diagram of a portion of the system. CP+, CP+) (PFI)...Processor,
(IOC), (IOC,) ~ (IOCm)...Input/output control unit, (M)...Common memory, iBl...Common bus, IsI...System status monitoring signal line, il+...
- Driver, (8)... CPU, L12... detection circuit, Q61, (16+) to (165)... interrupt gate circuit. Agent Patent Attorney Fuji 1) Ryutabe No. 2 Figure Chi Rikiketsu Figure 4 Figure 5 Figure 1! J6 diagram

Claims (1)

【特許請求の範囲】[Claims] (1)複数のプロセッサを共通バスにより結合するとと
もに、前記共通バスに入出力制御部および共通メモリ等
を接続し、かつ、前記いずれかのプロセッサに障害が発
生した場合に障害発生のプロセッサを特定し得るよう構
成してなるマルチプロセッサシステムにおいて、 前記共通バスを構成するアドレスバスのアドレス信号お
よび前記共通バスを構成するデータバスのデータにもと
ずいて前記障害発生のプロセッサに停止、リセット、割
込み禁止等の制御指令を与える手段と、 前記各プロセッサに設けられ前記共通バスを介して前記
入出力制御部等から入力される割込みを前記任意のプロ
セッサからの割込み禁止の制御指令により禁止する手段
と、 を備えたことを特徴とするマルチプロセッサシステム。
(1) Connect multiple processors via a common bus, connect the input/output control unit, common memory, etc. to the common bus, and identify the faulty processor when a fault occurs in any of the processors. In a multiprocessor system configured to enable the processor to stop, reset, or interrupt the faulty processor based on address signals on an address bus that makes up the common bus and data on a data bus that makes up the common bus, means for giving a control command such as prohibition, and means provided in each of the processors to inhibit interrupts input from the input/output control unit or the like via the common bus by a control command for prohibiting interrupts from the arbitrary processor; A multiprocessor system characterized by being equipped with the following.
JP62024306A 1987-02-03 1987-02-03 Multi-processor system Pending JPS63191240A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62024306A JPS63191240A (en) 1987-02-03 1987-02-03 Multi-processor system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62024306A JPS63191240A (en) 1987-02-03 1987-02-03 Multi-processor system

Publications (1)

Publication Number Publication Date
JPS63191240A true JPS63191240A (en) 1988-08-08

Family

ID=12134489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62024306A Pending JPS63191240A (en) 1987-02-03 1987-02-03 Multi-processor system

Country Status (1)

Country Link
JP (1) JPS63191240A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6782492B1 (en) 1998-05-11 2004-08-24 Nec Corporation Memory error recovery method in a cluster computer and a cluster computer
US7383461B2 (en) 2004-02-12 2008-06-03 International Business Machines Corporation Method and system to recover a failed flash of a blade service processor in a server chassis

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6782492B1 (en) 1998-05-11 2004-08-24 Nec Corporation Memory error recovery method in a cluster computer and a cluster computer
US7383461B2 (en) 2004-02-12 2008-06-03 International Business Machines Corporation Method and system to recover a failed flash of a blade service processor in a server chassis
US7970880B2 (en) 2004-02-12 2011-06-28 International Business Machines Corporation Computer program product for recovery of a failed flash of a blade service processor in a server chassis
US7996706B2 (en) 2004-02-12 2011-08-09 International Business Machines Corporation System to recover a failed flash of a blade service processor in a server chassis
US8140705B2 (en) 2004-02-12 2012-03-20 International Business Machines Corporation Method and system to recover a failed flash of a blade service processor in a server chassis

Similar Documents

Publication Publication Date Title
JP2552651B2 (en) Reconfigurable dual processor system
JP5722426B2 (en) Computer system for control, method for controlling computer system for control, and use of computer system for control
US7467322B2 (en) Failover method in a cluster computer system
US7627774B2 (en) Redundant manager modules to perform management tasks with respect to an interconnect structure and power supplies
JPS63191240A (en) Multi-processor system
US7836335B2 (en) Cost-reduced redundant service processor configuration
JPS6027041B2 (en) How to switch lower control devices in Hiaraki control system
CN115328706A (en) Comprehensive control method and system for dual-CPU redundant architecture
WO2015132953A1 (en) Computer device and computer mechanism
JPH08287030A (en) Device and method for automatically restarting multiple computer system
JP2015106226A (en) Dual system
JPS6139138A (en) Multiplexing system
US7016995B1 (en) Systems and methods for preventing disruption of one or more system buses
JP4348485B2 (en) Process control device
JP2815730B2 (en) Adapters and computer systems
JPS6113627B2 (en)
JPH0430245A (en) Multiprocessor control system
JP6540142B2 (en) Baseboard Management Controller, Information Processing System, and Baseboard Management Controller Processing Execution Method
JP3843388B2 (en) Process control device
JPS6232739A (en) Switching control system
JPH04109303A (en) Adjustment controller
JPS6351295B2 (en)
JPH05158905A (en) Microprocessor application device having distributed processing function
JP2000209236A (en) Interface unit
JPS589444B2 (en) Shared input/output equipment control device