JPH02301854A - Distributed processing system - Google Patents

Distributed processing system

Info

Publication number
JPH02301854A
JPH02301854A JP1123795A JP12379589A JPH02301854A JP H02301854 A JPH02301854 A JP H02301854A JP 1123795 A JP1123795 A JP 1123795A JP 12379589 A JP12379589 A JP 12379589A JP H02301854 A JPH02301854 A JP H02301854A
Authority
JP
Japan
Prior art keywords
processor
data
distributed processing
input
processing system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1123795A
Other languages
Japanese (ja)
Inventor
Makoto Fujii
誠 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1123795A priority Critical patent/JPH02301854A/en
Publication of JPH02301854A publication Critical patent/JPH02301854A/en
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

PURPOSE:To eliminate the necessity of special consideration to the software so that the reliability of the system can be improved by monitoring the quantity of the data fetched to a data latching mechanism and, when the quantity exceeds a fixed value, outputting a fault detecting signal. CONSTITUTION:When abnormality occurs in a processor 11 and the processor 11 does not make data access, new data arriving thereafter are successively stored in a data latching mechanism 16. When the value of an addressing mechanism 17 exceeds a fixed value, it is discriminated that the processor 11 becomes defective and the defective processor 11 is switched to a normal processor 11 so as to secure the function of the whole system by transmitting a fault detecting signal, namely, switch changeover signal to a crossbar switch 15 for making route switching. Therefore, it becomes unnecessary to add a special excessive function to the software of the processor 11 and the reliability of the system is improved.

Description

【発明の詳細な説明】 〔発明の目的〕 (産業上の利用分野) 本発明は、原子力発電プラントや宇宙術Jに等、計算機
に高い信頼性が要求される分野に適用される分野処理シ
ステムに関する。
[Detailed description of the invention] [Object of the invention] (Industrial application field) The present invention is a field processing system applied to fields where high reliability of computers is required, such as nuclear power plants and space technology. Regarding.

(従来の技術) 近年、計算機の信頼性を向上させる手段として、複数の
プロセッサから構成される分散処理システムが用いられ
るようになってきている。
(Prior Art) In recent years, distributed processing systems composed of a plurality of processors have come to be used as a means to improve the reliability of computers.

この分散処理システムでは、備えられた複数のプロセッ
サがそれぞれに与えられた機能を果し、全体がデータ伝
送路で結合されてデータのやりとりを行ないながら、協
調して稼動するものである。
In this distributed processing system, a plurality of processors are provided, each performing a given function, and the entire system is connected through a data transmission path to exchange data and operate in cooperation.

そして、分散処理システムは、本来、処理効率の向上を
目的としたものであったか、分散処理の特性を活かすこ
とにより、信頼性を向上させることも可能となってきて
いる。
Distributed processing systems were originally intended to improve processing efficiency, but by taking advantage of the characteristics of distributed processing, it has become possible to improve reliability.

分散処理システムの具体的なハードウェア構成について
はいくつかの種類が提案されているが、プロセッサの一
部に故障が発生した場合でも、他の健全なプロセッサが
機能の一部を肩代わりでき、システムの機能のダウンが
回避できる手法として、クロスバ−スイッチを用いた分
散処理システムか提案されている。
Several types of specific hardware configurations for distributed processing systems have been proposed, but even if a part of the processor fails, other healthy processors can take over some of the functions, and the system A distributed processing system using a crossbar switch has been proposed as a method to avoid the failure of the functions of the computer.

第2図は、クロスバ−スイッチを用いた従来の分散処理
システムの一例を示すもので、このシステムは、複数の
プロセッサ21、複数のメモリ22、および複数の入出
力インターフェース23を、伝送線24およびタロスパ
ースイッチ25で結合して構成され、クロスバ−スイッ
チ25ては、プロセッサ21がメモリ22および入出力
インターフェース23をアクセスする場合に、設定する
アドレスをスイッチングすることとにより、任意のアク
セスが可能となるようになっている。
FIG. 2 shows an example of a conventional distributed processing system using a crossbar switch. This system connects multiple processors 21, multiple memories 22, and multiple input/output interfaces 23 to transmission lines The crossbar switch 25 allows arbitrary access by switching the set address when the processor 21 accesses the memory 22 and the input/output interface 23. It's supposed to be.

ところで、この種の分散処理システムにおいて、すべて
のプロセッサ2]が健全な場合にはクロスバ−スイッチ
25のアドレスは、メモリ22および入出力インターフ
ェース23を各プロセッサ21に1対1に固定している
。すなわち、プロセッサ21、メモリ22および入出力
インターフェース2Bが一組となったものか、複数存在
する形でアドレスが設定されており、各組か各別の機能
を果せるようになっている。
By the way, in this kind of distributed processing system, when all the processors 2 are healthy, the addresses of the crossbar switch 25 are fixed on a one-to-one basis for the memory 22 and the input/output interface 23 for each processor 21. That is, the addresses are set such that the processor 21, memory 22, and input/output interface 2B are either a set or a plurality of sets, and each set can perform a different function.

一方、プロセッサ2]のうちの1つに故障か発生した場
合には、通常はそのプロセッサ2]か果していた機能が
ダウンすることになるか、このシステムでは、プロセッ
サ2]に故障か発生し7たことを検出すると、別のプロ
セッサ21のアI・レスをクロスバ−スイッチ25で切
換え、これにより、切換えられたプロセッサ21か、自
分が本来アクセスしたメモリ22、入出力インターフェ
ース23の他に、故障したプロセッサ21かアクセスし
たメモリ22、入出力インターフェース2Bにもアクセ
スできるようになる。
On the other hand, if a failure occurs in one of the processors 2, the function that the processor 2 was performing will normally go down, or in this system, if one of the processors 2 When this is detected, the crossbar switch 25 switches the address of another processor 21, and the processor 21, the memory 22 and the input/output interface 23 that were originally accessed, are The memory 22 and the input/output interface 2B that were accessed by the processor 21 can also be accessed.

このように、故障したプロセッサ2]の機能かダウンす
ることなく、別のプロセッサ2]によって肩代わりされ
、全体としての機能を確保することとが可能となる。そ
して、一部のプロセッサ21の故障か、システム全体の
機能に普及することがなくなることから、システムとし
ての信頼性を向上させることが可能となる。
In this way, the functions of the failed processor 2 can be taken over by another processor 2 without any downtime, and the overall functionality can be ensured. Furthermore, since the malfunction of a part of the processor 21 will not spread to the functions of the entire system, it is possible to improve the reliability of the system.

ところで、この種の分散処理システムにおいて、最も重
要なことは、プロセッサ2]に故障か発生した場合に、
その故障を確実に検出できることである。
By the way, in this kind of distributed processing system, the most important thing is that if a failure occurs in processor 2,
It is possible to reliably detect the failure.

従来、このような故障検知手法として、ウォッチドッグ
タイマを用いることが行なわれている。
Conventionally, a watchdog timer has been used as such a failure detection method.

ウォッチドッグタイマを用いた分散処理システムでは、
第2図に示すように、クロスバ−スイッチを用いた分散
システムにおいて、各プロセッサ21にさらにタイマ2
6がそれぞれ設けられており、各タイマ26は、常時時
刻をカウントアツプしていく。一方、プロセッサでは、
ソフトウェアにより一定周期でタイマ26の値をクリア
する。
In a distributed processing system using a watchdog timer,
As shown in FIG. 2, in a distributed system using a crossbar switch, each processor 21 also has a timer 2.
6, and each timer 26 constantly counts up the time. On the other hand, the processor
The value of the timer 26 is cleared at regular intervals by software.

このような方式を用いることにより、タイマ26の値は
、プロセラ1す21の機能が健全である限り、一定の値
以」二になることはないので、タイマ26の値が、−・
定値を超えた場合には、プロセッサ21に異常が発生し
ているものと判断できる。
By using such a method, the value of the timer 26 will never exceed a certain value as long as the functions of the processors 1 and 21 are healthy.
If it exceeds the fixed value, it can be determined that an abnormality has occurred in the processor 21.

そして、タイマ26は、一定値を超えた際に故障発生信
号を発生し、クロスバ−スイッチ25にf云えてアドレ
スの切換えを行なう。
When the timer 26 exceeds a certain value, the timer 26 generates a failure occurrence signal, sends a signal to the crossbar switch 25, and switches the address.

以上の構成を有するウォッチドッグタイマ方式の分散処
理システムにおいては、各プロセッサ21に用いられる
ソフトウェアの中に、周期的にタイマ26をクリアする
機能を含ませなければならない。通常、高い信頼性か要
求される計算機システムでは、ソウトウエアについても
同様の信頼性が要求されることから、ソウトウエアの構
成は、できるたけ単純にして余分な機能を含まないよう
にする必要がある。したがって、ウオッチドックタイマ
方式の分散処理シテムはソウトウエアに特別な配慮が必
要となることから、ソフトウェア仁頼性の而で問題があ
る。
In the watchdog timer type distributed processing system having the above configuration, the software used for each processor 21 must include a function to periodically clear the timer 26. Generally, in computer systems that require high reliability, similar reliability is also required for the software, so the software configuration must be kept as simple as possible and do not include unnecessary functions. Therefore, the watchdog timer type distributed processing system requires special consideration for the software, which poses a problem in terms of software reliability.

そこで一部では、第3図に示すように共通メモリを用い
た分散処理システムが提案され°Cいる。
Therefore, some people have proposed a distributed processing system using a common memory as shown in FIG.

このシステムは、第3図に承りように、複数のプロセッ
ーリ31、複数のメモリ32、および複数の入出力イン
ターフェース33を、伝送線34およびクロスバ−スイ
ッチ35で結合して構成され、さらに、各プロセッサ3
1が共通にアクセスできる共通メモリ36か設けられて
いる。この共通メモリ36には、各プロセッサ31が自
分の機能を果す中で、その状態を示す情報が格納される
。そして、その情報の中に、何等かの異常状態を表す情
報が含まれていた場合には、クロスバ−スイッチ35に
その旨を伝えてアドレス切換えを行なう。
As shown in FIG. 3, this system is composed of a plurality of processors 31, a plurality of memories 32, and a plurality of input/output interfaces 33 connected by a transmission line 34 and a crossbar switch 35. 3
A common memory 36 is provided which can be accessed in common by all. This common memory 36 stores information indicating the status of each processor 31 while it performs its own function. If the information includes information indicating some kind of abnormal state, the crossbar switch 35 is informed of this fact and address switching is performed.

(発明が解決しようとする課題) 前記従来の共通のメモリを用いた分散処理システムにお
いては、各プロセッサ31の診断情報がすべて共通メモ
リ36に集中することになるため、万一この共通メモリ
36に故障が発生した場合には、システムに重大な影響
を与えることになるという問題がある。
(Problems to be Solved by the Invention) In the conventional distributed processing system using a common memory, all of the diagnostic information of each processor 31 is concentrated in the common memory 36, so in the unlikely event that this common memory 36 There is a problem in that if a failure occurs, it will have a serious impact on the system.

本発明は、このような点を考慮してなされたもので、ソ
フトウェアに余分な機能を付加する必要がなく、しかも
共通部分を設けることなく、プロセッサに発生した故障
を検知することができる分散処理システムを提供するこ
とを目的とする。
The present invention has been made with these points in mind, and it provides distributed processing that can detect failures that occur in processors without the need to add extra functions to software and without providing common parts. The purpose is to provide a system.

〔発明の構成〕[Structure of the invention]

(課題を解決するだめの手段) 本発明は、前記1」的を達成する手段として、複数のプ
ロセッサと、複数のメモリと、複数の入出力インタフェ
ースと、任意のプロセッサ、メモリおよび入出力インタ
ーフェースの間で伝送経路が確保されるように経路切換
を行なうクロスバ−スイッチ機構とを具(liitする
分数処理システムにおいて、入力データを周期的に取込
むとともにプロセッサからのデータアクセスにより取込
んだデータを送出するデークラッチ手段と、データラッ
チ丁。
(Means for Solving the Problems) As a means for achieving the above-mentioned object 1, the present invention provides a plurality of processors, a plurality of memories, a plurality of input/output interfaces, and a plurality of processors, memories, and input/output interfaces. In a fractional processing system that includes a crossbar switch mechanism that switches paths so that a transmission path is secured between data latch means and data latch mechanism.

段に取込まれているデータ量を監視しその値か一定値を
超えた際に故障検出信号を出力する故障検出手段とを設
けるようにしたことを特徴とする。
The present invention is characterized in that it is provided with a failure detection means for monitoring the amount of data taken into the stage and outputting a failure detection signal when the amount exceeds a certain value.

(作 用) 本発明に係る分散処理システムにおいて、データラッチ
手段は、対象プロセッサから得られたプロセスデータを
周期的に蓄え、時系列的に格納していき、一方プロセッ
ザは、このデータラッチ手段からF I F O(Fj
rst In First 0ut)に基つい−Q  
  − てデータをアクセスしていく。そして、データラッチ手
段に蓄えられているデータ数等のデータ量は、故障検出
手段により常時監視される。
(Function) In the distributed processing system according to the present invention, the data latch means periodically stores the process data obtained from the target processor and stores it in chronological order, while the processor receives the process data from the data latch means. F I F O (Fj
rst In First 0ut) -Q
- access the data. The amount of data such as the number of data stored in the data latch means is constantly monitored by the failure detection means.

ところで、データラッチ手段のデータの取込み周期とデ
ータ参照周期とを、例えば同一にしておくと、アドレス
の値はほぼ一定となり、したがって通常は、ある値以上
に大きくなることはない。
By the way, if the data acquisition cycle of the data latch means and the data reference cycle are made the same, for example, the address value will be approximately constant, and therefore will not normally exceed a certain value.

ところが、いずれかのプロセッサが故障してデータアク
セスしなくなった場合には、アドレスの値は次第に大き
くなっていき、最終的にある一定値を超えてしまう。こ
れを、故障検出手段により検出し、あるプロセッサに故
障が発生した旨を他の健全なプロセッサに伝え、クロス
バ−スイッチを切換えて故障プロセッサの機能を代行さ
せる。
However, if one of the processors fails and no longer accesses data, the address value gradually increases and eventually exceeds a certain value. This is detected by a failure detection means, and the fact that a failure has occurred in a certain processor is notified to other healthy processors, and the crossbar switch is switched to take over the function of the failed processor.

(実施例) 以下、本発明の一実施例を第1図を参照して説明する。(Example) An embodiment of the present invention will be described below with reference to FIG.

第1図において、符号1]は複数のプロセッサであり、
これら各プロセッサ11、複数のメモリ]2および複数
の入出力インターフェース13は、−Q    − 伝送線14を介してクロスバ−スイッチ15に11−合
されている。
In FIG. 1, reference numeral 1] indicates a plurality of processors;
These processors 11, multiple memories 2, and multiple input/output interfaces 13 are connected to a crossbar switch 15 via a -Q transmission line 14.

各入出力インターフェース]3には、第1図に示すよう
に、データラッチ機構16とアドレス機構17とがそれ
ぞれ設けられており、データラッチ機構16は、入力デ
ータを一定の周期で取込み格納するとともに、プロセッ
サ]]からのデータアクセスにより、最も以前に格納さ
れたデータから順次送出するようになっている。そして
、このデータラッチ機構]6内に格納されているデータ
の数は、アドレス機構17に保持されるようにプよって
いる。
Each input/output interface] 3 is provided with a data latch mechanism 16 and an address mechanism 17, respectively, as shown in FIG. , processor]], data is sequentially sent out from the earliest stored data. The number of data stored in this data latch mechanism 6 is determined so as to be held in the address mechanism 17.

次に本実施例に作用について説明する。Next, the operation of this embodiment will be explained.

各入出力インターフェース13は、一定の周期でデータ
を取込み、データラッチ機+M 16にデータを格納す
るとともに、アドレス機構17の値を1つカウントアツ
プする。
Each input/output interface 13 takes in data at a constant cycle, stores the data in the data latch device +M 16, and counts up the value of the address mechanism 17 by one.

一方、各プロセッサ11は、入出力インターフェース1
3からのデータが必要となると、入出力インタフェース
13にデータアクセスする。すると、入出力インタフェ
ース13は、データラッチ機構16に格納されている最
も以前のデータを、プロセッサ1]に渡すとともに、ア
ドレス機構17の値を1つカウントダウンする。
On the other hand, each processor 11 has an input/output interface 1
When data from 3 is required, data access is made to the input/output interface 13. Then, the input/output interface 13 passes the earliest data stored in the data latch mechanism 16 to the processor 1 and counts down the value of the address mechanism 17 by one.

ここで、入出力インターフェース13におけるデータ取
込み周期と、プロセッサ]]からのデータアクセス周期
とを同一にしておけば、プロセッサ11に伝わるプロセ
スデータも、充分に新しいデータを渡すことができ、し
かもアドレス機+1417に保持される値も、1または
0となってそれ以上に増えることはない。したがって、
プロセッサ11の健全性を確認するには、アドレス機構
17の値が1以下であることを監視すればよい。
Here, if the data acquisition cycle at the input/output interface 13 and the data access cycle from the processor] are made the same, the process data transmitted to the processor 11 can be sufficiently new, and moreover, the address machine The value held at +1417 also becomes 1 or 0 and does not increase any further. therefore,
In order to confirm the health of the processor 11, it is sufficient to monitor that the value of the address mechanism 17 is 1 or less.

すなわち、プロセッサ11に異常が発生してデータアク
セスしなくなると、データラッチ機構16には、新しい
データが次々と蓄えられることになり、アドレス機構1
7の値も、これにつれて次第に大きくなっていく。そこ
でアドレス機構の値か、ある一定の値、例えば3以上に
なったところで、そのプロセッサ11に故障か発生した
と判断し、クロスバ−スイッチ]5に故障検出(r3号
、すなイっちスイッチ切換信号を伝えて経路切換を11
ない、故障したプロセッサ]1の機能を健全なプロセッ
サ11で代行し、システム全体の機能を(1n゛保する
That is, when an abnormality occurs in the processor 11 and data access is no longer performed, new data is stored one after another in the data latch mechanism 16, and the address mechanism 1
The value of 7 also gradually increases accordingly. Then, when the value of the address mechanism reaches a certain value, for example 3 or more, it is determined that a failure has occurred in that processor 11, and the failure is detected by the crossbar switch 5 (r3, Convey the switching signal and switch the route 11
A healthy processor 11 takes over the functions of the failed processor]1, and the functions of the entire system are maintained (1n).

このように、本実施例によれば、プロセッサ1]のソフ
トウェアに特殊な機能を追加することなく故障検出が可
能となり、ソフトウェアの単純性による信頼性の向上か
可能となる。また、故19※診断機構が、各サブシステ
ムに分散していて共通部分がないので、システム全体の
信頼性向上もIIJ能となる。
As described above, according to the present embodiment, failure detection can be performed without adding special functions to the software of the processor 1, and reliability can be improved due to the simplicity of the software. In addition, since the diagnostic mechanism is distributed among each subsystem and has no common parts, it is possible to improve the reliability of the entire system.

なお、前記実施例では、アドレス機構]7に、データラ
ッチ機構16のデータの数自体を格納する場合について
説明したか、データの数自体を格納する必要はなく、例
えば最も以前のデータと最も新しいデータを格納したア
ドレスレジスタを持ち、その差を監視する等の方法でも
よい。
In addition, in the above embodiment, the case where the number of data of the data latch mechanism 16 is stored in the address mechanism]7 is explained, or the number of data itself does not need to be stored. A method such as having an address register storing data and monitoring the difference therebetween may also be used.

また、前記実施例では、データ取込み周期とプロセッサ
11からのデータアクセス周期とを同−一   」 1
  − にする場合について説明したか、両同期を必ずしも同一
にする必要はなく、例えば、前記アドレスレジスタを用
いる方式で、レジスタの値を適当に操作することによっ
ても、同様の機能を実現できる。
Furthermore, in the embodiment, the data acquisition period and the data access period from the processor 11 are the same.
- However, it is not necessary to make both synchronizations the same. For example, the same function can be achieved by appropriately manipulating the value of the register using a method using the address register.

〔発明の効果〕〔Effect of the invention〕

以上説明したように本発明は、プロセッサのソフトウェ
アに特別に余分な機能を付加する必要がなく、また、そ
の部分の故障によってシステム全体に重大な影響を与え
るような共通部分もないので、システムの信頼性を大幅
に向上させることができる。
As explained above, the present invention does not require any special extra functions to be added to the software of the processor, and there is no common part where failure of that part would seriously affect the entire system. Reliability can be significantly improved.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例に係る分散処理システムを示
す構成図、第2図はウォッチドッグタイマ方式の従来の
分散処理システムを示す構成図、第3図は共通メモリ方
式の従来の分散処理システムを示す構成図である。 11・・・プロセッサ、12・・・メモリ、]3・入出
カインターフェース、]−4・・・伝送線、15・クロ
スバ−スイッチ、16・・・データラッチ機hL]−7
・・・アドレス機構。
FIG. 1 is a block diagram showing a distributed processing system according to an embodiment of the present invention, FIG. 2 is a block diagram showing a conventional distributed processing system using a watchdog timer method, and FIG. 3 is a block diagram showing a conventional distributed processing system using a common memory method. FIG. 1 is a configuration diagram showing a processing system. DESCRIPTION OF SYMBOLS 11... Processor, 12... Memory, ]3. Input/output interface, ]-4... Transmission line, 15. Crossbar switch, 16... Data latch machine hL]-7
...Address mechanism.

Claims (1)

【特許請求の範囲】[Claims] 複数のプロセッサと、複数のメモリと、複数の入出イン
ターフェースと、任意のプロセッサ、メモリおよび入出
力インターフェースの間で伝送経路が確保されるように
経路切換を行なうクロスバースイッチ機構とを具備する
分散処理システムにおいて、入出力データを周期的に取
込むとともにプロセッサからのデータアクセスにより取
込んだデータを送出するデータラッチ手段と、データラ
ッチ手段に取込まれているデータ量を監視しその値が一
定値を超えたた際に故障検出信号を出力する故障検出手
段とを備えていることを特徴とする分散処理システム。
Distributed processing that includes multiple processors, multiple memories, multiple input/output interfaces, and a crossbar switch mechanism that switches paths so that transmission paths are secured between arbitrary processors, memories, and input/output interfaces. In the system, there is a data latch means that periodically captures input/output data and sends out the captured data through data access from the processor, and a data latch means that monitors the amount of data captured by the data latch means and maintains the value at a constant value. A distributed processing system comprising: failure detection means for outputting a failure detection signal when a failure detection signal is exceeded.
JP1123795A 1989-05-17 1989-05-17 Distributed processing system Pending JPH02301854A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1123795A JPH02301854A (en) 1989-05-17 1989-05-17 Distributed processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1123795A JPH02301854A (en) 1989-05-17 1989-05-17 Distributed processing system

Publications (1)

Publication Number Publication Date
JPH02301854A true JPH02301854A (en) 1990-12-13

Family

ID=14869497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1123795A Pending JPH02301854A (en) 1989-05-17 1989-05-17 Distributed processing system

Country Status (1)

Country Link
JP (1) JPH02301854A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05236525A (en) * 1991-10-31 1993-09-10 Internatl Business Mach Corp <Ibm> Very large scale modular switch

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05236525A (en) * 1991-10-31 1993-09-10 Internatl Business Mach Corp <Ibm> Very large scale modular switch

Similar Documents

Publication Publication Date Title
US6012148A (en) Programmable error detect/mask utilizing bus history stack
US3964055A (en) Data processing system employing one of a plurality of identical processors as a controller
JP2017058751A (en) Information processor, log acquisition method and log acquisition program
US20100162269A1 (en) Controllable interaction between multiple event monitoring subsystems for computing environments
JPH02301854A (en) Distributed processing system
JP3896660B2 (en) Network monitoring system
JP2000353154A (en) Fault monitoring system
JPH1027115A (en) Fault information sampling circuit for computer system
JPS6112580B2 (en)
JP2013207674A (en) Network monitoring system, network monitoring method, and control device and program
JPS6290068A (en) Auxiliary monitor system
KR950011481B1 (en) An electronic exchanger
JPH02281368A (en) Trouble detecting mechanism for controller
KR100394736B1 (en) Method And Apparatus For Fail Recovery And Board Selecting In Dual System
JP2698449B2 (en) Failure notification unit
JPH05324413A (en) On-line communication processing system
JPH06103251A (en) Monitor and control system for information processor
JPS63100563A (en) Faulty processor detecting system
JPH0275043A (en) Information processor
KR0175481B1 (en) Alarm Collector of Asynchronous Transfer Mode Switching System
KR100605998B1 (en) Method for node operation maintenance in inter communication processor network of exchanging system
JP2006313406A (en) System for collecting failure information
JPS59127131A (en) Bus monitor system
KR19980047016A (en) Multiprocessor State Monitoring Method Using Dynamic Monitoring Period in Asynchronous Transfer Mode Switch
JPH08314843A (en) Computer system