JPH0335346A - Mutual diagnostic method for multicomputer system - Google Patents

Mutual diagnostic method for multicomputer system

Info

Publication number
JPH0335346A
JPH0335346A JP1169680A JP16968089A JPH0335346A JP H0335346 A JPH0335346 A JP H0335346A JP 1169680 A JP1169680 A JP 1169680A JP 16968089 A JP16968089 A JP 16968089A JP H0335346 A JPH0335346 A JP H0335346A
Authority
JP
Japan
Prior art keywords
computer
mutual
normal message
mutual diagnosis
message communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1169680A
Other languages
Japanese (ja)
Inventor
Kazuya Shinjo
新庄 和哉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1169680A priority Critical patent/JPH0335346A/en
Publication of JPH0335346A publication Critical patent/JPH0335346A/en
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

PURPOSE:To reduce the overhead by recording a fact that the normal message communication is performed into a control field of a shared memory and omitting the mutual diagnoses in accordance with the reference results of the diagnoses carried out in each mutual diagnostic cycle. CONSTITUTION:The control fields 13A - 13C are secured on a shared memory 12 of a system to record the communication confirming information showing a fact that the normal message communication is carried out between the computers 11A and 11B which share the memory 12. Each of both computers 11A and 11B contains a normal message communication means to record the communication confirming information to the fields 13A - 13C when the normal message communication is carried out. Furthermore a mutual diagnostic means is added to carry out the mutual diagnoses in accordance with the result of decision showing whether the normal message communication is carried out or not between both computers by reference to the fields 13A - 13C at the mutual diagnoses carried out in each fixed cycle. When the execution of the normal message communication is confirmed, the mutual diagnoses are omitted and the corresponding communication confirming information is erased out of the fields 13A - 13C. As a result, the overhead due to the mutual diagnoses can be reduced with no deterioration of the diagnostic performance.

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) この発明は、マルチコンピュータシステムにおける相互
診断処理の負荷軽減に好適な相互診断方式に関する。
DETAILED DESCRIPTION OF THE INVENTION [Object of the Invention] (Field of Industrial Application) The present invention relates to a mutual diagnosis method suitable for reducing the load of mutual diagnosis processing in a multi-computer system.

(従来の技術) 一般にマルチコンピュータシステムは、複数の計算機と
、これらの計算機に共有される共有メモリを備えている
。従来、この種のマルチコンピュータシステムにおける
相互診断は、一定周明を定め、その周朋毎に他計算機に
メッセー、ジを送信し、ある一定時間内に、送信したメ
ツセージに対する応答メツセージを確認することにより
行われていた。この相互診断を目的とするメツセージ交
信は相互診断メツセージ交信と呼ばれる。
(Prior Art) Generally, a multi-computer system includes a plurality of computers and a shared memory shared by these computers. Conventionally, mutual diagnosis in this type of multi-computer system is carried out by setting a fixed period of time, sending messages to other computers every period, and checking the response messages to the sent messages within a certain period of time. It was done. Message communication for the purpose of mutual diagnosis is called mutual diagnosis message communication.

以上の相互診断では、一定周期毎に必ず相互診断メツセ
ージ交信を行わなければならないため、計算機の負荷が
高いとき並びに診断周期が短いときには相互診断による
オーバーヘッドが顕著に現われるという問題があった。
In the mutual diagnosis described above, since mutual diagnosis messages must be exchanged at regular intervals, there is a problem in that the overhead caused by the mutual diagnosis becomes noticeable when the load on the computer is high or when the diagnosis cycle is short.

このオーバーヘッドを軽減するために、計算機の空き時
間を利用して不定期で相互診断を行う方式や、診断周期
を長く設定する方式等が考えられる。しかし、この方式
ハ診断性能を犠牲にするもので、マルチコンピュータシ
ステムの異常検出の遅れを招く虞があり、適用しがたい
In order to reduce this overhead, there may be a method in which mutual diagnosis is performed irregularly using the idle time of the computer, or a method in which the diagnosis cycle is set longer. However, this method sacrifices diagnostic performance and may cause a delay in abnormality detection in a multi-computer system, making it difficult to apply.

(発明が解決しようとする課題) 上記したように従来のマルチコンピュータシステムにお
ける相互診断方式では、システムの異常を確実且つ速や
かに検出するために、一定周期毎に必ず相互診断メツセ
ージ交信を行わなければならず、したがってシステムの
オーバーヘッドが大きいという問題があった。
(Problem to be Solved by the Invention) As mentioned above, in the mutual diagnosis method in the conventional multi-computer system, mutual diagnosis messages must be exchanged at regular intervals in order to reliably and promptly detect system abnormalities. Therefore, there was a problem that the system overhead was large.

この発明は上記事情に鑑みてなされたものでその目的は
、マルチコンピュータシステムの相互診断におけるオー
バーヘッドが、診断性能を犠牲にすることなく軽減でき
るマルチコンピュータシステムにおける相互診断方式を
提供することにある。
The present invention has been made in view of the above circumstances, and an object thereof is to provide a mutual diagnosis method for a multi-computer system that can reduce the overhead in mutual diagnosis of a multi-computer system without sacrificing diagnostic performance.

[発明の構成] (課題を解決するための手段) この発明は、マルチコンピュータシステムの共有メモリ
上に、この共有メモリを共有する各計算機間で通常メツ
セージ交信(相互診断メツセージ交信とは別の通常のメ
ツセージ交信)が行われたことを示す交信確認情報が記
録される制御フィールドを設けると共に、上記各計算機
に、通常メツセージ交信を行った際には上記制御フィー
ルドにその旨を示す交信確認情報を記録する通常メツセ
ージ交信手段と、一定周期毎の相互診断に際して上記制
御フィールドを参照して相手計算機との間で通常メツセ
ージ交信が行われたが否かを判別し、この判別結果に応
じて相互診断を実行する(0互診断手段とを設け、通常
メツセージ交信が行ゎれたことが判別された場合には相
互診断を省略して対応する交信確認情報を上記制御フィ
ールドから消去するようにしたことを特徴とするもので
ある。
[Structure of the Invention] (Means for Solving the Problems) This invention provides normal message communication (different from mutual diagnostic message communication) on a shared memory of a multi-computer system between computers that share this shared memory. In addition to providing a control field in which communication confirmation information indicating that message communication (message communication) has been carried out, when normal message communication is carried out in each of the above computers, communication confirmation information indicating that is recorded in the control field. During mutual diagnosis at regular intervals, the normal message communication means to record and the control field are referred to to determine whether or not normal message communication has occurred with the other computer, and based on the result of this determination, mutual diagnosis is performed. (0 mutual diagnosis means is provided, and when it is determined that normal message communication has been carried out, mutual diagnosis is omitted and the corresponding communication confirmation information is deleted from the control field. That is.

(作 用) 上記の構成によれば、計算機間で必要に応じて通常メツ
セージ交信が行われると、その旨を示す交信確認情報が
共有メモリ上の制御フィールドに記録される。通常メツ
セージ交信が行われたということは、その交信相手が正
常であることである。このため、上記のように交信確認
情報を制御フィールドに記録することは、相互診断を行
ってその結果が正常な場合にその旨を記録したことと等
価となる。したがって、計算機において一定周期毎の相
互診断を実行しようとする際に制御フィールドを参照す
ることにより、最も最近の相互診断周期の間に相互診断
相手との間で通常メツセージ交信が正常に行われたか否
かを判別することが可能となる。そこで上記の構成にお
いては、制御フィールドの参照により、相互診断相手と
の間で通常メツセージ交信が正常に行われたことを判別
した場合には、相互診断の代替処理が行われて正常判定
がなされたものとして、該当周期における相互診断が省
略され、対応する交信確認情報が制御フィールドから消
去される。これに対して、対応する交信確認情報が記録
されておらず、相互診断相手との間の通常メツセージ交
信が正常に行われたことが判別できない場合には、従来
と同様に相互診断が行われる。
(Function) According to the above configuration, when normal message communication is performed between computers as necessary, communication confirmation information indicating this is recorded in the control field on the shared memory. The fact that normal message communication has occurred means that the communication partner is normal. Therefore, recording the communication confirmation information in the control field as described above is equivalent to performing mutual diagnosis and recording that fact when the result is normal. Therefore, by referring to the control field when attempting to execute mutual diagnosis at regular intervals in a computer, it is possible to determine whether normal message communication was normally performed with the mutual diagnosis partner during the most recent mutual diagnosis cycle. It becomes possible to determine whether or not. Therefore, in the above configuration, when it is determined by referring to the control field that normal message communication has been performed normally with the mutual diagnosis partner, an alternative process for mutual diagnosis is performed and a normal determination is made. As a result, the mutual diagnosis in the corresponding period is omitted, and the corresponding communication confirmation information is deleted from the control field. On the other hand, if the corresponding communication confirmation information is not recorded and it cannot be determined that normal message communication between the mutual diagnosis partner was carried out normally, mutual diagnosis will be performed as before. .

(実施例) 第1図はこの発明を適用するマルチコンピュータシステ
ムの一実施例を示すブロック構成図である。、同図にお
いて、IIA 、 IIB 、 IIc 4;!計算機
、12は計算機11A−11cによって共有される共有
メモリである。計算機11A−110間のメツセージ交
信は共有メモリ12を介して行われる。この共有メモリ
12の所定領域には、計算機11A 、 11B 、 
IIcに対応して3つの制御フィールド13A 、 1
3B 。
(Embodiment) FIG. 1 is a block diagram showing an embodiment of a multi-computer system to which the present invention is applied. , In the same figure, IIA, IIB, IIc 4;! A computer 12 is a shared memory shared by the computers 11A-11c. Message communication between the computers 11A-110 is performed via the shared memory 12. In a predetermined area of this shared memory 12, computers 11A, 11B,
Three control fields 13A, 1 corresponding to IIc
3B.

13cが確保される。制御フィールド13Aは計算機1
1Aから他計算機(ここでは計算機11B 、 tic
 )に対する通常のメツセージ交信が確認されたことを
示すためのフィールド、制御フィールド13Bは計算機
11Bから細針算機(ここでは計算機11c 。
13c is secured. Control field 13A is computer 1
From 1A to other computers (here, computer 11B, tic
), the control field 13B is a field for indicating that normal message communication has been confirmed for the computer 11B to the fine needle calculator (here, the computer 11c).

11A )に対する通常のメツセージ交信が確認された
ことを示すためのフィールド、制御フィールド13cは
計算機11Cから細針算機(ここでは計算機11A 、
 IIB )に対する通常のメツセージ交信が確認され
たことを示すためのフィールドである。
11A), and a control field 13c is a field for indicating that normal message communication has been confirmed for the computer 11C (computer 11A).
This field is used to indicate that normal message communication with IIB) has been confirmed.

第2図は第1図の制御フィールド13A −13cのフ
ォーマットを示す。図に示すように、制御フィールド1
3AのビットOは計算機11Aが計算機11Bに対して
通常のメツセージを送信したことを示す送信確認ビット
に、ビット1は計算機11r3が計算機11Aからの通
常のメツセージを受信したことを示す受信確認ビットに
、ビット2は計算機U^が計算機11cに対して通常の
メツセージを送信したことを示す送信確認ビットに、ビ
ット3は計算機11Gが計算機11Aからの通常のメツ
セージを受信したことを示す受信確認ビットに、それぞ
れ割当てられている。また、制御フィールド13Bのビ
ットOは計算機11Bが計算機11Cに対して通常のメ
ツセージを送信したことを示す送信確認ビットに、ビッ
ト1は計算機lICが計算機11Bからの通常のメツセ
ージを受信したことを示す受信確認ビットに、ビット2
は計算機11Bが計算機11Aに対して通常のメツセー
ジを送信したことを示す送信確認ビットに、ビット3は
計算機11Aが計算機11Bからの通常のメツセージを
受信したことを示す受信確認ビットに、それぞれ割当て
られている。また、制御フィールド13cのビットOは
計算機ttCが計算機11Aに対して通常のメツセージ
を送信したことを示す送信確認ビットに、ビット1は計
算機11Aが計算機+ICからの通常のメツセージを受
信したことを示す受信確認ビットに、ビット2は計算機
11Gが計算機11Bに対して通常のメツセージを送信
したことを示す送信確認ビットに、ビット3は計算機1
1Bが計算機+ICからの通常のメツセージを受信した
ことを示す受信確認ビットに、それぞれ割当てられてい
る。
FIG. 2 shows the format of control fields 13A-13c of FIG. As shown in the figure, control field 1
Bit 0 of 3A is a transmission confirmation bit indicating that computer 11A has sent a normal message to computer 11B, and bit 1 is a reception confirmation bit indicating that computer 11r3 has received a normal message from computer 11A. , bit 2 is a transmission confirmation bit indicating that the computer U^ has sent a normal message to the computer 11c, and bit 3 is a reception confirmation bit indicating that the computer 11G has received a normal message from the computer 11A. , are assigned respectively. Furthermore, bit O of the control field 13B is a transmission confirmation bit indicating that the computer 11B has sent a normal message to the computer 11C, and bit 1 is a transmission confirmation bit indicating that the computer IC has received a normal message from the computer 11B. Bit 2 for reception confirmation bit
is assigned to a transmission confirmation bit indicating that computer 11B has sent a normal message to computer 11A, and bit 3 is assigned to a reception confirmation bit indicating that computer 11A has received a normal message from computer 11B. ing. Furthermore, bit O of the control field 13c is a transmission confirmation bit indicating that the computer ttC has sent a normal message to the computer 11A, and bit 1 is a transmission confirmation bit indicating that the computer 11A has received a normal message from the computer +IC. In the reception confirmation bit, bit 2 is a transmission confirmation bit indicating that computer 11G has sent a normal message to computer 11B, and bit 3 is in computer 1.
Each bit is assigned to a reception confirmation bit indicating that 1B has received a normal message from the computer+IC.

第3図は第1図の計算機11Aにおける計算機11Bと
の間の相互診断動作を説明するためのフローチャートを
示す。
FIG. 3 shows a flowchart for explaining the mutual diagnosis operation between the computer 11A and the computer 11B shown in FIG.

次に、この発明の一実施例の動作を上記第1図乃至第3
図を適宜参照して説明する。
Next, the operation of one embodiment of the present invention will be described in FIGS. 1 to 3 above.
This will be explained with reference to the figures as appropriate.

まず第1図のマルチコンピュータシステムにおいて、計
算機間の通常のメツセージ交信時に行われる制御フィー
ルドに対するビット操作について、計算機11^、 I
IBの通常メツセージ交信を例に説明する。計算機11
A 、 IIBは、通常の機能(通常メツセージ交信)
において、細針算機に対してメツセージを送信したとき
は、共有メモリ12に確保された制御フィールド13A
 、 13Bの対応する送信確認ビットをオンする。こ
れにより、例えば計算機11Aから計算機11Bへ通常
のメツセージを送信した場合であれば、制御フィールド
13Aのビット0が計算機+1Aによってオン(“1”
に設定)される。また、計算機11Bから計算機11A
へ通常のメツセージを送信した場合であれば、・制御フ
ィールド13Bのビット2が計算機11Bによってオン
される。また計算機11^、 IIBは、細針算機から
通常のメツセージを受信したときには、その送信元に固
有の制御フィールドの対応する受信確認ビットをオンす
る。これにより、計算機118が計算機11Aからのメ
ツセージを受信した場合であれば、制御フィールド13
Aのビット1が計算機11Bによってオンされる。また
、計算機+1Aが計算機11Bからのメツセージを受信
した場合であれば、制御フィールド13Bのビット3が
計算機11Aによってオンされる。
First, in the multi-computer system shown in FIG.
This will be explained using IB normal message communication as an example. Calculator 11
A, IIB are normal functions (normal message communication)
, when a message is sent to the thin needle calculator, the control field 13A secured in the shared memory 12 is
, 13B turns on the corresponding transmission confirmation bit. As a result, for example, if a normal message is sent from the computer 11A to the computer 11B, bit 0 of the control field 13A is turned on (“1”) by the computer +1A.
). Also, from the computer 11B to the computer 11A
If a normal message is sent to the computer 11B, bit 2 of the control field 13B is turned on by the computer 11B. Further, when the computer 11^, IIB receives a normal message from the thin needle calculator, it turns on the corresponding reception confirmation bit in the control field specific to the sender. As a result, if the computer 118 receives a message from the computer 11A, the control field 13
Bit 1 of A is turned on by computer 11B. Further, if computer +1A receives a message from computer 11B, bit 3 of control field 13B is turned on by computer 11A.

上記したように本大施例では、計算機間で通常のメツセ
ージ交信が正常に行われると、対応する制御フィールド
の送信確認ビット並びに受信確認ビットがオンされる。
As described above, in this embodiment, when normal message communication is performed between computers, the transmission confirmation bit and reception confirmation bit of the corresponding control field are turned on.

具体的には、上記のように計算機11Aから計算機11
Bに通常のメツセージが送信されて、計算機11Bにお
いて正常に受信された場合であれば、制御フィールド1
3Aのビット0.1がいずれもオンされる。また、計算
機11Bから計算機11Aに通常のメツセージが送信さ
れて、計算機11Aにおいて正常に受信された場合であ
れば、制御フィールド13Bのビット2,3がいずれも
オンされる。なお、計算機11Aから計算機11cに通
常のメツセージが送信されて、計算機ttCにおいて正
常に受信された場合であれば、制御フィールド13Aの
ビット2.3がいずれもオンされることは明らかである
Specifically, as described above, from the computer 11A to the computer 11
If a normal message is sent to computer 11B and received normally by computer 11B, control field 1
All bits 0.1 of 3A are turned on. Further, if a normal message is sent from the computer 11B to the computer 11A and is normally received by the computer 11A, both bits 2 and 3 of the control field 13B are turned on. Note that if a normal message is sent from the computer 11A to the computer 11c and is normally received by the computer ttC, it is clear that bits 2.3 of the control field 13A are both turned on.

次に、第1図のマルチコンピュータシステムにおける相
互診断について、計算機11Aが11算機1113との
間の相互診断を行う場合を例に説明する。
Next, mutual diagnosis in the multi-computer system shown in FIG. 1 will be explained using an example in which the computer 11A performs mutual diagnosis with the eleventh computer 1113.

まず計算機11Aは、制御フィールド13Aのビット0
.1がいずれもオン状態にあるか否かをチエツク、する
(第3図ステップSt)。もし、制御フィールド13A
のビット0,1の少なくとも一方がオフ状態にある場合
には、計算機11Aは周知の方式で計算機11Bとの間
の相互診断を行う(第3図ステップS2)。次に計算機
11Aは制御フィールド13Aのビット0.1を全てオ
フ(“0“クリア)して(第3図ステップS3)、通常
の処理に入る。
First, the computer 11A selects bit 0 of the control field 13A.
.. 1 is in the on state (step St in FIG. 3). If control field 13A
When at least one of bits 0 and 1 of is in the off state, the computer 11A performs mutual diagnosis with the computer 11B using a well-known method (step S2 in FIG. 3). Next, the computer 11A turns off (clears "0") all bits 0.1 of the control field 13A (step S3 in FIG. 3) and enters normal processing.

そして一定周期(所定の相互診断周期)が経過すると(
第3図ステップS4)、計算機11Aは再び第3図のス
テップSlを実行し、制御フィールド13Aのビット0
,1がいずれもオン状態にあるか否かをチエツクする。
Then, after a certain period (predetermined mutual diagnosis period) has passed (
Step S4 in FIG. 3), the computer 11A again executes step Sl in FIG.
, 1 are all in the on state.

もし、制御フィールド13^のビット0,1がいずれも
オン状態にある場合には、計算機11Aは、前記相互診
断周期の間に計算機11^から計算機11Bへの通常の
メツセージ交信が正常にj−rわれでいることが確認で
きたものとして(したがって現在の相互診断周期におけ
る相互診断処理は不要であるものとして)、第3図ステ
ップS2の相互診断処理をスキップして第3図ステップ
S3に進む。そして計算機+1Aは、制御フィールド1
3Aのビット0,1を全てオフした後、通常の処理に入
る。
If bits 0 and 1 of the control field 13^ are both in the ON state, the computer 11A determines that normal message communication from the computer 11^ to the computer 11B is normal during the mutual diagnosis cycle. Assuming that the mutual diagnosis process in the current mutual diagnosis cycle is confirmed to be broken (therefore, the mutual diagnosis process in the current mutual diagnosis cycle is unnecessary), the process skips the mutual diagnosis process in step S2 of FIG. 3 and proceeds to step S3 of FIG. 3. . And the calculator +1A is the control field 1
After turning off all bits 0 and 1 of 3A, normal processing begins.

以上のように、制御フィールド13Aのビット0.1が
いずれもオン状態にある場合には、第3図ステップSt
の判定処理だけで、最も最近のt目互診断周期内に計算
機11Aから計算機11Bへの通常のメツセージ交信が
正常に行われたことが確認できるので、上記のように第
3図ステップS2の相互診断処理を省略しても何等問題
とならず、この相互診断処理の省略により、計算機11
A 、 IIBは通常の処理のための時間を十分に確保
でき、システムのオーバーヘッドが軽減される。
As described above, if all bits 0.1 of the control field 13A are in the on state, step St in FIG.
It can be confirmed that the normal message communication from the computer 11A to the computer 11B was performed normally within the most recent t-th mutual diagnosis cycle only by the determination process of step S2 in FIG. 3 as described above. There is no problem even if the diagnostic processing is omitted, and by omitting this mutual diagnostic processing, the computer 11
A, IIB can secure enough time for normal processing, reducing system overhead.

なお、計算機11Aが計算機llCとの間の相互診断を
行う場合には、制御フィールド13Aのビット2,3の
状態をチエツクすることで、本来の相互診断処理を省略
できるか否かが判別できることは明らかである。同様に
、計算機11Bが計算機用Cとの間の相互診断を行う場
合には、制御フィールド13Bのビット0,1の状態を
チエツクすることで、また計算機11Bが計算機11A
との間の相互診断を行う場合には、制御フィールド13
Bのビット2,3の状態をチエツクすることで、それぞ
れ本来の相互診断処理を省略できるか否かが判別できる 以上はマルチコンピュータシステムにおける相互診断に
ついて説明したが、本発明は相互診断を行うシステムで
あれば、他のシステムにも応用可能である。
Note that when the computer 11A performs mutual diagnosis with the computer IIIC, it can be determined whether or not the original mutual diagnosis process can be omitted by checking the states of bits 2 and 3 of the control field 13A. it is obvious. Similarly, when the computer 11B performs mutual diagnosis with the computer C, the computer 11B checks the status of bits 0 and 1 of the control field 13B.
When performing mutual diagnosis between
By checking the states of bits 2 and 3 of B, it can be determined whether or not the original mutual diagnosis process can be omitted.The above description has been about mutual diagnosis in a multi-computer system, but the present invention relates to a system that performs mutual diagnosis. If so, it can be applied to other systems as well.

[発明の効果] 以上詳述したようにこの発明によれば、計算機間で通常
メツセージ交信が行われたということは、その交信相手
が正常であるということに着目して、通常メツセージ交
信が行われた際に、その旨を共有メモリ上に設けけられ
た制御フィールドに記録するようにし、相互診断周期毎
の相互診断の際に上記制御フィールドを参照してその参
照結果に応じて相互診断を省略する構成としたので、一
定周期毎に無条件で相互診断を行っていた従来方式に比
べて相互診断に起因するオーバーヘッドを軽減すること
ができる。しかも、相互診断を省略するのは、対応する
相互診断周期において、対応する計算機間で通常メツセ
ージ交信が正常に行われた場合であり、相互診断省略に
よる悪影響(診断性能の低下)はない。
[Effects of the Invention] As detailed above, according to the present invention, the fact that normal message communication has occurred between computers means that the communication partner is normal, and normal message communication is carried out between computers. When a mutual diagnosis is made, the fact is recorded in a control field provided on the shared memory, and the above control field is referred to during mutual diagnosis in each mutual diagnosis cycle, and mutual diagnosis is performed according to the reference result. Since this configuration is omitted, the overhead caused by mutual diagnosis can be reduced compared to the conventional method in which mutual diagnosis is performed unconditionally at regular intervals. Furthermore, mutual diagnosis is omitted when normal message communication is normally performed between the corresponding computers in the corresponding mutual diagnosis cycle, and there is no adverse effect (deterioration of diagnostic performance) due to the omission of mutual diagnosis.

【図面の簡単な説明】[Brief explanation of drawings]

第1図はこの発明を適用するマルチコンピュタシステム
の一実施例を示すブロック構成図、第2図は第1図に示
す制御フィールドIIA 、 1111 。 ttCのフォーマット図、第3図は第1図に示す計算機
11Aにおける計算機11Bとの間の相互診断動作を説
明するためのフローチャートである。 11A 1B 1C ・・・計算機、 12・・・共有メモリ、 3A 3B 3c ・・・制御フィ ル ド。 出廟人代理人
FIG. 1 is a block diagram showing an embodiment of a multi-computer system to which the present invention is applied, and FIG. 2 shows the control field IIA, 1111 shown in FIG. The ttC format diagram, FIG. 3, is a flowchart for explaining the mutual diagnosis operation between the computer 11A shown in FIG. 1 and the computer 11B. 11A 1B 1C... Computer, 12... Shared memory, 3A 3B 3c... Control field. Mausoleum representative

Claims (1)

【特許請求の範囲】 複数の計算機と、この複数の計算機によって共有される
共有メモリとを備えたマルチコンピュータシステムにお
いて、 上記共有メモリ上に、上記各計算機間で通常メッセージ
交信が行われたことを示す交信確認情報が記録される制
御フィールドを設けると共に、上記各計算機に、上記通
常メッセージ交信を行った際には上記制御フィールドに
その旨を示す上記交信確認情報を記録する通常メッセー
ジ交信手段と、一定周期毎の相互診断に際して上記制御
フィールドを参照して相手計算機との間で上記通常メッ
セージ交信が行われたか否かを判別し、この判別結果に
応じて相互診断を実行する相互診断手段とを設け、 上記相互診断に際して上記通常メッセージ交信が行われ
たことが判別された場合には上記相互診断を省略して対
応する上記交信確認情報を上記制御フィールドから消去
するようにしたことを特徴とするマルチコンピュータシ
ステムにおける相互診断方式。
[Claims] In a multi-computer system comprising a plurality of computers and a shared memory shared by the plurality of computers, a message is normally exchanged between the computers on the shared memory. normal message communication means for recording the communication confirmation information in the control field when the normal message communication is performed in each of the computers; Mutual diagnosis means refers to the control field to determine whether or not the above-mentioned normal message communication has been performed with the other computer during mutual diagnosis at regular intervals, and executes mutual diagnosis according to the result of this determination. and when it is determined during the mutual diagnosis that the normal message communication has occurred, the mutual diagnosis is omitted and the corresponding communication confirmation information is deleted from the control field. Mutual diagnosis method in multi-computer systems.
JP1169680A 1989-06-30 1989-06-30 Mutual diagnostic method for multicomputer system Pending JPH0335346A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1169680A JPH0335346A (en) 1989-06-30 1989-06-30 Mutual diagnostic method for multicomputer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1169680A JPH0335346A (en) 1989-06-30 1989-06-30 Mutual diagnostic method for multicomputer system

Publications (1)

Publication Number Publication Date
JPH0335346A true JPH0335346A (en) 1991-02-15

Family

ID=15890918

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1169680A Pending JPH0335346A (en) 1989-06-30 1989-06-30 Mutual diagnostic method for multicomputer system

Country Status (1)

Country Link
JP (1) JPH0335346A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08305675A (en) * 1995-04-28 1996-11-22 Nippon Denki Ido Tsushin Kk Multi-processor system and its operation management method
JP2008060713A (en) * 2006-08-29 2008-03-13 Fuji Xerox Co Ltd Information processing apparatus and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08305675A (en) * 1995-04-28 1996-11-22 Nippon Denki Ido Tsushin Kk Multi-processor system and its operation management method
JP2008060713A (en) * 2006-08-29 2008-03-13 Fuji Xerox Co Ltd Information processing apparatus and program

Similar Documents

Publication Publication Date Title
JP2996440B2 (en) Diagnosis method of data processing system
US6519712B1 (en) Independent checkpointing method using a memory checkpoint on a distributed system
JPH0335346A (en) Mutual diagnostic method for multicomputer system
CN113608914B (en) Chip, functional safety detection method of chip, medium and electronic equipment
US7533299B2 (en) Temporal correlation of messages transmitted by a microprocessor monitoring circuit
US7500154B2 (en) Method and system for generating a console log
JPH06103251A (en) Monitor and control system for information processor
JP3245552B2 (en) Transfer control system
JPH1125044A (en) On-line diagnostic system
JP2524673B2 (en) Direct memory access device
JPH03142535A (en) Terminal system with substitute processing function
JPS6148247A (en) Fault detection system of data transfer system
JP2001043104A (en) Bus monitor device for computer system
JPS62105243A (en) Recovery device for system fault
JPH0877121A (en) Hot standby information handing-over system
JPH088948A (en) Unilateral loop transmission line circuit
JPH0589022A (en) Information processor
JPH0282337A (en) Controlling method for data processor
JPH0298711A (en) Numerical control data transfer checking system
JPH05303549A (en) Terminal data inheritance system
JPS628830B2 (en)
JPH01318337A (en) Communication method in duplicate equipment
JPH0224759A (en) Inter-processor communication control system in information processing system
JPH01258136A (en) Information processing system
JPH10254733A (en) Microcomputer monitoring device