JPH07282020A - Communication load reduction method in highly reliable computer system, - Google Patents

Communication load reduction method in highly reliable computer system,

Info

Publication number
JPH07282020A
JPH07282020A JP6077264A JP7726494A JPH07282020A JP H07282020 A JPH07282020 A JP H07282020A JP 6077264 A JP6077264 A JP 6077264A JP 7726494 A JP7726494 A JP 7726494A JP H07282020 A JPH07282020 A JP H07282020A
Authority
JP
Japan
Prior art keywords
execution
output data
execution result
computer
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6077264A
Other languages
Japanese (ja)
Inventor
Shingo Kinoshita
真吾 木下
Hiroyuki Yamashita
博之 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP6077264A priority Critical patent/JPH07282020A/en
Publication of JPH07282020A publication Critical patent/JPH07282020A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To maintain the reliability and to reduce a communication load in a system by selecting output data by means of the comparison of execution results on the execution main body-side. CONSTITUTION:Only when the number (n) of the execution main bodies is larger than the matched number (h) of requests, the execution main body 20j transmits the execution result 30j to the execution main bodies 20j+1 to 20n-h+1 in an execution result output means 22j to the integer of 1<=j<=(n-h). In the case of n>=h hereafter, the execution main body 20n-h+1 does not transmit the execution result 30n-h+1 to any execution main bodies to an integer n-h+1. The execution main body 20k corresponding to the integer (k) of n-h+1<k<=n transmits the execution result 30k to the execution main bodies 201 to 20n-h+1 in an execution result output means 22k. The execution main body 20i compares the execution results 30i, 301-30i-1, 30n-h+2 and 30n in an output data selection means 25i, selects the matched execution results as output data only when the matched execution results include the respective execution results and the requested matched number (h) of the results exactly exist and transmits them to succeeding execution main bodies 101-10m.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、高信頼計算機システム
における通信負荷削減方法に係り、同一機能を有する複
数の実行主体が同一入力データに基づいて処理を独立に
実行し、それらの実行結果の比較により、信頼性を高め
ようとする高信頼計算機システムにおける通信負荷削減
方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a communication load reducing method in a highly reliable computer system, in which a plurality of executing entities having the same function independently execute processing based on the same input data and By comparison, the present invention relates to a communication load reduction method in a high-reliability computer system that attempts to improve reliability.

【0002】詳しくは、オンラインシステム等におい
て、上位の計算機の実行結果を後続の計算機に使用する
ような場合に、同一機能を有する複数の上位計算機の実
行結果を比較して正しい結果を後続の計算機に送出する
高信頼計算機システムに関するものである。
More specifically, in an online system or the like, when the execution result of a high-order computer is used for a subsequent computer, the execution results of a plurality of high-order computers having the same function are compared to obtain a correct result as a succeeding computer. The present invention relates to a highly reliable computer system for sending to a computer.

【0003】[0003]

【従来の技術】高信頼計算機システムは、同一機能を有
する複数の実行主体の実行結果を比較し、一致する実行
結果が所定の必要数(単純な多数決の場合は、実行結果
数の過半数)以上ある場合、一致した実行結果を、出力
データとして選択し、それに基づいて複数の後継実行主
体に継続処理を行わせることで、処理の信頼性を高めよ
うとするものである。従来のシステムは、出力データの
選択を後継実行主体側で行うものである。
2. Description of the Related Art A high-reliability computer system compares the execution results of a plurality of execution subjects having the same function, and the matching execution results are equal to or more than a predetermined required number (a majority of the execution results in the case of a simple majority decision). In some cases, the matching execution result is selected as output data, and a plurality of succeeding execution subjects are made to perform continuous processing based on the selected output data, so as to improve the reliability of the processing. In the conventional system, output data is selected on the side of the succeeding executing party.

【0004】図4は従来の高信頼計算機システムの一例
を示す。同図に示すシステムは、複数の実行主体(計算
機)201 〜20n 、ネットワーク100、及び複数の
後継実行主体(後続計算機)101 〜10m より構成さ
れる。実行主体201 〜20 n は、同一の入力50が入
力されると、独立の処理を実行し、実行結果を後継実行
主体10にそれぞれ送出する。
FIG. 4 shows an example of a conventional highly reliable computer system.
Indicates. The system shown in FIG.
Machine) 201~ 20n, Network 100, and multiple
Successor execution subject (successor computer) 101-10mMade up of
Be done. Execution subject 201~ 20 nInput the same input 50
When executed, it executes independent processing and succeeds execution result
The data is transmitted to the main body 10.

【0005】同図において、実行主体201 、202
…、20n は、同一の機能の機能実行部211 、2
2 、…21n と実行結果出力部221 、222 、…2
n とをそれぞれ有する。実行主体201 、202
…、20n は、それぞれ同一の入力データ50を受け取
り、機能実行部211 、212 、…、21n により入力
データ50に基づく処理を実行し、実行結果出力部22
1 、222 、…、22n によりそれぞれの実行結果30
1 、302 、…、30n をそれぞれの後継実行主体10
1 、102 、…、10n へ送出する。例えば、実行結果
出力部221 から出力された実行結果301 は、後続実
行主体101 、102 、…、10m のそれぞれに送出さ
れる。後継実行主体101 、102 、…、10m は、機
能実行部111、112 、 …、11m と出力データ選
択部141 、…、14m を有する。後続実行主体1
1 、102 、…、10m のそれぞれの出力データ選択
部141 、…、14m は、実行主体201 、202
…、20n からの実行結果301 、30 2 、…、30n
の比較を行い、一致する実行結果が要求一致数h(単純
な多数決の場合は実行主体数の過半数)以上ある場合、
一致した実行結果を後続実行主体101 、102 、…、
10m の機能実行部111 、112 、 …、11m への
出力データとして選択する。
Referring to FIG.1, 202,
…, 20nIs the function execution unit 21 having the same function.1Two
12, ... 21nAnd execution result output unit 221, 222, ... 2
TwonAnd have respectively. Execution subject 201, 202,
…, 20nReceive the same input data 50 respectively
Function execution unit 211, 212, ..., 21nInput by
A process based on the data 50 is executed, and the execution result output unit 22
1, 222, ..., 22nEach execution result by 30
1, 302, ..., 30nEach succeeding execution subject 10
110,2, ... 10nSend to. For example, the execution result
Output unit 221Execution result 30 output from1Is the successor
Line subject 10110,2, ... 10mSent to each of
Be done. Successor execution subject 10110,2, ... 10mIs the machine
Noh execution unit 111, 112, ..., 11mAnd output data selection
Selector 141, ..., 14mHave. Subsequent execution subject 1
0110,2, ... 10mOutput data selection for each
Part 141, ..., 14mIs the execution subject 201, 202,
…, 20nExecution result from 301, 30 2, ..., 30n
, And the matching execution result is the requested match count h (simple
In case of a majority vote
The subsequent execution subject 10110,2, ...
10mFunction execution unit 111, 112, ..., 11mTo
Select as output data.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、上記従
来の高信頼計算機システムは、全ての後継実行主体10
1 、102 、…、10m がそれぞれ正しい出力データを
選択できるためには、実行主体201 、202 、…、2
n が、それぞれの実行結果出力部221 、22 2
…、22n により実行結果301 、302 、…、30n
を後続実行主体10 1 、102 、…、10m それぞれに
送出しなければならず、結果として実行主体201 、2
2 、…、20n の数と後継実行主体101 、102
…、10m の数の積、即ち、n×m回もの通信が必要と
なりシステム内の通信負荷の増大を招いているという問
題がある。
[Problems to be Solved by the Invention]
Conventional high-reliability computer systems are all the successors 10
110,2, ... 10mEach output correct output data
In order to be selectable, the execution subject 201, 202, ... 2
0nHowever, each execution result output unit 221, 22 2,
…, 22nExecution result by 301, 302, ..., 30n
Subsequent execution subject 10 110,2, ... 10meach
Must be sent out, and as a result the executing entity 201Two
02, ..., 20nAnd the successor body 10110,2,
... 10mThe product of the number of times, that is, communication of n × m times is required.
The problem is that it is increasing the communication load in the system.
There is a problem.

【0007】本発明は、上記の点に鑑みなされたもの
で、上記従来の問題点を解決し、従来の高信頼計算機シ
ステムと同様の信頼性を維持しながら、主体間の通信の
数を削減することが可能な高信頼計算器システムにおけ
る通信負荷削減方法を提供することを目的とする。
The present invention has been made in view of the above points, and solves the above-mentioned conventional problems and reduces the number of communications between the main constituents while maintaining the same reliability as the conventional high-reliability computer system. It is an object of the present invention to provide a communication load reducing method in a high-reliability computer system.

【0008】[0008]

【課題を解決するための手段】本発明は、実行主体の実
行結果の比較による出力データの選択を実行主体側で行
い、後継実行主体に送出するシステムである。
The present invention is a system in which output data is selected by the execution subject side by comparison of execution results of the execution subject and is sent to the successor execution subject.

【0009】本発明は、同一機能を有し、それぞれが少
なくとも中央処理装置、データ入力装置、実行結果出力
装置及び出力データ選択装置を含む複数の実行主体
1 ,X 2 ,…,Xn (n≧2の整数)の実行結果
r1,Xr2,…,Xrnを比較し、一致する実行結果が所
定の必要数(要求一致数h(n≧h≧2の整数))以上
である場合、一致した実行結果を出力データとして選択
し、出力データに基づいて複数の後継実行主体Y1 、Y
2 、…、Ym (m≧2の整数)に後続処理を行わせるこ
とで処理の信頼性を高めようとする高信頼計算機システ
ムにおいて、実行主体数が要求一致数より多い場合(n
>h)に限り、1≦j≦(n−h)の整数jに対して、
実行主体Xj は、実行結果Xrjを実行主体Xj+1 ,X
j+2 ,…,Xn-h+1 に送出し、以降、実行主体数と要求
主体数が等しい(n=h)場合を含めた実行主体数が要
求一致数以上の場合(n≧h)、整数n−h+1に対し
て、実行主体Xn-h+1は、実行結果Xrn-h+1をどの実行
主体へも送出せず、n−h+1<k≦nの整数kに対し
て、実行主体Xk は、実行結果Xrkを実行主体X1 ,X
2 ,…,Xn-h+ 1 へ送出し、n−h+1<i≦nの整数
iに対して、実行主体Xi は、実行結果Xri,Xr1,X
r2,Xri-1,Xrn-h+2,…,Xrnを比較し、一致する実
行結果が各自の実行結果を含めて要求一致数hだけちょ
うどある場合に限り、一致を得た実行結果を出力データ
として選択し、出力データを後継実行主体Y1 ,Y2
…Ym へ送出する。
The present invention has the same function,
Central processing unit, data input unit, execution result output
Multiple actors including a device and an output data selection device
X1, X 2, ..., XnExecution result of (n ≧ 2 integer)
Xr1, Xr2, ..., XrnAnd the matching execution results are
At least a certain required number (the number of matching requests h (n ≧ h ≧ 2 integer))
If it is, select the matching execution result as output data
Then, based on the output data, a plurality of succeeding execution subjects Y1, Y
2, ..., Ym(M ≧ 2 integer) should be used for subsequent processing.
A highly reliable computer system that tries to improve the reliability of processing by
If the number of executing subjects is greater than the number of matching requests in the system (n
> H) only, for an integer j of 1 ≦ j ≦ (n−h),
Execution subject XjIs the execution result XrjExecuting subject Xj + 1, X
j + 2, ..., Xn-h + 1The number of execution subjects and requests thereafter
The number of executing subjects is required, including the case where the number of subjects is equal (n = h)
If the number of matches is greater than or equal to (n ≧ h), for integer n−h + 1
Execution subject Xn-h + 1Is the execution result Xrn-h + 1Which run
For an integer k of n−h + 1 <k ≦ n without sending it to the subject,
Execution subject XkIs the execution result XrkExecuting subject X1, X
2, ..., Xn-h + 1To n, an integer of n−h + 1 <i ≦ n
Execution subject X for iiIs the execution result Xri, Xr1, X
r2, Xri-1, Xrn-h + 2, ..., XrnCompare and match real
The line result is the number of request matches h including the execution result of each person.
Outputs the execution result with a match only when there is a Udo
And select the output data as the successor agent Y1, Y2
... YmSend to.

【0010】また、本発明は、通信時間が十分に大き
く、実行主体が実行結果を送出した後、出力データを送
出する前に故障して、後続実行主体に出力データを送出
できないような可能性がある場合に、1≦j≦(n−
h)の整数jに対して実行主体X j が出力データを送出
する際に、実行主体Xj+1 ,Xj+2 ,…,Xn-h+1 に出
力データの送出の事実を周知するためのメッセージを合
わせて送出する。
The present invention also has a sufficiently long communication time.
After the execution subject sends the execution result, it sends the output data.
Before it goes out, it breaks down and sends the output data to the subsequent execution subject.
If there is a possibility that it cannot be performed, 1 ≦ j ≦ (n−
Execution subject X for integer j in h) jSends output data
Execution subject Xj + 1, Xj + 2, ..., Xn-h + 1Out
A message to inform the fact that the force data has been sent.
Send together.

【0011】[0011]

【作用】図1は、本発明の原理説明図である。本発明
は、実行主体数n>要求一致数hである場合に限り、1
≦j≦(n−h)の整数jに対して実行主体20j は、
実行結果出力手段22j により実行結果30j を実行主
体20j+1 、20j+2 、…、20n-h+1 に送出し、これ
以降はn≧hの場合に整数n−h+1に対して、実行主
体20n-h+1 は実行結果30n-h+1をどの実行主体へも
送出せず、n−h+1<k≦nの整数kに対応する実行
主体20k は、実行結果出力手段22k により、実行結
果30k を実行主体201 、202 、…、20n-h+1
送出し、1≦i≦n−h+1の整数iに対して実行主体
20i は、出力データ選択手段25i により、実行結果
30i ,301 ,30 2 、…、30i-1 、30n-h+2
…、30n を比較し、一致する実行結果が各自の実行結
果を含み要求一致数hだけちょうどある場合に限り、一
致した実行結果を出力データとして選択し、出力データ
を後継実行主体101 、102 、…、10m へ送出す
る。
FIG. 1 is a diagram for explaining the principle of the present invention. The present invention
Is 1 if and only if the number of executing agents n> the number of matching requests h
Execution subject 20 for integer j of ≦ j ≦ (n−h)jIs
Execution result output means 22jExecution result by 30jExecutor
Body 20j + 1, 20j + 2, ..., 20n-h + 1Send this to
After that, when n ≧ h, the execution principal is applied to the integer n−h + 1.
Body 20n-h + 1Is the execution result 30n-h + 1To any actor
Execution corresponding to an integer k of n−h + 1 <k ≦ n without sending
Subject 20kIs the execution result output means 22kExecution result
Fruit 30kExecuting subject 201, 202, ..., 20n-h + 1What
Send out and execute subject for integer i of 1 ≦ i ≦ n−h + 1
20iIs output data selection means 25iExecution result
Thirtyi, 301, 30 2, ..., 30i-1, 30n-h + 2,
…, 30nAnd the matching execution results are
Only if there is exactly the requested number of matches h including the fruit,
Select the executed result as output data and output data
The successor body 10110,2, ... 10mSend to
It

【0012】これにより、実行主体(計算機)の故障の
有無に関わらず、正常動作を行っている実行主体(計算
機)のうち1つの実行主体(計算機)の実行結果のみを
出力データとして後続実行主体(後続計算機)に送出す
ることにより、全体的に通信回数を削除することができ
る。
As a result, regardless of whether or not there is a failure in the execution subject (computer), only the execution result of one execution subject (computer) that is performing a normal operation is used as output data for the subsequent execution subject. By sending the data to the (subsequent computer), the number of times of communication can be deleted as a whole.

【0013】また、本発明は、実行主体Xj が実行結果
rjを実行主体Xj+1 ,Xj+2 ,…,Xn-h+1 に送出す
る際に、後続実行主体に出力データの送出の事実を周知
するためのメッセージを実行結果Xrjに付加して送出す
ることにより、もし、実行主体Xj が送出途中で故障し
たような場合に、他の実行主体Xj+1 ,Xj+2 ,…,X
n-h+1 のいずれかが、後続実行主体に対して出力データ
を送出することが可能となる。
Further, according to the present invention, when the execution subject X j sends the execution result X rj to the execution subjects X j + 1 , X j + 2 , ..., X n-h + 1 , the execution result is output to the succeeding execution subject. By adding a message for notifying the fact of data transmission to the execution result X rj and transmitting it, if the execution subject X j fails in the middle of transmission, another execution subject X j + 1 , X j + 2 , ..., X
Any of n-h + 1 can send the output data to the subsequent execution subject.

【0014】[0014]

【実施例】以下、図面と共に本発明の実施例を説明す
る。
Embodiments of the present invention will be described below with reference to the drawings.

【0015】図2は、本発明の一実施例のシステム構成
を示す。同図に示す計算機20a、20b、20cは、
中央処理装置21a、21b、21c、実行結果出力装
置22a、22b、22c、出力データ選択装置25
a、25b、25cを有し、入力データ50が入力さ
れ、実行結果30a、30b、30cを出力する。ま
た、ネットワーク100を介して後継計算機10a、1
0b、10cが接続されている。
FIG. 2 shows the system configuration of an embodiment of the present invention. The computers 20a, 20b, 20c shown in FIG.
Central processing units 21a, 21b, 21c, execution result output devices 22a, 22b, 22c, output data selection device 25
a, 25b, 25c, input data 50 is input, and execution results 30a, 30b, 30c are output. Further, the successor computers 10a, 1 are connected via the network 100.
0b and 10c are connected.

【0016】以下に動作を説明する上で、上記のように
実行主体数は、20a,20b,20cのn=3であ
り、要求一致数は、実行主体数の過半数、即ちこの例で
は、h=2とする。さらに故障は、中央処理装置21で
の処理の実行結果にのみ誤りが生じる中央処理装置の誤
り故障と、計算機全体20、即ち、中央処理装置21、
実行結果出力装置22、出力データ選択装置25とが全
く停止し、利用できなくなる計算機20a、20b、2
0cの停止故障とを考え、同時に発生する故障の最大数
は、過半数より小さく1であると考える。さらに、通信
は、ネットワーク100を介して正常に行われ、メッセ
ージの紛失や書換えは起こらないものとする。
In the following description of the operation, the number of execution subjects is n = 3 of 20a, 20b, 20c as described above, and the number of requested matches is a majority of the number of execution subjects, that is, h in this example. = 2. Further, the failure is an error failure of the central processing unit in which an error occurs only in the execution result of the processing in the central processing unit 21, and the entire computer 20, that is, the central processing unit 21,
The execution result output device 22 and the output data selection device 25 are completely stopped, and the computers 20a, 20b, 2 are no longer available.
Considering the stop failure of 0c, the maximum number of failures that occur at the same time is considered to be 1 which is less than the majority. Furthermore, it is assumed that the communication is normally performed via the network 100 and the message is not lost or rewritten.

【0017】なお、実行主体20aは、実行結果30a
を実行主体20bに送出し、実行主体20cは、実行結
果30cを実行主体20a、20bに送出し、実行主体
20bは実行結果をどこにも出力しないものとする。
The execution subject 20a has the execution result 30a.
To the execution subject 20b, the execution subject 20c sends the execution result 30c to the execution subjects 20a and 20b, and the execution subject 20b does not output the execution result to any part.

【0018】図3は、本発明の一実施例の各計算機の動
作を示すフローチャートである。計算機20a、20
b、20cは、入力データ待ち状態(ステップ0)から
入力データ50を受信し、中央処理装置21a、21
b、21cが入力データ50に基づく処理を独立に実行
する(ステップ1)。
FIG. 3 is a flow chart showing the operation of each computer according to the embodiment of the present invention. Computer 20a, 20
b, 20c receive the input data 50 from the input data waiting state (step 0), and the central processing units 21a, 21c
b and 21c independently execute the processing based on the input data 50 (step 1).

【0019】計算機20aは、実行結果出力装置22a
により実行結果30aを計算機20bに送出し(ステッ
プ2−1)、計算機20bは、どこにも実行結果を送出
しない(ステップ2−2)。計算機20cは、実行結果
出力装置22cにより実行結果30cを計算機20bに
送出する(ステップ2−3)。
The computer 20a has an execution result output device 22a.
Thus, the execution result 30a is sent to the computer 20b (step 2-1), and the computer 20b does not send the execution result anywhere (step 2-2). The computer 20c sends the execution result 30c to the computer 20b by the execution result output device 22c (step 2-3).

【0020】計算機20aは、出力データ選択装置25
aにより、計算機20a自身の実行結果出力装置22a
から入力された実行結果30aと計算機20cから受信
した実行結果30cを比較し(ステップ3−1)、一致
する場合に限り、一致を得た実行結果を出力データとし
て選択し、後継計算機10a、10b、10cへ出力デ
ータを送出する(ステップ4−1)。再び次の入力デー
タ受信待ち状態となる。一致しない場合は、ステップ0
に移行し、出力データを送出できず、次の入力データ5
0待ち状態となる。
The computer 20a has an output data selection device 25.
a, the execution result output device 22a of the computer 20a itself
The execution result 30a input from the computer 20c is compared with the execution result 30c received from the computer 20c (step 3-1), and only when there is a match, the execution result with a match is selected as output data, and the successor computers 10a and 10b are selected. The output data is sent to 10c (step 4-1). The state again stands by for the next input data reception. If they do not match, step 0
, The output data cannot be sent, and the next input data 5
Waiting for 0.

【0021】計算機20bの出力データ選択装置25b
は、計算機20aから入力された実行結果30aと計算
機20cから入力された実行結果30cとを比較し(ス
テップ3−2)、一致する実行結果の数が実行結果30
bを含めて2つの場合に限り、一致を得た実行結果を出
力データとして選択し、後継計算機10a、10b、1
0cに送出し(ステップ4−2)、再び次の入力データ
50待ち状態となる。それ以外の場合は、出力データを
送出できず、次の入力データ受信待ち状態となる。
Output data selection device 25b of computer 20b
Compares the execution result 30a input from the computer 20a with the execution result 30c input from the computer 20c (step 3-2), and the number of matching execution results is 30.
Only in two cases including b, the execution result that has obtained a match is selected as output data, and the successor computers 10a, 10b, 1
0c (step 4-2), and the next input data 50 waits again. In other cases, output data cannot be sent and the next input data reception wait state is entered.

【0022】計算機20cは、次の入力データ受信待ち
状態となる。
The computer 20c is in a waiting state for receiving the next input data.

【0023】次に、各実行計算機の状態毎の事例を示
す。
Next, an example for each state of each execution computer will be shown.

【0024】〈正常時〉故障がない場合、計算機20a
は、出力データ選択装置25aにより、実行結果30a
と実行結果30cとの一致を確認し、出力データとして
選択し、後継計算機10a、10b、10cへ出力デー
タを送出する(実線40)。
<Normal time> When there is no failure, the computer 20a
Is the execution result 30a by the output data selection device 25a.
And the execution result 30c are confirmed and selected as output data, and the output data is sent to the successor computers 10a, 10b, 10c (solid line 40).

【0025】計算機20bは、出力データ選択装置25
bにより実行結果30aと実行結果30bと実行結果3
0cとの3つの一致を確認するので、出力データを送出
できない。これは、自分自身の実行結果30bを含み、
丁度要求一致数h(=2)の実行結果の一致数を確認し
た計算機のみが、後続計算機10a,10b,10cへ
出力データを送出することができるため、3つのデータ
の一致を確認した計算機20bは出力データを送出する
ことができない。
The computer 20b has an output data selection device 25.
execution result 30a, execution result 30b, and execution result 3 depending on b
The output data cannot be sent because the three matches with 0c are confirmed. This includes the result 30b of its own execution,
Only the computer that has confirmed the number of matches of the execution result of the requested number of matches h (= 2) can send the output data to the subsequent computers 10a, 10b, 10c, and thus the computer 20b that has confirmed the match of the three data. Cannot send output data.

【0026】〈計算機20aが停止故障の場合〉計算機
20aが停止故障の場合、計算機20aは、停止故障に
つき出力データを送出することができない。
<When the computer 20a has a stop failure> When the computer 20a has a stop failure, the computer 20a cannot send output data due to the stop failure.

【0027】計算機20bは、出力データ選択装置25
bにより、実行結果30a、実行結果30b、実行結果
30cとを比較し、実行結果30bと実行結果30cの
2つだけの一致を確認できた結果を出力データとして選
択し、後継計算機10a、10b、10cへ出力データ
を送出する(点線60)。
The computer 20b is an output data selection device 25.
b, the execution result 30a, the execution result 30b, and the execution result 30c are compared, and the result in which only two matches of the execution result 30b and the execution result 30c can be confirmed are selected as output data, and the successor computers 10a, 10b, Output data is sent to 10c (dotted line 60).

【0028】〈計算機20aの中央処理装置21aが誤
り故障の場合〉計算機20aの中央処理装置21aが誤
り故障の場合に、計算機20aは、出力データ選択装置
25aにより、実行結果30aと実行結果30cとの不
一致を確認するので、出力データを送出できない。
<When the central processing unit 21a of the computer 20a has an error failure> When the central processing unit 21a of the computer 20a has an error failure, the computer 20a outputs the execution result 30a and the execution result 30c by the output data selection device 25a. The output data cannot be sent because the mismatch of is confirmed.

【0029】計算機20bは、出力データ選択装置25
bにより実行結果30bと実行結果30cの2つだけの
一致を確認し、出力データとして選択し、後継計算機1
0a、10b、10cへ出力データを送出する(点線6
0)。
The computer 20b has an output data selection device 25.
b) confirms that only two of the execution result 30b and the execution result 30c match, and selects them as output data.
Output data to 0a, 10b, 10c (dotted line 6
0).

【0030】〈計算機20bが停止故障の場合〉計算機
20bが停止故障の場合、計算機20aは、出力データ
選択装置25aが実行結果30aと実行結果30cとの
一致を確認し、出力データとして選択し、後継計算機1
0a、10b、10cへ出力データを送出する(実線4
0)。このとき、計算機20bは、停止故障につき出力
データを送出できない。
<When the computer 20b has a stop failure> When the computer 20b has a stop failure, the output data selection device 25a of the computer 20a confirms that the execution result 30a and the execution result 30c match and selects them as output data. Successor computer 1
Output data to 0a, 10b, 10c (solid line 4
0). At this time, the computer 20b cannot send output data due to a stop failure.

【0031】〈計算機20bの中央処理装置21bが誤
り故障の場合〉計算機20bの中央処理装置21bが誤
り故障の場合、計算機20aは、出力データ選択装置2
5aにより実行結果30aと計算機20cからの実行結
果30cとの一致を確認し、出力データとして選択し、
後継計算機10a、10b、10cへ出力データを送出
する(実線40)。計算機20bは、出力データ選択装
置25bにより、計算機20aの実行結果30a、計算
機20bの実行結果30b及び計算機20cの実行結果
30cの3つの実行結果を比較し、実行結果30aと実
行結果30cの2つだけの一致を確認するが、計算機2
0bの中央処理装置21bが故障であるため実行結果が
出力されない。このため、実行結果30bを含んでいな
いため、出力データを送出できない。
<When the central processing unit 21b of the computer 20b has an error failure> When the central processing unit 21b of the computer 20b has an error failure, the computer 20a uses the output data selection device 2
5a confirms the match between the execution result 30a and the execution result 30c from the computer 20c, and selects it as output data,
The output data is sent to the successor computers 10a, 10b, 10c (solid line 40). The computer 20b compares the three execution results of the execution result 30a of the computer 20a, the execution result 30b of the computer 20b, and the execution result 30c of the computer 20c by the output data selection device 25b, and compares the two execution results 30a and 30c. Make sure only the match, but Calculator 2
Since the central processing unit 21b of 0b has a failure, the execution result is not output. Therefore, the output data cannot be sent because the execution result 30b is not included.

【0032】〈計算機20cが停止故障の場合〉計算機
20aは、出力データ選択装置25aにより実行結果3
0aと実行結果30cとの不一致を確認したため、出力
データを送出できない。
<When the computer 20c has a stop failure> The computer 20a uses the output data selection device 25a to execute the execution result 3
The output data cannot be sent because the mismatch between 0a and the execution result 30c is confirmed.

【0033】計算機20bは、出力データ選択装置25
bにより、実行結果30a、実行結果30b及び実行結
果30cとを比較し、実行結果30aと実行結果30b
の2つだけの一致を確認し、出力データとして選択し、
後継計算機10a、10b、10cへ出力データを送出
する(点線60)。
The computer 20b has an output data selection device 25.
b, the execution result 30a, the execution result 30b, and the execution result 30c are compared, and the execution result 30a and the execution result 30b are compared.
Check only the two matches and select it as the output data,
The output data is sent to the successor computers 10a, 10b, 10c (dotted line 60).

【0034】〈計算機20cの中央処理装置21cが誤
り故障の場合〉計算機20aは、出力データ選択装置2
5aにより実行結果30aと実行結果30cとの不一致
を確認し、出力データを送出できない。
<When the central processing unit 21c of the computer 20c has an error failure> The computer 20a is the output data selection device 2
5a confirms the mismatch between the execution result 30a and the execution result 30c, and cannot output the output data.

【0035】計算機20bは、出力データ選択装置25
bにより、実行結果30a、実行結果30b及び実行結
果30cとを比較し、実行結果30aと実行結果30b
の2つだけの一致を確認し、出力データとして選択し、
後継計算機10a、10b、10cへ出力データを送出
する(点線60)。
The computer 20b has an output data selection device 25.
b, the execution result 30a, the execution result 30b, and the execution result 30c are compared, and the execution result 30a and the execution result 30b are compared.
Check only the two matches and select it as the output data,
The output data is sent to the successor computers 10a, 10b, 10c (dotted line 60).

【0036】この結果、このようなシステム構成におい
ては、9回もの通信が必要であった従来の方法に比べて
通信回数を6回に削減できる。
As a result, in such a system configuration, the number of communications can be reduced to 6 as compared with the conventional method which requires 9 communications.

【0037】なお、本発明の高信頼計算機システムにお
ける通信負荷削減方法は、機能端子等の実行主体とする
LSIやWSI,CPUやパッケージやボード等を実行
主体とする計算機、計算機を実行主体とするネットワー
クワイドや分散システムなど、様々なスケールのシステ
ムに対して適用可能である。
The communication load reducing method in the highly reliable computer system according to the present invention uses a computer or a computer whose execution subject is an LSI or WSI, a CPU, a package, a board or the like which is an execution subject of a functional terminal or the like. It is applicable to various scale systems such as network wide and distributed systems.

【0038】なお、通信の時間が十分に大きい場合、即
ち、実行結果を送出した計算機が、実行結果転送中に、
故障してしまう可能性がある場合、本発明では、どの計
算機からも出力データが送出されないといった問題が生
じる。例えば、上記の実施例において、計算機20aか
ら計算機20bへの実行結果の転送中に、計算機20a
が停止故障した場合、計算機20aからの出力データの
送出はなく、また、計算機20bは計算機20aからの
実行結果を得、計算機20aが出力データを送出したも
のとして判断するため、計算機20bからの出力データ
の送出もなくなる。
When the communication time is sufficiently long, that is, when the computer that sent the execution result is transferring the execution result,
When there is a possibility of failure, the present invention has a problem that output data is not sent from any computer. For example, in the above-described embodiment, the computer 20a is being transferred while the execution result is being transferred from the computer 20a to the computer 20b.
Output failure from the computer 20a, the computer 20b obtains the execution result from the computer 20a and judges that the computer 20a has transmitted the output data. Therefore, the output from the computer 20b No data is sent.

【0039】上記のような問題は、1≦j≦{(実行主
体数n)−(要求一致数h)}の整数jに対して、出力
データを送出した実行主体Xj が、そのデータの送出と
同時に、送出の事実を周知するメッセージを実行主体X
j+1 ,Xj+2 ,…,Xn-h+1に送出することで解決され
る。つまり、計算機20aが後続計算機10a,10
b,10cに出力データを送出する際に、他の計算機2
0bへ送出済みのメッセージを送出する。これにより、
出力データ送出済みのメッセージが計算機20bに対し
て送出されない場合には、計算機20bは計算機20a
に何らかの障害が発生したものとして、計算機20aの
代わりに後続計算機10a,10b,10cに出力デー
タを送出する。これによる通信回数の増加は、最大n−
h回で済むことになる。
The problem as described above is that, for an integer j of 1≤j≤ {(number of executing subjects n)-(request matching number h)}, the executing subject X j that has sent the output data outputs At the same time as the transmission, a message that informs the fact of the transmission is issued by the executing entity X
It is solved by sending to j + 1 , X j + 2 , ..., X n-h + 1 . That is, the computer 20a is replaced by the subsequent computers 10a, 10
b, when sending output data to 10c, another computer 2
The already sent message is sent to 0b. This allows
When the message of which output data has been sent is not sent to the computer 20b, the computer 20b is
Assuming that some kind of failure has occurred, the output data is sent to the subsequent computers 10a, 10b, 10c instead of the computer 20a. The maximum increase in the number of communications due to this is n-
It will be done h times.

【0040】上記実施例は、通信回数の増加は1回で、
総通信回数は7回となるが、従来は9回必要であったの
に比較すると2回少なくなる。
In the above embodiment, the number of communications is increased once,
The total number of times of communication is 7, but it is reduced by 2 compared to 9 times in the past.

【0041】[0041]

【発明の効果】上述のように本発明の通信負荷削減方法
によれば、実行結果の比較による出力データの選択を後
継実行主体側で行うのではなく、実行主体側において行
うことにより、システムトータルとしては、信頼性を維
持しながら、システム内の通信負荷を削減できる。
As described above, according to the communication load reducing method of the present invention, the output data is not selected by comparing the execution results on the side of the succeeding execution body, but on the side of the execution body. As a result, the communication load in the system can be reduced while maintaining reliability.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の原理を説明するための図である。FIG. 1 is a diagram for explaining the principle of the present invention.

【図2】本発明の一実施例のシステム構成図である。FIG. 2 is a system configuration diagram of an embodiment of the present invention.

【図3】本発明の一実施例の計算機の動作を示すフロー
チャートである。
FIG. 3 is a flowchart showing the operation of the computer according to the embodiment of this invention.

【図4】従来の高信頼計算機システムの一例を示すブロ
ック図である。
FIG. 4 is a block diagram showing an example of a conventional highly reliable computer system.

【符号の説明】[Explanation of symbols]

10 後続実行主体、後続計算機 20 実行主体、計算機 21 機能実行手段、中央処理装置 22 実行結果出力手段、実行結果出力装置 25 出力データ選択手段、出力データ選択装置 30 実行結果 40 計算機20aから送出される出力データ 60 計算機20bから送出される出力データ 100 ネットワーク 10 Subsequent Execution Subject, Subsequent Computer 20 Execution Subject, Computer 21 Function Execution Unit, Central Processing Unit 22 Execution Result Output Unit, Execution Result Output Unit 25 Output Data Selection Unit, Output Data Selection Device 30 Execution Result 40 Output from Computer 20a Output data 60 Output data sent from the computer 20b 100 Network

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 同一機能を有し、それぞれが少なくとも
中央処理装置、データ入力装置、実行結果出力装置及び
出力データ選択装置を含む複数の実行主体X 1 ,X2
…,Xn (n≧2の整数)の実行結果Xr1,Xr2,…,
rnを比較し、一致する実行結果が所定の必要数(要求
一致数h(n≧h≧2の整数))以上である場合、一致
した実行結果を出力データとして選択し、該出力データ
に基づいて複数の後継実行主体Y1 、Y2 、…、Y
m (m≧2の整数)に後続処理を行わせることで処理の
信頼性を高めようとする高信頼計算機システムにおい
て、 実行主体数が要求一致数より多い場合(n>h)に限
り、1≦j≦(n−h)の整数jに対して、実行主体X
j は、実行結果Xrjを実行主体Xj+1 ,Xj+2 ,…,X
n-h+1 に送出し、 以降、実行主体数と要求主体数が等しい(n=h)場合
を含め、実行主体数が要求一致数以上の場合(n≧
h)、整数n−h+1に対して、実行主体Xn-h+1は、
実行結果Xrn-h+1をどの実行主体へも送出せず、n−h
+1<k≦nの整数kに対して、実行主体Xk は、実行
結果Xrkを実行主体X1 ,X2 ,…,Xn-h+ 1 へ送出
し、 n−h+1<i≦nの整数iに対して、実行主体X
i は、実行結果Xri,Xr1,Xr2,Xri-1,Xrn-h+2
…,Xrnを比較し、 一致する実行結果が各自の実行結果を含めて要求一致数
hだけちょうどある場合に限り、一致を得た実行結果を
出力データとして選択し、出力データを後継実行主体Y
1 ,Y2 ,…Ym へ送出することを特徴とする高信頼計
算機システムにおける通信負荷削減方法。
1. Having the same function, each at least
Central processing unit, data input device, execution result output device and
Multiple execution entities X including output data selection device 1, X2
…, XnExecution result X of (integer of n ≧ 2)r1, Xr2,… ,
XrnAnd the matching execution results are the required number (request
Match if the number of matches is greater than or equal to h (n ≧ h ≧ 2)
Select the executed result as the output data,
Based on multiple successor actors Y1, Y2, ..., Y
mBy making (m ≧ 2 integer) perform subsequent processing,
A highly reliable computer system that seeks to improve reliability
Only when the number of executing subjects is greater than the number of matching requests (n> h)
, The execution subject X for an integer j of 1 ≦ j ≦ (n−h)
jIs the execution result XrjExecuting subject Xj + 1, Xj + 2, ..., X
n-h + 1When the number of executing subjects is equal to the number of requesting subjects (n = h)
Including the case where the number of execution subjects is equal to or greater than the number of requested matches (n ≧
h), for the integer n-h + 1, the execution subject Xn-h + 1Is
Execution result Xrn-h + 1Is not sent to any execution subject, and nh
Execution subject X for integer k of +1 <k ≦ nkRun
Result XrkExecuting subject X1, X2, ..., Xn-h + 1Send to
Then, for the integer i of n−h + 1 <i ≦ n, the execution subject X
iIs the execution result Xri, Xr1, Xr2, Xri-1, Xrn-h + 2
…, XrnThe number of matching requests including the execution results of each
Only if there is exactly h
Select as output data and use the output data as the successor agent Y
1, Y2, ... YmHighly reliable meter characterized by sending to
Communication load reduction method in computer system.
【請求項2】 通信時間が十分に大きく、実行主体が実
行結果を送出した後、出力データを送出する前に故障し
て、前記後続実行主体に出力データを送出できないよう
な可能性がある場合に、 1≦j≦(n−h)の整数jに対して実行主体Xj が出
力データを送出する際に、実行主体Xj+1 ,Xj+2
…,Xn-h+1 に出力データの送出の事実を周知するため
のメッセージを合わせて送出する請求項1記載の高信頼
計算機システムにおける通信負荷削減方法。
2. When the communication time is sufficiently long and there is a possibility that the execution subject may fail after sending the execution result and before sending the output data, and cannot output the output data to the subsequent execution subject. to, 1 ≦ j ≦ when (n-h) execution entity X j for integer j of sending the output data, the execution subject X j + 1, X j + 2,
The communication load reducing method in the high reliability computer system according to claim 1, wherein a message for making the fact of the output data transmission known to X n-h + 1 is transmitted together.
JP6077264A 1994-04-15 1994-04-15 Communication load reduction method in highly reliable computer system, Pending JPH07282020A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6077264A JPH07282020A (en) 1994-04-15 1994-04-15 Communication load reduction method in highly reliable computer system,

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6077264A JPH07282020A (en) 1994-04-15 1994-04-15 Communication load reduction method in highly reliable computer system,

Publications (1)

Publication Number Publication Date
JPH07282020A true JPH07282020A (en) 1995-10-27

Family

ID=13628990

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6077264A Pending JPH07282020A (en) 1994-04-15 1994-04-15 Communication load reduction method in highly reliable computer system,

Country Status (1)

Country Link
JP (1) JPH07282020A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10887377B2 (en) 2017-10-06 2021-01-05 Yokogawa Electric Corporation Control system, control method and equalization apparatus
JP2021064409A (en) * 2017-10-06 2021-04-22 横河電機株式会社 Control system, control method and equalization device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10887377B2 (en) 2017-10-06 2021-01-05 Yokogawa Electric Corporation Control system, control method and equalization apparatus
JP2021064409A (en) * 2017-10-06 2021-04-22 横河電機株式会社 Control system, control method and equalization device

Similar Documents

Publication Publication Date Title
US5274762A (en) Method for high speed data transfer
US8238350B2 (en) Message batching with checkpoints systems and methods
US5386512A (en) System for deriving and testing mutual capability set after receiving updated capability from other processors and before requesting service information
US20060085669A1 (en) System and method for supporting automatic protection switching between multiple node pairs using common agent architecture
JPH10200552A (en) Redundant method using ethernet communication
US7178051B2 (en) Method for synchronous support of fault-tolerant and adaptive communication
US5054019A (en) Transfer direction turnaround in network data communications
JPH07282020A (en) Communication load reduction method in highly reliable computer system,
US5894547A (en) Virtual route synchronization
JP2764896B2 (en) Data delivery confirmation system
JPH07168790A (en) Information processor
CN105634694A (en) Method and system for data transmission between nodes
KR100241557B1 (en) Data processing method of dual network
KR950006564B1 (en) Service data back-up/restoration method in the front and back end dualization structure
CN111490997A (en) Task processing method, agent system, service system and electronic equipment
KR100904085B1 (en) Sequenced data transmission method
JP2001297016A (en) Instruction execution system
JPH07152662A (en) Communication system
JP3245552B2 (en) Transfer control system
JP3112778B2 (en) Token re-generation method
JPH05298270A (en) Data transmission method
JPH1031606A (en) Method and system for updating interactive file
KR970007005B1 (en) Service data recovery method with intelligent network service
JPS63284941A (en) Terminal equipment
JPS60201760A (en) Data transmission system