JPH08314744A - Fault tolerant system - Google Patents
Fault tolerant systemInfo
- Publication number
- JPH08314744A JPH08314744A JP7119858A JP11985895A JPH08314744A JP H08314744 A JPH08314744 A JP H08314744A JP 7119858 A JP7119858 A JP 7119858A JP 11985895 A JP11985895 A JP 11985895A JP H08314744 A JPH08314744 A JP H08314744A
- Authority
- JP
- Japan
- Prior art keywords
- processing
- node
- data
- fault
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Multi Processors (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
- Computer And Data Communications (AREA)
- Hardware Redundancy (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、サブシステムを多重化
したフォ−ルトトレラントシステムに関するものであ
る。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a fault tolerant system in which subsystems are multiplexed.
【0002】[0002]
【従来の技術】制御コンピュ−タシステム等の信頼性を
高める技術としては、サブシステムを多重化したフォ−
ルトトレラントシステムが知られている。2. Description of the Related Art As a technique for improving the reliability of a control computer system or the like, a system in which subsystems are multiplexed is used.
Ruto tolerant systems are known.
【0003】また、このようなフォ−ルトトレラントシ
ステムにおいて、多重化した各サブシステムに同じ処理
を実行させ、各サブシステムの出力する処理結果のうち
から最も確からしい処理結果を選択し、制御対象に出力
することが行われている。Further, in such a fault tolerant system, each multiplexed subsystem is made to execute the same processing, and the most probable processing result is selected from the processing results output by each subsystem to be controlled. Is being output to.
【0004】最も確からしい出力結果を選択する技術と
しては、多数決論理によって最も確からしい処理結果を
決定する技術や、各サブシステムの自己診断結果に基づ
いて最も確からしい処理結果を選択する技術等が知られ
ている。Techniques for selecting the most probable output result include a technique for determining the most probable processing result by majority logic and a technique for selecting the most probable processing result based on the self-diagnosis result of each subsystem. Are known.
【0005】また、特開平3−15946号公報等に記
載されているように、シンドローム(障害発生状況)に
基づき各サブシステムの処理結果の信頼度を推定し、最
も信頼度の高い処理結果を選択する技術等が知られてい
る。この技術では、各サブシステム間、および、各シス
テムと各サブシステムの出力する処理結果のうちから制
御対象に出力する処理結果を選択する出力選択回路とを
各々独立した通信路で接続し、相互に情報を交換しなが
ら最終的に出力する処理結果を出力選択回路で選択して
いる。Further, as described in JP-A-3-15946, etc., the reliability of the processing result of each subsystem is estimated based on the syndrome (fault occurrence state), and the processing result with the highest reliability is obtained. Techniques for selecting are known. In this technology, each subsystem is connected to each other and an output selection circuit that selects a processing result to be output to a control target among processing results output from each system and each subsystem by independent communication paths, and The output selection circuit selects the processing result to be finally output while exchanging information.
【0006】また、高信頼化の技術としては、ハードウ
ェアの多重度を高める技術の他に、1つのハードウェア
の中の処理を多重化する技術が知られている。[0006] As a technique for improving reliability, a technique for increasing the multiplicity of hardware and a technique for multiplexing processing in one piece of hardware are known.
【0007】[0007]
【発明が解決しようとする課題】さて、このようなフォ
−ルトトレラントシステムにおいては、各サブシステム
や、各サブシステムの出力する処理結果のうちから制御
対象に出力する処理結果を選択する出力処理回路を広域
に分散して配置する必要がある場合がある。しかし、こ
のような分散配置は、前述した特開平3−15946号
公報の技術では、必要となる通信路が膨大な規模となっ
てしまうために実現が困難である。In such a fault-tolerant system, an output process for selecting a processing result to be output to the control target from among the processing results output from each subsystem and each subsystem. It may be necessary to disperse the circuits over a wide area. However, such a distributed arrangement is difficult to realize in the technique of Japanese Patent Laid-Open No. 3-15946 mentioned above, because the required communication path becomes huge.
【0008】また、前述した特開平3−15946号公
報等に記載されている、各サブシステムの処理結果の信
頼度を推定し最も信頼度の高い処理結果を選択する技術
は、各サブシステムの内部構成が同一であり、障害検出
/障害回復機能のカバレッジ(障害検出/障害回復漏れ
がない確率)が等しいという仮定に基づいている。Further, the technique of estimating the reliability of the processing result of each subsystem and selecting the processing result with the highest reliability, as described in the above-mentioned Japanese Patent Laid-Open No. 3-15946, is based on the technique of each subsystem. It is based on the assumption that the internal configurations are the same and the coverage of the failure detection / failure recovery functions (probability that there is no failure detection / failure recovery omission) is the same.
【0009】しかし、実際のシステムは、システムの拡
張等によって新旧のサブシステムが混在した構成となる
こともある。そして、このような場合には、サブシステ
ムごとに障害検出/障害回復機能のカバレッジが異なる
ことがある。また、デザインダイバーシティの効果のた
めに意図的に異なる製造業者により製造されたサブシス
テムを混在させるような場合も同様に、サブシステムご
とに内部構成や、障害検出/障害回復機能のカバレッジ
が異なることがある。このような場合、前述した特開平
3−15946号公報等に記載されている技術では、必
ずしも最も信頼度が高い処理結果が選択されない場合が
ある。However, an actual system may have a configuration in which old and new subsystems are mixed due to system expansion and the like. In such a case, the coverage of the failure detection / failure recovery function may differ for each subsystem. Similarly, when subsystems intentionally manufactured by different manufacturers are mixed for the purpose of the effect of design diversity, the internal configuration and the coverage of the failure detection / failure recovery function may differ for each subsystem. There is. In such a case, the technique described in the above-mentioned Japanese Patent Laid-Open No. 3-15946 may not always select the processing result with the highest reliability.
【0010】また、前述した1つのハードウェアの中の
処理を多重化する技術によれば、多重化化した処理の間
で相関した誤りが発生したり、誤りの影響が局所化され
ないために処理結果の選択が正常に行えなくなることが
ある。Further, according to the technique of multiplexing the processing in one piece of hardware described above, an error that is correlated between the multiplexed processing does not occur and the influence of the error is not localized, so that the processing is performed. The result selection may not be performed normally.
【0011】そこで、本発明は、サブシステムや出力選
択回路の分散配置に適したフォ−ルトトレラントシステ
ムを提供することを目的とする。Therefore, an object of the present invention is to provide a fault tolerant system suitable for distributed arrangement of subsystems and output selection circuits.
【0012】また、さらに、サブシステム毎に障害検出
/障害回復機能のカバレッジが異なる場合にも、各サブ
システムが出力する処理結果のうちから最も信頼度が高
い処理結果を選択することができるフォ−ルトトレラン
トシステムを提供することを目的とする。Further, even when the coverage of the failure detection / failure recovery function differs for each subsystem, the processing result with the highest reliability can be selected from the processing results output by each subsystem. -To provide a tolerant system.
【0013】また、本発明は、1つのハードウェアの中
の処理を多重化する場合に、各処理の誤りが伝搬しない
ように局所化することを目的とする。It is another object of the present invention to localize an error of each process so that the error does not propagate when the processes in one hardware are multiplexed.
【0014】[0014]
【課題を解決するための手段】一例を挙げれば、前記第
1番目の目的達成のために、本発明は、たとえば、同じ
処理を実行する複数のプロセッシングノードと、少なく
とも1つの出力選択ノードと、前記複数のプロセッシン
グノ−ドと出力選択ノ−ドとに接続するネットワ−クと
を有し、前記各プロセッシングノードは、前記処理を実
行するデータ処理手段と、データ処理手段が行う処理に
関して発生した障害を検出もしくは回復する自己診断手
段と、前記データ処理手段が実行した処理の処理結果で
あるデータと、前記自己診断手段の障害検出もしくは回
復の状況を表す障害発生情報とを前記ネットワ−クに送
信する送信手段とを備え、前記出力選択ノードは、各プ
ロセッシングノ−ドから前記ネットワ−クに送信された
各データ相互間の一致/不一致を検出するデータ比較手
段と、検出した各データ相互間の一致/不一致と、各プ
ロセッシングノ−ドから前記ネットワ−クに送信された
障害発生情報が表す各プロセッシングノ−ドにおける障
害の検出もしくは回復の状況とに基づき、各プロッセッ
シグノ−ドから前記ネットワ−クに送信された各データ
のうちの最も信頼度が高いデータを判定する判定手段
と、最も信頼度が高いと判定されたデータを出力する選
択手段とを有することを特徴とするフォールトトレラン
トシステムを提供する。For example, in order to achieve the first object, the present invention provides, for example, a plurality of processing nodes that execute the same processing, and at least one output selection node, The processing node has a network connected to the plurality of processing nodes and an output selection node, and each of the processing nodes generates data processing means for executing the processing and processing performed by the data processing means. A self-diagnosis means for detecting or recovering a failure, data which is the processing result of the processing executed by the data processing means, and failure occurrence information indicating the status of failure detection or recovery of the self-diagnosis means are provided to the network. And a transmission means for transmitting, wherein the output selection node is provided between the respective data transmitted from the respective processing nodes to the network. A data comparison means for detecting a match / mismatch, a match / mismatch between the detected data, and a failure in each processing node represented by the failure occurrence information transmitted from each processing node to the network. Based on the state of detection or recovery, the determining means for determining the most reliable data among the respective data transmitted from each process node to the network, and the data determined to have the highest reliability. A fault tolerant system is provided.
【0015】[0015]
【作用】前記本発明に係るフォル−トトレラントシステ
ムによれば、ネットワークの特質を活かしたシステム構
成、情報伝送方式を取り入れて、広域に分散したシステ
ムにおいても莫大な通信路を必要とせずに障害発生情報
に基づく信頼度推定により、最も信頼度の高いデータの
選択を実現することができる。According to the fault tolerant system according to the present invention, a system configuration and information transmission method that take advantage of the characteristics of the network are adopted, and even in a system distributed over a wide area, a huge communication path is not required and a failure occurs. The reliability estimation based on the generation information makes it possible to select the most reliable data.
【0016】[0016]
【実施例】以下、本発明に係るフォ−ルトトレラントシ
ステムの実施例を説明する。EXAMPLES Examples of the fault tolerant system according to the present invention will be described below.
【0017】まず、第1の実施例について説明する。First, the first embodiment will be described.
【0018】図1に、本第1実施例に係るフォ−ルトト
レラントシステムの構成を示す。FIG. 1 shows the configuration of a fault tolerant system according to the first embodiment.
【0019】図示するように、本第1実施例に係るフォ
−ルトトレラントシステムは、データ処理を行う複数の
プロセッシングノード11〜1nと、各プロセッシング
ノード11〜1nにおけるデータ処理の結果であるデー
タ141〜14nのうち最も信頼度の高いデータを選択
して制御対象(不図示)に出力信号250として与える
出力選択ノ−ド20と、出力選択ノ−ド20と各プロセ
ッシングノード11〜1nを接続したネットワ−ク3よ
り構成される。As shown in the figure, in the fault tolerant system according to the first embodiment, a plurality of processing nodes 11 to 1n for performing data processing and data 141 as a result of data processing in each of the processing nodes 11 to 1n. To 14n, the most reliable data is selected, and the output selection node 20 to be given to the controlled object (not shown) as the output signal 250, the output selection node 20, and the processing nodes 11 to 1n are connected. It consists of the network 3.
【0020】プロセッシングノード11〜1nはデータ
処理機能111〜11n、障害の発生状況を検出する自
己診断機能121〜12n、処理結果送信機能131〜
13nをそれぞれ有している。データ処理機能111〜
11nにおけるデータ処理の結果であるデータ141〜
14nと、自己診断機能121〜12nによって検出し
た障害の発生状況を表す障害発生情報151〜15nは
処理結果送信機能131〜13nによりネットワーク3
を通じて他のノードへ送信される。The processing nodes 11 to 1n have data processing functions 111 to 11n, self-diagnosis functions 121 to 12n for detecting a failure occurrence state, and processing result transmission functions 131 to 131n.
13n respectively. Data processing function 111-
Data 141 to 11n that are the results of data processing in 11n
14n and failure occurrence information 151 to 15n indicating the occurrence status of the failure detected by the self-diagnosis functions 121 to 12n are transmitted to the network 3 by the processing result transmission functions 131 to 13n.
Is transmitted to another node through.
【0021】一方、出力選択ノード20は、処理結果収
集機能210、データ比較機能220、判定機能23
0、選択機能240を有している。On the other hand, the output selection node 20 has a processing result collection function 210, a data comparison function 220, and a judgment function 23.
0, has a selection function 240.
【0022】但し、プロセッシングノード11〜1nお
よび出力選択ノード20の内部構成は、機能の構成を示
したものであり、ハ−ドウェア的には、プロセッシング
ノード11〜1nおよび出力選択ノード20はMPUや
メモリを備えた一般的な構成のコンピュ−タであってよ
い。この場合、図1に示したプロセッシングノード11
〜1nおよび出力選択ノード20の内部の各機能は、コ
ンピュ−タ上で実行されるソフトウェアのプロセスとし
て実現される。However, the internal configuration of the processing nodes 11 to 1n and the output selection node 20 shows the functional configuration, and in terms of hardware, the processing nodes 11 to 1n and the output selection node 20 are MPU and It may be a computer having a general configuration including a memory. In this case, the processing node 11 shown in FIG.
1n and each function inside the output selection node 20 are realized as a process of software executed on the computer.
【0023】処理結果収集機能210は各プロセッシン
グノードがネットワーク3上に送信したデータ141〜
14nと障害発生情報151〜15nを収集する。デー
タ比較機能220は収集されたデータ141〜14n同
士を比較照合し、比較照合の結果、即ち、一致/不一致
の情報を判定機能230に報告する。判定機能230で
は、データ141〜14nの比較照合の結果と、収集さ
れた障害発生情報151〜15nに基づき、データ14
1〜14nそれぞれが正しい確率(データの信頼度)を
推定し、推定した信頼度が最も高いデータが、どれかを
選択機能240へ報告する。選択機能240は判定機能
230からの報告に基づき、データ141〜14nの中
から出力信号250として出力するデータを選択する。The processing result collection function 210 is provided with data 141 to 141 sent by each processing node on the network 3.
14n and failure occurrence information 151 to 15n are collected. The data comparison function 220 compares and collates the collected data 141 to 14n, and reports the result of the comparison and collation, that is, the match / mismatch information to the determination function 230. In the determination function 230, based on the comparison result of the data 141 to 14n and the collected failure occurrence information 151 to 15n, the data 14
Each of 1 to 14n estimates a correct probability (reliability of data), and reports to the selection function 240 which data has the highest estimated reliability. The selection function 240 selects the data to be output as the output signal 250 from the data 141 to 14n based on the report from the determination function 230.
【0024】判定機能230におけるデータの信頼度の
推定は、特開平3−16946号公報記載の技術を用い
て行うことができる。The reliability of the data in the determination function 230 can be estimated by using the technique described in Japanese Patent Laid-Open No. 3-16946.
【0025】以下に、データの信頼度の推定の方法につ
いて説明する。The method of estimating the reliability of data will be described below.
【0026】データの信頼度Rdはデータ141〜14
nの一致/不一致および障害発生情報151〜15nか
らなるSyndromeに依存する。したがい、Syndromeは、デ
ータの信頼度Rdの高い順に、 Syndrome1,Syndrome2,・・・SyndromeL (L:Syndro
meの総数) すなわち Rd(Syndrome1)>Rd(Syndrome2)>・・・>Rd(SyndromeL) ただし、Rd(Syndromei):Syndromeiが観測されてい
るときの出力の信頼度 と順序づけることができる。The data reliability Rd is the data 141 to 14
It depends on the Syndrome consisting of n match / mismatch and failure occurrence information 151 to 15n. Therefore, Syndrome has a high reliability Rd of data in the order of Syndrome1, Syndrome2, ... SyndromeL (L: Syndro
That is, Rd (Syndrome1)> Rd (Syndrome2)>...> Rd (SyndromeL) However, Rd (Syndromei): It can be ordered with the reliability of the output when Syndromei is observed.
【0027】ここで、Syndrome1は最良の症状即ち全く
異常が検出されないということを表し、一方SyndromeL
は最悪の症状即ち全てのチェック項目で異常が検出され
たということを表す。例えば、チェック項目が障害発生
情報とデータ比較の2つだけである場合には、Syndrome
1は自己診断で異常が検出されずかつデータが他のプロ
セッシングノ−ドが出力したデータと一致していること
を表し、SyndromeLは、自己診断で異常が検出されかつ
データが他のプロセッシングノ−ドが出力したデータと
不一致を起こしていることを表す。Here, Syndrome 1 represents the best symptom, that is, no abnormality is detected, while Syndrome L
Indicates the worst symptom, that is, the abnormality is detected in all the check items. For example, if there are only two check items, failure information and data comparison, Syndrome
1 indicates that no abnormality is detected in the self-diagnosis and that the data matches the data output by another processing node. Syndrome L indicates that the abnormality is detected in the self-diagnosis and the data is in another processing node. Indicates that the data output by the driver is inconsistent.
【0028】このようなSyndromeを定義することによ
り、以下のように最良の症状から順次症状のグレードを
下げながら存在するSyndromeを探索して、存在するSynd
romeのうち最も高い信頼度Rdに対応するSyndromeを検
出し、そのSyndromeを持つプロセッシングノ−ドの出力
するデータを選択することにより、各プロセッシングノ
−ドから出力されるデータのうちから、一番信頼度Rd
のものを選択することができる。By defining such a Syndrome, the existing Syndrome is searched by gradually decreasing the grade of the symptom from the best symptom as follows, and the Syndrome that exists is searched.
By detecting the Syndrome corresponding to the highest reliability Rd among the romes and selecting the data output by the processing node having that Syndrome, the data output from each processing node is the most Reliability Rd
You can choose one.
【0029】 if any subsystem has Syndrome1 then select the subsystem(s) which has Syndrome1, else if any subsystem has Syndrome2 then select the subsystem(s) which has Syndrome2, ・ ・ ・ else if any subsystem has SyndromeL-1 then select the subsystem(s) which has SyndromeL-1, else output fail safe signal. 簡単のためにデータ141〜14nの一致/不一致およ
び1つの自己診断の結果即ち、正常/異常という2段階
(1ビットの情報)の障害発生情報151〜15nから
Syndromeが構成されている場合を例にとり具体的に、こ
のデータの信頼度の推定の方法を説明する。If any subsystem has Syndrome1 then select the subsystem (s) which has Syndrome1, else if any subsystem has Syndrome2 then select the subsystem (s) which has Syndrome2, ・ ・ ・ else if any subsystem has SyndromeL-1 then select the subsystem (s) which has SyndromeL-1, else output fail safe signal. For simplicity, data 141 to 14n are matched / mismatched and one self-diagnosis result, that is, normal / abnormal, two-stage (1-bit information) From failure occurrence information 151 to 15n
A method of estimating the reliability of this data will be specifically described by taking the case where Syndrome is configured as an example.
【0030】いま、各プロセッシングノ−ドの自己診断
の欠報率(プロセッシングノ−ドが異常であるのに正常
であると誤判定されてしまう確率、すなわち1−カバレ
ッジ)をPdε,誤ったデ−タが一致してしまう確率を
Paε,プロセッシングノ−ドにおいて誤りの発生する
確率をPεとする。Now, the missing rate of the self-diagnosis of each processing node (probability that a processing node is abnormal but is erroneously determined to be normal, that is, 1-coverage) is Pdε, an erroneous data. The probability that the data will match will be Paε, and the probability that an error will occur in the processing node will be Pε.
【0031】この場合、誤ったデ−タが一致してしまう
確率は、その誤り方がランダムであると仮定すれば、ラ
ンダムな2つのデ−タが一致する確率と考えられ、 Paε=2の−n乗 ただし n:デ−タのbit長 と表される。コンピュ−タシステム等でデ−タをソフト
ウェアにより照合する場合には、通常デ−タのbit長n
は大きな値をとることが多いため、 Paε≒0 であり、 Paε≪Pdε と考えることができる。In this case, the probability of erroneous data matching is considered to be the probability of random two data matching assuming that the error is random, and Paε = 2. -Nth power However, it is expressed as n: bit length of data. When data is collated by software in a computer system or the like, the bit length n of the normal data is used.
Often takes a large value, so that Paε≈0, and it can be considered that Paε << Pdε.
【0032】したがい、これらことを考慮すると各Synd
romeに対応するデータの信頼度Rdは、信頼度Rdの高い
順に (1) 自己診断の結果正常と診断されかつデータが他のk
個のプロセッシングノ−ドのものと一致している場合Therefore, considering these things, each Synd
The reliability Rd of the data corresponding to rome is ascending from the highest reliability Rd. (1) As a result of self-diagnosis, it is diagnosed as normal
If it matches that of one processing node
【0033】[0033]
【数1】 [Equation 1]
【0034】(2)データが他のk個のサブシステムのも
のと一致している場合(2) When the data matches those of the other k subsystems
【0035】[0035]
【数2】 [Equation 2]
【0036】(3)自己診断の結果正常と診断された場合(3) When the result of self-diagnosis is normal
【0037】[0037]
【数3】 (Equation 3)
【0038】となる。[0038]
【0039】したがい、判定機能230は、データ14
1〜14nの比較照合の結果と、収集された障害発生情
報151〜15nに基づき以下のような手順に従って、
最も信頼度の高いデータを選択することができる。ただ
し本第1実施例では、、各プロセッシングノ−ドの自己
診断の欠報率Pdε、各プロセッシングノ−ドにおいて
誤りの発生する確率Pεは全て等しいものとする。Accordingly, the judgment function 230 determines that the data 14
Based on the result of the comparison and collation of 1 to 14n and the collected failure occurrence information 151 to 15n, following the procedure below,
The most reliable data can be selected. However, in the first embodiment, it is assumed that the failure rate Pdε of self-diagnosis of each processing node and the probability Pε of error occurrence in each processing node are all equal.
【0040】(1)自己診断の結果正常と診断されかつデ
ータが他のプロセッシングノ−ドのものと一致している
プロセッシングノ−ドを正常とみなしそのデータを選択
する。(1) As a result of self-diagnosis, a processing node which is diagnosed as normal and whose data matches those of other processing nodes is regarded as normal, and the data is selected.
【0041】条件(1)を満たすプロセッシングノ−ドが
ない場合には、 (2) データが他のプロセッシングノ−ドのものと一致し
ているプロセッシングノ−ドを正常とみなしそのデータ
を選択する。When there is no processing node satisfying the condition (1), (2) a processing node whose data matches that of another processing node is regarded as normal and the data is selected. .
【0042】条件(2)を満たすプロセッシングノ−ドが
ない場合には、 (3) 自己診断の結果正常と診断されたプロセッシングノ
−ドを正常とみなしそのデータを選択する。When there is no processing node satisfying the condition (2), (3) a processing node which is diagnosed as normal as a result of self-diagnosis is regarded as normal and its data is selected.
【0043】なお、さらに条件(3)を満たすプロセッシ
ングノ−ドがない場合には、判定機能230は、 (4) 選択機能240からの出力を停止させるか、または
選択機能240から正常な出力が得られないことを警告
する信号を出力させる。If there is no processing node satisfying the condition (3), the judgment function 230 either (4) stops the output from the selection function 240 or outputs a normal output from the selection function 240. It outputs a signal warning that it cannot be obtained.
【0044】なお、以上では、簡単のために障害発生情
報151〜15nが1つの自己診断の結果からなる場合
について説明したが、障害発生情報151〜15nが複
数の自己診断の結果の組合せから構成される場合には、
データの信頼度Rdは以下の通りとなる。In the above description, the case where the failure occurrence information 151 to 15n consists of one self-diagnosis result has been described for simplification, but the failure occurrence information 151 to 15n is composed of a combination of a plurality of self-diagnosis results. If
The data reliability Rd is as follows.
【0045】[0045]
【数4】 [Equation 4]
【0046】なお、数4のようにRdの計算が複雑な場
合には、上記、判断のアルゴリズムも複雑になり多段階
となる。そこで、段階の数が多い場合には、信頼度Rd
の高い順に、シンドロームと選択すべきデータとを表形
式に並べ、最初に一致したシンドロームに対応するデー
タを選択するようにしてもよい。When the calculation of Rd is complicated as shown in the equation 4, the above-mentioned judgment algorithm is complicated and there are multiple steps. Therefore, when the number of stages is large, the reliability Rd
It is also possible to arrange the syndromes and the data to be selected in a table form in the descending order of, and select the data corresponding to the first matching syndrome.
【0047】なお、プロセッシングノード11〜1nの
自己診断機能121〜12nで障害発生情報151〜1
5nを生成するために行う自己診断としてはコンピュ−
タ・システムの場合を例にとれば、 (1) RAM等に付加されたにECC(Error Correcting
Code:誤り訂正符号)エンコ−ダ/デコ−ダによる記憶
データのbit誤りの検出、訂正の情報 (2) マイクロプロセッサが持つ誤り検出機能による検出
結果(バス・エラ−、アドレス・エラ−など) (3) ハ−ドウェアの機能診断プログラムの実行結果 (4) 分散配置デ−タ(同一プロセッシングノ−ド内で多
重化したデータ)の照合結果(照合によって、不一致が
検出された場合にはプロセッシングノ−ド内で多数決論
理により訂正を行う) (5) マイクロプロセッサの演算ユニットなどに付加され
た誤り検出機能による誤り検出結果 次に、プロセッシングノード11〜1nの処理結果送信
機能131〜13nについて説明する。Note that the self-diagnosis functions 121 to 12n of the processing nodes 11 to 1n cause the failure occurrence information 151 to 1n.
Computation is a self-diagnosis performed to generate 5n.
For example, in the case of a data system, (1) ECC (Error Correcting) added to RAM etc.
Code: Error correction code) Information on detection and correction of bit errors in stored data by the encoder / decoder (2) Detection results by the error detection function of the microprocessor (bus error, address error, etc.) (3) Execution result of the hardware function diagnosis program (4) Collation result of distributed arrangement data (data multiplexed in the same processing node) (processing is performed when a discrepancy is detected by collation) (The correction is performed by majority logic in the node.) (5) Error detection result by error detection function added to arithmetic unit of microprocessor Next, the processing result transmission functions 131 to 13n of the processing nodes 11 to 1n will be described. To do.
【0048】図2に、処理結果送信機能131の構成を
示す。FIG. 2 shows the configuration of the processing result transmission function 131.
【0049】図中の、レジスタ1311は障害発生のた
びに自己診断機能121より送られる障害発生情報15
1をデータ処理機能111の処理の間蓄積する。蓄積す
る期間はデータ処理機能111から前回のデータ141
が送られてから次の回、即ち該当する回のデータ141
が送られて来るまでの期間である。即ち、データ141
の到来はレジスタ1311の蓄積動作を制御するトリガ
ー1315の役割を果たす。In the figure, the register 1311 stores the failure occurrence information 15 sent from the self-diagnosis function 121 each time a failure occurs.
1 is accumulated during the processing of the data processing function 111. The period of accumulation is from the data processing function 111 to the previous data 141
Is sent next time, that is, the data 141 of the corresponding time
It is the period until is sent. That is, the data 141
Of the register 1311 serves as a trigger 1315 for controlling the accumulation operation of the register 1311.
【0050】パケット編集機能1312では、データ処
理機能111の処理が終了しデータ141が得られたな
らば、データ141とレジスタに蓄えられている障害発
生情報151をひとまとめに編集して、パケット131
3にして送信機能1314に渡す。送信機能1314は
所定のプロトコルに従ってネットワーク3を通じてパケ
ット1313の内容をメッセージとして送信する。In the packet editing function 1312, when the processing of the data processing function 111 is completed and the data 141 is obtained, the data 141 and the failure occurrence information 151 stored in the register are collectively edited, and the packet 131 is edited.
It is set to 3 and is passed to the transmission function 1314. The transmission function 1314 transmits the content of the packet 1313 as a message through the network 3 according to a predetermined protocol.
【0051】図3には、データ処理機能111での処
理、自己診断機能121、パケット編集機能1312、
送信機能1314の動作の時間的な関連を示した。In FIG. 3, the processing by the data processing function 111, the self-diagnosis function 121, the packet editing function 1312,
The time relation of the operation of the transmission function 1314 is shown.
【0052】図示するように、データ処理機能111で
の処理の間に発生した障害は障害発生情報151として
自己診断機能121により検出され随時、レジスタ13
11に蓄積される。データ処理機能111での処理が終
了すると、データ141と障害発生情報151をもとに
パケット編集機能1312においてパケット1313に
編集され、送信機能1314に渡される。As shown in the figure, a failure occurring during the processing by the data processing function 111 is detected by the self-diagnosis function 121 as failure occurrence information 151, and the register 13 is updated at any time.
It is stored in 11. When the processing by the data processing function 111 is completed, it is edited into a packet 1313 by the packet editing function 1312 based on the data 141 and the failure occurrence information 151, and is passed to the transmission function 1314.
【0053】以上、本発明の第1実施例について説明し
た。The first embodiment of the present invention has been described above.
【0054】このように本第1実施例によれば、ネット
ワークで結ばれ、分散したシステムにおいて、データ1
41〜14n間の一致/不一致の情報、障害発生情報1
51〜15nからデータの信頼度を推定し、信頼度が最
も高いデータをシステムの最終出力として選択すること
ができる。As described above, according to the first embodiment, in the distributed system connected by the network, the data 1
Information of match / mismatch between 41 to 14n, failure occurrence information 1
The reliability of the data can be estimated from 51 to 15n and the data with the highest reliability can be selected as the final output of the system.
【0055】以下、本発明の第2の実施例について説明
する。The second embodiment of the present invention will be described below.
【0056】図4に、本第2実施例に係るフォ−ルトト
レラントシステムの構成を示す。FIG. 4 shows the configuration of the fault tolerant system according to the second embodiment.
【0057】図示するように、本第2実施例では、前述
した第1の実施例に係るフォ−ルトトレラントシステム
において、プロセッシングノード11〜1nがプロセッ
シングノードの信頼度、構成、障害検出/回復のカバレ
ッジを表すカテゴリを出力するカテゴリ161〜16i
を付加したものである。As shown in the figure, in the second embodiment, in the fault tolerant system according to the first embodiment described above, the processing nodes 11 to 1n are responsible for the reliability, configuration, and fault detection / recovery of the processing nodes. Categories 161 to 16i that output categories representing coverage
Is added.
【0058】このような構成によって、本フォ−ルトト
レラントシステムでは、各プロセッシングノード11〜
1nの処理結果送信機能131〜13iは、データ14
1から14n、障害発生情報151〜15nに加えてプ
ロセッシングノードの信頼度、構成、障害検出/回復の
カバレッジを表すカテゴリ161〜16nをネットワー
ク3を通じて出力選択ノード20へ送信する。With this configuration, in the present fault tolerant system, each processing node 11 to 11 is
The processing result transmission functions 131 to 13i of the 1n process the data 14
In addition to 1 to 14n and failure occurrence information 151 to 15n, categories 161 to 16n representing reliability of the processing node, configuration, and coverage of failure detection / recovery are transmitted to the output selection node 20 through the network 3.
【0059】一方、出力選択ノード20内の判定機能2
30では、データ141〜14nの比較照合結果、障害
発生情報151〜15n、カテゴリ161〜16nに基
づき、データ141〜14nそれぞれが正しい確率(デ
ータの信頼度)を推定し、そのデータの信頼度が最も高
いかを選択機能240へ報告する。選択機能240は判
定機能230からの報告に基づき、データ141〜14
nの中から出力信号250を選択する。On the other hand, the judgment function 2 in the output selection node 20
In 30, the probability that each of the data 141 to 14n is correct (data reliability) is estimated based on the comparison and comparison result of the data 141 to 14n, the failure occurrence information 151 to 15n, and the categories 161 to 16n, and the reliability of the data is The highest value is reported to the selection function 240. The selection function 240 uses the data 141 to 14 based on the report from the determination function 230.
The output signal 250 is selected from n.
【0060】ここで、カテゴリ161〜16nのプロセ
ッシングノードの信頼度は、そのプロセッシングノード
で誤りの発生する確率Pεを表し、プロセッシングノー
ドの構成より、誤ったデ−タが一致してしまう確率Pa
εを求めることができ、カテゴリ161〜16nの障害
検出/回復のカバレッジより各自己診断の欠報率Pdεi
を求めることができるので、このようにカテゴリ161
〜16nを出力選択ノード20に送信するようにするこ
とにより、判定機能230は各プロセッシングノ−ドか
ら送られた各データの信頼度Rdを先に示した数4と同
様の式より求めることができる。Here, the reliability of the processing nodes of the categories 161 to 16n represents the probability Pε that an error will occur at the processing node, and the probability Pa that the erroneous data will match depending on the configuration of the processing node.
ε can be obtained, and the failure rate Pdεi of each self-diagnosis is obtained from the fault detection / recovery coverage of categories 161 to 16n.
Thus, the category 161 can be obtained in this way.
By sending 16n to 16n to the output selection node 20, the determination function 230 can obtain the reliability Rd of each data sent from each processing node by the same equation as the above-mentioned equation 4. it can.
【0061】なお、本第2実施例では、第1実施例とは
異なり、データのビット数のみならず、プロセッシング
ノードの構成の多様度より、2つのプロセッシグノ−ド
の誤ったデ−タが一致してしまう確率Paεを求める。
同じ処理を実行する2つのプロセッシングノードの構成
が異なるほど、同じ誤りを犯す確率は低くなるので、判
定機能230は、受け取った各プロセッシングノードの
構成より、データが一致した2つのプロセッシングノー
ドの構成の多様度を求め、多様度が大きい程度確率Pa
εが小さくなるように定める。また、データの信頼度
は、数4式中の確率Paεのk−1乗の項を、そのデー
タと、当該データと一致した各データとの間の確率Pa
εの積に置き換えて求める。In the second embodiment, unlike the first embodiment, not only the number of bits of data but also the diversification of the configuration of the processing node causes the erroneous data of the two processing nodes to be one. The probability Pa ε is calculated.
The more different the configurations of the two processing nodes that execute the same process, the lower the probability of making the same error. Therefore, the determination function 230 determines the configuration of the two processing nodes having the same data from the configuration of each received processing node. Diversity is calculated, and the degree of diversity is large Probability Pa
Determine so that ε is small. Further, the reliability of the data is obtained by calculating the term of the probability Pa ε in the expression (4), which is the k−1 power, and the probability Pa between that data and each data that matches the data.
It is calculated by replacing with the product of ε.
【0062】つまり、本第2実施例では図1に示す実施
例に加えて、各プッロセッシングノードの信頼度や、種
別構成や、自己診断機能の誤り検出漏れの確率が異なる
場合にも正しく最も信頼度の高いデータを選択すること
ができる。従って、本実施例によれば、様々なプロセッ
シングノードを組み合わせて高信頼なシステムを構築す
ることができる。That is, in the second embodiment, in addition to the embodiment shown in FIG. 1, even when the reliability of each processing node, the type configuration, and the probability of error detection omission of the self-diagnosis function are different, The most reliable data can be selected. Therefore, according to this embodiment, a highly reliable system can be constructed by combining various processing nodes.
【0063】図5に、本第2実施例におけるプロセッシ
ングノ−ド11〜1nの処理結果送信機能131の構成
を示す。図示するように、図3に示した第1実施例係る
処理結果送信機能131の構成において、カテゴリもパ
ケット編集1312に入力するようにしたものである。FIG. 5 shows the configuration of the processing result transmission function 131 of the processing nodes 11 to 1n in the second embodiment. As shown in the figure, in the configuration of the processing result transmission function 131 according to the first embodiment shown in FIG. 3, the category is also input to the packet edit 1312.
【0064】パケット編集1312は、たとえば、図6
に示すような形式のパケット1313を編集する。The packet edit 1312 is, for example, as shown in FIG.
The packet 1313 having the format shown in is edited.
【0065】すなわち、パケット1313を、入力され
た障害発生情報15x、カテゴリ16x、データ14x
から構成する。ここでは、障害発生情報15x、カテゴ
リ16x、データ14xの順番とした。That is, the packet 1313 is input to the fault occurrence information 15x, the category 16x, and the data 14x.
It consists of. Here, the order of the failure occurrence information 15x, the category 16x, and the data 14x is set.
【0066】また、この例では、障害発生情報15x
は、パリティ誤りが検出/非検出、ECCで1ビット誤り
が検出/非検出、2ビット誤りが検出/非検出、自己診
断の結果が正常/異常、2重化比較照合結果が一致/不
一致の情報から構成した。また、また、カテゴリ16x
は2重化比較照合カバレッジ、ECCカバレッジパリティ
バレッジ、自己診断カバレッジ、ハードウエア多様度、
ソフトウエア多様度の情報から構成した。ハードウエア
多様度、ソフトウエア多様度は、プロセッシングノード
のハ−ドウェア構成、ソフトウェア構成を表すバ−ジョ
ンNo等である。Further, in this example, the failure occurrence information 15x
Indicates that parity error is detected / non-detected, 1-bit error is detected / non-detected by ECC, 2-bit error is detected / non-detected, self-diagnosis result is normal / abnormal, duplicate comparison / matching result is match / mismatch Composed of information. Again, category 16x
Is dual comparison / verification coverage, ECC coverage parity leverage, self-diagnosis coverage, hardware diversity,
It is composed of information on software diversity. The hardware diversity and the software diversity are, for example, the hardware configuration of the processing node and the version number representing the software configuration.
【0067】さて、本図では、各プロセッシングノード
の信頼度は送信しない場合の例を示した。この場合に
は、そのプロセッシングノードで誤りの発生する確率P
εを出力選択ノ−ドの判定機能において固定とする。こ
のように、本第2実施例においては、カテゴリ161〜
16nとして、プロセッシングノードの信頼度、構成、
障害検出/回復のカバレッジのうちの一つまたは二つの
みを用い、確率Pε、確率Paε、確率Pdεiのうちの
一つまたは二つのみをプロセッシングノ−ド毎に可変と
するようにしてもよい。In the figure, an example is shown in which the reliability of each processing node is not transmitted. In this case, the probability P that an error will occur at the processing node
ε is fixed in the determination function of the output selection node. As described above, in the second embodiment, categories 161 to
16n, processing node reliability, configuration,
Only one or two of the fault detection / recovery coverage may be used, and only one or two of the probability Pε, the probability Paε, and the probability Pdεi may be variable for each processing node. .
【0068】次に、送信機能1314は、このようなパ
ケット1313を受取り、これに、図7にに示すよう
に、ヘッダ−31を付加したメッセ−ジを作成し、ネッ
トワーク3を介して出力選択ノ−ドに送信する。ヘッダ
−31は発信元のノード、宛先のノード、メッセージの
種別等の情報を表し、含まれている情報はネットワーク
3の種類、プロトコルに依存する。Next, the transmission function 1314 receives such a packet 1313, creates a message with a header-31 added thereto, as shown in FIG. 7, and selects an output via the network 3. Send to node. The header-31 represents information such as a source node, a destination node, a message type, etc. The included information depends on the type and protocol of the network 3.
【0069】ところで、パケット編集1312が編集す
るパケット1313は、図8に示すように構成してもよ
い。図8の形式は、データ14x、障害発生情報15
x、カテゴリ16xの順番でパケットを構成したもので
ある。By the way, the packet 1313 edited by the packet edit 1312 may be constructed as shown in FIG. The format of FIG. 8 is data 14x, failure occurrence information 15
x and category 16x are formed in this order.
【0070】この場合送信機能1312からは、ネット
ワーク3を介して図9に示すメッセ−ジが出力選択ノ−
ドに伝送されることになる。In this case, from the transmission function 1312, the message shown in FIG.
Will be transmitted to the internet.
【0071】このようなメッセ−ジは、通常のネットワ
ークで交換されるメッセージつまり、ヘッダ31、デー
タ14xの順番で構成されるメッセージの後に、本第2
実施例特有の障害発生情報15x、カテゴリ16xを付
加した形となる。したがって、ネットワークに障害発生
情報15x、もしくは、障害発生情報15xおよびカテ
ゴリ16xを送信する機能を有していないプロセッシン
グノードがシステム中に存在する場合でも、出力選択ノ
−ド20において、当該プロセッシングノードについて
は最初のヘッダ31、データ14xのみを参照し、それ
以降の障害発生情報15x、カテゴリ16xを無視する
ようにすれば、他のプロセッシングノ−ドと同様に扱う
ことができる。すなわち、従来のプロセッシングノード
をシステム中に混在することを許容することができる。
なお、図8、図9において、障害発生情報15x、カテ
ゴリ16xの順番が反対の場合も同じ効果がある。Such a message is a message exchanged in a normal network, that is, a message composed of a header 31 and data 14x in this order, followed by the second message.
The failure occurrence information 15x and category 16x peculiar to the embodiment are added. Therefore, even if there is a processing node in the system that does not have the function of transmitting the failure occurrence information 15x or the failure occurrence information 15x and the category 16x to the network, the output selection node 20 will be able to detect the processing node concerned. If only the first header 31 and the data 14x are referred to and the subsequent failure occurrence information 15x and the category 16x are ignored, it can be handled in the same manner as other processing nodes. That is, it is possible to allow the conventional processing nodes to be mixed in the system.
8 and 9, the same effect can be obtained when the order of the failure occurrence information 15x and the category 16x is opposite.
【0072】なお、図7、9のメッセ−ジからカテゴリ
を省略したものが、前述した第1実施例において各プロ
セッシングノ−ドが送信するメッセ−ジに相当する。The categories omitted from the messages of FIGS. 7 and 9 correspond to the messages transmitted by each processing node in the first embodiment.
【0073】以下、本発明の第3の実施例について説明
する。The third embodiment of the present invention will be described below.
【0074】図10に、本第3実施例に係るフォ−ルト
トレラントシステムの構成を示す。FIG. 10 shows the configuration of the fault tolerant system according to the third embodiment.
【0075】本第3実施例では、プロセッシングノード
11〜1nで複数のタスク1(41)〜タスクm(4
m)を実行する。また、各タスクに対応して、出力選択
ノード21〜2mを設けている。In the third embodiment, the processing nodes 11 to 1n have a plurality of tasks 1 (41) to m (4).
m) is executed. Further, output selection nodes 21 to 2m are provided corresponding to each task.
【0076】図10ではプロセッシングノード11〜1
nの内プロセッシングノード11〜1iはタスク1(4
1)を実行し、プロセッシングノード1j〜1nはタス
クm(4m)を実行している。In FIG. 10, the processing nodes 11 to 1 are shown.
Processing nodes 11 to 1i out of n are task 1 (4
1) is executed, and the processing nodes 1j to 1n are executing the task m (4m).
【0077】出力選択ノード21〜2mはそれぞれタス
ク1(41)〜タスクm(4m)に対応して設けられて
おり、対応するタスクを実行しているプロセッシングノ
−ドの出力する出のうちから最も信頼度の高いデータを
選択して出力251〜25mとしている。The output selection nodes 21 to 2m are provided corresponding to the tasks 1 (41) to m (4m), respectively, and are selected from the outputs of the processing nodes executing the corresponding tasks. The data with the highest reliability is selected and set as the outputs 251 to 25 m.
【0078】例として、タスク1(41)のデータを出
力251する出力選択ノード21の動作を説明する。タ
スク1(41)を実行しているプロセッシングノード1
1〜1iからのデータ141〜14i、障害発生情報1
51〜15i、カテゴリ161〜16iはネットワーク
3を通じて送信され、出力選択ノード21内の処理結果
収集機能により選びだされる。判定機能231では、デ
ータ141〜14iの比較照合の結果、障害発生情報1
51〜15i、カテゴリ161〜16iに基づき、デー
タ141〜14iそれぞれが正しい確率(データの信頼
度)を推定し、そのデータの信頼度が最も高いかを選択
機能241へ報告する。選択機能241は判定機能23
1からの報告に基づき、データ141〜14nの中から
出力信号251を選択する。As an example, the operation of the output selection node 21 which outputs 251 the data of task 1 (41) will be described. Processing node 1 executing task 1 (41)
Data 141 to 14i from 1 to 1i, fault occurrence information 1
51 to 15i and categories 161 to 16i are transmitted through the network 3 and selected by the processing result collecting function in the output selection node 21. In the judgment function 231, as a result of comparison and collation of the data 141 to 14i, the failure occurrence information 1
Based on 51 to 15i and categories 161 to 16i, the probability that each of the data 141 to 14i is correct (data reliability) is estimated, and whether the data reliability is highest is reported to the selection function 241. The selection function 241 is the judgment function 23.
Based on the report from No. 1, the output signal 251 is selected from the data 141 to 14n.
【0079】以上述べた実施例によれば、ネットワーク
の特質を活かして、膨大な通信路を必要とせずに多機能
な高信頼度の分散システムをに実現することができる。
なお、さらに、ネットワークを冗長化してネットワーク
の障害によりシステム全体が影響を受けないようにして
もよい。According to the above-mentioned embodiment, it is possible to realize a multi-functional and highly reliable distributed system by utilizing the characteristics of the network without the need for a huge communication path.
Further, the network may be made redundant so that the entire system is not affected by the network failure.
【0080】以下、本発明の第4の実施例について説明
する。The fourth embodiment of the present invention will be described below.
【0081】図11に、本第4実施例に係るフォ−ルト
トレラントシステムの構成を示す。FIG. 11 shows the configuration of a fault tolerant system according to the fourth embodiment.
【0082】図示するように、本第4実施例に係るフォ
−ルトトレラントシステムは、第3実施例に係るフォ−
ルトトレラントシステムの構成(図10参照)におい
て、各プロセッシングノード11〜1nに、処理結果収
集機能131’〜13n’、データ比較機能171〜1
7n、実行タスク決定機能181〜18nを付加した構
成となっている。As shown in the figure, the fault tolerant system according to the fourth embodiment is a fault tolerant system according to the third embodiment.
In the configuration of the lto tolerant system (see FIG. 10), the processing result collecting functions 131 ′ to 13 n ′ and the data comparison functions 171 to 1 are included in each of the processing nodes 11 to 1 n.
7n, execution task determination functions 181 to 18n are added.
【0083】このような構成において、各プロセッシン
グノ−ド11〜1nは、実行するタスクを自ら決定し、
実行する。In such a configuration, each of the processing nodes 11 to 1n determines the task to be executed by itself,
Run.
【0084】さて、各プロセッシングノードの処理結果
収集機能131’〜13n’はプロセッシングノード1
1〜1nがネットワークを通じて送信するデータ141
〜14i、障害発生情報151〜15i、カテゴリ16
1〜16iを収集する。データ比較機能171〜17n
は収集されたデータ141〜14n同士を比較照合し、
比較照合の結果即ち、一致/不一致を実行タスク決定機
能181〜18nに報告する。実行タスク決定機能18
1〜18nは障害発生情報151〜15i、カテゴリ1
61〜16iおよびデータ比較機能171〜17nより
報告されたデータ141〜14n同士の一致/不一致情
報に基づき、各タスクの信頼度を推定し、信頼度の最も
低いタスクを実行すべきタスクと判断し、実行を開始す
る。By the way, the processing result collecting functions 131 'to 13n' of each processing node are processed by the processing node 1
Data 141 transmitted from 1 to 1n through the network
To 14i, failure occurrence information 151 to 15i, category 16
Collect 1-16i. Data comparison function 171 to 17n
Compares and collates the collected data 141 to 14n,
The result of comparison and matching, that is, the match / mismatch is reported to the execution task determination functions 181 to 18n. Execution task decision function 18
1 to 18n are failure occurrence information 151 to 15i, category 1
61 to 16i and the data comparison function 171 to 17n, the reliability of each task is estimated based on the match / mismatch information between the data 141 to 14n, and the task with the lowest reliability is determined to be the task to be executed. , Start running.
【0085】すなわち、確率Pε、確率Paε、確率Pd
εiが全て等しく、N1個のプロセッシングノ−ドが同
じタスクを実行しており、その内N2個のプロセッシン
グノ−ドの障害発生情報が障害が発生していないことを
表しており、N3個のプロセッシングノ−ドのデータが
一致したときには、N1個のプロセッシングノ−ドの確
率Pεの積と、障害が発生していないN2個のプロセッ
シングノ−ドの確率Pdεiの積と、N3個のプロセッシ
ングノ−ドのデータが誤って一致してしまう確率との積
を、タスクの処理結果が誤っている確率として求め、こ
れを、1から減じた値を当該タスクの信頼度として用い
る。または、さらに、これにタスクを実行しているプロ
セッシングノ−ド数を考慮してもよい。タスクを実行し
ているプロセッシングノ−ド数が多ければ多いほど当該
タスクの信頼度は高いと考えることができる。That is, the probability Pε, the probability Paε, and the probability Pd
εi are all equal, N1 processing nodes are executing the same task, and failure information of N2 processing nodes indicates that no failure has occurred, and N3 processing nodes When the data of the processing nodes match, the product of the probabilities Pε of the N1 processing nodes, the product of the probabilities Pdεi of the N2 processing nodes with no failure, and the N3 processing nodes. -The product of the probability that the data of erroneous coincides is obtained as the probability that the processing result of the task is erroneous, and the value subtracted from this is used as the reliability of the task. Alternatively, the number of processing nodes executing the task may be considered. It can be considered that the greater the number of processing nodes executing the task, the higher the reliability of the task.
【0086】そして、各プロセッシングノ−ド毎に、求
めたタスクの信頼度に予めタスク毎に定めたオフセット
値を与えることにより各タスクの信頼度の値を修正す
る。同じタスクに当られるオフセット値はプロセッシン
グノ−ド毎に異ならせるようにする。たとえば、タスク
毎に、このタスクを主に担当するプロセッシングノ−ド
を定め、このプロセッシングノ−ドでは、このタスクの
信頼度が相対的に小さくなるように、このプロセッシン
グノ−ドにおける、このタスクのオフセット値を定め
る。このようにすることにより、各プロセッシングノ−
ドにおいて、そのプロセッシングノ−ドが主に担当する
タスクの信頼度が相対的に低くなるので、このプロセッ
シングノ−ドが、このタスクに代えて他のタスクを実行
することがなくなる。Then, for each processing node, the reliability value of each task is corrected by giving the calculated reliability of the task an offset value previously determined for each task. The offset value applied to the same task is made different for each processing node. For example, a processing node mainly responsible for this task is defined for each task, and in this processing node, this task in this processing node is set so that the reliability of this task becomes relatively small. Determine the offset value of. By doing this, each processing node
In this mode, since the reliability of the task mainly handled by the processing node is relatively low, this processing node does not execute other tasks in place of this task.
【0087】そして、各プロセッシングノ−ドの実行タ
スク決定機能181〜18nは、自プロセッシングノ−
ドで実行しているタスクより信頼度の低いタスクが存在
する場合、このタスクを実行するようデータ処理機能を
制御する。The execution task decision functions 181 to 18n of the respective processing nodes have their own processing nodes.
If there is a task whose reliability is lower than that of the task that is running on the computer, control the data processing function to execute this task.
【0088】この際、同じタスクに当られるオフセット
値はプロセッシングノ−ド毎に異ならせるようにしてい
るので、各オフセット値を適宜定めれば、全てのプロセ
ッシングノ−ドが同じタスクを実行したり、実行されな
いタスクが生じたりすることを防止することができる。At this time, the offset value applied to the same task is made different for each processing node. Therefore, if each offset value is set appropriately, all processing nodes can execute the same task. It is possible to prevent a task that is not executed from occurring.
【0089】以下、本発明の第5実施例を説明する。The fifth embodiment of the present invention will be described below.
【0090】本第5実施例に係るフォ−ルトトレラント
システムの基本構成は、第3実施例に係るフォ−ルトト
レラントシステムの構成(図10参照)と同じであり、
プロセッシングノード11〜1nで複数のタスク1(4
1)〜タスクm(4m)を実行する。また、各タスクに
対応して、出力選択ノード21〜2mを設けている。The basic construction of the fault tolerant system according to the fifth embodiment is the same as that of the fault tolerant system according to the third embodiment (see FIG. 10),
A plurality of task 1 (4
1) -Execute task m (4m). Further, output selection nodes 21 to 2m are provided corresponding to each task.
【0091】ただし、図12に示すように、同じタスク
を実行する複数のプロセッシングノ−ドのうち一つのプ
ロセッシングノ−ドを除くプロセッシングノ−ドは図1
2のプロセッシングノ−ド1iのように構成する。すな
わち、処理結果収集機能13i’、データ処理機能11
i,データ比較機能191i、自己診断機能12i、カ
テゴリ16i、処理結果障害発生情報比較機能193i
と、比較情報ステップ心機能13i”でプロセッシング
ノ−ドを構成する。However, as shown in FIG. 12, the processing nodes except one of a plurality of processing nodes that execute the same task are shown in FIG.
2 processing node 1i. That is, the processing result collection function 13i ′ and the data processing function 11
i, data comparison function 191i, self-diagnosis function 12i, category 16i, processing result failure occurrence information comparison function 193i
And a comparison information step heart function 13i ″ constitutes a processing node.
【0092】図12は、本第5実施例に係るフォ−ルト
トレラントシステムのノ−ドうち、タスク1(41)に
関連した処理を行うノ−ドのみを表したものである。図
中において、プロセッシングノード11〜1iはタスク
1(41)をデータ処理機能111〜11iで実行し、
出力選択ノード21は、対応するタスク1を実行してい
るプロセッシングノ−ド11〜1iで求まったデータの
うちから最も信頼度の高いデータを選択して出力251
とするためのノ−ドでである。FIG. 12 shows only the node which performs the processing related to the task 1 (41) among the nodes of the fault tolerant system according to the fifth embodiment. In the figure, the processing nodes 11 to 1i execute task 1 (41) by the data processing functions 111 to 11i,
The output selection node 21 selects the data with the highest reliability from the data obtained by the processing nodes 11 to 1i executing the corresponding task 1 and outputs the selected data 251.
It is a node for
【0093】ただし、図12ではプロセッシングノード
12〜1(i−1)も図示を省略している。However, the processing nodes 12 to 1 (i-1) are not shown in FIG.
【0094】さて、いま、図12において、プロセッシ
ングノード12〜1iは、図示したプロセッシングノー
ド1iと同じ構成を有しているのものとする。Now, in FIG. 12, it is assumed that the processing nodes 12 to 1i have the same configuration as the illustrated processing node 1i.
【0095】このような構成において、タスク1(4
1)を実行しているプロセッシングノード11〜1iの
うち、プロセッシングノード11は、前記第3実施例に
おける場合と同様にデータ141、障害発生情報15
1、カテゴリ161を処理結果送信機能131によりメ
ッセージとしてネットワーク3を通じて送信する。ただ
し、送信先は、出力選択ノ−ド21とプロセッシングノ
−ド12〜1iとする。In such a configuration, task 1 (4
Among the processing nodes 11 to 1i executing 1), the processing node 11 has the data 141 and the failure occurrence information 15 as in the case of the third embodiment.
1, the category 161 is transmitted as a message through the network 3 by the processing result transmission function 131. However, the transmission destinations are the output selection node 21 and the processing nodes 12 to 1i.
【0096】プロセッシングノード12〜1iは送信さ
れたデータ141、障害発生情報151、カテゴリ16
1と自らのデータ処理機能112〜11iで行ったタス
ク1の処理の処理結果のデータ142〜14i、自己診
断機能122〜12iで生成した障害発生情報152〜
15i、カテゴリ162〜16iとをデータ比較機能1
912〜191iおよび障害発生情報比較機能1932
〜193iで比較し、データ比較情報1922〜192
i、障害発生情報比較情報1942〜194iを比較情
報送信機能132”〜13i”より出力選択ノ−ド21
に送信する。データ比較情報1922〜1922は、自
データ処理機能112〜11iで求めたデータ14iと
データ141との一致、または差分を表す情報である。
また、同様に、障害発生情報比較情報1942〜194
2は、自己診断機能122〜12iと障害発生情報15
1との一致または差分と、カテゴリ162〜16iとカ
テゴリ161との一致または差分を表す情報である。The processing nodes 12 to 1i transmit the transmitted data 141, the failure occurrence information 151, the category 16
1 and data 142 to 14i of the processing result of the processing of task 1 performed by its own data processing functions 112 to 11i, and failure occurrence information 152 generated by the self-diagnosis functions 122 to 12i.
Data comparison function 1 for 15i and categories 162 to 16i
912 to 191i and failure occurrence information comparison function 1932
Data comparison information 1922-192.
i, failure occurrence information comparison information 1942-194i output from comparison information transmission function 132 "-13i" selection node 21
Send to. The data comparison information 1922 to 1922 is information indicating a match or a difference between the data 14i and the data 141 obtained by the own data processing functions 112 to 11i.
Similarly, failure occurrence information comparison information 1942-194.
2 is self-diagnosis functions 122 to 12i and failure occurrence information 15
It is information indicating the match or difference with 1 and the match or difference between the categories 162 to 16i and the category 161.
【0097】ここで、理解を助けるためにプロセッシン
グノード1iに着目して動作を説明する。プロセッシン
グノード1iは送信されたデータ141、障害発生情報
151、カテゴリ161と自らの処理結果のデータ1
i、障害発生情報15i、カテゴリ16iとをデータ比
較機能191iおよび障害発生情報比較機能193iで
比較し、データ比較情報192i、障害発生情報比較情
報194iを生成し、こ比較情報送信機能131”より
ネットワーク3を通じて出力選択ノ−ド21送信する。Here, the operation will be described focusing on the processing node 1i in order to facilitate understanding. The processing node 1i transmits the data 141, the failure occurrence information 151, the category 161, and the processing result data 1 of itself.
i, the failure occurrence information 15i, and the category 16i are compared by the data comparison function 191i and the failure occurrence information comparison function 193i to generate the data comparison information 192i and the failure occurrence information comparison information 194i. The output selection node 21 is transmitted through the step 3.
【0098】データ比較情報192i、障害発生情報比
較情報194iは、前述した比較の結果が一致であれば
一致である旨をある情報とし、不一致であれば差分を表
す情報とする。The data comparison information 192i and the failure occurrence information comparison information 194i are information indicating that they are a match if the above-mentioned comparison results are coincident, and information indicating a difference if they are not coincident.
【0099】出力選択ノード21内の判定機能231で
は、障害発生情報151、カテゴリ161、データ比較
情報1922〜192i、障害発生情報比較情報194
2〜194iに基づき、プロセッシングノ−ド12〜1
iから送られたデータ比較情報1922〜192i、障
害発生情報比較情報1942〜194iの全てが一致を
表しており、障害発生情報151が障害の発生を表して
いない場合には、データ141を選択するよう選択機能
240へ報告する。データ比較情報1922〜192
i、障害発生情報比較情報1942〜194iの全てが
一致を表しており、障害発生情報151が障害の発生を
表している場合には、制御対象がフェイルセ−フ側に停
止する予め定めたデータを出力するよう選択機能240
を制御する。In the judgment function 231 in the output selection node 21, the failure occurrence information 151, the category 161, the data comparison information 1922 to 192i, and the failure occurrence information comparison information 194.
2 to 194i, processing nodes 12 to 1
If all of the data comparison information 1922 to 192i and the failure occurrence information comparison information 1942 to 194i sent from i indicate coincidence and the failure occurrence information 151 does not indicate occurrence of a failure, the data 141 is selected. Report to select function 240. Data comparison information 1922-192
i, the failure occurrence information comparison information 1942 to 194i all indicate coincidence, and the failure occurrence information 151 indicates the occurrence of a failure, the predetermined data for stopping the controlled object on the fail-safe side is displayed. Select function to output 240
Control.
【0100】もし、データ比較情報1922〜192
i、障害発生情報比較情報1942〜194iの全てが
一致を表していない場合には、一致を表さないデータ比
較情報、障害発生情報比較情報が表す差分から、これら
の情報を送った各プロセッシングノ−ドのデータ、障害
発生情報、カテゴリを復元し、前述したように、データ
141と、復元した各データの信頼度を推定し、どのデ
ータの信頼度が最も高いかを選択機能240へ報告す
る。選択機能240は判定機能230からの報告に基づ
き、選択を行う。If the data comparison information 1922-192
i, the failure occurrence information comparison information 194 to 194i does not represent a match, the data comparison information that does not represent a match and the difference represented by the failure occurrence information comparison information are used to process each of the processing nodes that sent these information. -Restore the data, failure occurrence information, and category, estimate the reliability of the data 141 and each restored data, and report which data has the highest reliability to the selection function 240, as described above. . The selection function 240 makes a selection based on the report from the determination function 230.
【0101】以上のようにすれば、障害が発生しない場
合には、プロセッシングノード12〜1iはデータ比較
情報1922〜192i、障害発生情報比較情報194
2〜194iつまり、データ141、障害発生情報15
1、カテゴリ161との一致のみを送信するので、ネッ
トワーク3を介して交換される情報量を削減することが
できる。As described above, when no failure occurs, the processing nodes 12 to 1i have the data comparison information 1922 to 192i and the failure occurrence information comparison information 194.
2 to 194i, that is, data 141, failure occurrence information 15
Since only 1 and a match with the category 161 are transmitted, the amount of information exchanged via the network 3 can be reduced.
【0102】さらに、プロセッシングノード12〜1i
が、一致を表す場合にはデータ比較情報1922〜19
2i、障害発生情報比較情報1942〜194iの送信
を省略するようにすれば、メッセージ交換の回数自体も
大幅に削減される。この場合、出力選択ノ−ド21は、
あるプロセッシングノ−ドからデータ比較情報、障害発
生情報比較情報を受け取らなかった場合、その受け取ら
なかったプロセッシグノ−ドから一致を表すデータ比較
情報、障害発生情報比較情報を受け取ったものとして前
記動作を行うようにする。Further, the processing nodes 12 to 1i
, If they represent a match, the data comparison information 1922-19
If the transmission of 2i and the failure occurrence information comparison information 1942 to 194i is omitted, the number of times of message exchange itself is significantly reduced. In this case, the output selection node 21 is
When the data comparison information and the failure occurrence information comparison information are not received from a certain processing node, the above operation is performed assuming that the data comparison information indicating the coincidence and the failure occurrence information comparison information are received from the processing node which is not received. To do so.
【0103】以下、本発明の第6の実施例について説明
する。The sixth embodiment of the present invention will be described below.
【0104】本第6実施例は、フォ−ルトトレラントシ
ステムの要素となる先の実施例で示してきたようなノー
ドの高信頼化に関するものである。The sixth embodiment relates to the high reliability of the node as shown in the previous embodiment which is an element of the fault tolerant system.
【0105】図13に、本第6実施例に係るノード50
の構成を示す。図示するように本実施例では、ノ−ド5
0に出力選択装置7を付加している。FIG. 13 shows a node 50 according to the sixth embodiment.
Shows the configuration of. As shown in the figure, in this embodiment, node 5 is used.
The output selection device 7 is added to 0.
【0106】ノ−ド50は、後に示すようにMPUやメ
モリを備えた一般的な構成のコンピュ−タであり、ソフ
トウェアの実行によって実現される同一の機能を持つ処
理1(61)〜処理N(6N)を内部で時分割に実行す
る。この処理1(61)〜処理N(6N)の結果は出力
選択装置7の入力ポート1(711)〜入力ポートN
(71N)に入力され、正しいと思われる一つの処理結
果が出力選択回路72で選択され出力される。The node 50 is a computer having a general configuration including an MPU and a memory as will be described later, and has processes 1 (61) to N having the same functions realized by executing software. (6N) is internally executed in a time-sharing manner. The results of this processing 1 (61) to processing N (6N) are the input port 1 (711) to input port N of the output selection device 7.
It is input to (71N), and one processing result which seems to be correct is selected by the output selection circuit 72 and output.
【0107】なお、出力選択回路72は、単純な多数決
論理によって処理結果を選択して出力したり、特開平3
−15946号等に記載されている、所定の障害検出機
能によって障害が検出されていない固定数の処理結果の
多数決と取るMV(ModifiedVoter)などによって処理結
果を選択して出力したりするようにしてもよい。The output selection circuit 72 selects and outputs the processing result by a simple majority logic.
No. 15946, etc., the processing result is selected and output by a majority decision of a fixed number of processing results in which no failure is detected by a predetermined failure detection function and MV (Modified Voter). Good.
【0108】本第6実施例によれば、ハードウェアの増
大を招かずに、発生するフォールトの大半を占める過渡
フォールトの影響はノード内での処理の冗長化によりマ
スクすることができる。According to the sixth embodiment, the effect of transient faults, which accounts for most of the generated faults, can be masked by the redundancy of the processing in the node without increasing the hardware.
【0109】次に本発明の第7の実施例について説明す
る。Next, a seventh embodiment of the present invention will be described.
【0110】図14に、本第7実施例に係るプロセッシ
ングノード50の構成を示す。FIG. 14 shows the configuration of the processing node 50 according to the seventh embodiment.
【0111】図示するように本第7実施例では、プロセ
ッシングノードをノード5a〜5xと多重化し、さら
に、それぞれのノードで実行する処理を多重化したもの
である。ノード5a〜5xの構成は第6実施例のノ−ド
50と同一のものである。As shown in the figure, in the seventh embodiment, the processing nodes are multiplexed with the nodes 5a to 5x, and the processing executed by each node is also multiplexed. The nodes 5a to 5x have the same structure as the node 50 of the sixth embodiment.
【0112】出力選択装置7は、多重化したノード5a
〜5xのさらに多重化した処理の結果のなかから、前述
したように、ひとつの処理結果を出力選択装置7で選択
する。The output selection device 7 includes the multiplexed node 5a.
As described above, one output result is selected by the output selection device 7 from the results of the further multiplexed processing of .about.5x.
【0113】ここで、同一のノード内で多重化した処理
結果のうち過半数が一致している場合には、その処理結
果に過渡フォールトによる誤りが生じていないことが判
る。さらにその処理結果が他のノードの少なくとも1つ
の処理結果と一致している場合には処理を実行している
ハードウェアの故障つまり、固定フォールトによる誤り
が生じていないことががわかる。Here, when the majority of the processing results multiplexed in the same node are the same, it is understood that no error due to a transient fault has occurred in the processing results. Further, when the processing result matches the processing result of at least one of the other nodes, it can be seen that the hardware that is executing the processing has not failed, that is, the error due to the fixed fault has not occurred.
【0114】そこで、本第7実施例では、同一のノード
内で多重化した処理結果のうち過半数が一致し、かつ他
のノードの少なくとも1つの処理結果と一致している場
合にはその出力を出力選択装置7で選択するようにす
る。これにより、過渡フォールト、固定フォールトのい
ずれもの影響も受けていない処理結果、即ち正しい処理
結果を常に得ることができる。Therefore, in the seventh embodiment, when the majority of the processing results multiplexed in the same node match and at least one processing result of another node matches, the output is output. The output selection device 7 makes a selection. As a result, it is possible to always obtain a processing result that is not affected by any of the transient fault and the fixed fault, that is, a correct processing result.
【0115】本第7実施例によれば、発生するフォール
トの大半を占める過渡フォールトの影響はノード内での
処理の多重化によりマスクされ、ノ−ドのハードウェア
の故障などに代表される固定フォールトの影響はノード
の多重化によりマスクされる。ハードウェアの多重度よ
りも処理の多重度の方が高いので、発生する頻度のより
高い過渡フォールトにより強い合理的な構成である。According to the seventh embodiment, the effects of transient faults, which account for most of the generated faults, are masked by the multiplexing of processing in the node, and fixed as represented by the failure of the node hardware. The effects of faults are masked by node multiplexing. Since the multiplicity of processing is higher than the multiplicity of hardware, it is a strong rational configuration due to the more frequent transient faults that occur.
【0116】ところで、本第7実施例に係るノ−ドの最
小構成は、図15のようになる。By the way, the minimum configuration of the node according to the seventh embodiment is as shown in FIG.
【0117】図15はノードを2重化し、それぞれのノ
ードの中で処理を2重化、つまり、ハードウェアを2重
化、処理を4重化した実施例である。過渡フォールト発
生時には処理1a、処理2a、処理1b、処理2bのい
ずれか1つの結果が異なるので、他と一致している結果
を選択すればよい。しかし、固定フォールト時には処理
1a、処理2aの結果と処理1b、処理2bの結果とが
不一致となり、正常な出力が特定できない場合がある。
そこで、安全性が重視される用途では、このような場合
には、73出力によって制御される対象が、安全側に動
作を停止する出力を出すようにする。すなわち、フェイ
ルセーフ動作を行うようにする。一方、もし、稼働率が
重視される用途では、他と一致している結果を出力とし
て選択すればよい。FIG. 15 shows an embodiment in which the nodes are duplicated and the processing is duplicated in each node, that is, the hardware is duplicated and the processing is quadrupled. When a transient fault occurs, the result of any one of process 1a, process 2a, process 1b, and process 2b is different, so the result that matches the other may be selected. However, during a fixed fault, the results of processing 1a and processing 2a do not match the results of processing 1b and processing 2b, and there are cases where normal output cannot be specified.
Therefore, in an application where safety is important, in such a case, an object controlled by the 73 output outputs an output for stopping the operation to the safe side. That is, the fail-safe operation is performed. On the other hand, if the usage rate is important, the result that matches the others may be selected as the output.
【0118】ここで、安全性が重視される用途に適した
出力選択回路72の選択の例を示しておく。Here, an example of selection of the output selection circuit 72 suitable for the use where safety is important is shown.
【0119】以下に論理式で示した選択の例は、過渡フ
ォールト発生時には一つの処理結果を選択して出力する
選択を行って処理を継続し、固定フォールト発生時には
安全側に動作を停止させる出力を選択するファイルセー
フな動作を実現するものである。The example of selection shown by the logical expressions below is an output for selecting one processing result to be output when a transient fault occurs and continuing the processing, and for stopping the operation to the safe side when a fixed fault occurs. This is a file-safe operation for selecting.
【0120】[0120]
【数5】 SEL_1a = (1a = 2a) AND ((1a = 1b) OR (1a = 2b))[Equation 5] SEL_1a = (1a = 2a) AND ((1a = 1b) OR (1a = 2b))
【0121】[0121]
【数6】 SEL_2a = (1a = 2a) AND
((2a = 1b) OR (2a = 2b))SEL — 2a = (1a = 2a) AND
((2a = 1b) OR (2a = 2b))
【0122】[0122]
【数7】 SEL_1b = (1b = 2b) AND
((1a = 1b) OR (2a = 1b))SEL_1b = (1b = 2b) AND
((1a = 1b) OR (2a = 1b))
【0123】[0123]
【数8】 SEL_2b = (1b = 2b) AND ((1a = 2b) OR (2a = 2b))[Formula 8] SEL_2b = (1b = 2b) AND ((1a = 2b) OR (2a = 2b))
【0124】[0124]
【数9】Fail-Safe = NOT (SEL_1a OR SEL_1b) 但し、 SEL_1aが真のとき:処理1aの結果を選択す
る。[Formula 9] Fail-Safe = NOT (SEL_1a OR SEL_1b) However, when SEL_1a is true: the result of the process 1a is selected.
【0125】SEL_2aが真のとき:処理2aの結果を選択
する。When SEL_2a is true: The result of the process 2a is selected.
【0126】SEL_1bが真のとき:処理1bの結果を選択
する。When SEL_1b is true: The result of the process 1b is selected.
【0127】SEL_2bが真のとき:処理2bの結果を選択
する。When SEL_2b is true: The result of the process 2b is selected.
【0128】Fail-Safeが真のとき:安全側停止出力を
選択する。When Fail-Safe is true: Select the safe side stop output.
【0129】1a:処理1aの結果 2a:処理2aの結果 1b:処理1bの結果 2b:処理2bの結果 以上述べたように例によれば、ハードウェアの少ない増
加で発生頻度の比較的高い過渡フォールト発生時には処
理を継続させ、発生頻度の比較的低い固定フォールト発
生時にはフェイルセーフ動作をさせることができ、稼働
率の向上と安全性の確保の両立を図れる。1a: Result of process 1a 2a: Result of process 2a 1b: Result of process 1b 2b: Result of process 2b As described above, according to the example, transients with relatively high frequency of occurrence occur due to increase in hardware. When a fault occurs, the process can be continued, and when a fixed fault that occurs relatively infrequently occurs, a fail-safe operation can be performed, so that it is possible to improve the operating rate and ensure safety.
【0130】以下、本発明の第8の実施例について説明
する。The eighth embodiment of the present invention will be described below.
【0131】本第8実施例は、第1〜第5実施例で示し
た出力選択ノ−ドに、第6実施例を適用したものであ
る。In the eighth embodiment, the sixth embodiment is applied to the output selection nodes shown in the first to fifth embodiments.
【0132】図16に、この場合の出力選択ノ−ド20
の構成を示す。FIG. 16 shows the output selection node 20 in this case.
Shows the configuration of.
【0133】選択ノードのデータ選択機能つまり、処理
結果収集機能210データ比較機能230、判定機能2
30、選択機能240を、多重化する処理1(61)〜
処理N(6N)としたものである。Data selection function of selected node, that is, processing result collection function 210 data comparison function 230, determination function 2
30, processing 1 (61) for multiplexing the selection function 240
It is the process N (6N).
【0134】このようにすることにより、データ選択自
体の信頼度を向上させ、ひいてはシステム全体の信頼度
を大幅に向上させることができる。By doing so, it is possible to improve the reliability of the data selection itself and, in turn, the reliability of the entire system.
【0135】また、同様に、処理結果収集機能210デ
ータ比較機能230、判定機能230、選択機能240
を、多重化する処理1(61)〜処理N(6N)とし
て、第1〜第5実施例で示した出力選択ノ−ドに、第7
実施例を適用することもできる。Similarly, the processing result collection function 210, the data comparison function 230, the judgment function 230, and the selection function 240.
As the processing 1 (61) to processing N (6N) for multiplexing, the output selection nodes shown in the first to fifth embodiments are
The embodiment can also be applied.
【0136】また、同様に、第6実施例、第7実施例の
多重化の技術を前述した第1実施例から第5実施例のプ
ロセッシングノ−ドに適用することもできる。この場合
はたとえば、第6実施例、第7実施例で示したプロセッ
シングノ−ドの機能全体を多重化する処理とすればよ
い。Similarly, the multiplexing techniques of the sixth and seventh embodiments can be applied to the processing nodes of the above-mentioned first to fifth embodiments. In this case, for example, the entire processing function of the processing nodes shown in the sixth and seventh embodiments may be multiplexed.
【0137】次に、本発明の第9の実施例を説明する。Next, a ninth embodiment of the present invention will be described.
【0138】本第9実施例は、第6、7、8実施例で示
したノ−ド内の処理の多重化を実現するノ−ド50内の
構成についてのものである。The ninth embodiment relates to the configuration in the node 50 which realizes the multiplexing of the processes in the nodes shown in the sixth, seventh and eighth embodiments.
【0139】本第9実施例に係るノ−ド50の構成を図
17に示す。The structure of the node 50 according to the ninth embodiment is shown in FIG.
【0140】図示するように、本ノ−ド50は、MPU
(Micro-Processing Unit)501、メモリ(MEM)5
03、インタフェース(I/F)504がバス500を
介してお互いに接続した構成を有している。MPU50
1はメモリ(MEM)503に各種のデータを読み書き
しながらソフトウェアに従い処理を実行するのは通常の
コンピュータである。出力選択装置72の入力ポート1
(711)〜入力ポートN(71N)に接続しているイ
ンタフェース(I/F)504の出力ポート1(51
1)〜ポートN(51N)にはそれぞれ異なるアドレス
が割り当ててある。As shown, the present node 50 is an MPU.
(Micro-Processing Unit) 501, Memory (MEM) 5
03, an interface (I / F) 504 are connected to each other via a bus 500. MPU50
An ordinary computer 1 executes processing according to software while reading and writing various data from and in the memory (MEM) 503. Input port 1 of output selection device 72
(711) to output port 1 (51) of the interface (I / F) 504 connected to the input port N (71N)
Different addresses are assigned to 1) to port N (51N).
【0141】MPU501は図18に示すように同一の
機能を持つ処理1(61)、処理2(62)、...処
理N(6N)を順次実行し、実行の度に処理1(61)
〜処理N(6N)の結果をインタフェース(I/F)5
04の出力ポート1(511)〜ポートN(51N)に
書き込む。また、処理1(61)〜処理N(6N)ごと
にメモリ(MEM)503を分割して使用する。すなわ
ち、各処理で異なる出力ポート1(511)〜ポートN
(51N)、メモリ503の異なる領域を使用する。As shown in FIG. 18, the MPU 501 has processing 1 (61), processing 2 (62) ,. . . Process N (6N) is sequentially executed, and process 1 (61) is executed each time it is executed.
~ Interface (I / F) 5 for the result of processing N (6N)
No. 04 output port 1 (511) to port N (51N). Further, the memory (MEM) 503 is divided and used for each of processing 1 (61) to processing N (6N). That is, the output port 1 (511) to port N that is different for each process
(51N), a different area of the memory 503 is used.
【0142】これにより、処理1(61)〜処理N(6
N)の独立性を高めることができる。本第9実施例のメ
モリ(MEM)503、出力ポ−トのアドレスマップを
図19に示しておく。As a result, processing 1 (61) to processing N (6)
The independence of N) can be increased. FIG. 19 shows the address map of the memory (MEM) 503 and output port of the ninth embodiment.
【0143】以上述べた本第9実施例によれば、プロセ
ッサ501の誤動作が過渡フォールトによるものである
場合には、正常に実行できた処理結果を選択することに
より、正常な出力を得ることができる。また、プロセッ
サ501の誤動作の要因の大半が過渡フォールトによる
ものであるので本実施例によれば、ハードウェアの増加
を招かずにフォールトの大半の影響をマスクすることが
できる。According to the ninth embodiment described above, when the malfunction of the processor 501 is due to a transient fault, a normal output can be obtained by selecting a processing result that can be normally executed. it can. Further, since most of the factors causing the malfunction of the processor 501 are due to the transient fault, according to the present embodiment, it is possible to mask the influence of most of the fault without increasing the hardware.
【0144】次に、本発明の第10実施例について説明
する。Next, a tenth embodiment of the present invention will be described.
【0145】本第10実施例も、第9実施例と同様に、
第6、7、8実施例で示したノ−ド内の処理の多重化を
実現するノ−ド50の構成についてのものである。The tenth embodiment is also similar to the ninth embodiment.
It relates to the configuration of the node 50 which realizes the multiplexing of the processes in the nodes shown in the sixth, seventh and eighth embodiments.
【0146】本第10実施例に係るノ−ド50の構成を
図20に示す。The structure of the node 50 according to the tenth embodiment is shown in FIG.
【0147】本第10実施例が第9実施例と異なる点
は、ノ−ドのインタフェ−ス504の出力ポ−トを一つ
だけ用い、カウンタ506の出力値によって出力選択装
置7の入力ポート1(711)〜入力ポートN(71
N)を切り替えるようにした点である。The tenth embodiment is different from the ninth embodiment in that only one output port of the node interface 504 is used and the output value of the counter 506 is used for the input port of the output selector 7. 1 (711) to input port N (71
The point is that N) is switched.
【0148】タイマ505は1回の処理が終了する時間
ごとに信号を出力し、カウンタ506はその度に計数
値、現在実行されている処理が処理1(61)〜処理N
(6N)のどの処理なのかを認識し、処理番号509を
出力する。ポート選択装置507は処理番号509に従
い、対応する入力ポートを選択する。The timer 505 outputs a signal every time one processing ends, and the counter 506 outputs a count value each time, and the currently executed processing is processing 1 (61) to processing N.
It recognizes which process (6N), and outputs the process number 509. The port selection device 507 selects the corresponding input port according to the processing number 509.
【0149】本第10実施例によれば、プロセッサ50
1が誤動作した場合でも、処理番号に応じた入力ポート
を選択することができるので、プロセッサ501の誤動
作の場合でも出力選択装置7を確実に動作させられる。
したがって、プロセッサ501の誤動作が過渡フォール
トによるものである場合には、正常に実行できた処理結
果を選択することにより、正常な出力を得ることができ
る。According to the tenth embodiment, the processor 50
Since the input port corresponding to the processing number can be selected even when 1 malfunctions, the output selection device 7 can be reliably operated even if the processor 501 malfunctions.
Therefore, when the malfunction of the processor 501 is due to a transient fault, a normal output can be obtained by selecting a processing result that can be normally executed.
【0150】また更に、タイマ505からの1回の処理
が終了する時間ごとの信号によりプロセッサ501をリ
セットすれば、ある処理で過渡フォールトが発生しても
次の処理ではリセット後なので過渡フォールトの影響を
除去できる。したがって、処理1(61)〜N(6N)
間の独立性をさらに高めることが可能となる。Furthermore, if the processor 501 is reset by a signal from the timer 505 at each time when one processing ends, even if a transient fault occurs in one processing, it is after reset in the next processing, the influence of the transient fault occurs. Can be removed. Therefore, processing 1 (61) to N (6N)
It is possible to further increase the independence between them.
【0151】次に、本発明の第11の実施例について説
明する。Next, an eleventh embodiment of the present invention will be described.
【0152】本第11実施例も、第9実施例と同様に、
第6、7、8実施例で示したノ−ド内の処理の多重化を
実現するノ−ド50内の構成についてのものである。The eleventh embodiment is also similar to the ninth embodiment.
The present invention relates to the configuration in the node 50 which realizes the multiplexing of the processes in the nodes shown in the sixth, seventh and eighth embodiments.
【0153】本第11実施例に係るノ−ド50の構成を
図21に示す。FIG. 21 shows the structure of the node 50 according to the eleventh embodiment.
【0154】本第11実施例が第9実施例と異なる点
は、MPU501からのアドレスを処理ごとにアドレス
変換機能508で異なるアドレス領域に変換することに
より、強制的に処理毎に異なるメモリ501の領域が使
用されるようにした点である。The eleventh embodiment differs from the ninth embodiment in that the address from the MPU 501 is forcibly converted into a different address area by the address conversion function 508 so that the memory 501 which is different for each process is forcibly processed. The point is that the area is used.
【0155】図中において、タイマ505は1回の処理
が終了する時間ごとに信号を出力し、カウンタ506は
その度に計数値、現在実行されている処理が処理1(6
1)〜処理N(6N)のどの処理なのかを認識し、処理
番号509を出力する。アドレス変換機能508はカウ
ンタ506からの処理番号509に従い、MPU501
からのアドレスを変換する。In the figure, the timer 505 outputs a signal every time one processing ends, the counter 506 counts each time, and the currently executed processing is processed 1 (6).
1) to the processing N (6N) are recognized, and the processing number 509 is output. The address translation function 508 follows the processing number 509 from the counter 506 and follows the MPU 501.
Translate addresses from.
【0156】アドレス変換機能の変換の例を図22に示
す。図22に示すように、カウンタ506の出力値を、
MPU501の出力するアドレスの上位2ビット目の上
位ビットの位置に挿入すれば、図23に示すようにMP
U501が毎回全く同一の処理を繰り返していても、処
理の番号に応じて使用するメモリの領域、出力ポートは
図24のアドレスマップに示すように強制的に変換され
る。但し、MPU501の出力する最上位ビットam
は、処理毎のメモリ501の使用、出力ポ−トのアドレ
ッシングに際して変化しないものとする。FIG. 22 shows an example of conversion of the address conversion function. As shown in FIG. 22, the output value of the counter 506 is
If it is inserted at the position of the higher-order second higher-order bit of the address output from the MPU 501, as shown in FIG.
Even if the U501 repeats exactly the same processing every time, the memory area and output port to be used are forcibly converted according to the processing number as shown in the address map of FIG. However, the most significant bit am output from the MPU 501
Does not change when the memory 501 is used for each process and the output port is addressed.
【0157】本第10実施例によれば、プロセッサ50
1が誤動作した場合でも、処理番号に応じた入力ポート
を選択することができるので、プロセッサ501の誤動
作の場合でも出力選択装置7を確実に動作させられる。
その上、同一の処理プログラムで処理1(61)〜処理
N(6N)を実行させることができるので、ソフトウェ
アに対する透過性(トランスペアレンシ)を実現でき
る。According to the tenth embodiment, the processor 50
Since the input port corresponding to the processing number can be selected even when 1 malfunctions, the output selection device 7 can be reliably operated even if the processor 501 malfunctions.
Moreover, since the processing 1 (61) to the processing N (6N) can be executed by the same processing program, transparency to software (transparency) can be realized.
【0158】以上、本発明の各実施例を説明した。The respective embodiments of the present invention have been described above.
【0159】このように本発明の各実施例によれば、ネ
ットワークの特質を活かした広域に分散したシステムに
適した高信頼化の方法、冗長資源管理の方法を実現する
ことができる。さらに、より少ないハードウェアの増加
で、稼働率、安全性共に高いシステムを提供することが
できる。As described above, according to each of the embodiments of the present invention, it is possible to realize a highly reliable method and a redundant resource management method suitable for a wide-area distributed system that takes advantage of the characteristics of the network. Furthermore, it is possible to provide a system with high operating rate and high safety by increasing the amount of hardware required.
【0160】[0160]
【発明の効果】以上のように、本発明によれば、サブシ
ステムや出力選択回路の分散配置に適したフォ−ルトト
レラントシステムを提供することを目的とする。As described above, it is an object of the present invention to provide a fault tolerant system suitable for distributed arrangement of subsystems and output selection circuits.
【0161】また、さらに、サブシステム毎に障害検出
/障害回復機能のカバレッジが異なる場合にも、各サブ
システムが出力する処理結果のうちから最も信頼度が高
い処理結果を選択することができるフォ−ルトトレラン
トシステムを提供することができる。Further, even when the coverage of the failure detection / failure recovery function is different for each subsystem, the processing result with the highest reliability can be selected from the processing results output by each subsystem. -A rult tolerant system can be provided.
【0162】また、本発明によれば、1つのハードウェ
アの中の処理を多重化する場合に、各処理の誤りが、他
の処理に波及しないようにを局所化することができる。Further, according to the present invention, when processing in one piece of hardware is multiplexed, it is possible to localize so that an error of each processing does not affect other processing.
【図1】本発明の第1実施例に係るフォ−ルトトレラン
トシステムの構成を示すブロック図である。FIG. 1 is a block diagram showing the configuration of a fault tolerant system according to a first embodiment of the present invention.
【図2】本発明の第1実施例に係る処理結果送信機能の
構成を示すブロック図である。FIG. 2 is a block diagram showing a configuration of a processing result transmission function according to the first embodiment of the present invention.
【図3】本発明の第1実施例に係る処理結果送信機能の
動作を示すタイミングチャ−トである。FIG. 3 is a timing chart showing the operation of the processing result transmission function according to the first embodiment of the present invention.
【図4】本発明の第2実施例に係るフォ−ルトトレラン
トシステムの構成を示すブロック図である。FIG. 4 is a block diagram showing a configuration of a fault tolerant system according to a second embodiment of the present invention.
【図5】本発明の第2実施例に係る処理結果送信機能の
構成を示すブロック図である。FIG. 5 is a block diagram showing a configuration of a processing result transmission function according to a second embodiment of the present invention.
【図6】本発明の第2実施例で用いるパケットの第1の
フォーマット例を示す図である。FIG. 6 is a diagram showing a first format example of a packet used in the second embodiment of the present invention.
【図7】本発明の第2実施例で用いるメッセージの第1
のフォーマット例を示す図である。FIG. 7 shows a first message used in the second embodiment of the present invention.
It is a figure which shows the example of a format of.
【図8】本発明の第2実施例で用いるパケットの第2の
フォーマット例を示す図である。FIG. 8 is a diagram showing a second format example of a packet used in the second embodiment of the present invention.
【図9】本発明の第2実施例で用いるメッセージの第2
のフォーマット例を示す図である。FIG. 9 is a second message used in the second embodiment of the present invention.
It is a figure which shows the example of a format of.
【図10】本発明の第3実施例に係るフォ−ルトトレラ
ントシステムの構成を示すブロック図である。FIG. 10 is a block diagram showing a configuration of a fault tolerant system according to a third embodiment of the present invention.
【図11】本発明の第4実施例に係るフォ−ルトトレラ
ントシステムの構成を示すブロック図である。FIG. 11 is a block diagram showing the configuration of a fault tolerant system according to a fourth embodiment of the present invention.
【図12】本発明の第5実施例に係るフォ−ルトトレラ
ントシステムの構成を示すブロック図である。FIG. 12 is a block diagram showing the configuration of a fault tolerant system according to a fifth embodiment of the present invention.
【図13】本発明の第6実施例に係るフォ−ルトトレラ
ントシステムのノ−ドの構成を示すブロック図である。FIG. 13 is a block diagram showing a node configuration of a fault tolerant system according to a sixth embodiment of the present invention.
【図14】本発明の第7実施例に係るフォ−ルトトレラ
ントシステムのノ−ドの第1の構成例を示すブロック図
である。FIG. 14 is a block diagram showing a first structural example of a node of a fault tolerant system according to a seventh embodiment of the present invention.
【図15】本発明の第7実施例に係るフォ−ルトトレラ
ントシステムのノ−ドの第2の構成例を示すブロック図
である。FIG. 15 is a block diagram showing a second configuration example of the node of the fault tolerant system according to the seventh embodiment of the present invention.
【図16】本発明の第8実施例に係るフォ−ルトトレラ
ントシステムの出力選択ノ−ドの構成を示すブロック図
である。FIG. 16 is a block diagram showing a configuration of an output selection node of a fault tolerant system according to an eighth embodiment of the present invention.
【図17】本発明の第9実施例に係るフォ−ルトトレラ
ントシステムのノ−ド内の構成を示すブロック図であ
る。FIG. 17 is a block diagram showing an internal configuration of a fault tolerant system according to a ninth embodiment of the present invention.
【図18】本発明の第9実施例に係るフォ−ルトトレラ
ントシステムのノ−ドが行う処理の手順を示す図であ
る。FIG. 18 is a diagram showing a procedure of processing performed by a node of the fault tolerant system according to the ninth embodiment of the present invention.
【図19】本発明の第9実施例に係るフォ−ルトトレラ
ントシステムのノ−ドにおけるアドレスマップを示す図
である。FIG. 19 is a diagram showing an address map in the node of the fault tolerant system according to the ninth embodiment of the present invention.
【図20】本発明の第10実施例に係るフォ−ルトトレ
ラントシステムのノ−ド内の構成を示すブロック図であ
る。FIG. 20 is a block diagram showing an internal configuration of a fault tolerant system according to a tenth embodiment of the present invention.
【図21】本発明の第11実施例に係るフォ−ルトトレ
ラントシステムのノ−ド内の構成を示すブロック図であ
る。FIG. 21 is a block diagram showing an internal configuration of a fault tolerant system according to an eleventh embodiment of the present invention.
【図22】本発明の第11実施例に係るフォ−ルトトレ
ラントシステムのノ−ドアドレス変換機能の構成を示す
図である。FIG. 22 is a diagram showing the configuration of a node address conversion function of the fault tolerant system according to the eleventh embodiment of the present invention.
【図23】本発明の第11実施例に係るフォ−ルトトレ
ラントシステムのノ−ドの行う処理手順を示す図であ
る。FIG. 23 is a diagram showing a processing procedure performed by a node of the fault tolerant system according to the eleventh embodiment of the present invention.
【図24】本発明の第11実施例に係るフォ−ルトトレ
ラントシステムのノ−ドにおけるアドレスマップを示す
図である。FIG. 24 is a diagram showing an address map in the node of the fault tolerant system according to the eleventh embodiment of the present invention.
11〜1n……プロセッシングノード、20〜2m……
出力選択ノード、3……ネットワーク、111〜11n
……データ処理機能、121〜12n……自己診断機
能、111〜11n……実行タスク決定機能、131〜
13n……処理結果送信機能、210〜21m……処理
結果収集機能、220〜22m……データ比較機能、2
30〜23m……判定機能、240〜24m……選択機
能、7……出力選択装置、50……ノード11-1n …… Processing node, 20-2m ……
Output selection node, 3 ... Network, 111-11n
...... Data processing function, 121 to 12n ...... Self-diagnosis function, 111 to 11n ...... Execution task determination function, 131 to
13n ... Processing result transmitting function, 210-21m ... Processing result collecting function, 220-22m ... Data comparing function, 2
30 to 23 m ... Judgment function, 240 to 24 m ... Selection function, 7 ... Output selection device, 50 ... Node
───────────────────────────────────────────────────── フロントページの続き (72)発明者 佐藤 美道 茨城県日立市大みか町七丁目1番1号 株 式会社日立製作所日立研究所内 (72)発明者 大辻 信也 茨城県日立市大みか町七丁目1番1号 株 式会社日立製作所日立研究所内 (72)発明者 堀田 多加志 茨城県日立市大みか町七丁目1番1号 株 式会社日立製作所日立研究所内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Michi Sato 7-1-1 Omika-cho, Hitachi-shi, Ibaraki Hitachi Ltd. Hitachi Research Laboratory (72) Inventor Shinya Otsuji 7-chome, Omika-cho, Hitachi-shi, Ibaraki 1-1 Hitachi Ltd. Hitachi Research Laboratory (72) Inventor Takashi Hotta 7-1 Omika-cho, Hitachi City, Ibaraki Prefecture Hitachi Ltd Hitachi Research Laboratory
Claims (14)
ノードと、少なくとも1つの出力選択ノードと、前記複
数のプロセッシングノ−ドと出力選択ノ−ドとに接続す
るネットワ−クとを有し、 前記各プロセッシングノードは、前記処理を実行するデ
ータ処理手段と、データ処理手段が行う処理に関して発
生した障害を検出もしくは回復する自己診断手段と、前
記データ処理手段が実行した処理の処理結果であるデー
タと、前記自己診断手段の障害検出もしくは回復の状況
を表す障害発生情報とを前記ネットワ−クに送信する送
信手段とを備え、 前記出力選択ノードは、各プロセッシングノ−ドから前
記ネットワ−クに送信された各データ相互間の一致/不
一致を検出するデータ比較手段と、検出した各データ相
互間の一致/不一致と、各プロセッシングノ−ドから前
記ネットワ−クに送信された障害発生情報が表す各プロ
セッシングノ−ドにおける障害の検出もしくは回復の状
況とに基づき、各プロッセッシグノ−ドから前記ネット
ワ−クに送信された各データのうちの最も信頼度が高い
データを判定する判定手段と、最も信頼度が高いと判定
されたデータを出力する選択手段とを有することを特徴
とするフォールトトレラントシステム。1. A plurality of processing nodes for executing the same processing, at least one output selection node, and a network connected to the plurality of processing nodes and the output selection nodes. Each processing node includes a data processing unit that executes the process, a self-diagnosis unit that detects or recovers from a failure that occurs in the process performed by the data processing unit, and data that is a processing result of the process executed by the data processing unit. And a transmission means for transmitting fault occurrence information indicating a situation of fault detection or recovery of the self-diagnosis means to the network, and the output selection node transmits from each processing node to the network. Data comparing means for detecting a match / mismatch between the detected data, and a match / mismatch between the detected data, and Based on the status of fault detection or recovery in each processing node represented by the fault occurrence information transmitted from the processing node to the network, each data transmitted from each processing node to the network is described. A fault-tolerant system comprising: a determination unit that determines the most reliable data among them, and a selection unit that outputs the data that is determined to have the highest reliability.
テムであって、 前記プロセッシングノードは、さらに、プロセッシング
ノードの構成と、プロセッシングノードの信頼度と、前
記自己診断手段の障害検出もしくは回復のカバレッジと
のうちの少なくとも一つを表す情報であるカテゴリを、
前記データと障害発生情報と共に前記ネットワ−クに送
信する手段を有し、 前記出力選択ノードの前記判定手段は、前記検出した各
データ相互間の一致/不一致と、各プロセッシングノ−
ドから前記ネットワ−クに送信された障害発生情報が表
す各プロセッシングノ−ドにおける障害の検出もしくは
回復の状況に加え、さらに、各プロセッシングノ−ドか
ら前記ネットワ−クに送信されたカテゴリが表す、各プ
ロセッシングノードの構成と、各プロセッシングノード
の信頼度と、各プロセッシングノ−ドの前記自己診断手
段の障害検出もしくは回復のカバレッジとのうちの少な
くとも一つに基づき、各プロッセッシグノ−ドから送信
された各データのうちの最も信頼度が高いデータを判定
することを特徴とするフォールトトレラントシステム。2. The fault tolerant system according to claim 1, wherein the processing node further comprises a configuration of the processing node, reliability of the processing node, and fault detection or recovery coverage of the self-diagnosis means. A category that is information that represents at least one of
The output selection node has a means for transmitting to the network together with the data and the failure occurrence information, and the determination means of the output selection node detects whether the detected data match each other or not, and each processing node.
In addition to the status of fault detection or recovery in each processing node represented by the fault occurrence information transmitted from the network to the network, the category transmitted from each processing node to the network is further represented. , Based on at least one of the configuration of each processing node, the reliability of each processing node, and the fault detection or recovery coverage of the self-diagnosis means of each processing node, transmitted from each processing node. A fault-tolerant system characterized by determining the most reliable data among the respective data.
テムであって複数の処理の各々に毎に、それぞれ、当該
処理を実行する複数のプロセッシングノードと、前記出
力選択ノードとを備え、 前記複数のプロセッシングノードの少なくとも一部のプ
ロセッシングノ−ドは、さらに、他の各プロセッシング
ノ−ドから前記ネットワ−クに送信された各データ相互
間の一致/不一致を検出する手段と、検出した各データ
相互間の一致/不一致と他の各プロセッシングノ−ドか
ら前記ネットワ−クに送信された障害発生情報が表す他
の各プロセッシングノ−ドにおける障害の検出もしくは
回復の状況に基づき、各プロッセッシグノ−ドが実行し
ている処理のうち最も処理の信頼度が低い処理を判定
し、判定最も処理の信頼度が低い処理を前記データ処理
手段に実行させる実行処理決定手段とを有することを特
徴とするフォールトトレラントシステム。3. The fault-tolerant system according to claim 1, further comprising a plurality of processing nodes that execute the respective processes and a plurality of output selection nodes for each of the plurality of processes. The processing node of at least a part of the nodes further comprises means for detecting a match / mismatch between the data transmitted from the other processing nodes to the network, and a means for detecting the data matching between the detected data. Each processing node is executed based on the match / mismatch of each other and the status of the detection or recovery of the failure in each of the other processing nodes represented by the failure occurrence information transmitted from each of the other processing nodes to the network. The processing with the lowest processing reliability is determined, and the processing with the lowest processing reliability is determined as the data. A fault-tolerant system, comprising: an execution process determining unit that causes a processing unit to execute.
テムであって、 複数の処理の各々に毎に、それぞれ、当該処理を実行す
る複数のプロセッシングノードと、前記出力選択ノード
とを備え、 前記複数のプロセッシングノードの少なくとも一部のプ
ロセッシングノ−ドは、さらに、他の各プロセッシング
ノ−ドから前記ネットワ−クに送信された各データ相互
間の一致/不一致を検出する手段と、 検出した各データ相互間の一致/不一致と、 他の各プロセッシングノ−ドから前記ネットワ−クに送
信された障害発生情報が表す他の各プロセッシングノ−
ドにおける障害の検出もしくは回復の状況と、 他の各プロセッシングノ−ドから前記ネットワ−クに送
信された前記カテゴリが表す、各プロセッシングノ−ド
における障害の検出もしくは回復の状況と、前記カテゴ
リの表すプロセッシングノードの構成と、プロセッシン
グノードの信頼度と、前記自己診断手段の障害検出もし
くは回復のカバレッジとのうちの少なくとも一つと、 に基づき、各プロッセッシグノ−ドが実行している処理
のうち最も処理の信頼度が低い処理を判定し、判定した
最も処理の信頼度が低い処理を前記データ処理手段に実
行させる実行処理決定手段とを有することを特徴とする
フォールトトレラントシステム。4. The fault tolerant system according to claim 2, further comprising a plurality of processing nodes that execute the respective processes and a plurality of output selection nodes for each of the plurality of processes. At least a part of the processing nodes of the processing node further comprises means for detecting a match / mismatch between the data transmitted from the other processing nodes to the network, and a means for detecting the detected data mutual. Match / mismatch between the other processing nodes, and other processing nodes indicated by the failure occurrence information transmitted from the other processing nodes to the network.
Status of failure detection or recovery in each processing node, status of failure detection or recovery in each processing node represented by the category transmitted from each of the other processing nodes to the network, and the category Based on the configuration of the processing node represented, the reliability of the processing node, and at least one of the fault detection or recovery coverage of the self-diagnosis means, the most processing among the processings executed by each processing node. A fault-tolerant system, comprising: a process having a low reliability, and executing process determining means for causing the data processing unit to execute a process having the lowest reliability of the determined process.
ポ−トと、前記複数の入力ポ−トで受け取った各処理結
果を収集し、各処理結果の比較照合結果、もしくは、各
実行結果の多数決に応じて、収集した各処理結果のうち
の最も確からしい処理結果を出力する出力選択装置と、 同一の処理を複数回繰り返して実行するプロセッサと、
前記プロセッサが実行した各回の処理の処理結果を、そ
れぞれ、前記出力選択装置の異なる入力ポ−トに出力す
る手段とを備えたノ−ドとを備えたことを特徴とするフ
ォールトトレラントシステム。5. A plurality of input ports that receive the processing results and the respective processing results received by the plurality of input ports are collected, and the comparison and collation results of the respective processing results or the respective execution results are collected. An output selection device that outputs the most probable processing result among the collected processing results according to the majority decision, and a processor that repeatedly executes the same processing a plurality of times,
A fault tolerant system comprising: a node having means for outputting the processing result of each processing executed by the processor to different input ports of the output selection device.
ステムであって、 前記ノ−ドは、前記プロセッサの処理結果を、各回の処
理毎に前記出力選択装置の異なる入力ポ−トに中継する
切換手段とを有することを特徴とするフォールトトレラ
ントシステム。6. The fault tolerant system according to claim 5, wherein said node relays a processing result of said processor to a different input port of said output selecting device for each processing. A fault-tolerant system having a switching means.
ステムであって、 前記ノ−ドは、前記プロセッサの各回の処理結果が、そ
れぞれ入力される複数の出力ポ−トを有し、 前記複数の出力ポ−トは、入力された処理結果を、前記
出力選択装置の、それぞれ異なる入力ポ−トに出力する
ことを特徴とするフォールトトレラントシステム。7. The fault tolerant system according to claim 5, wherein said node has a plurality of output ports to which the processing results of each time of said processor are inputted, respectively. Is a fault tolerant system, wherein the input processing result is output to different input ports of the output selection device.
ステムであって、 前記ノ−ドは、前記プロセッサの処理結果が入力される
複数の出力ポ−トと、前記プロセッサの処理結果が入力
される出力ポ−トを各回の処理毎に強制的に切り替える
手段とを有し、 前記複数の出力ポ−トは、入力された処理結果を、前記
出力選択装置の、それぞれ異なる入力ポ−トに出力する
ことを特徴とするフォールトトレラントシステム。8. The fault tolerant system according to claim 5, wherein the node receives a plurality of output ports to which the processing results of the processor are input, and the processing results of the processor. And a means for forcibly switching the output port for each processing, wherein the plurality of output ports output the input processing results to different input ports of the output selection device. A fault tolerant system characterized by outputting.
を用いながら繰り返して実行するプロセッサと、前記プ
ロセッサが用いるメモリ上の領域を各回の処理毎に強制
的に切り替える手段とを備えたノ−ドと、 前記プロセッサが実行した各回の処理の実行結果を収集
し、各実行結果の比較照合結果、もしくは、各実行結果
の多数決に応じて、収集した各実行結果のうちの最も確
からしい処理結果を出力する出力選択装置とを備えたこ
とを特徴とするフォールトトレラントシステム。9. A memory comprising: a memory; a processor for repeatedly executing the same processing a plurality of times while using the memory; and means for forcibly switching an area on the memory used by the processor for each processing. And the execution result of each processing executed by the processor, and the most probable processing among the collected execution results according to the comparison and collation result of each execution result or the majority decision of each execution result. A fault-tolerant system, comprising: an output selection device that outputs a result.
トトレラントシステムであって、 前記プロセッサは、各回の処理毎に初期化されることを
特徴とするフォールトトレラントシステム。10. The fault tolerant system according to claim 6, 8 or 9, wherein the processor is initialized for each processing.
し、 前記各ノ−ドは、同一の処理を複数回繰り返して実行す
るプロセッサを備え、 前記出力装置は、各プロセッサの各回の処理の処理結果
を収集し、同一のノードで実行された複数回の処理の処
理結果のうち過半数の処理結果が一致し、かつ、当該一
致した処理結果が、他のノードで実行された複数回の処
理の処理結果のうちの少なくとも1つの処理結果と一致
した場合に、当該一致した処理結果を選択し出力するこ
とを特徴とするフォールトトレラントシステム。11. A plurality of nodes and an output selection device, each node comprising a processor for repeating the same processing a plurality of times, and the output device each time of each processor. The processing results of the process are collected, the processing results of the majority of the processing results of the processing performed a plurality of times on the same node match, and the matching processing results are A fault-tolerant system, which selects and outputs the matched processing result when at least one processing result among the processing results of the second processing matches.
システムであって、 出力装置は、各プロセッサの各回の処理の処理結果を収
集し、同一のノードで実行された複数回の処理の処理結
果のうち過半数の処理結果が一致する処理結果であっ
て、かつ、他のノードで実行された複数回の処理の処理
結果のうちの少なくとも1つの処理結果と一致する処理
結果が存在しない場合に、警報を示す値の信号を出力す
ることを特徴とするフォールトトレラントシステム。12. The fault tolerant system according to claim 11, wherein the output device collects processing results of each processing of each processor, and outputs the processing results of a plurality of processings executed by the same node. If there is no processing result that matches the processing results of the majority of the processing results, and there is no processing result that matches at least one processing result among the processing results of the plurality of processing executed in other nodes, A fault-tolerant system that outputs a signal of the indicated value.
システムであって、 出力装置は、各プロセッサの各回の処理の処理結果を収
集し、同一のノードで実行された複数回の処理の処理結
果のうち過半数の処理結果が一致する処理結果であっ
て、かつ、他のノードで実行された複数回の処理の処理
結果のうちの少なくとも1つの処理結果と一致する処理
結果が存在しない場合に、当該出力装置の出力によって
制御される対象を、比較的に安全に動作させる信号を出
力することを特徴とするフォールトトレラントシステ
ム。13. The fault tolerant system according to claim 11, wherein the output device collects a processing result of each processing of each processor, and outputs the processing results of a plurality of processing executed by the same node. If there are no processing results that match the processing results of the majority of the processing results, and there is no processing result that matches at least one processing result of the processing results of multiple times executed by other nodes, A fault tolerant system, which outputs a signal for operating an object controlled by the output of the device relatively safely.
グノードと、少なくとも1つの出力選択ノードと、前記
複数のプロセッシングノ−ドと出力選択ノ−ドとに接続
するネットワ−クとを有し、 前記各プロセッシングノードは、前記処理を実行するデ
ータ処理手段と、データ処理手段が行う処理に関して発
生した障害を検出もしくは回復する自己診断手段と、前
記データ処理手段が実行した処理の処理結果であるデー
タと、前記自己診断手段の障害検出もしくは回復の状況
を表す障害発生情報とを前記ネットワ−クに送信する送
信手段とを備え、 前記出力選択ノードは、 各プロセッシングノ−ドから前記ネットワ−クに送信さ
れた各データ相互間の一致/不一致を検出し、検出した
各データ相互間の一致/不一致と、各プロセッシングノ
−ドから前記ネットワ−クに送信された障害発生情報が
表す各プロセッシングノ−ドにおける障害の検出もしく
は回復の状況とに基づき、各プロッセッシグノ−ドから
前記ネットワ−クに送信された各データのうちの最も信
頼度が高いデータを判定し、最も信頼度が高いと判定さ
れたデータを前記処理結果として出力する処理を理を複
数回繰り返して実行するプロセッサと、 前記プロセッサが実行した各回の処理の実行結果を収集
し、各実行結果の比較照合結果、もしくは、各実行結果
の多数決に応じて、収集した各実行結果のうちの最も確
からしい処理結果を出力する出力選択装置とを備えたこ
とを特徴とするフォールトトレラントシステム。14. A plurality of processing nodes performing the same processing, at least one output selection node, and a network connected to the plurality of processing nodes and the output selection nodes, Each processing node includes a data processing unit that executes the process, a self-diagnosis unit that detects or recovers from a failure that occurs in the process performed by the data processing unit, and data that is a processing result of the process executed by the data processing unit. And a transmission means for transmitting failure occurrence information indicating the status of failure detection or recovery of the self-diagnosis means to the network, and the output selection node transmits from each processing node to the network. Matches / mismatches between the detected data are detected, and the detected match / mismatch between the data and each processing Of the data transmitted from each processing node to the network based on the detection or recovery status of the fault in each processing node represented by the fault occurrence information transmitted from the network to the network. A processor that repeats the process of determining the data with the highest reliability and outputting the data determined to have the highest reliability as the processing result a plurality of times, and the execution of each processing executed by the processor It is equipped with an output selection device that collects results and outputs the most probable processing result of the collected execution results according to the comparison and collation result of each execution result or the majority decision of each execution result. Fault tolerant system.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7119858A JPH08314744A (en) | 1995-05-18 | 1995-05-18 | Fault tolerant system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7119858A JPH08314744A (en) | 1995-05-18 | 1995-05-18 | Fault tolerant system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH08314744A true JPH08314744A (en) | 1996-11-29 |
Family
ID=14772024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7119858A Pending JPH08314744A (en) | 1995-05-18 | 1995-05-18 | Fault tolerant system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH08314744A (en) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100408291B1 (en) * | 2001-08-08 | 2003-12-01 | 삼성전자주식회사 | Fault and noise tolerant system and method thereof |
JP2009217504A (en) * | 2008-03-10 | 2009-09-24 | Hitachi Ltd | Computer system, computer control method and computer control program |
JP2010009327A (en) * | 2008-06-27 | 2010-01-14 | Hitachi Ltd | Collation system |
JP2010244129A (en) * | 2009-04-01 | 2010-10-28 | Hitachi Ltd | Computer system |
JP2011076262A (en) * | 2009-09-29 | 2011-04-14 | Hitachi Ltd | Computer system and method therefor |
WO2011138886A1 (en) * | 2010-05-06 | 2011-11-10 | 株式会社日立製作所 | Fault tolerant computer system and data access method |
JP2012008819A (en) * | 2010-06-25 | 2012-01-12 | Hitachi Ltd | Computer system and management method for computer |
WO2012032572A1 (en) | 2010-09-08 | 2012-03-15 | 株式会社日立製作所 | Computing device |
WO2012127652A1 (en) | 2011-03-23 | 2012-09-27 | 株式会社日立製作所 | Computer system, data processing method, and data processing program |
JP2017502389A (en) * | 2013-12-03 | 2017-01-19 | ローベルト ボッシュ ゲゼルシャフト ミット ベシュレンクテル ハフツング | Control device for vehicle |
JP2017527895A (en) * | 2014-08-04 | 2017-09-21 | ヨジテック・ソシエタ・ペル・アチオニYOGITECH Spa | Method, corresponding system, and computer program product for executing a program in an electronic system for functional safety applications, including a plurality of processors |
WO2020217589A1 (en) * | 2019-04-26 | 2020-10-29 | Necスペーステクノロジー株式会社 | Basic logical element, semiconductor device provided with basic logical element, output control method for basic logical element, and non-transitory computer readable medium |
-
1995
- 1995-05-18 JP JP7119858A patent/JPH08314744A/en active Pending
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100408291B1 (en) * | 2001-08-08 | 2003-12-01 | 삼성전자주식회사 | Fault and noise tolerant system and method thereof |
JP2009217504A (en) * | 2008-03-10 | 2009-09-24 | Hitachi Ltd | Computer system, computer control method and computer control program |
JP2010009327A (en) * | 2008-06-27 | 2010-01-14 | Hitachi Ltd | Collation system |
JP2010244129A (en) * | 2009-04-01 | 2010-10-28 | Hitachi Ltd | Computer system |
JP2011076262A (en) * | 2009-09-29 | 2011-04-14 | Hitachi Ltd | Computer system and method therefor |
WO2011138886A1 (en) * | 2010-05-06 | 2011-11-10 | 株式会社日立製作所 | Fault tolerant computer system and data access method |
JP2011237846A (en) * | 2010-05-06 | 2011-11-24 | Hitachi Ltd | Fault tolerant computer system and data access method |
JP2012008819A (en) * | 2010-06-25 | 2012-01-12 | Hitachi Ltd | Computer system and management method for computer |
WO2012032572A1 (en) | 2010-09-08 | 2012-03-15 | 株式会社日立製作所 | Computing device |
JP5707409B2 (en) * | 2010-09-08 | 2015-04-30 | 株式会社日立製作所 | calculator |
WO2012127652A1 (en) | 2011-03-23 | 2012-09-27 | 株式会社日立製作所 | Computer system, data processing method, and data processing program |
JP5416863B2 (en) * | 2011-03-23 | 2014-02-12 | 株式会社日立製作所 | Computer system, data processing method, and data processing program |
JP2017502389A (en) * | 2013-12-03 | 2017-01-19 | ローベルト ボッシュ ゲゼルシャフト ミット ベシュレンクテル ハフツング | Control device for vehicle |
JP2017527895A (en) * | 2014-08-04 | 2017-09-21 | ヨジテック・ソシエタ・ペル・アチオニYOGITECH Spa | Method, corresponding system, and computer program product for executing a program in an electronic system for functional safety applications, including a plurality of processors |
WO2020217589A1 (en) * | 2019-04-26 | 2020-10-29 | Necスペーステクノロジー株式会社 | Basic logical element, semiconductor device provided with basic logical element, output control method for basic logical element, and non-transitory computer readable medium |
JPWO2020217589A1 (en) * | 2019-04-26 | 2021-09-13 | Necスペーステクノロジー株式会社 | Basic logic element, semiconductor device equipped with it, output control method and control program of basic logic element |
US11899062B2 (en) | 2019-04-26 | 2024-02-13 | Nec Space Technologies, Ltd. | Basic logic element, semiconductor device including the same, output control method for basic logic element, and non-transitory computer readable medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3229070B2 (en) | Majority circuit and control unit and majority integrated semiconductor circuit | |
JP5127491B2 (en) | Storage subsystem and control method thereof | |
US7689882B2 (en) | Fault diagnosis in relaying data among a plurality of networks | |
JPH08314744A (en) | Fault tolerant system | |
US9317359B2 (en) | Reliable, low latency hardware and software inter-process communication channel for safety critical system | |
KR20080016435A (en) | Memory controller and method of controlling memory | |
CN110166354B (en) | Data processing system containing network-on-chip fault-tolerant routing | |
US20020144181A1 (en) | Method for managing an uncorrectable, unrecoverable data error (UE) as the UE passes through a plurality of devices in a central electronics complex | |
CN108983682B (en) | Redundancy voting control method based on double buses | |
US11080161B2 (en) | Control device, and processing method in event of failure in control device | |
US20150012781A1 (en) | Power supply diagnostic strategy | |
US20070271486A1 (en) | Method and system to detect software faults | |
CN111142367B (en) | Control system for railway safety application | |
KR20100086211A (en) | Gateway device for car | |
Zhu | Reliability and availability analysis for large networking system | |
Schepers | Terminology and paradigms for fault tolerance | |
JP2005143015A (en) | Remote input/output device | |
Reindl et al. | Comparative Reliability Analysis for Single and Dual CAN (FD) Systems | |
KR100807095B1 (en) | Structure of predictive hybrid redundancy using exponential smoothing method | |
JPH10233700A (en) | Crc error check method, crc error check system, monitor control method and monitor control system | |
Proenza et al. | Using FTT and stars to simplify node replication in CAN-based systems | |
CN112769591B (en) | Effective anti-interference and error-proof daisy chain communication processing method | |
JP2005250577A (en) | Computer system and soundness determination means of arithmetic processing module | |
JPH0563683A (en) | Redundancy system switching device for digital transmission | |
US20240281319A1 (en) | Method for operating a safety-critical computer system |