JP3279004B2 - Redundant resource management method and distributed fault tolerant computer system using the same - Google Patents

Redundant resource management method and distributed fault tolerant computer system using the same

Info

Publication number
JP3279004B2
JP3279004B2 JP25801393A JP25801393A JP3279004B2 JP 3279004 B2 JP3279004 B2 JP 3279004B2 JP 25801393 A JP25801393 A JP 25801393A JP 25801393 A JP25801393 A JP 25801393A JP 3279004 B2 JP3279004 B2 JP 3279004B2
Authority
JP
Japan
Prior art keywords
task
computer
computer module
fij
executed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25801393A
Other languages
Japanese (ja)
Other versions
JPH07114520A (en
Inventor
信康 金川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP25801393A priority Critical patent/JP3279004B2/en
Priority to KR1019940026329A priority patent/KR100375691B1/en
Publication of JPH07114520A publication Critical patent/JPH07114520A/en
Application granted granted Critical
Publication of JP3279004B2 publication Critical patent/JP3279004B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、冗長資源の管理の方法
にかかり、特にフォールトトレラントコンピュータシス
テムにおける冗長資源の効率的利用に関するものであ
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for managing redundant resources, and more particularly to an efficient use of redundant resources in a fault-tolerant computer system.

【0002】[0002]

【従来の技術】コンピュータが交通管制や、金融などの
社会の中枢ともいえる役割や、宇宙船や航空機の制御等
の人命にかかわる役割を担うようになり、コンピュータ
の故障による停止や誤動作が大きな影響を波及するよう
になってきている。このような時代のすう勢の中で、コ
ンピュータの信頼性が益々求められるようになってきて
いる。
2. Description of the Related Art Computers play a role in the center of society such as traffic control and finance, and also play a role in human life such as control of spacecraft and aircraft. Is spreading. In such an era, computer reliability is increasingly required.

【0003】コンピュータを高信頼化するために、フォ
ールト発生に備えてコンピュータやコンピュータを構成
するユニットを予め余分に用意しておく冗長化という手
段が広く用いられている。
In order to increase the reliability of a computer, a means of redundancy in which an extra computer or a unit constituting the computer is prepared in advance for the occurrence of a fault is widely used.

【0004】一方、コンピュータの高信頼化の為に冗長
なハードウエアを持たせることは、コスト,寸法,重
量,消費電力の大幅な増加につながる。そこで、フォー
ルトトレラントコンピュータシステムへの投資効率すな
わちコストパフォーマンスを高めるためには、冗長ハー
ドウエア資源を信頼性向上,処理性能向上のために有効
利用することが求められる。
On the other hand, providing redundant hardware for high reliability of a computer leads to a large increase in cost, size, weight, and power consumption. Therefore, in order to increase the investment efficiency, that is, the cost performance, of the fault-tolerant computer system, it is required to effectively use the redundant hardware resources for improving the reliability and the processing performance.

【0005】冗長ハードウエア資源を有効利用するため
の冗長資源管理方法として、文献(Jean−Charles Fabr
e,et al.:“Saturation:reduced idleness for impro
vedfault−tolerance,"Proc.FTCS−18(The 18th Int'
1 Symp.on Fault−tolerantComputing),pp.200−205
(1988))が従来から提案されている。
As a redundant resource management method for effectively utilizing redundant hardware resources, a literature (Jean-Charles Fabr
e, et al .: “Saturation: reduced idleness for impro
vedfault-tolerance, "Proc. FTCS-18 (The 18th Int '
1 Symp.on Fault-tolerantComputing), pp.200-205
(1988)).

【0006】本従来技術によれば、タスクごとに同時に
実行する冗長コピーの最小必要数すなわちMNC(Mini
mum Number of Copies)を予め定めておき、タスク実行
要求メッセージが到達したとき、空いている(idle状態
の)ノード(冗長コンピュータモジュール)の数がMN
Cよりも大きい場合には該空きノードでタスク実行を開
始する。もし、空きノードの数がMNCよりも小さい場
合には現在実行しているタスクが終了し、必要な数の空
きノードが出るまで待つ。
According to the prior art, the minimum required number of redundant copies executed simultaneously for each task, that is, the MNC (Minimum Copy)
mum Number of Copies) is determined in advance, and when the task execution request message arrives, the number of vacant (idle) nodes (redundant computer modules) is MN.
If the value is larger than C, task execution is started at the empty node. If the number of free nodes is smaller than the MNC, the task currently being executed ends, and the system waits until the required number of free nodes is output.

【0007】[0007]

【発明が解決しようとする課題】前記文献に示されてい
る従来技術は、タスク開始要求が頻繁に生じるOLTP
(On−line Transaction Processor)には好適な冗長資
源管理方法である。
The prior art disclosed in the above-mentioned document is based on the OLTP in which task start requests frequently occur.
(On-line Transaction Processor).

【0008】従来技術はリアルタイム制御用コンピュー
タの高信頼化に際して、タスク実行中のフォールト発
生、さらには多重フォールトの発生については十分な考
慮がされていない。これは、トランザクションが短時間
で終了するというOLTPの性質から、タスク実行時間
が平均故障間隔MTBF(Mean Time Between Failure)
と比べて十分に短いという仮定のもとに従来技術が提案
されているからである。しかし、リアルタイム制御用コ
ンピュータの場合、タスクが長時間連続して実行される
ことが多い。例えば、航空機,宇宙船等ではそのミッシ
ョンタイムの間、コンピュータは正常に動作を続けなけ
ればならないばかりでなく、ミッションを中断するのに
もコンピュータの支援を必要とする。そのためタスク実
行時間は平均故障間隔MTBFと比べ無視できず、タス
ク実行途中でのフォールトの発生、さらには多重フォー
ルトの発生について考慮する必要が出てくる。
In the prior art, when the reliability of a real-time control computer is increased, the occurrence of a fault during the execution of a task and the occurrence of multiple faults are not sufficiently considered. This is because of the nature of OLTP that transactions are completed in a short time, task execution time is mean time between failures (MTBF).
This is because the prior art has been proposed on the assumption that it is sufficiently shorter than. However, in the case of a real-time control computer, tasks are often executed continuously for a long time. For example, in an aircraft, a spacecraft, or the like, the computer must not only normally operate during the mission time, but also require the assistance of the computer to interrupt the mission. Therefore, the task execution time cannot be ignored as compared with the mean time between failures MTBF, and it is necessary to consider the occurrence of a fault during the task execution and the occurrence of multiple faults.

【0009】従来技術では、割り当てるコンピュータモ
ジュールの数を管理するのはタスク実行開始時のみであ
る。従ってタスク実行中にフォールト発生によるタスク
を実行しているコンピュータモジュールの機能が失われ
ても、新たにコンピュータモジュールを追加するような
ことはない。つまり、タスク実行中にフオールトが発生
した場合には、冗長度(タスクを冗長に実行しているコ
ンピュータモジュールの数)が減少したままタスク実行
を続けることになり、当該タスクの信頼度が損なわれ
る。例えば、2つのコンピュータモジュールが冗長にタ
スクを実行しているとき2つのうち1つのコンピュータ
モジュールに故障が発生した場合、万一第2のフォール
トが引き続いて発生すればタスクの実行は中断されるこ
とになる。本発明の目的は、タスク実行途中でのフォー
ルトの発生、さらには多重フォールトの発生に対処でき
る冗長資源の管理方法及びそれを用いた分散型フォール
トトレラントコンピュータシステムを提供することにあ
る。
In the prior art, the number of computer modules to be allocated is managed only at the start of task execution. Therefore, even if the function of the computer module executing the task due to the occurrence of a fault is lost during the task execution, no new computer module is added. In other words, if a fault occurs during the execution of a task, the task execution is continued with the redundancy (the number of computer modules executing the task redundantly) reduced, and the reliability of the task is impaired. . For example, if a failure occurs in one of the two computer modules when two computer modules are redundantly executing a task, the execution of the task may be interrupted if a second fault continues to occur. become. An object of the present invention is to provide a redundant resource management method capable of coping with the occurrence of a fault during the execution of a task and the occurrence of multiple faults, and a distributed fault-tolerant computer system using the same.

【0010】[0010]

【課題を解決するための手段】本発明は、複数のタスク
を複数のコンピュータモジュールに割当て実行する分散
型フォールトトレラントコンピュータシステムにおい
て、システム内の任意のコンピュータモジュールに故障
が発生した場合に、その故障が発生したコンピュータモ
ジュールが実行していたタスクと異なるタスクを予め割
り当てられていた他のコンピュータモジュールの中から
少なくとも1以上のコンピュータモジュールを選択し、
この選択したコンピュータモジュールに対し、故障が発
生したコンピュータモジュールが実行していたタスクを
割当て実行させる選択実行手段を設けたことを特徴とす
る。
SUMMARY OF THE INVENTION The present invention relates to a distributed fault-tolerant computer system in which a plurality of tasks are assigned to a plurality of computer modules and executed. Selecting at least one or more computer modules from among other computer modules to which a task different from the task executed by the computer module in which the error occurred has been assigned in advance;
Selective execution means is provided for allocating and executing a task executed by the failed computer module to the selected computer module.

【0011】尚、本発明における各コンピュータモジュ
ールは、具体的には、以下のような構成をとるものであ
る。
Each of the computer modules according to the present invention specifically has the following configuration.

【0012】(1)それぞれのコンピュータモジュールは
タスク処理中は常に適当なタイミング(チェックポイン
ト)で自コンピュータモジュールについてのフォールト
発生情報(フォールト検出結果)、処理結果を他のコン
ピュータモジュールにブロードキャストする。
(1) Each computer module broadcasts fault occurrence information (fault detection result) and its processing result of its own computer module to other computer modules at an appropriate timing (checkpoint) during task processing.

【0013】(2)それぞれのコンピュータモジュール
は、他のコンピュータモジュールからブロードキャスト
されたフォールト発生情報(フォールト検出結果)、お
よび処理結果の一致/不一致の情報に基づき各タスクに
ついての信頼度の余裕度を表す評価関数Fij(i:コン
ピュータモジュールの番号,j:タスクの番号)を推定
する。
(2) Each computer module determines a margin of reliability for each task based on fault occurrence information (fault detection result) broadcast from another computer module and information on matching / mismatching of processing results. Estimate an evaluation function Fij (i: computer module number, j: task number) to represent.

【0014】(3)それぞれのコンピュータモジュール
は、評価関数Fijを最小にするタスクjを実行すべき処
理として決定し、実行している処理を前記実行すべき処
理に切り替える。
(3) Each computer module determines a task j that minimizes the evaluation function Fij as a process to be executed, and switches the executed process to the process to be executed.

【0015】なおここで、評価関数Fijは各タスクにつ
いての信頼度の余裕度を表すので、タスクの重要度が高
いほどFijは低く、コンピュータモジュールのタスクに
対する責任度が高いほどFijは低く、タスクの信頼度が
高いほどFijは高くなるように定める。
Here, since the evaluation function Fij represents a margin of reliability for each task, the higher the importance of the task, the lower the Fij, and the higher the responsibility of the computer module for the task, the lower the Fij. Is determined so that the higher the reliability of is, the higher the Fij becomes.

【0016】例えば、以下のように定めれば以上の条件
を満たすことができる。
For example, the above conditions can be satisfied by determining as follows.

【0017】Fij=Lrj−Lthij または、 Fij=Lrj/Lthij ただし、Lthij:コンピュータモジュールiにおけるタ
スクjの信頼度レベルのしきい値 Lrj:タスクjの信頼度レベル i:自コンピュータモジュールの番号 j:タスクの番号 または、 Fij=log{(1−Lthij)/Pej} ただし、Pej:タスクjの結果が誤っている確率 なおここでタスクjの信頼度レベルのしきい値Lthijは
タスクによって異なり、より高い信頼度の要求される重
要な(重要度の高い)タスクほど大きな値のLthijが設
定される。
Fij = Lrj-Lthij or Fij = Lrj / Lthij where Lthij: threshold value of the reliability level of task j in computer module i Lrj: reliability level of task j i: number of own computer module j: Task number or Fij = log {(1-Lthij) / Pej} where Pej is the probability that the result of task j is wrong. Here, the threshold value Lthij of the reliability level of task j differs depending on the task. A larger value of Lthij is set for an important (higher importance) task requiring higher reliability.

【0018】さらにLthijはコンピュータモジュールi
によって異なり、タスクについて責任度の高いコンピュ
ータモジュールほど高いLthijが設定される。
Further, Lthij is a computer module i
Lthij is set higher for a computer module having higher responsibility for a task.

【0019】[0019]

【作用】本発明によれば、常に評価関数Fijがバランス
するように各タスクにコンピュータモジュールが割り当
てられるので、特定のタスクのFijが突出して大きくな
ったり小さくなったりすることがない。つまり、動作中
にフォールト発生により信頼度レベルが低下した特定の
タスク(以下危険タスクと呼ぶことにする)がある場合
には、信頼度の面で余裕のある他のタスクを実行してい
るコンピュータモジュールが危険タスクを実行するの
で、特定のタスクのみの信頼度レベル低下を防ぐことが
できる。したがって、タスク実行中のフォールトの発生
に対処し、信頼性を維持しながらシステムに与えられた
責務を果たすことができる。
According to the present invention, a computer module is assigned to each task so that the evaluation function Fij is always balanced, so that the Fij of a specific task does not increase or decrease. In other words, if there is a specific task whose reliability level has been reduced due to the occurrence of a fault during operation (hereinafter, referred to as a dangerous task), a computer that is executing another task that has a margin in terms of reliability. Since the module executes a dangerous task, it is possible to prevent the reliability level of only a specific task from being lowered. Therefore, it is possible to cope with the occurrence of a fault during the execution of a task and fulfill the responsibility given to the system while maintaining reliability.

【0020】また、重要度の高いタスクほどLthijが高
く設定されるので、より高いLrjで他のタスクとFijが
バランスする。従って、重要度の高いタスクほど多くの
コンピュータモジュールを割当てることにより高い信頼
度レベルLrjを維持することができる。
Since Lthij is set higher for a task having a higher importance, Fij is balanced with another task at a higher Lrj. Therefore, a higher reliability level Lrj can be maintained by assigning more computer modules to tasks with higher importance.

【0021】さらに各コンピュータモジュールが自律的
に実行すべきタスクを決定することができるので、タス
ク実行を割り振るための中枢的な機構が不要で、単一故
障点が無い。したがって単一のフォールトによりシステ
ム全体が障害を受けることが無く、システムの信頼性を
向上させることができる。
Further, since each computer module can autonomously determine a task to be executed, a central mechanism for allocating task execution is not required, and there is no single point of failure. Therefore, the entire system is not damaged by a single fault, and the reliability of the system can be improved.

【0022】[0022]

【実施例】以下、図に従い本発明の実施例について説明
を加える。
BRIEF DESCRIPTION OF THE DRAWINGS FIG.

【0023】〈動作概念〉図4は本発明の実施例を模式
的に示したものである。図4では例として、コンピュー
タモジュール101〜10(i−1)が冗長にタスク1
を実行し、コンピュータモジュール10i〜10mが冗
長にタスク2を実行しており、コンピュータモジュール
10(i−1)でフォールト(障害)が発生し、正常な
動作が不可能になった場合を想定している。本実施例に
よれば、コンピュータモジュール10(i−1)でフォ
ールト(障害)が発生し、正常な動作が不可能になった
場合には、コンピュータモジュール10iがタスク2の
実行を中止して、タスク1の実行を開始する。従って、
コンピュータモジュール10(i−1)の障害によりタ
スク1を実行しているコンピュータモジュールの数が大
幅に減少することを緩和し、タスク1の信頼度の大幅な
低下を防止することができる。
<Operation Concept> FIG. 4 schematically shows an embodiment of the present invention. In FIG. 4, as an example, the computer modules 101 to 10 (i-1) redundantly execute the task 1
Is executed, the computer modules 10i to 10m redundantly execute the task 2, and assume that a fault (failure) occurs in the computer module 10 (i-1) and normal operation becomes impossible. ing. According to the present embodiment, when a fault (failure) occurs in the computer module 10 (i-1) and normal operation becomes impossible, the computer module 10i stops execution of the task 2, and Start execution of task 1. Therefore,
It is possible to alleviate a significant decrease in the number of computer modules executing the task 1 due to the failure of the computer module 10 (i-1), and to prevent a significant decrease in the reliability of the task 1.

【0024】図5は図4のコンピュータモジュール10
iのタスク切り替えの判断に評価関数F1,F2を導入
した実施例である。ここで評価関数F1,F2はそれぞ
れタスク1,タスク2の信頼度を反映したものとする。
なお、評価関数の定め方については後述する。まず図5
の左側では、タスク1を実行しているコンピュータモジ
ュール10(i−1)でフォールトが発生したため、評
価関数F1(信頼度)が低下してF2よりも低下する。
そこで図5の左側のように、タスク2を実行しているコ
ンピュータモジュールの中のコンピュータモジュール1
0iがタスク1の実行に加わり、評価関数F1,F2が
ほぼ同じ値となる。なお、フォールト発生に伴い評価関
数の値に大きな差が生じた場合に、どのコンピュータモ
ジュールで実行しているタスクを変えるかの判断は、あ
らかじめ各コンピュータモジュールの各タスクに対して
の責任度を定めておくことにより決定づけられる。本実
施例では、タスク2を実行しているコンピュータモジュ
ール10i〜10mの中ではコンピュータモジュール1
0iがタスク1に対する責任度が最も高い。
FIG. 5 shows the computer module 10 of FIG.
This is an embodiment in which evaluation functions F1 and F2 are introduced in the determination of task switching of i. Here, the evaluation functions F1 and F2 reflect the reliability of task 1 and task 2, respectively.
How to determine the evaluation function will be described later. First, FIG.
On the left side of, since a fault has occurred in the computer module 10 (i-1) executing the task 1, the evaluation function F1 (reliability) is reduced to be lower than F2.
Therefore, as shown on the left side of FIG. 5, the computer module 1 among the computer modules executing the task 2
0i is added to the execution of the task 1, and the evaluation functions F1 and F2 have substantially the same value. If a large difference occurs in the value of the evaluation function due to the occurrence of a fault, the determination of which computer module is to change the task being executed is determined in advance by determining the degree of responsibility for each task of each computer module. It is decided by keeping. In this embodiment, among the computer modules 10i to 10m executing the task 2, the computer module 1
0i has the highest responsibility for task 1.

【0025】以上述べた冗長資源管理機能、すなわち、
タスク切り替え機能,判断機能を担うハードウエアが冗
長化されておらず単一であると、当該ハードウエアの故
障により冗長資源管理機能をもとよりシステム全体の正
常動作が妨げられるおそれがある。そこで、冗長資源管
理機能を担うハードウエア自体を冗長化することが必要
である。冗長化の方法としては以下の3つの方法があ
る。
The redundant resource management function described above, that is,
If the hardware that performs the task switching function and the judgment function is not redundant and is single, the failure of the hardware may hinder the normal operation of the entire system based on the redundant resource management function. Therefore, it is necessary to make the hardware itself responsible for the redundant resource management function redundant. There are the following three methods for redundancy.

【0026】(1)専用のハードウエアに冗長資源管理機
能を担わせ、そのハードウエアを冗長化する方法。
(1) A method in which dedicated hardware is assigned a redundant resource management function to make the hardware redundant.

【0027】(2)コンピュータモジュール101〜10
(i−1)のうちの複数のコンピュータモジュールに冗
長資源管理機能を担わせ、どのコンピュータモジュール
に冗長資源管理機能を担わせるかという判断,制御を冗
長資源管理機能により実現する方法。
(2) Computer modules 101 to 10
(I-1) A method of causing a plurality of computer modules to perform the redundant resource management function and determining and controlling which computer module is to perform the redundant resource management function by the redundant resource management function.

【0028】(3)コンピュータモジュール101〜10
(i−1)それぞれに自律的に自コンピュータモジュー
ルで実行すべきタスクを判断し、実行する冗長資源管理
機能を持たせる方法。
(3) Computer modules 101 to 10
(I-1) A method of autonomously determining a task to be executed by the own computer module and providing a redundant resource management function to execute the task.

【0029】(1)の方法は、図4,図5に示す冗長資源
管理機能を実現するためのハードウエアまたはハードウ
エア及びソフトウエアを複数用意すれば実現できる。ま
た、(2)の方法は図4,図5に示す冗長資源管理機能を
行うタスクを複数のコンピュータモジュールに割当て
て、このタスクも他のタスクと同様に冗長資源管理の対
象とすればよい。続いて(3)の方法の実施例を以下に述
べる。
The method (1) can be realized by preparing hardware or a plurality of hardware and software for realizing the redundant resource management function shown in FIGS. In the method (2), a task for performing the redundant resource management function shown in FIGS. 4 and 5 may be assigned to a plurality of computer modules, and this task may be subjected to redundant resource management like other tasks. Subsequently, an embodiment of the method (3) will be described below.

【0030】図6はフォールト発生に伴い評価関数の値
に大きな差が生じた場合に、評価関数の低下したタスク
の実行に加えるかどうかを各コンピュータモジュールが
単独に独立して判断する実施である。コンピュータモジ
ュール101〜10mは各々評価関数Fij(i:プロセ
ッサの番号,j:タスクの番号)を計算している。ここ
で、評価関数Fijはタスクjに対する責任度の高いコン
ピュータモジュールほど低くなるように定義するものと
する。すなわち、評価関数Fijは、各タスクに対しての
各コンピュータモジュールが果たすべき責任の余裕度と
考えることができる。例えば、図6ではコンピュータモ
ジュール101,…,10mの順にタスク1に対する責
任度が高く、タスク2に対する責任度が低いので、図6
の左側のように全てのコンピュータモジュールが正常な
時でもF11<F21<…<Fm1,F12>F22…>Fm2とな
る。コンピュータモジュール101〜10(i−1)で
はFij<Fi2が成立ち、コンピュータモジュール10i
〜10mではFi1>Fi2が成立つためそれぞれタスク
1,タスク2を実行している。
FIG. 6 shows an embodiment in which, when a large difference occurs in the value of the evaluation function due to the occurrence of a fault, each computer module independently determines whether or not to add to the execution of the task whose evaluation function has been lowered. . Each of the computer modules 101 to 10m calculates an evaluation function Fij (i: processor number, j: task number). Here, it is assumed that the evaluation function Fij is defined to be lower as the computer module has higher responsibility for the task j. That is, the evaluation function Fij can be considered as a margin of responsibility to be fulfilled by each computer module for each task. For example, in FIG. 6, the responsibility for task 1 is high and the responsibility for task 2 is low in the order of the computer modules 101,.
F11 <F21 <... <Fm1, F12> F22 ...> Fm2 even when all the computer modules are normal as shown on the left side of FIG. In the computer modules 101 to 10 (i-1), Fij <Fi2 holds and the computer module 10i
At 10 to 10 m, since Fi1> Fi2 holds, task 1 and task 2 are executed, respectively.

【0031】図6の中央のようにコンピュータモジュー
ル10(i−1)でフォールトが発生した場合には全て
のコンピュータモジュールにおいてFi1の値が低下し、
コンピュータモジュール10iでは、Fi1,Fi2の間の
大小関係が反転し、Fi1<Fi2となる。従って図6の右
に示すようにコンピュータモジュール10iは独自の判
断によりタスク2の実行を中止してタスク1を開始す
る。以上のように本実施例によれば、それぞれのコンピ
ュータモジュールが自律的に独自の判断で実行している
タスクを切り替えているので、システム全体の冗長資源
管理機能が集中した、いわゆるマネージャーが存在しな
いので、信頼性向上の上であい路となる単一故障点がな
く、冗長資源管理機能自体の信頼性を高めることができ
る。
When a fault occurs in the computer module 10 (i-1) as shown in the center of FIG. 6, the value of Fi1 decreases in all the computer modules,
In the computer module 10i, the magnitude relationship between Fi1 and Fi2 is inverted, and Fi1 <Fi2. Therefore, as shown on the right side of FIG. 6, the computer module 10i stops execution of task 2 and starts task 1 by its own judgment. As described above, according to the present embodiment, since each computer module autonomously switches the task executed by its own judgment, there is no so-called manager in which the redundant resource management function of the entire system is concentrated. Therefore, there is no single point of failure, which is a path for improving reliability, and the reliability of the redundant resource management function itself can be improved.

【0032】以上図4から図6に示す実施例では簡単の
ためにシステム内ではタスク1とタスク2の2つしか実
行していない場合を例としてあげたが、任意のn個のタ
スクについても同様に冗長資源の管理ができることはい
うまでもない。
In the embodiments shown in FIGS. 4 to 6, for the sake of simplicity, the case where only two tasks, task 1 and task 2, are executed in the system has been described as an example. Similarly, it goes without saying that redundant resources can be managed.

【0033】なお、各タスクの冗長なコンピュータモジ
ュールによる計算結果の選択の方法としては、多数決に
よる方法、本件発明者らによってすでに出願されている
特願昭63−118603号,特開平1−288928 号による方法な
どがある。
As a method of selecting a calculation result by a redundant computer module for each task, a method based on a majority decision is adopted, and Japanese Patent Application No. 63-118603 and Japanese Patent Application Laid-Open No. 1-288928 filed by the present inventors have already filed. And the like.

【0034】〈システム構成〉図1は、本発明を実現す
るためのシステム構成である。本発明によるシステムは
同一の機能を持つm個のコンピュータモジュール101
〜10mから構成されている。タスク111〜11nに
は高信頼化のために複数のコンピュータモジュールが割
り当てられ、冗長にタスクを実行している。図1の例で
はコンピュータモジュール101〜10i1のi1個が
タスク1(111)に、コンピュータモジュール10
(i1+1)〜10i2の(i2−i1)個がタスク2
(112)に、コンピュータモジュール10(in+1
1)〜10mの(in+1−m)個がタスクn(11n)
に割り当てられている。
<System Configuration> FIG. 1 shows a system configuration for realizing the present invention. The system according to the present invention comprises m computer modules 101 having the same function.
-10 m. A plurality of computer modules are allocated to the tasks 111 to 11n for high reliability, and the tasks are executed redundantly. In the example of FIG. 1, i1 of the computer modules 101 to 10i1 is assigned to the task 1 (111),
(I1 + 1) to 10i2 (i2-i1) tasks 2
In (112), the computer module 10 (in + 1 +
1) to 10 m (in + 1− m) tasks n (11n)
Assigned to.

【0035】コンピュータモジュール101〜10mそ
れぞれが出力選択回路51〜5lに出力を出せる。な
お、出力31−1〜31−l,…,3m−1〜3m−l
がそれぞれコンピュータモジュール10−1,…,10
−mの出力選択回路51〜5lへの出力である。さら
に、コンピュータモジュール10−1,…,10−mは
出力選択回路51〜5lへ選択制御信号41−1〜41
−l,…,4m−1〜4m−lを出力31−1〜31−
l,…,3m−1〜3m−lとともに出している。選択
制御信号41−1〜41−l,…,4m−1〜4m−l
は、出力31−1〜31−l,…,3m−1〜3m−l
を出力選択回路51〜5lで選択すべきかどうかを表し
ている。例えば、コンピュータモジュール101が正常
でかつ出力選択回路51へ出力すべき出力31−3を出
力しているときは、選択制御信号41−1がオンとな
る。
Each of the computer modules 101 to 10m can output to the output selection circuits 51 to 51. .., 3m-1 to 3m-1
Are computer modules 10-1,..., 10
−m is an output to the output selection circuits 51 to 51. Further, the computer modules 10-1,..., 10-m supply selection control signals 41-1 to 41-1 to the output selection circuits 51 to 51.
−l,..., Output 4m-1 to 4m-1
1, ..., 3m-1 to 3m-1. Selection control signals 41-1 to 41-1,..., 4m-1 to 4m-1
Are the outputs 31-1 to 31-l,..., 3m-1 to 3m-1
Is to be selected by the output selection circuits 51 to 51. For example, when the computer module 101 is normal and outputs the output 31-3 to be output to the output selection circuit 51, the selection control signal 41-1 turns on.

【0036】なお、図中では出力31−1〜31−l,
選択制御信号41−1〜41−lのみを示し、出力32
−1〜32−l,…,3m−1〜3m−l,選択制御信
号42−1〜42−l,…,4m−1〜4m−lは省略
している。
In the drawing, outputs 31-1 to 31-l,
Only the selection control signals 41-1 to 41-1 are shown, and the output 32
-1 to 32-1, ..., 3m-1 to 3m-1, and the selection control signals 42-1 to 42-1, ..., 4m-1 to 4m-1 are omitted.

【0037】出力選択回路51〜5lでは、選択制御信
号41−1〜41−l,…,4m−1〜4m−lに基づ
き、選択すべき出力を決定し各出力61−6lとする。
なお、出力61〜6lは出力装置71−7lに接続され
ている。また多くの制御装置の場合には、出力装置71
−7lは電気,油圧等のアクチュエータで制御対象を制
御する。
The output selection circuits 51 to 51 determine the outputs to be selected based on the selection control signals 41-1 to 41-1,..., 4m-1 to 4m-1, and make the outputs 61-6l.
The outputs 61 to 61 are connected to the output device 71-7l. In the case of many control devices, the output device 71
-7l controls an object to be controlled by an actuator such as an electric or hydraulic pressure.

【0038】出力選択回路51−5lとしては本件発明
者らによって既に出願されている特願昭63−118603号,
特開平1−288928 号の図2記載のMV(Modified Vote
r)回路がある。
The output selection circuit 51-5l is disclosed in Japanese Patent Application No. 63-118603, filed by the present inventors.
MV (Modified Vote) described in FIG. 2 of JP-A 1-288928.
r) There is a circuit.

【0039】図2は本発明を実施するためのコンピュー
タモジュール10iの構成を機能イメージで示したもの
である。コンピュータモジユール10iにタスク実行手
段12i,フォールト情報交換機能13i,実行すべき
タスクを決定する判定機能14i,タスク切り替え機能
15iを有し、判定機能14iでの判定結果に基づきタ
スク1(111)からタスクn(11n)の中から実行すべ
きタスクを選択し実行する。図2の実施例では、コンピ
ュータモジュール101はタスク1(111)を実行して
いる。
FIG. 2 is a functional image showing the configuration of a computer module 10i for implementing the present invention. The computer module 10i has a task execution means 12i, a fault information exchange function 13i, a determination function 14i for deciding a task to be executed, and a task switching function 15i. The task to be executed is selected from the tasks n (11n) and executed. In the embodiment of FIG. 2, the computer module 101 executes the task 1 (111).

【0040】フォールト情報交換機能13iでは、自コ
ンピュータモジュールでのフォールト発生状況や、実行
しているタスクの処理結果を通信路1を介して他のコン
ピュータモジュールにブロードキャストすると同時に、
他のコンピュータモジュールがブロードキャストしたフ
ォールト発生状況や、実行しているタスクの処理結果を
収集する。
The fault information exchange function 13i broadcasts the fault occurrence status in the own computer module and the processing result of the task being executed to other computer modules via the communication path 1, and
Collects the fault occurrence status broadcast by another computer module and the processing result of the task being executed.

【0041】なお、通信路1を介して他のコンピュータ
モジュールと通信する方法には、メッセージパッシング
による方法,共有メモリによる方法,メモリバンク切り
替えによる方法などが従来から提案されており、また通
信路1の形態にもバス型,ネット型,リング型などが提
案されている。
As a method of communicating with another computer module via the communication path 1, a method using message passing, a method using a shared memory, a method using memory bank switching, and the like have been conventionally proposed. As a form, a bus type, a net type, a ring type, and the like have been proposed.

【0042】図3は本発明を実施するためのコンピュー
タモジュール10iの構成を示したものである。バス2
0iにはMPU(Micro−Processing Unit)21i,通
信インタフェース22i,出力インタフェース23i,
選択制御信号インタフェース24i,記憶装置25iが
接続されている。通信インタフェース22iは他のコン
ピュータモジュールとの通信のためのもので、通信路1
を経由して他のコンピュータモジュールと接続してい
る。図2のフォールト情報交換機能13iは、選択制御
信号インタフェース24iを通じて実現する。
FIG. 3 shows the configuration of a computer module 10i for implementing the present invention. Bus 2
In 0i, an MPU (Micro-Processing Unit) 21i, a communication interface 22i, an output interface 23i,
The selection control signal interface 24i and the storage device 25i are connected. The communication interface 22i is used for communication with another computer module.
Connected to other computer modules via. The fault information exchange function 13i of FIG. 2 is realized through the selection control signal interface 24i.

【0043】出力インタフェース23iは出力選択回路
51〜5lに出力3i−1〜3i−lを出力するための
回路である。出力の転送方式は用途に合わせてパラレル
転送とシリアル転送のいずれでも可能である。なお、出
力インタフェース23iからそれぞれ独立した出力3i
−1〜3i−lを出せるようにすれば、同時に複数の出
力装置を用いる用途に使用することができる。
The output interface 23i is a circuit for outputting the outputs 3i-1 to 3i-1 to the output selection circuits 51 to 51. The output transfer method can be either parallel transfer or serial transfer according to the application. The output 3i is independent from the output interface 23i.
If it is possible to output -1 to 3i-l, it can be used for an application using a plurality of output devices at the same time.

【0044】選択制御信号インタフェース24iは、出
力選択回路51〜5lに選択制御信号4i−1〜4i−
lを送るための回路である。MPU21iから選択制御信号イ
ンタフェース24iのレジスタに書き込むことによって
所定の選択制御信号4i〜1〜4i−lをオン(選択)
とすることができる。なお、選択制御信号4i−l′
(l′:1,…,lの整数)をオン(選択)とする条件
は、(a)コンピュータモジュール10iで出力選択回路
5l′へ出力3i−l′を出力するタスクを実行してい
て、かつ(b)コンピュータモジュール10iで実行して
いるタスクが正常とみなされることである。なお、(b)
の正常か異常かという判断の方法は、既に本件発明者ら
によって出願されている特願昭63−118603号,特開平1
−288928 号の方法がある。
The selection control signal interface 24i provides the output selection circuits 51 to 51 with selection control signals 4i-1 to 4i-.
This is a circuit for sending l. The predetermined selection control signals 4i to 1 to 4i-l are turned on (selected) by writing from the MPU 21i to the register of the selection control signal interface 24i.
It can be. Note that the selection control signal 4i-l '
The condition for turning on (selecting) (l ′: 1,..., L) is that (a) the computer module 10i executes the task of outputting the output 3i−1 ′ to the output selection circuit 51 ′. And (b) the task being executed by the computer module 10i is considered to be normal. (B)
The method of judging whether is normal or abnormal is described in Japanese Patent Application No. 63-118603, which has already been filed by the present inventors.
There is a method of −288928.

【0045】コンピュータモジュール101が正常でか
つ出力選択回路51へ出力を出すタスク1を実行してい
て、出力選択回路52へ出力を出すタスク2を実行して
いる他のコンピュータモジュール10−iでフォールト
が発生し、コンピュータモジュール101のタスク2へ
の責任度が最も高い場合には、コンピュータモジュール
101はタスク1の実行を終了し、タスク2の実行を開
始する。この時には、タスク1を実行中オンとなってい
たコンピュータモジュール101から出力選択回路51
への選択制御信号41−1がタスク1の実行終了と共に
オフとなり、タスク2実行開始と共に出力選択回路52
への選択制御信号42−1がオンとなる。さらに、オン
となっていたコンピュータモジュール10−iから出力
選択回路52への選択制御信号4i−2はフォールト発
生と共にオフとなる。その結果出力選択回路52では、
フォールト発生前には正常にタスク2を実行しているコ
ンピュータモジュール10−iからの出力32−iを出
力62として選択しアクチュエータ72に送っていた
が、フォールト発生後にはコンピュータモジュール10
1からの出力32−1を出力62として選択しアクチュ
エータ72に送ることができる。
A fault occurs in another computer module 10-i in which the computer module 101 is normal and executes the task 1 for outputting to the output selecting circuit 51, and executes the task 2 for outputting to the output selecting circuit 52. Occurs, and when the responsibility of the computer module 101 for the task 2 is the highest, the computer module 101 ends the execution of the task 1 and starts the execution of the task 2. At this time, the output selection circuit 51 is output from the computer module 101 which is on during execution of the task 1.
Is turned off when the execution of the task 1 is completed, and the output selection circuit 52 is started when the execution of the task 2 is started.
Is turned on. Further, the selection control signal 4i-2 from the computer module 10-i which has been turned on to the output selection circuit 52 turns off when a fault occurs. As a result, in the output selection circuit 52,
Before the occurrence of the fault, the output 32-i from the computer module 10-i normally executing the task 2 was selected as the output 62 and sent to the actuator 72.
The output 32-1 from 1 can be selected as the output 62 and sent to the actuator 72.

【0046】以上本発明の実施例によれば、複数のコン
ピュータモジュールを用いて複数のタスクを並列にかつ
冗長に実施することが可能となる。
According to the embodiment of the present invention, a plurality of tasks can be executed in parallel and redundantly by using a plurality of computer modules.

【0047】なお、ここでは1つのタスクが複数のアク
チュエータに出力する場合を想定して説明したが、1つ
のタスクが複数のアクチュエータに出力したり、タスク
がアクチュエータにまったく出力しない場合なども考え
られる。
The above description has been made on the assumption that one task outputs to a plurality of actuators. However, it is also conceivable that one task outputs to a plurality of actuators, or the task does not output to an actuator at all. .

【0048】〈評価関数の算出と判定アルゴリズム〉図
7は、本発明により実行すべきタスクを判定機能14−
1〜14−mで判定する際の判定のフローチャートを表
したものである。
<Evaluation Function Calculation and Judgment Algorithm> FIG. 7 shows a task to be executed according to the present invention by a judgment function 14-.
It is a flow chart of the judgment at the time of judgment in 1 to 14-m.

【0049】評価関数算出処理300では各タスクにつ
いての評価関数Fij(j:タスクの番号)を算出する。
In the evaluation function calculation processing 300, an evaluation function Fij (j: task number) for each task is calculated.

【0050】なおここで、評価関数Fijは各タスクにつ
いての信頼度の余裕度を表すので、タスクの重要度が高
いほどFijは低く、コンピュータモジュールのタスクに
対する責任度が高いほどFijは低く、タスクの信頼度が
高いほどFijは高くなるように定める。すなわち、 ∂Fij/∂I<0 ∂Fij/∂Resp<0 ∂Fij/∂Rel>0 ただし、 I:重要度 Resp:責任度 Rel:信頼度 となる。
Here, since the evaluation function Fij represents a margin of reliability for each task, the higher the importance of the task, the lower the Fij, and the higher the responsibility of the computer module for the task, the lower the Fij. Is determined so that the higher the reliability of is, the higher the Fij becomes. That is, ∂Fij / ∂I <0 ∂Fij / ∂Resp <0 ∂Fij / ∂Rel> 0, where I: importance Resp: responsibility Rel: reliability.

【0051】上記の条件を満たす評価関数Fijは例え
ば、
The evaluation function Fij satisfying the above condition is, for example,

【0052】[0052]

【数1】 Fij=Lrj−Lthij …(1) ただし、Lthij:コンピュータモジュールiにおけるタ
スクjの信頼度レベルのしきい値 Lrj:タスクjの信頼度レベル i:自コンピュータモジュールの番号 j:タスクの番号 となる。
Fij = Lrj−Lthij (1) where Lthij is a threshold value of the reliability level of task j in computer module i Lrj: the reliability level of task j i: the number of the own computer module j: task number Number.

【0053】なおここで、タスクjの信頼度レベルのし
きい値Lthijはタスクの重要度によって異なり、重要な
タスクすなわち高い信頼度が要求されるタスクほど大き
な値が設定される。さらに全てのコンピュータモジュー
ルについて同じ値のLthijを設定すると、フォールト発
生時に全てコンピュータモジュールが同一のタスクを実
行してしまうためにシステムの動作が不安定になる。従
ってLthijはコンピュータモジュールiによって異な
り、タスクについて責任度の高いコンピュータモジュー
ルほど高い値が設定される。
Here, the threshold value Lthij of the reliability level of the task j differs depending on the importance of the task, and a larger value is set for an important task, that is, a task requiring a higher reliability. Further, if the same value Lthij is set for all the computer modules, the operation of the system becomes unstable because all the computer modules execute the same task when a fault occurs. Therefore, Lthij differs depending on the computer module i, and a higher value is set for a computer module having a higher responsibility for a task.

【0054】すなわち、 ∂Lthij/∂I>0 ∂Lthij/∂Resp>0 となる。That is, ∂Lthij / ∂I> 0 and ∂Lthij / ∂Resp> 0.

【0055】ここで、タスクjの信頼度レベルLrjの決
定方法について説明する。信頼度レベルLrjなる評価関
数は、タスクjを実行しているコンピュータモジュール
の数、処理結果の一致不一致および処理結果が一致して
いるプロセッサの数などのフォールト検出結果すなわち
フォールト情報から算出されるものとする。
Here, a method of determining the reliability level Lrj of the task j will be described. The evaluation function having the reliability level Lrj is calculated from fault detection results, that is, fault information such as the number of computer modules executing the task j, the mismatch between processing results, and the number of processors having matching processing results. And

【0056】まずここで、誤った結果をシステムの出力
として採用してしまう確率に着目すると、チェック(検
査)の合格の度合いから信頼度レベルLrjが算出でき
る。N1個のコンピュータモジュールがタスクjが実行
していて、その内N2個のコンピュータモジュールがチ
ェックの結果正常と判断され、N3個のコンピュータモ
ジュールの計算結果が一致した場合、タスクjの計算結
果が誤っている確率Pejは、
First, focusing on the probability that an erroneous result will be adopted as the output of the system, the reliability level Lrj can be calculated from the degree of pass of the check (inspection). When the task j is executed by the N1 computer modules, and the N2 computer modules are determined to be normal as a result of the check, and the calculation results of the N3 computer modules match, the calculation result of the task j is incorrect. Probability Pej is

【0057】[0057]

【数2】 (Equation 2)

【0058】ただし、 Pε:誤りが発生する確率 Pεd:チェックが誤りを見逃す確率 Pεa:誤った計算結果が偶然一致する確率 となる。なおここで、Pε,Pεd,Pεaはシステムの
動作環境、誤り検出方式により求めることができ、既知
の定数であるのでPejはN1,N2,N3−1の関数で
ある。
Here, Pε: the probability of occurrence of an error Pεd: the probability that a check misses an error Pεa: the probability that an erroneous calculation result coincides by chance. Here, Pε, Pεd, and Pεa can be obtained by the operating environment of the system and the error detection method. Since Pej is a known constant, Pej is a function of N1, N2, and N3-1.

【0059】タスクjの信頼度レベルLrjすなわち計算
結果が誤っていない確率は、
The reliability level Lrj of task j, that is, the probability that the calculation result is not incorrect, is

【0060】[0060]

【数3】 Lrj=1−Pej …(3) で与えられる。Lrj = 1−Pej (3)

【0061】なおここで、簡単のために(3)式よりP
ejの大小でLrjの大小を評価することにすれば、(2)
式の両辺の対数をとれば、
Here, for the sake of simplicity, from equation (3), P
If we evaluate the magnitude of Lrj based on the magnitude of ej, (2)
If we take the log of both sides of the equation,

【0062】[0062]

【数4】 log(Pej)=N1・log(Pε)+N2・log(Pεd)+(N3−1)・log(Pεa) …(4) となり、Pε,Pεd,Pεaの値はフィールドデータや
シミュレーションにより算出が可能であるから、これら
の値の対数をそれぞれK1,K2,K3とすると(4)
式は、
Log (Pej) = N1 · log (Pε) + N2 · log (Pεd) + (N3-1) · log (Pεa) (4) where the values of Pε, Pεd, and Pεa are field data and simulations. Since the logarithms of these values are K1, K2, and K3, respectively, (4)
ceremony,

【0063】[0063]

【数5】 log(Pe)=N1・K1+N2・K2+(N3−1)・K3 …(4′) と簡略化される。(5) log (Pe) = N1 · K1 + N2 · K2 + (N3-1) · K3 (4 ′)

【0064】さらにここで、(1)式の評価関数のかわ
りに計算結果が誤っている確率Peに着目して、
Further, paying attention to the probability Pe that the calculation result is incorrect instead of the evaluation function of the equation (1),

【0065】[0065]

【数6】 Fij=log{(1−Lthij)/Pe} …(1′) なる評価関数を定義すれば、[Formula 6] By defining an evaluation function of Fij = log {(1-Lthij) / Pe} (1 ′),

【0066】[0066]

【数7】 Fij=K4−N1・K1+N2・K2+(N3−1)・K3 …(1″) ただし、K4=log(1−Lthij) と評価関数Fijの算出が加算,減算,乗算だけで可能と
なり、容易化(高速化)できる。
Fij = K4−N1 · K1 + N2 · K2 + (N3-1) · K3 (1 ″) where K4 = log (1−Lthij) and the calculation of the evaluation function Fij can be performed only by addition, subtraction, and multiplication. And can be simplified (speeded up).

【0067】同様に、タスクjを実行しているコンピュ
ータモジュールで誤りが発生する確率に着目してもタス
クjの信頼度レベルLrjを算出することができる。
Similarly, the reliability level Lrj of the task j can be calculated by paying attention to the probability of occurrence of an error in the computer module executing the task j.

【0068】N1個のコンピュータモジュールがタスク
jを実行していると仮定すると、これら全てのコンピュ
ータモジュールで誤りが発生し、タスクjについての計
算結果が誤る確率は、
Assuming that N1 computer modules are executing task j, the probability that an error will occur in all of these computer modules and the calculation result for task j will be incorrect will be:

【0069】[0069]

【数8】 (Equation 8)

【0070】となり、両辺の対数をとると(2)式と同
様にして、
Then, taking the logarithm of both sides, as in the equation (2),

【0071】[0071]

【数9】 Fij=K4−N1・K1 …(1′′′) と評価関数Fijの算出を簡略化することができる。[Mathematical formula-see original document] Fij = K4-N1 * K1 (1 "") and the calculation of the evaluation function Fij can be simplified.

【0072】条件判定処理301では、各タスクについ
ての評価関数(Fij(j:1,…,n,n:タスクの
数)と現在実行しているタスクkについての評価関数F
ikとを比較する。その結果もしFij<Fikを満たすタス
クjがあれば、現在実行しているタスクkを終了し、タ
スクjを開始する。
In the condition determination processing 301, an evaluation function (Fij (j: 1,..., N, n: number of tasks)) for each task and an evaluation function F for the task k currently being executed
Compare with ik. As a result, if there is a task j that satisfies Fij <Fik, the currently executed task k is terminated and the task j is started.

【0073】タスクkの終了、タスクj開始のタスミン
グを図8に示す。フィードバック制御用のコンピュータ
の場合には図8のように制御フレームごとに周期的に入
力データを読み込み、タスクを実行し、結果を出力す
る。いま、コンピュータモジュールiでタスクkを実行
しており、制御フレーム1においてタスクjを実行して
いるコンピュータモジュールでの故障発生によりFij<
Fikとなったとする。コンピュータモジュールiでは、
直ちにタスクkを終了し、タスクjの実行準備を開始す
る。タスクjを開始するために前回の制御フレームまで
のデータ(履歴データ)が不要な場合には、制御フレー
ム2からタスクjを開始することができる。また、タス
クjを開始するために履歴データが必要な場合には、図
8のように制御フレーム2で履歴データを収集し、制御
フレーム3からタスクjを開始する。この際、履歴デー
タは既にタスクjを実行しているコンピュータモジュー
ルに通信路1を介して要求を出し、収集すればよい。
FIG. 8 shows tasking for ending task k and starting task j. In the case of a computer for feedback control, as shown in FIG. 8, input data is periodically read for each control frame, a task is executed, and a result is output. Now, the task k is being executed by the computer module i, and Fij <Fij <
Suppose that it becomes Fik. In the computer module i,
Immediately ends task k and starts preparation for execution of task j. When the data (history data) up to the previous control frame is not needed to start the task j, the task j can be started from the control frame 2. When history data is required to start task j, history data is collected in control frame 2 as shown in FIG. 8, and task j is started from control frame 3. At this time, the history data may be collected by issuing a request to the computer module already executing the task j via the communication path 1.

【0074】〈ハンチング防止−不感帯の設定〉図9は
条件判定処理301での判断の際に不感帯δを設け、F
ij<Fik−δを満たすタスクjがあれば、現在実行して
いるタスクkを終了し、タスクjを開始するようにした
実施例である。本実施例は図7の動作を更に改善するも
のである。
<Hunting Prevention-Setting of Dead Zone> FIG.
In this embodiment, if there is a task j that satisfies ij <Fik-δ, the currently executing task k is terminated and the task j is started. This embodiment further improves the operation of FIG.

【0075】図7の実施例において図10に示すよう
に、 (1)フォールト発生によりFij<Fikとなり、タスクk
を実行しているコンピュータモジュールがタスクjの実
行を時刻t1に始めると、評価関数Fijが大きくなり、
評価関数Fikが小さくなる。
As shown in FIG. 10 in the embodiment of FIG. 7, (1) Fij <Fik due to the occurrence of a fault and the task k
Is started at time t1, the evaluation function Fij increases,
The evaluation function Fik becomes smaller.

【0076】(2)ここでもし、Fij,Fikの大小が逆転
しFij>Fikとなるとタスクjの実行を開始したコンピ
ュータモジュールが再びタスクkを時刻t2に開始す
る。
(2) Here, if the magnitudes of Fij and Fik are reversed and Fij> Fik, the computer module which has started execution of task j starts task k again at time t2.

【0077】上記(1),(2)を繰り返す結果、履歴デー
タ収集などのためシステムの動作効率が低下してしまう
可能性がある。
As a result of repeating the above (1) and (2), there is a possibility that the operation efficiency of the system is reduced due to the collection of history data.

【0078】そこで図9のように条件判断処理301で
の判断の際にタスク切り換え時のFik,Fijの変化分よ
りも大きな不感帯δを設けヒステリシス特性を持たせれ
ば、実行タスク切り替えのハンチングが発生せずにシス
テムを図11に示すように安定に動作させることができ
る。
Therefore, as shown in FIG. 9, if a dead zone δ larger than the change of Fik and Fij at the time of task switching is provided at the time of the determination in the condition determination processing 301 and a hysteresis characteristic is provided, hunting of the execution task switching occurs. Without this, the system can be operated stably as shown in FIG.

【0079】なおPε,Pεd,Pεaが既知であるの
で、N1,N2,N3が変化したときのFijの変化分∂
Fij/∂N1,∂Fij/∂N2,∂Fij/∂N3を予め
知ることができる。そこで不感帯δの幅は、 max(∂Fij/∂N1,∂Fij/∂N2,∂Fij/∂N
3) よりも大きい値を設定すればよい。
Since Pε, Pεd, and Pεa are known, the change amount of Fij when N1, N2, and N3 change is obtained.
Fij / ∂N1, ∂Fij / ∂N2, ∂Fij / ∂N3 can be known in advance. Therefore, the width of the dead zone δ is max (∂Fij / ∂N1, ∂Fij / ∂N2, ∂Fij / ∂N
3) A larger value may be set.

【0080】以上述べた図1から図11に示す実施例に
より図12に示すように、故障発生により、冗長システ
ムを構成するコンピュータモジュールの時間と共に失わ
れていっても、タスク1,…,タスクnにコンピュータ
モジュールを割り当てて行き、各タスクに求められてい
る信頼度レベルに従ってタスク間の冗長度のバランスを
保つことができる。また、高い信頼度が要求される重要
度の高いタスクほど多くの冗長コンピュータモジュール
を割り当てるのでフォールト検出のカバレッジを高める
ことができる。
As shown in FIG. 12, according to the embodiment shown in FIGS. 1 to 11 described above, even if the computer modules constituting the redundant system are lost with time due to the occurrence of a failure, the tasks 1,. It is possible to assign computer modules to n, and to balance the redundancy between tasks according to the reliability level required for each task. In addition, since more redundant computer modules are allocated to tasks of higher importance requiring higher reliability, the coverage of fault detection can be increased.

【0081】〈安定度の向上−時間平均化〉さらに図1
から図12に示す実施例を図13に示す実施例を加えれ
ば、システムの安定度を高めることが可能である。
<Improvement of stability—averaging over time> Further, FIG.
By adding the embodiment shown in FIG. 13 to the embodiment shown in FIG. 12, the stability of the system can be improved.

【0082】図13は評価関数Fijを算出する際にLrj
またはPe を時間領域で平均化する実施例である。
FIG. 13 shows that when calculating the evaluation function Fij, Lrj
Alternatively, this is an embodiment in which Pe is averaged in the time domain.

【0083】図1から図12に示す実施例によれば、タ
スクjを実行しているコンピュータモジュールの故障が
発生した場合、タスクkを実行しているコンピュータモ
ジュールの中で最もLthijが高いすなわちタスクjに対
する責任度が最も高いコンピュータモジュールiにおい
てFij<Fikが成り立つためにコンピュータモジュール
iはタスクjの実行を始め、図14のaに示すようにタ
スクjの信頼度レベルを保つことができる。もしこの時
コンピュータモジュールiでも故障が発生していた場合
にはタスクjの実行を新たに始めるコンピュータモジュ
ールは存在しなくなり図14のbに示すようにタスクj
の信頼度レベルが低下したままとなる。つまり、コンピ
ュータモジュールi故障の発生によって冗長資源管理の
結果が影響を受けシステムの安定度が低下することにな
る。
According to the embodiment shown in FIGS. 1 to 12, when a failure occurs in the computer module executing the task j, the highest Lthij among the computer modules executing the task k, that is, the task Since Fij <Fik is satisfied in the computer module i having the highest responsibility for j, the computer module i starts executing the task j and can maintain the reliability level of the task j as shown in FIG. At this time, if a failure has occurred in the computer module i, there is no computer module for newly starting the execution of the task j, and the task j as shown in FIG.
Remains low. That is, the result of the redundant resource management is affected by the occurrence of the failure of the computer module i, and the stability of the system is reduced.

【0084】そこで図13に示すように評価関数Fijを
算出する際にLrjまたはPejを時間領域で平均化すれ
ば、図15の実線で示すようにFijは時間経過と共に徐
々に低下して行く。もしタスクjに対する責任度が最も
高いコンピュータモジュールiが存在しているのなら
ば、図15のaで示すように時刻t1においてコンピュ
ータモジュールiがタスクjの実行を開始しFijの値が
回復する。もしコンピュータモジュールiが生存してお
らず、次にタスクjに対する責任度が高いコンピュータ
モジュールi′が生存しているのならば、図15のbに
示すように時刻t2においてコンピュータモジュール
i′がタスクjの実行を開始しFijの値が回復する。も
しコンピュータモジュールiもコンピュータモジュール
i′も生存しておらず、コンピュータモジュールi′に
続いてタスクjに対する責任度が高いコンピュータモジ
ュールi″が生存しているのならば、図15のcで示す
ように時刻t3においてコンピュータモジュールi″が
タスクjの実行を開始しFijの値が回復する。
Therefore, if Lrj or Pej is averaged in the time domain when calculating the evaluation function Fij as shown in FIG. 13, Fij gradually decreases with time as shown by the solid line in FIG. If there is a computer module i having the highest responsibility for the task j, the computer module i starts executing the task j at time t1, and the value of Fij recovers, as shown in FIG. If the computer module i is not alive and the computer module i ′ having the next highest responsibility for the task j is alive, as shown in FIG. The execution of j is started, and the value of Fij recovers. If neither the computer module i nor the computer module i ′ is alive and the computer module i ″ having a high responsibility for the task j is alive after the computer module i ′, as shown in FIG. 15C. At time t3, the computer module i ″ starts executing the task j, and the value of Fij recovers.

【0085】LrjまたはPe を時間領域で平均化する方
法としては(1)移動平均をとる方法、(2)K次遅れ系
(伝達関数G(s)=1/(1+Ts)∧K)を用いる方
法などがある。
As a method of averaging Lrj or Pe in the time domain, (1) a method of taking a moving average, and (2) a K-order delay system (transfer function G (s) = 1 / (1 + Ts) ∧K) is used. There are methods.

【0086】本実施例によれば、タスクに対する責任度
の大きな特定のコンピュータモジュールの故障によって
冗長資源管理の結果が受ける影響を軽減することができ
るので、冗長資源管理方式自体のフォールトトレランス
(耐故障性)を高めることができる。
According to the present embodiment, it is possible to reduce the influence on the result of the redundant resource management due to the failure of a specific computer module having a high responsibility for a task. Therefore, the fault tolerance (fault tolerance) of the redundant resource management method itself can be reduced. ) Can be increased.

【0087】〈通信量,計算量の削減〉図16は本発明
実施によりコンピュータモジュール101−m相互間の
通信量及び評価関数算出のための計算量の増加を緩和す
る実施例である。図1から図15に示す実施例によれ
ば、それぞれのコンピュータモジュールは自コンピュー
タモジュールでのフォールト検出状況を他の全てのコン
ピュータモジュールに通知する(ブロードキャストす
る)ためにNcom =m(m−1)回の通信が必要とな
り、通信量が著しく増加する。そこで、図16では、通
常は同一タスクを実行しているコンピュータモジュール
のみ評価関数フォールト検出状況を通知し、評価関数F
ijが変化したときのみ、他の全てのコンピュータモジュ
ールに通知する。コンピュータモジュール1〜3がタス
ク1を実行しており、コンピュータモジュールiがタス
ク2を実行している場合を考える。制御フレーム1で
は、コンピュータモジュール1〜3には異常が見られな
いため、コンピュータモジュール1〜3相互間でのみ6
回の通信が発生する。続いて制御フレーム2でコンピュ
ータモジュール3に異常が発生した場合を考える。第1
回目の通信はコンピュータモジュール1〜3相互間での
み行われ、通信により交換したフォールト検出情報に基
づき(この場合はコンピュータモジュール3がダウンし
て沈黙している)算出された評価関数Fijはコンピュー
タモジュール3の異常のために前回(制御フレーム1)
よりも低下している。従って制御フレーム2では引き続
き第2回目の通信が実施され、評価関数Fijが低下した
旨コンピュータモジュールiに通知される。コンピュー
タモジュールiでは、通知された情報をもとに自コンピ
ュータモジュールがタスク1の実行に参加すべきかどう
かを判断し、参加すべき時にはタスク2の実行を中止し
てタスク1の実行を開始する。
<Reduction of Communication Volume and Calculation Volume> FIG. 16 shows an embodiment of the present invention in which the communication volume between the computer modules 101-m and the calculation volume for calculating the evaluation function are alleviated. According to the embodiment shown in FIGS. 1 to 15, each computer module informs (broadcasts) the fault detection status of its own computer module to all other computer modules, and Ncom = m (m-1). Times of communication is required, and the amount of communication increases significantly. Therefore, in FIG. 16, normally, only the computer module executing the same task notifies the evaluation function fault detection status, and the evaluation function F
Notify all other computer modules only when ij changes. It is assumed that the computer modules 1 to 3 are executing the task 1 and the computer module i is executing the task 2. In the control frame 1, since no abnormality is found in the computer modules 1 to 3, only 6
Times communication occurs. Next, a case where an abnormality occurs in the computer module 3 in the control frame 2 is considered. First
The first communication is performed only between the computer modules 1 to 3, and the evaluation function Fij calculated based on the fault detection information exchanged by the communication (in this case, the computer module 3 is down and silent) is calculated by the computer module Previous time (control frame 1) due to abnormality 3
Than it is. Therefore, in the control frame 2, the second communication is continuously performed, and the computer module i is notified that the evaluation function Fij has decreased. The computer module i determines whether or not its own computer module should participate in the execution of the task 1 based on the notified information, and when it should participate, suspends the execution of the task 2 and starts the execution of the task 1.

【0088】本実施例によれば、コンピュータモジュー
ル相互間の通信は、
According to this embodiment, the communication between the computer modules is

【0089】[0089]

【数10】 (Equation 10)

【0090】ただし、N1j:タスクjを実行しているコ
ンピュータモジュールの数となる。ここで、
Here, N1j is the number of computer modules executing the task j. here,

【0091】[0091]

【数11】 [Equation 11]

【0092】であるから、本実施例により通信の回数は
Ncom′≒Ncom/nとほぼ1/nとなる。
Therefore, according to the present embodiment, the number of times of communication is Ncom'nNcom / n, which is approximately 1 / n.

【0093】図17は、図16の実施例のための全ての
コンピュータモジュールにブロードキャストするかどう
かの判断を示すフローチャートである。まず、同一タス
クを実行しているコンピュータモジュール同士でフォー
ルト検出情報を交換(302)し、それに基づいた評価関
数Fijを算出(300′)する。なお、評価関数Fijの
算出処理300′は同一タスクを実行しているコンピュ
ータモジュールのみの評価関数Fijを算出している点
で、図7,図9,図18に示す(全てのコンピュータモ
ジュールの)評価関数Fijの算出処理300と異なる。
従って、評価関数Fijの算出処理300ではm回のFij
の計算が必要であるのにたいして、評価関数Fijの算出
処理300′では同一タスクを実行しているコンピュー
タモジュールの個数だけ(O(m/n))のFijを計算
すればよいので、計算量もほぼ1/nとすることができ
る。評価関数Fijの算出300′の後、現在のFijと前
回の値Fijold とを比較し(303)、不一致の場合に
はフォールト情報を全てのコンピュータモジュールにブ
ロードキャスト(304)する。最後に現在の評価関数
の値Fijを次回に備えて変数Fijoldに格納(305)
する。
FIG. 17 is a flowchart showing the determination as to whether or not to broadcast to all computer modules for the embodiment of FIG. First, fault detection information is exchanged between computer modules executing the same task (302), and an evaluation function Fij based on the fault detection information is calculated (300 '). The calculation function 300 'of the evaluation function Fij calculates the evaluation function Fij only for the computer module executing the same task. This is different from the calculation processing 300 of the evaluation function Fij.
Therefore, in the calculation processing 300 of the evaluation function Fij, m times Fij
Is required, the calculation function 300 ′ of the evaluation function Fij only needs to calculate Fij (O (m / n)) by the number of computer modules executing the same task. It can be approximately 1 / n. After the evaluation function Fij is calculated 300 ', the current Fij is compared with the previous value Fijold (303), and if they do not match, the fault information is broadcast to all the computer modules (304). Finally, the current evaluation function value Fij is stored in the variable Fijold for the next time (305).
I do.

【0094】一方、ブロードキャストを受ける側のコン
ピュータモジュールでは、図18に示すように全域ブロ
ードキャストがあったかどうか判定(306)し、全域
ブロードキャストがあった場合に限り図7,図9に示す
判断に進む。
On the other hand, the computer module on the broadcast receiving side determines whether or not there has been an entire area broadcast as shown in FIG. 18 (306), and proceeds to the determination shown in FIGS. 7 and 9 only when there is an all area broadcast.

【0095】〈適応制御システムへの応用〉図19は本
発明を適応制御システムに適用した実施例である。制御
対象20の物理量をセンサ2で測定し状態観測器16で
制御対象の状態を観測(推定)し、観測された状態をも
とに制御に適切な特性を持つレギュレータ17,アクチ
ュエータ7を介して制御対象20へフィードバックを加
える。以上は現代制御理論に基づき状態フィードバック
を行う制御システムの典型的な構成である。
<Application to Adaptive Control System> FIG. 19 shows an embodiment in which the present invention is applied to an adaptive control system. The physical quantity of the control target 20 is measured by the sensor 2, the state of the control target is observed (estimated) by the state observer 16, and the regulator 17 and the actuator 7 having characteristics suitable for control based on the observed state. Feedback is added to the control target 20. The above is a typical configuration of a control system that performs state feedback based on modern control theory.

【0096】さらにセンサ2の出力信号とアクチュエー
タ7への入力信号とから、制御対象特性同定部18でセ
ンサ2,アクチュエータ7を含めた制御対象20の特性
を同定し、最適レギュレータ設計部19では、制御対象
特性の同定結果から制御に最適なレギュレータのパラメ
ータを算出し、レギュレータ17のパラメータを最適値
に設定する。以上のような適応制御システムにより制御
特性が向上し、特に航空機,宇宙往還機(いわゆるスペ
ースシャトル)などの空気力学特性の非線形性により、
線形近似した制御システムにおいて高度,速度により制
御対象の特性が見かけ上変化するような制御対象の制御
に特に最適であることが知られている。さらに制御対象
20,センサ2,アクチュエータ7に故障が発生した場
合でも制御システムは制御対象の特性変化として捉え、
その都度最適なパラメータをレギュレータ17に設定す
るので、制御対象の故障による特性劣化を補うことがで
きる。通常信頼性の要求されている制御システムではア
クチュエータも冗長化していることが多い。例えば航空
機などでは、昇降舵,方向舵などの制御舵面(Control
Surface)や推力発生装置は冗長化し、一部が故障した場
合でも飛行には支障のないように設計されている。しか
しこれらの冗長化したアクチュエータの一部が故障した
場合には、等価的にアクチュエータのゲインが低下した
ことになり、システム全体の制御特性が悪化する。また
場合によっては、制御の対象となる値の間に干渉が起こ
り特に人間の運転操作を介しての制御が著しく困難とな
る。そこで、本実施例による適応制御装置はアクチュエ
ータのゲイン低下を特性同定部18で検出し、最適レギ
ュレータ設計部19ではそれに最適なレギュレータ17
のパラメータを決定すれば、制御特性の悪化を補うこと
ができる。
Further, from the output signal of the sensor 2 and the input signal to the actuator 7, the characteristics of the controlled object 20 including the sensor 2 and the actuator 7 are identified by the controlled object characteristic identifying section 18, and the optimum regulator designing section 19 A regulator parameter optimal for control is calculated from the identification result of the control target characteristic, and the parameter of the regulator 17 is set to an optimal value. The control characteristics are improved by the adaptive control system as described above. In particular, due to the non-linearity of the aerodynamic characteristics of aircraft, space shuttles (so-called space shuttles),
It is known that a linearly approximated control system is particularly suitable for controlling a controlled object in which the characteristics of the controlled object apparently change depending on altitude and speed. Further, even if a failure occurs in the control target 20, the sensor 2, and the actuator 7, the control system regards the change as a characteristic change of the control target.
Since the optimal parameters are set in the regulator 17 each time, it is possible to compensate for the characteristic deterioration due to the failure of the control target. Usually, in a control system requiring reliability, the actuator is often made redundant. For example, in aircraft, control rudder, rudder, etc.
(Surface) and thrust generators are designed to be redundant, so that even if a part fails, flight is not hindered. However, when a part of these redundant actuators fails, the gain of the actuators equivalently decreases, and the control characteristics of the entire system deteriorate. Further, in some cases, interference occurs between the values to be controlled, and it becomes particularly difficult to control the vehicle through a human driving operation. Therefore, in the adaptive control device according to the present embodiment, the decrease in the gain of the actuator is detected by the characteristic identification unit 18, and the optimal regulator
By determining these parameters, the deterioration of the control characteristics can be compensated.

【0097】本実施例では、適応制御への応用にあた
り、状態観測器16とレギュレータ17をタスク1(ま
たはタスクグループ1)で実現し、制御対象特性同定部
18と最適レギュレータ設計部19をタスク2(または
タスクグループ2)で実現し、 Lth11>Lth21>Lth31>Lth41>Lth51かつ、Lth12
<Lth22<Lth32<Lth42<Lth52かつ、Lth11>Lth
52かつ、Lth21>Lth42かつ、Lth31>Lth32かつ、L
th41>Lth22かつ、Lth51>Lth11 と設定し、タスク2(またはタスクグループ2)を実行
するコンピュータモジュールが存在しない場合には予め
用意した数表によりレギュレータ17のパラメータを設
定するようにしたものである。本実施例による冗長資源
管理の様子を図20に示す。まず、正常なコンピュータ
モジュールの数が5個の場合には3個のコンピュータモ
ジュールがタスク1(またはタスクグループ1)に、2
個のコンピュータモジュールがタスク2(またはタスク
グループ2)に割り当てられる。1個のコンピュータモ
ジュールで故障が発生し、正常なコンピュータモジュー
ルの数が4個となった場合には2個のコンピュータモジ
ュールがタスク1(またはタスクグループ1)に、2個
のコンピュータモジュールがタスク2(またはタスクグ
ループ2)に割り当てられる。2個のコンピュータモジ
ュールで故障が発生し、正常なコンピュータモジュール
の数が3個となった場合には2個のコンピュータモジュ
ールがタスク1(またはタスクグループ1)に、1個の
コンピュータモジュールがタスク2(またはタスクグル
ープ2)に割り当てられる。3個のコンピュータモジュ
ールで故障が発生し、正常なコンピュータモジュールの
数が4個となった場合には2個のコンピュータモジュー
ルがタスク1(またはタスクグループ1)に割り当てら
れ、タスク2(またはタスクグループ2)にはコンピュ
ータモジュールは割り当てられない、代わりに予め用意
された数表によりレギュレータ17のパラメータを設定
して制御を続行する。
In this embodiment, in application to adaptive control, the state observer 16 and the regulator 17 are realized by task 1 (or task group 1), and the control target characteristic identification unit 18 and the optimal regulator design unit 19 are implemented by task 2 (Or task group 2), Lth11>Lth21>Lth31>Lth41> Lth51 and Lth12
<Lth22 <Lth32 <Lth42 <Lth52 and Lth11> Lth
52 and Lth21> Lth42 and Lth31> Lth32 and L
When th41> Lth22 and Lth51> Lth11 are set, and there is no computer module that executes task 2 (or task group 2), the parameters of the regulator 17 are set according to a numerical table prepared in advance. . FIG. 20 shows the state of redundant resource management according to this embodiment. First, when the number of normal computer modules is 5, three computer modules are assigned to task 1 (or task group 1).
Computer modules are assigned to task 2 (or task group 2). When a failure occurs in one computer module and the number of normal computer modules becomes four, two computer modules are assigned to task 1 (or task group 1) and two computer modules are assigned to task 2 (Or task group 2). When two computer modules fail and the number of normal computer modules becomes three, two computer modules are assigned to task 1 (or task group 1) and one computer module is assigned to task 2 (Or task group 2). If three computer modules fail and the number of normal computer modules becomes four, two computer modules are assigned to task 1 (or task group 1) and task 2 (or task group 1). In 2), no computer module is assigned. Instead, parameters of the regulator 17 are set according to a table prepared in advance, and control is continued.

【0098】以上本実施例によれば、コンピュータモジ
ュールでの故障だけでなく制御対象の故障をも許容する
制御システムを構成することができ、制御システム全体
の信頼度を向上させることができる。
As described above, according to the present embodiment, a control system that allows not only a failure in the computer module but also a failure in the control target can be configured, and the reliability of the entire control system can be improved.

【0099】図21,図22,図23は出力選択,多数
決機能を持つサーボモータ系の実施例である。このサー
ボモータ系は図1の出力選択回路51〜5lと出力装置
71〜7lの機能を合わせ持っている。本実施例のサー
ボモータは図21に示すように単一のシャフト701に
複数の電機子巻線7041〜704lを設け、電機子巻
線に対応した界磁巻線7031〜703lを電機子巻線
に対向させてハウジング702内に設けたものである。
なお、図21中のA−A′面の断面を図22に示す。こ
のサーボモータの出力トルクは次式で与えられる。
FIGS. 21, 22, and 23 show an embodiment of a servo motor system having an output selection and majority decision function. This servo motor system has the functions of the output selection circuits 51 to 51 and the output devices 71 to 71 in FIG. As shown in FIG. 21, the servomotor of this embodiment is provided with a plurality of armature windings 7041 to 704l on a single shaft 701, and the field windings 7031 to 703l corresponding to the armature windings are replaced by armature windings. Are provided in the housing 702 so as to face the.
FIG. 22 shows a cross section taken along the line AA ′ in FIG. The output torque of this servomotor is given by the following equation.

【0100】[0100]

【数12】 (Equation 12)

【0101】ただし Ifi:界磁巻線703iの電流 Iai:電機子巻線704iの電流 K:比例係数 ここで、全てのIfiを一定とすれば、Where Ifi: current of the field winding 703i Iai: current of the armature winding 704i K: proportionality coefficient Here, if all Ifi are constant,

【0102】[0102]

【数13】 (Equation 13)

【0103】ただし K′:比例係数(K・Ifi) となりIriを入力すれば多数決に準じた動作(以下疑似
多数決と呼ぶ)をさせることができる。また、Ifiを各
入力Iaiの信頼度に比例した値とすれば(8)式に示す
ように重み付きの疑似多数決を実施できる。図23は図
21,図22の疑似多数決機能を持つサーボモータを用
いて重み付きの疑似多数決を実施するための回路であ
る。この図では図1の出力選択回路51と出力装置71
の機能を担う回路を示しているが、他の出力選択回路5
2〜5lと出力装置72〜7lについても同様である。
コンピュータモジュール101〜10mからの出力31
−1〜3m−1,選択制御信号41−1〜4m−1に比
例した電流をサーボアンプを介して電機子巻線7041
〜704m,界磁巻線7031〜703mにそれぞれ供
給する。以上により、選択制御信号41−1〜4m−1
により正常とみなされたコンピュータモジュール101
〜10mからの出力31−1〜3m−1の多数決を実現
できる。さらに、サーボアンプ、電機子巻線7041〜
704m、界磁巻線7031〜703mを多重化すれば
サーボアンプの故障や巻線の短絡,断線による障害を防
げ、サーボモータ系の信頼度を高めることが可能であ
る。
However, K ′: proportional coefficient (K · Ifi), and by inputting Iri, an operation in accordance with majority decision (hereinafter referred to as pseudo majority decision) can be performed. If Ifi is a value proportional to the reliability of each input Iai, a weighted pseudo-majority decision can be performed as shown in equation (8). FIG. 23 shows a circuit for performing a weighted pseudo majority by using the servo motor having the pseudo majority function shown in FIGS. In this figure, the output selection circuit 51 and the output device 71 of FIG.
Is shown, but other output selection circuits 5
The same applies to 2 to 5 l and output devices 72 to 7 l.
Output 31 from computer module 101-10m
-1 to 3m-1 and a current proportional to the selection control signal 41-1 to 4m-1 are supplied to the armature winding 7041 via the servo amplifier.
To 704 m and field windings 7031 to 703 m, respectively. As described above, the selection control signals 41-1 to 4m-1
Module 101 considered normal by
A majority decision of outputs 31-1 to 3m-1 from 10 to 10m can be realized. Furthermore, a servo amplifier, armature windings 7041 to
By multiplexing the 704 m and the field windings 7031 to 703 m, it is possible to prevent a failure of the servo amplifier or a failure due to short-circuit or disconnection of the winding, thereby improving the reliability of the servo motor system.

【0104】またここで、選択制御信号41−1〜4m
−1はON/OFFの二値だけでなく、出力を出してい
る各コンピュータモジュールの信頼度に対応した多値と
すれば、重み付きの疑似多数決を実現できる。上記のサ
ーボモータ系を適用したシステム構成を図24に示す。
先に述べたように図1のシステムで出力選択回路52〜
5lと出力装置72〜7lをそれぞれサーボモータ系7
00に置き換えればよい。以上述べた本実施例によれ
ば、サーボモータ系により図1の出力選択回路51〜5
lと出力装置71〜7lの機能を実現できるので、シス
テム全体の構成を簡略化でき、小型化,部品点数の削減
による高信頼化が可能である。なお、(8)式から明ら
かなようにIfi,Iaiの間では交換法則が成り立つの
で、コンピュータモジュール101〜10mからの出力
31−1〜3m−1に対応した電流を界磁巻線7031
〜703mに、選択制御信号41−1〜4m−1に対応
した電流を電機子巻線7041〜704mにそれぞれ流
しても同じ効果が得られる。
Here, the selection control signals 41-1 to 4m
If -1 is not only a binary value of ON / OFF but also a multi-value value corresponding to the reliability of each computer module outputting an output, a weighted pseudo majority decision can be realized. FIG. 24 shows a system configuration to which the above servomotor system is applied.
As described above, in the system of FIG.
5l and the output devices 72 to 7l are respectively connected to the servo motor system 7
00 may be replaced. According to the present embodiment described above, the output selection circuits 51 to 5 of FIG.
1 and the functions of the output devices 71 to 7l can be realized, so that the configuration of the whole system can be simplified, and high reliability can be achieved by reducing the size and the number of parts. As is clear from equation (8), since the exchange law is established between Ifi and Iai, the current corresponding to the outputs 31-1 to 3m-1 from the computer modules 101 to 10m is supplied to the field winding 7031.
The same effect can be obtained by supplying currents corresponding to the selection control signals 41-1 to 4m-1 to the armature windings 7041 to 704m respectively.

【0105】[0105]

【発明の効果】本発明によれば、各タスクに要求される
信頼度レベルに応じて適切な数の冗長資源を割り当てる
ことができるので、冗長資源の処理性能向上,信頼度向
上が可能となる。
According to the present invention, an appropriate number of redundant resources can be allocated according to the reliability level required for each task, so that the processing performance and reliability of the redundant resources can be improved. .

【0106】さらに本発明を適応制御システムに応用す
ることによりコンピュータモジュールでの故障だけでな
く制御対象の故障をも許容する制御システムを構成で
き、制御システム全体の信頼度を向上させることができ
る。
Further, by applying the present invention to an adaptive control system, a control system that allows not only a failure in a computer module but also a failure in a control target can be configured, and the reliability of the entire control system can be improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明のフォールトトレラントシステムの構成
図。
FIG. 1 is a configuration diagram of a fault-tolerant system of the present invention.

【図2】コンピュータモジュールの構成図。FIG. 2 is a configuration diagram of a computer module.

【図3】コンピュータモジュールの他の構成図。FIG. 3 is another configuration diagram of a computer module.

【図4】本発明の実施例の概念図。FIG. 4 is a conceptual diagram of an embodiment of the present invention.

【図5】本発明の実施例の概念図。FIG. 5 is a conceptual diagram of an embodiment of the present invention.

【図6】本発明の実施例の概念図。FIG. 6 is a conceptual diagram of an embodiment of the present invention.

【図7】条件判定のフローチャート。FIG. 7 is a flowchart of condition determination.

【図8】タスク切り換えのタイミング。FIG. 8 shows task switching timing.

【図9】条件判定のフローチャート(不感帯付)。FIG. 9 is a flowchart of condition determination (with a dead zone).

【図10】Fijの変化(不感帯なし)を表す図。FIG. 10 is a diagram showing a change in Fij (no dead zone).

【図11】Fijの変化(不感帯付)を表す図。FIG. 11 is a diagram showing a change in Fij (with a dead zone).

【図12】コンピュータモジュール割付け状況を示す
図。
FIG. 12 is a diagram showing a computer module allocation status.

【図13】Lrjの平均化を表す図。FIG. 13 is a diagram showing averaging of Lrj.

【図14】Fijの変化(Lrjの平均化なし)を示す図。FIG. 14 is a diagram showing a change in Fij (without averaging of Lrj).

【図15】Fijの変化(Lrjの平均化あり)を示す図。FIG. 15 is a diagram showing a change in Fij (with Lrj averaging).

【図16】モジュール間通信量の削減を説明する図。FIG. 16 is a view for explaining reduction of the inter-module communication amount.

【図17】広域ブロードキャストのための条件判断フロ
ーチャート。
FIG. 17 is a flowchart of condition determination for wide area broadcasting.

【図18】広域ブロードキャストのための条件判断フロ
ーチャート。
FIG. 18 is a flowchart of condition determination for wide area broadcasting.

【図19】適応制御システムへの応用をした場合のシス
テム構成図。
FIG. 19 is a system configuration diagram when applied to an adaptive control system.

【図20】コンピュータモジュール割付け状況を表す
図。
FIG. 20 is a diagram showing a computer module allocation status.

【図21】サーボモータの断面図。FIG. 21 is a sectional view of a servomotor.

【図22】サーボモータの断面図(図21A−A′
面)。
FIG. 22 is a sectional view of the servomotor (FIG. 21A-A ′);
surface).

【図23】サーボモータ系のブロック図。FIG. 23 is a block diagram of a servo motor system.

【図24】サーボモータ系を適用したシステムの構成
図。
FIG. 24 is a configuration diagram of a system to which a servo motor system is applied.

【符号の説明】[Explanation of symbols]

101〜10m…コンピュータモジュール、111−1
1n…タスク、21〜2h…入力装置、31−1〜3m
−l,…,31−l〜3m−l…出力、41−1〜4m
−l,…,41−l〜4m−l…選択制御信号、51〜
5l…出力選択回路、71〜7l…出力装置、16…状
態観測器、17…レギュレータ、18…制御対象特性同
定部、19…最適レギュレータ設計部、20…制御対
象。
101 to 10 m: Computer module, 111-1
1n task, 21-2h input device, 31-1-3m
−l,..., 31-1 to 3 ml,... Output, 41-1 to 4 m
−l,..., 41−1 to 4 ml −...
5l: output selection circuit, 71 to 7l: output device, 16: state observer, 17: regulator, 18: control target characteristic identification unit, 19: optimal regulator design unit, 20: control target.

Claims (12)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】複数のコンピュータモジュールから構成さ
れ、複数のタスクをコンピュータモジュールで実行し、
且つ、それぞれのタスクは複数の冗長なコンピュータモ
ジュールで実行されるフォールトトレラントコンピュー
タシステムにおける冗長資源の管理方法において、 正常なコンピュータモジュールの数及び各タスクの重要
度に応じて、各タスクを冗長に実行するコンピュータモ
ジュールの数を変化させ、 冗長に実行しているコンピュータモジュールにおけるフ
ォールト検出状況に基づき、各タスクごとに評価関数を
算出し、評価関数の値が低下した第1のタスクがある場
合には、評価関数の値がより大きい第2のタスクを実行
しているコンピュータモジュールに第1のタスクを実行
させることを特徴とする冗長資源の管理方法。
A computer module configured to execute a plurality of tasks,
In addition, in a method of managing redundant resources in a fault-tolerant computer system in which each task is executed by a plurality of redundant computer modules, each task is redundantly executed according to the number of normal computer modules and the importance of each task. The number of computer modules to be executed is changed, and an evaluation function is calculated for each task based on a fault detection situation in the redundantly executed computer module. If there is a first task having a lower evaluation function value, And causing a computer module executing a second task having a larger value of the evaluation function to execute the first task.
【請求項2】請求項において、全てのコンピュータモ
ジュールが各タスクごとの評価関数を算出し、評価関数
の値が低下した第1のタスクがある場合には、もし、自
コンピュータモジュール内で実行している第2のタスク
の評価関数の値が第1のタスクより大きいならば、コン
ピュータモジュール単独の判断で第2のタスクの実行を
中止して、第1のタスクを実行することを特徴とする冗
長資源の管理方法。
2. The computer system according to claim 1, wherein all the computer modules calculate an evaluation function for each task, and if there is a first task having a reduced evaluation function value, the execution is executed in the own computer module. If the value of the evaluation function of the second task is larger than the first task, the execution of the second task is stopped by the judgment of the computer module alone, and the first task is executed. To manage redundant resources.
【請求項3】複数のコンピュータモジュールから構成さ
れ、複数のタスクをコンピュータモジュールで実行し、
且つ、それぞれのタスクは複数の冗長なコンピュータモ
ジュールで実行されるフォールトトレラントコンピュー
タシステムにおける冗長資源の管理方法において、 正常なコンピュータモジュールの数及び各タスクの重要
度に応じて、各タスクを冗長に実行するコンピュータモ
ジュールの数を変化させ、 それぞれのコンピュータモジュールにおいて、自コンピ
ュータモジュールにおいて実行しているタスク番号及び
フォールト発生情報を他のコンピュータモジュールに通
知し、他のコンピュータモジュールから通知されたフォ
ールト発生情報に基づき、各タスクの信頼度を推定し、
自コンピュータモジュールでどのタスクの冗長構成に参
加すべきかを決定し、参加すべきタスクが現在実行して
いるタスクと異なる場合には、実行しているタスクを前
記参加すべきタスクに切り替えることを特徴とする冗長
資源の管理方法。
3. A computer system comprising a plurality of computer modules, wherein a plurality of tasks are executed by the computer modules.
In addition, in a method of managing redundant resources in a fault-tolerant computer system in which each task is executed by a plurality of redundant computer modules, each task is redundantly executed according to the number of normal computer modules and the importance of each task. In each computer module, the task number and the fault occurrence information executed in its own computer module are notified to other computer modules, and the fault occurrence information notified from the other computer modules is added to each computer module. Estimate the reliability of each task based on
The computer module determines which task to participate in the redundant configuration, and when the task to be joined is different from the task currently being executed, the task to be executed is switched to the task to be joined. Redundant resource management method.
【請求項4】請求項乃至の何れかにおいて、 コンピュータモジュールi(i:1,…,N,N:コン
ピュータモジュールの個数)に対する前記評価関数を、
以下の式にて定義されるFijとし、この評価関数Fijを
最小にするタスクjを実行すべき処理として決定するこ
とを特徴とする冗長資源の管理方法。 Fij=Lrj−Lthij ただし、 Lthij:コンピュータモジュールiにおけるタスクjの
信頼度レベルのしきい値 Lrj:タスクjの信頼度レベル i:自コンピュータモジュールの番号 j:タスクの番号
4. A one of claims 1 to 2, the computer module i the evaluation function for (i:: 1, ..., N, N Computer number of modules),
A redundant resource management method, wherein Fij is defined by the following equation, and a task j that minimizes the evaluation function Fij is determined as a process to be executed. Fij = Lrj-Lthij where Lthij: threshold value of reliability level of task j in computer module i Lrj: reliability level of task j i: number of own computer module j: number of task
【請求項5】請求項乃至の何れかにおいて、 コンピュータモジュールi(i:1,…,N,N:コン
ピュータモジュールの個数)に対する前記評価関数を、
以下の式にて定義されるFijとし、この評価関数Fijを
最小にするタスクjを実行すべき処理として決定するこ
とを特徴とする冗長資源の管理方法。 Fij=Lrj/Lthij ただし、 Lthij:コンピュータモジュールiにおけるタスクjの
信頼度レベルのしきい値 Lrj:タスクjの信頼度レベル i:自コンピュータモジュールの番号 j:タスクの番号
5. In any one of claims 1 to 2, the computer module i the evaluation function for (i:: 1, ..., N, N Computer number of modules),
A redundant resource management method, wherein Fij is defined by the following equation, and a task j that minimizes the evaluation function Fij is determined as a process to be executed. Fij = Lrj / Lthij where Lthij: threshold value of the reliability level of task j in computer module i Lrj: reliability level of task j i: number of own computer module j: number of task
【請求項6】請求項乃至の何れかにおいて、 コンピュータモジュールi(i:1,…N,N:コンピ
ュータモジュールの個数)に対する前記評価関数を、以
下の式にて定義されるFijとし、この評価関数Fijを最
小にするタスクjを実行すべき処理として決定すること
を特徴とする冗長資源の管理方法。 Fij=log{(1−Lthij)/Pej} ただし、 Lthij:コンピュータモジュールiにおけるタスクjの
信頼度レベルのしきい値 Rej:タスクjの結果が誤っている確率 i:自コンピュータモジュールの番号 j:タスクの番号
6. In any one of claims 1 to 2, the computer module i (i: 1, ... N , N: Computer number of modules) the evaluation function for, and Fij which is defined by the following formula, A redundant resource management method, wherein a task j that minimizes the evaluation function Fij is determined as a process to be executed. Fij = log {(1−Lthij) / Pej} where Lthij: threshold value of the reliability level of task j in computer module i Rej: probability that the result of task j is incorrect i: number of own computer module j: Task number
【請求項7】請求項乃至の何れかにおいて、 前記Lthijは、コンピュータモジュール毎及びタスク毎
に予め決定され、前記Lrjは、前記フォールト発生情報
に基づき決定されることを特徴とする冗長資源の管理方
法。
7. The one of claims 4 to 6, wherein Lthij is predetermined for each respective computer modules, and tasks, the Lrj is redundant resources being determined on the basis of the fault occurrence information Management method.
【請求項8】請求項乃至の何れかにおいて、前記評
価関数Fijを最小にするタスクjの決定に際し、以下の
関係式を満たす場合に、当該タスクjを参加すべきタス
クとして決定することを特徴とする冗長資源の管理方
法。 Fij<Fik−δ ただし、 k:現在実行しているタスクの番号 δ:不感帯の幅
8. In any one of claims 4 to 6, in determining the task j that minimizes the evaluation function Fij, if they meet the following relational expression, determining as a task should participate the task j A method for managing redundant resources, characterized in that: Fij <Fik−δ, where k is the number of the currently executed task δ is the width of the dead zone
【請求項9】請求項乃至の何れかにおいて、 前記Lrjは、フォールト発生の際、時間の経過に従って
低下することを特徴とする冗長資源の管理方法。
9. In any of claims 4 to 6, wherein Lrj is the time of fault occurrence, the management method of redundant resource, wherein a decrease over time.
【請求項10】請求項乃至の何れかにおいて、 前記Lrjの値は、単位時間ごとのタスクjの信頼度レベ
ルの移動平均として設定されることを特徴とする冗長資
源の管理方法。
10. A one of claims 4 to 6, the value of the Lrj the management method of redundant resource, characterized in that it is configured as a moving average of the confidence level of the task j per unit time.
【請求項11】請求項において、 前記Lrjの値をK(K:1以上の整数)次遅れ系(伝達
関数G(s)=1/(1+Ts)^K,T:時定数)に
より時間平均化することを特徴とする冗長資源の管理方
法。
11. The method according to claim 9 , wherein the value of Lrj is determined by a K (K: an integer of 1 or more) order delay system (transfer function G (s) = 1 / (1 + Ts) sK, T: time constant). A method for managing redundant resources, characterized by averaging.
【請求項12】請求項において、 評価関数Fijが前回の制御フレームと比べて変化してい
ない場合には、自コンピュータモジュールと同一のタス
クを実行しているコンピュータモジュールへのみフォー
ルト発生情報を通知し、評価関数Fijが前回の制御フレ
ームと比べて変化している場合には、全てのコンピュー
タモジュールへフォールト発生情報を通知することを特
徴とする冗長資源の管理方法。
12. In the ninth aspect , when the evaluation function Fij has not changed from the previous control frame, the fault occurrence information is notified only to the computer module executing the same task as that of the own computer module. If the evaluation function Fij has changed compared to the previous control frame, the redundant resource management method is characterized by notifying all computer modules of fault occurrence information.
JP25801393A 1993-10-15 1993-10-15 Redundant resource management method and distributed fault tolerant computer system using the same Expired - Fee Related JP3279004B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP25801393A JP3279004B2 (en) 1993-10-15 1993-10-15 Redundant resource management method and distributed fault tolerant computer system using the same
KR1019940026329A KR100375691B1 (en) 1993-10-15 1994-10-14 Logic circuit with fault detecting function, method for managing redundant resources and fault tolerant system using them

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25801393A JP3279004B2 (en) 1993-10-15 1993-10-15 Redundant resource management method and distributed fault tolerant computer system using the same

Publications (2)

Publication Number Publication Date
JPH07114520A JPH07114520A (en) 1995-05-02
JP3279004B2 true JP3279004B2 (en) 2002-04-30

Family

ID=17314322

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25801393A Expired - Fee Related JP3279004B2 (en) 1993-10-15 1993-10-15 Redundant resource management method and distributed fault tolerant computer system using the same

Country Status (1)

Country Link
JP (1) JP3279004B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4203001B2 (en) 2004-01-28 2008-12-24 株式会社東芝 Parallel calculation method, parallel calculation program, and computer
JP4669487B2 (en) * 2007-03-02 2011-04-13 株式会社日立製作所 Operation management apparatus and operation management method for information processing system
JP2013225208A (en) * 2012-04-20 2013-10-31 Toyota Motor Corp Information processing apparatus, information processing method and program
CN109543251B (en) * 2018-11-05 2023-03-24 中国航空工业集团公司西安飞机设计研究所 Method for guaranteeing grade distribution in development of airborne equipment
JP7181663B2 (en) * 2019-01-11 2022-12-01 富士通株式会社 Communication device, communication program, and distributed processing method
JP7346980B2 (en) * 2019-07-30 2023-09-20 マツダ株式会社 vehicle control system

Also Published As

Publication number Publication date
JPH07114520A (en) 1995-05-02

Similar Documents

Publication Publication Date Title
US8719624B2 (en) Redundant configuration management system and method
US8713352B2 (en) Method, system and program for securing redundancy in parallel computing system
EP1168178B1 (en) Logic circuit having error detection function
US11106454B2 (en) Software update control device, software update control method, and recording medium having software update control program stored thereon
WO2004049157A2 (en) Automated power control policies for distributed server pools based on application-specific computational requirements
JP2007500895A (en) Dynamically configurable fault tolerance in autonomous computing with multiple service points
JP2534430B2 (en) Methods for achieving match of computer system output with fault tolerance
JP3279004B2 (en) Redundant resource management method and distributed fault tolerant computer system using the same
EP0866389B1 (en) Replicated controller and fault recovery method thereof
CN113132176B (en) Method for controlling edge node, node and edge computing system
CN1322422C (en) Automatic startup of cluster system after occurrence of recoverable error
CN116860463A (en) Distributed self-adaptive spaceborne middleware system
CN114153635A (en) Message processing method, device, storage medium and computer equipment
Islam et al. Dependability driven integration of mixed criticality SW components
CN111209084B (en) FAAS distributed computing method and device
Rawashdeh et al. A technique for specifying dynamically reconfigurable embedded systems
CN115755570A (en) Scheduling arbitration method and device of multi-redundancy heterogeneous scheduling arbitrator
Ahistrom et al. Design method for conceptual design of by-wire control: two case studies
EP3389222A1 (en) A method and a host for managing events in a network that adapts event-driven programming framework
Miyamoto et al. FMPA: A Fault-Tolerant Multi-Microprocessor System Based on Autonomous Decentralization Concept
JPH0326936B2 (en)
CN113794595A (en) IoT (Internet of things) equipment high-availability method based on industrial Internet
CN116841804B (en) Dynamic reconfiguration method and chip based on chiplet
Yu et al. Reliability enhancement of real-time multiprocessor systems through dynamic reconfiguration
KR100763781B1 (en) Server management system and migration method

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090222

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees