JPH04241038A - Recovering method for high-reliability computer system - Google Patents

Recovering method for high-reliability computer system

Info

Publication number
JPH04241038A
JPH04241038A JP3007520A JP752091A JPH04241038A JP H04241038 A JPH04241038 A JP H04241038A JP 3007520 A JP3007520 A JP 3007520A JP 752091 A JP752091 A JP 752091A JP H04241038 A JPH04241038 A JP H04241038A
Authority
JP
Japan
Prior art keywords
board
processor
processors
basic
computer system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3007520A
Other languages
Japanese (ja)
Other versions
JP3246751B2 (en
Inventor
Takeshi Miyao
健 宮尾
Manabu Araoka
学 荒岡
Tomoaki Nakamura
智明 中村
Masayuki Tanji
雅行 丹治
Shigenori Kaneko
茂則 金子
Koji Masui
晃二 桝井
Saburo Iijima
三朗 飯島
Nobuyasu Kanekawa
信康 金川
Shinichiro Yamaguchi
伸一朗 山口
Yoshiki Kobayashi
芳樹 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Information and Control Systems Inc
Original Assignee
Hitachi Ltd
Hitachi Process Computer Engineering Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Process Computer Engineering Inc filed Critical Hitachi Ltd
Priority to JP00752091A priority Critical patent/JP3246751B2/en
Priority to EP92300212A priority patent/EP0496506B1/en
Priority to DE69231452T priority patent/DE69231452T2/en
Priority to CA002059143A priority patent/CA2059143C/en
Publication of JPH04241038A publication Critical patent/JPH04241038A/en
Priority to US08/434,288 priority patent/US5901281A/en
Priority to US09/188,903 priority patent/US6216236B1/en
Application granted granted Critical
Publication of JP3246751B2 publication Critical patent/JP3246751B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

PURPOSE:To eliminate various trouble due to the recombination of processors by disconnecting some of the processors in the case of trouble occurrence and switching all the processor into another new processor group at the time of recovery. CONSTITUTION:Three MPUs(microprocessing unit) of a BPU(basic processing unit) 2A are normally in operation. If trouble occurs to the MPUC during the execution of a process B, it is disconnected and the operation is carried on by the MPUA and MPUB. The printed board of a new BPU2B is inserted into a free slot in response to abnormality information by the MPUA, and then the respective MPUs in the new BPU2B diagnose themselves; and the process is transferred from the old BPU2A to the new BPU2B and a process D is carried out according to the result of majority decision making by the three MPUs. Thus, the process is taken over by carrying on the operation of the BPLT up to a good switching point of time or a repair maintenance period, so that the takeover is done at the most suitable point of time of software.

Description

【発明の詳細な説明】[Detailed description of the invention]

【0001】0001

【産業上の利用分野】本発明は高信頼化コンピュータシ
ステムにかかり、特に障害発生時に運転継続できること
は勿論、その後の復旧策について工夫された高信頼化コ
ンピュータシステムの復旧方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a highly reliable computer system, and more particularly to a method for restoring a highly reliable computer system that not only allows continued operation in the event of a failure, but also devises subsequent recovery measures.

【0002】0002

【従来の技術】例えば交通管制システムや、金融,証券
システムは情報化社会の浸透に伴い、社会生活の根幹を
占めるようになってきており、これらに使用されるコン
ピュータシステムは障害が発生しないように工夫される
とともに、仮に障害が発生したとしてもデータの一貫性
を保持したまま処理を続行するように構成される必要が
ある。
[Prior Art] For example, traffic control systems, financial systems, and securities systems have become the basis of social life as the information society spreads, and the computer systems used in these systems are designed to prevent failures. It also needs to be configured so that even if a failure occurs, processing can continue while maintaining data consistency.

【0003】これらの要求に応えるため、従来より、障
害許容コンピュータもしくは、耐故障,耐欠陥コンピュ
ータシステムが種々提案されており、障害が発生しても
データ処理を継続できるように同じ機能を有する複数の
システムないし、部品で構成し、各部で冗長性を持たせ
ることにより障害の発生したシステムないし部品を検出
し、データ処理を続行するようにされている。
[0003] In order to meet these demands, various fault-tolerant computers, fault-tolerant, and defect-tolerant computer systems have been proposed. It consists of a system or parts, and by providing redundancy in each part, it is possible to detect a system or part in which a failure has occurred and continue data processing.

【0004】具体的な従来例として、米国特許第465
4857 号は、通称ペアアンドスペア法と呼ばれる方
式を採用し、自己診断機能のあるメモリ,プロセッサ,
入出力制御装置などからなるプロセッサボード2枚を1
組にして動作する。どのプロセッサボードも内部には2
個のマイクロプロセッサを持ち、マイクロプロセッサの
出力を照合し、不一致の場合はボード故障と見なすこと
により、障害を検出している。また、プロセッサボード
からバスにだされた出力はもう一方のプロセッサボード
とバスクロック毎に照合、同期するロックステップ方式
を採用しており、片方のプロセッサボードで障害が発生
してもそのバスクロック内で検出し、切り離し処理が行
われ、正常なプロセッサボードの出力のみが使用される
As a specific conventional example, US Pat. No. 465
No. 4857 adopts a method commonly called the pair-and-spare method, and uses memory, processor, and
Two processor boards consisting of input/output control devices, etc.
Works in pairs. Every processor board has two
It has several microprocessors, and detects failures by comparing the outputs of the microprocessors and assuming that there is a discrepancy as a board failure. In addition, a lockstep method is adopted in which the output sent from the processor board to the bus is compared and synchronized with the other processor board for each bus clock, so even if a failure occurs on one processor board, the output will remain within that bus clock. The processor board is detected and disconnected, and only the output of the normal processor board is used.

【0005】また、特開昭59−160899号では、
米国特許第4654857 号と同様に二重のシステム
バスの夫々に接続され、その内部に2つのプロセッサを
有する2つのプロセッサボードを有し、その同期化のた
めにキャッシュメモリに着目し、キャッシュメモリから
主記憶装置へのフラッシュ動作をOS制御の下で行うこ
とにより、ロックステップ動作による性能制限を避けて
いる。そして、プロセッサボード内の2個のマイクロプ
ロセッサの照合により障害が検出された場合、前回のフ
ラッシュポイントから代替プロセッサボードで処理を再
実行する。
[0005] Also, in Japanese Patent Application Laid-open No. 160899/1989,
Similar to U.S. Pat. No. 4,654,857, this patent has two processor boards connected to each of the dual system buses and has two processors inside, and focuses on cache memory for synchronization. By performing the flash operation to the main memory under OS control, performance limitations due to lockstep operation are avoided. If a failure is detected by comparing the two microprocessors in the processor board, the process is re-executed on the alternative processor board from the previous flash point.

【0006】上記システムではプロセッサボード上の2
台と別のプロセッサボード上の2台の計4台のマイクロ
プロセッサを使用するが、特開平1−258057 号
では、TMR(Triple Modular Red
undancy )技法を採用し、プロセッサ3台の出
力結果を多数決回路を介して二重化システムバスに出力
する。
[0006] In the above system, two
A total of four microprocessors are used, one on one processor board and two on another processor board.
The output results of the three processors are output to the redundant system bus via the majority circuit.

【0007】[0007]

【発明が解決しようとする課題】上記従来例は、一つの
プロセッサボ−ド上に何台のプロセッサを配置するかと
言ったことは別にして、いずれの場合も3台乃至4台の
プロセッサを使用するシステムであり、そのいずれかの
プロセッサに障害を発生したときにはこのプロセッサを
切り離して2台運転にシステムを縮小し、その後新たな
別の1台または2台のプロセッサを組み込んで元のシス
テム構成に再構成されるものである。
[Problems to be Solved by the Invention] In the above conventional example, apart from the question of how many processors are arranged on one processor board, in any case, three to four processors are arranged on one processor board. If one of the processors fails, the system is cut down to two processors, and then one or two new processors are installed to restore the original system configuration. It is reconstructed into

【0008】これらのシステムでは障害発生前のプロセ
ッサの組と、復旧後のプロセッサの組とは全く相違する
。つまり、前2者の従来例では当初A,B,C,Dの4
つのプロセッサで運転していたとすると、復旧後のプロ
セッサ構成はE,FC,Dにて運転されることになる。 また最後の従来例では当初A,B,Cのものが、D,B
,Cとなる。このように従来のものでは障害発生後の復
旧時にプロセッサの組替えが必要であり、このため従来
例のものではそのシステムを構成する他のプロセッサと
の間での特別な接続、切離しハードウエア、同期機構が
必要である。また、プロセッサあるいはプロセッサボー
ドは徐々にバージョンアップされ、あるいはレビジョン
されるのが通例であるが、システムの一部であるプロセ
ッサあるいはプロセッサボードを交換する上記従来例で
は復旧後のミスマッチを防ぐための十分な事前対応が不
可欠である。また、プロセッサボードを交換するもので
は常に高価な交換ボードを準備しておく必要がある。さ
らに、プロセッサ間での同期化が困難である。
In these systems, the set of processors before a failure occurs and the set of processors after recovery are completely different. In other words, in the former two conventional examples, initially there were 4 A, B, C, and D.
If the system was operating with three processors, the processor configuration after recovery would be E, FC, and D. In addition, in the last conventional example, initially A, B, and C were changed to D, B
,C. In this way, with conventional systems, it is necessary to rearrange the processors when recovering after a failure occurs, and for this reason, with conventional systems, special connections, disconnection hardware, and synchronization with other processors that make up the system are required. A mechanism is necessary. In addition, although processors or processor boards are usually upgraded or revised gradually, in the above conventional example of replacing a processor or processor board that is part of a system, sufficient Preliminary measures are essential. Furthermore, when replacing the processor board, it is always necessary to prepare an expensive replacement board. Additionally, synchronization between processors is difficult.

【0009】以上のことから本発明では、障害発生後の
復旧時にプロセッサの組替えが不要な高信頼化コンピュ
ータシステムの復旧方法を提供することを目的とする。
In view of the above, an object of the present invention is to provide a method for restoring a highly reliable computer system that does not require processor replacement when restoring after a failure occurs.

【0010】0010

【課題を解決するための手段】本発明においては、シス
テムバス,該システムバスに接続される主記憶装置、シ
ステムバスに接続されるベーシックプロセッシングユニ
ットよりなる高信頼化コンピュータシステムにおいて、
前記ベーシックプロセッシングユニットが通常は第1,
第2,第3のプロセッサを備えて同一演算を実行してお
り、第1のプロセッサの故障時にこれを切り離して第2
,第3のプロセッサによる同一演算を実行し、その後第
4,第5,第6のプロセッサによる同一演算に処理を移
行して、第2,第3のプロセッサによる演算を停止する
ように構成変更される。
[Means for Solving the Problems] The present invention provides a highly reliable computer system comprising a system bus, a main storage device connected to the system bus, and a basic processing unit connected to the system bus.
The basic processing unit is usually a first,
It is equipped with second and third processors to execute the same operation, and when the first processor fails, it is disconnected and the second
, the configuration is changed so that the third processor executes the same operation, then the fourth, fifth, and sixth processors perform the same operation, and the second and third processors stop the operation. Ru.

【0011】[0011]

【作用】本発明では、障害発生時にその一部を切離し、
復旧時にプロセッサの全てを新たな別のプロセッサ群に
切替てしまうので、プロセッサの組替えに伴う種々の障
害が排除される。
[Operation] In the present invention, when a failure occurs, a part of it is separated,
Since all of the processors are switched to a new, different processor group at the time of recovery, various failures associated with processor rearrangement are eliminated.

【0012】0012

【実施例】以下本発明について詳細に説明するが、本明
細書での説明はその理解を容易にするために以下の項目
に分けて行う。
[Example] The present invention will be explained in detail below, but the explanation in this specification will be divided into the following items to facilitate understanding.

【0013】I. システムの概略全体構成II.  
BPU2の構成 III. 異常検出手法 IV. 異常時の構成変更制御 V. 内部バス接続時の信号処理 VI. 異常発生後の復旧策 VII. 各部回路の代案変形例 I. システムの概略全体構成 図1に本発明のフォルトトレーラントシステムの概略全
体構成を示す。このシステムは2組のシステムバス1−
1と1−2を有しており、このバス上には一つまたは複
数のベーシックプロセッシングユニット(以下単にBP
Uという)2−1,2−2……2−nがシステムバス1
−1と1−2に夫々接続されている。またシステムバス
1−1には主記憶装置3−1が、1−2には主記憶装置
3−2が夫々個別に接続され、入出力装置(以下単にI
OUという)4−1,4−2が夫々システムバスの何れ
にも接続される。主記憶装置3及びIOU4は、夫々2
台を一組として使用され、図1の例では各一組づつ使用
する例を示しているが、これはシステムの拡張に応じて
適宜組数を増加して使用することができる。図示のn組
のBPUは、通常は夫々別の処理を実行しているが、何
れも同じ構成とされているのでここでの説明は特に必要
のないかぎりBPU2−1を例にとってその構成及び作
用について説明する。
I. Schematic overall configuration of the system II.
Configuration of BPU2 III. Anomaly detection method IV. Configuration change control in case of abnormality V. Signal processing during internal bus connection VI. Recovery measures after an abnormality occurs VII. Alternative modification example of each part circuit I. Schematic Overall Structure of the System FIG. 1 shows the schematic overall structure of the fault-tolerant system of the present invention. This system consists of two system buses 1-
1 and 1-2, and on this bus there is one or more basic processing units (hereinafter simply BP).
2-1, 2-2...2-n is system bus 1
-1 and 1-2, respectively. In addition, a main storage device 3-1 is connected to the system bus 1-1, and a main storage device 3-2 is connected to the system bus 1-2.
(referred to as OU) 4-1 and 4-2 are respectively connected to either system bus. The main storage device 3 and IOU4 each have 2
The units are used as a set, and the example in FIG. 1 shows an example in which each set is used, but the number of sets can be increased as appropriate as the system expands. The illustrated n sets of BPUs normally execute different processes, but since they all have the same configuration, the configuration and operation will be explained using BPU 2-1 as an example unless otherwise necessary. I will explain about it.

【0014】BPU2は、複数のマイクロプロセッシン
グユニット20(以下単にMPUという。図の例では3
台)、複数のMPU出力チェック回路23(図の例では
3台)、3ステートバッファ回路29等、複数のキャッ
シュメモリ220,221,複数のバスインターフェイ
ス回路27(以下単にBIUという)等を主要な構成要
件としている。ここで図1回路の概略の動作を説明して
おくと、3台のMPU20により演算が実行され、この
MPUの出力がチェック回路23においてチェックされ
、正常と判断された2つのMPUの出力が夫々バスイン
ターフェイス回路27を介して2組のシステムバス1、
あるいは2組のキャッシュメモリ220,221に夫々
出力される。MPUの1つに異常が発見された場合、こ
のMPUは除外されて残りの2つの正常なMPUにより
その出力が夫々バスインターフェイス回路27を介して
2組のシステムバス1に、あるいは2組のキャッシュメ
モリ220,221に夫々出力される。3台のMPU2
0の一部に異常が発見された後は、適宜のタイミングで
3台のMPU20が全く別の新たな3台のMPU20に
切替られて演算を実行する。
The BPU 2 includes a plurality of microprocessing units 20 (hereinafter simply referred to as MPUs; in the example shown in the figure, 3
), multiple MPU output check circuits 23 (three in the example shown), three-state buffer circuits 29, multiple cache memories 220, 221, multiple bus interface circuits 27 (hereinafter simply referred to as BIU), etc. It is considered a configuration requirement. To briefly explain the operation of the circuit in FIG. 1, three MPUs 20 execute calculations, the outputs of these MPUs are checked in the check circuit 23, and the outputs of the two MPUs determined to be normal are respectively two sets of system buses 1 via the bus interface circuit 27;
Alternatively, the data is output to two sets of cache memories 220 and 221, respectively. If an abnormality is found in one of the MPUs, this MPU is excluded and the remaining two normal MPUs send their outputs to two sets of system buses 1 via the bus interface circuit 27, or to two sets of caches. The signals are output to memories 220 and 221, respectively. 3 MPU2
After an abnormality is discovered in a part of 0, the three MPUs 20 are switched to three completely different new MPUs 20 at an appropriate timing to execute calculations.

【0015】II.BPU2の構成 BPU2のより詳細な構成は図2に示されている。なお
後述するように、BPUは一枚のプリント板上に図示の
機能を搭載されるのが良い。
II. Configuration of BPU2 A more detailed configuration of BPU2 is shown in FIG. As will be described later, it is preferable that the BPU has the illustrated functions mounted on a single printed board.

【0016】図2において、3台のMPU20−1,2
0−2,20−3は図示せぬクロックにより同期演算が
実行され、その結果がアドレスラインAとデータライン
Dに夫々出力される。MPU20−1,20−2,20
−3のアドレスラインA上のアドレスとデータラインD
上のデータには、パリティ生成/検査照合回路10乃至
15から適宜のパリティ信号が付与されてMPU出力チ
ェック回路23に与えられる。MPU出力チェック回路
23は、MPUA(20−1)からの出力(パリティ信
号が付与されたアドレス,データ)とMPUB(20−
2)からの出力とを比較する第1のチェック回路CHK
AB(23−1)と、MPUA(20−1)からの出力
とMPUC(20−3)からの出力とを比較する第2の
チェック回路CHKCA (23−2)と、MPUB(
20−2)からの出力とMPUC(20−3)からの出
力とを比較する第3のチェック回路CHKBC (23
−3)と、3つのチェック回路CHKからの比較結果に
応じてMPUのいずれの故障であるかを特定するエラー
チェック回路234,235から構成される。このMP
U出力チェック回路23はいわゆる多数決回路であり、
この判定結果に応じて3ステートバッファ回路200,
201,203,204,29の開閉状態が制御される
。この判定結果と3ステートバッファ回路の状態の関係
については後述するが、要するに異常と判定されたMP
Uを以後使用せず、正常とされたMPUの出力を2つの
キャッシュメモリ220,221に与えて2重系として
運用するものである。なお、以下の説明においては3ス
テートバッファ回路のイネーブル状態を単に開状態と称
し、ディセーブル状態を閉状態ということにする。
In FIG. 2, three MPUs 20-1 and 2
0-2 and 20-3 are subjected to synchronous calculations by a clock (not shown), and the results are output to address line A and data line D, respectively. MPU20-1, 20-2, 20
-3 address on address line A and data line D
Appropriate parity signals are added to the above data from the parity generation/check verification circuits 10 to 15, and the resulting data is applied to the MPU output check circuit 23. The MPU output check circuit 23 checks the output from MPUA (20-1) (address and data to which a parity signal is attached) and MPUB (20-1).
2) A first check circuit CHK that compares the output from
AB (23-1), a second check circuit CHKCA (23-2) that compares the output from MPUA (20-1) and the output from MPUC (20-3), and MPUB (
A third check circuit CHKBC (20-2) and an output from MPUC (20-3) are compared.
-3), and error check circuits 234 and 235 that identify which MPU is at fault in accordance with the comparison results from the three check circuits CHK. This MP
The U output check circuit 23 is a so-called majority circuit,
According to this determination result, the 3-state buffer circuit 200,
The open/close states of 201, 203, 204, and 29 are controlled. The relationship between this determination result and the state of the 3-state buffer circuit will be described later, but in short, the MP determined to be abnormal
U is no longer used, and the output of the MPU determined to be normal is given to the two cache memories 220 and 221 to operate as a dual system. In the following description, the enabled state of the three-state buffer circuit will be simply referred to as an open state, and the disabled state will be referred to as a closed state.

【0017】3ステートバッファ回路200,201,
203,204を介して得られたアドレス、データは2
つのキャッシュメモリ220,221に夫々与えられ、
その際パリティチェック回路250においてパリティ生
成/検査照合回路10乃至15で付与したパリティのチ
ェックが行われる。またMPU出力は、同期回路290
,291において2つのMPU出力の同期が図られ、バ
スインターフェイスユニットBIUを介してシステムバ
スに送出される。その際パリティチェック回路30,3
1においてパリティ生成/検査照合回路10乃至15で
付与したパリティのチェックが行われる。以上の構成は
、MPUからのライトアクセスを主体に述べたものであ
るが、このようにMPUからのライトアクセスのときは
MPU出力チェック回路23とパリティチェック回路3
0,31においてチェックが行われる。
3-state buffer circuits 200, 201,
The address and data obtained through 203 and 204 are 2
cache memories 220 and 221, respectively,
At that time, the parity check circuit 250 checks the parity given by the parity generation/checking and matching circuits 10 to 15. Also, the MPU output is output from the synchronous circuit 290.
, 291, the two MPU outputs are synchronized and sent to the system bus via the bus interface unit BIU. At that time, the parity check circuit 30, 3
1, the parity assigned by the parity generation/checking and matching circuits 10 to 15 is checked. The above configuration mainly describes write access from the MPU, but in this way, when write access from the MPU is performed, the MPU output check circuit 23 and the parity check circuit 3
A check is made at 0,31.

【0018】これに対し、キャッシュリードアクセス時
は、各キャッシュメモリ220,221,3ステートバ
ッファ回路202,205,MPUのル−トで信号伝送
が行われ、この場合にはパリティ生成/検査照合回路1
0乃至15でキャッシュメモリからのアドレス,データ
のチェックが行われる。なお、26,27も3ステート
バッファ回路であり、キャッシュリードアクセス時にパ
リティ生成/検査照合回路10乃至15でのアドレス,
データのチェック結果に応じて開閉状態が制御される。
On the other hand, during cache read access, signals are transmitted through the routes of each cache memory 220, 221, 3-state buffer circuits 202, 205, and MPU, and in this case, the parity generation/check verification circuit 1
Addresses and data from the cache memory are checked from 0 to 15. Note that 26 and 27 are also 3-state buffer circuits, and the addresses in the parity generation/check verification circuits 10 to 15 are
The opening/closing state is controlled according to the data check results.

【0019】図2の構成から明らかなように、本発明の
BPUシステムでは少なくとも3台のMPUと、多数決
回路による異常MPU検出回路と、二重化されたキャッ
シュメモリと、二重化された出力回路部分とを有する。
As is clear from the configuration of FIG. 2, the BPU system of the present invention includes at least three MPUs, an abnormal MPU detection circuit using a majority circuit, a duplicated cache memory, and a duplicated output circuit portion. have

【0020】III.異常検出手法 図2のBPU内部には、その異常検出部としてMPU出
力チェック回路23と、多くのパリティチェック回路を
採用している。この項では、これらの異常検出手法につ
いて説明する。
III. Abnormality Detection Method Inside the BPU shown in FIG. 2, an MPU output check circuit 23 and many parity check circuits are employed as an abnormality detection section. This section describes these anomaly detection methods.

【0021】《MPU出力回路による異常検出》このう
ち、MPU出力チェック部分について図3に示す。図3
において第1のチェック回路CHKAB の出力をAB
,第2のチェック回路CHKCA の出力をCA,第3
のチェック回路CHKBC の出力をBC,エラーチェ
ック回路231の出力を夫々Ag,Cg,29gとして
、3つのチェック回路の出力とそのときの3ステートバ
ッファ回路の開閉状態との関係について説明する。なお
、この図においてCは図2では記述しない制御線である
<<Abnormality Detection by MPU Output Circuit>> Of these, the MPU output check portion is shown in FIG. Figure 3
AB the output of the first check circuit CHKAB
, the output of the second check circuit CHKCA, and the output of the third check circuit CHKCA
Letting the output of the check circuit CHKBC be BC, and the outputs of the error check circuit 231 as Ag, Cg, and 29g, the relationship between the outputs of the three check circuits and the open/close states of the three-state buffer circuit at that time will be explained. Note that in this figure, C is a control line that is not described in FIG.

【0022】まず、第1乃至第3のチェック回路CHK
は、その夫々の2組の入力(アドレス,データ,制御信
号)を得て、第1のチェック回路CHKAB はMPU
Aの出力とMPUBの出力との比較結果ABを、第2の
チェック回路CHKCA はMPUAの出力とMPUC
の出力との比較結果CAを、第3のチェック回路CHK
BC はMPUBの出力とMPUCの出力との比較結果
BCを出力する。この比較結果は一致するか、しないか
のいずれかの状態信号である。
First, the first to third check circuits CHK
obtains their respective two sets of inputs (address, data, control signals), and the first check circuit CHKAB is connected to the MPU
The second check circuit CHKCA compares the comparison result AB between the output of A and the output of MPUB with the output of MPUA and MPUC.
The comparison result CA with the output of
BC outputs the comparison result BC between the output of MPUB and the output of MPUC. The result of this comparison is a status signal that either matches or does not match.

【0023】エラーチェック回路231は、3つのチェ
ック回路CHKの出力AB,BC,CAから、(1),
(2),(3)式に従いMPUA,MPUB,MPUC
の正常を表す出力Ag,Bg,Cgを得る。なお、図2
,図3においてエラーチェック回路は二重化されている
The error check circuit 231 detects (1),
MPUA, MPUB, MPUC according to formulas (2) and (3)
Outputs Ag, Bg, and Cg representing normality are obtained. In addition, Figure 2
, the error check circuit in FIG. 3 is duplicated.

【0024】   Ag=「AB・「CA+「AB・BC・CA+AB
・BC・「CA……(1)  Bg=「AB・「BC+
「AB・BC・CA+AB・「BC・CA……(2) 
 Cg=「BC・「CA+AB・「BC・CA+AB・
BC・「CA……(3)  但し、AB:MPUAとM
PUBの出力不一致の事象(23−1で確認)    
    BC:MPUBとMPUCの出力不一致の事象
(23−3で確認)        CA:MPUAと
MPUCの出力不一致の事象(23−2で確認)   
       ・:論理積(AND)        
  +:論理和(OR)          「:否定
(NOT)(1),(2),(3)式演算の結果に応じ
て3ステートバッファ回路200,201,204,2
05,29の開閉状態が制御されるが、この説明は次の
項で行う。表1は、3つのチェック回路CHKAB,C
HKBC 、CHKCA の出力(一致,不一致)と、
このときの異常MPUの判定結果Ag,Bg,Cgと、
その結果としての3ステートバッファ回路の開閉状態を
纏めた表である。なお、表1中の判定結果の項において
、1はMPU正常,0は異常または不明を意味する。
Ag="AB・"CA+"AB・BC・CA+AB
・BC・"CA...(1) Bg="AB・"BC+
"AB・BC・CA+AB・"BC・CA...(2)
Cg="BC・"CA+AB・"BC・CA+AB・
BC/“CA…(3) However, AB: MPUA and M
PUB output mismatch event (confirmed with 23-1)
BC: Event of mismatched output between MPUB and MPUC (confirmed in 23-3) CA: Event of mismatched output between MPUA and MPUC (confirmed in 23-2)
・: Logical product (AND)
+: Logical sum (OR) ": Negation (NOT) 3-state buffer circuits 200, 201, 204, 2 according to the results of the calculations of expressions (1), (2), and (3)
The open/close states of 05 and 29 are controlled, and this will be explained in the next section. Table 1 shows the three check circuits CHKAB,C
HKBC, CHKCA output (match, mismatch),
The determination results Ag, Bg, Cg of the abnormal MPU at this time,
This is a table summarizing the open/close states of the 3-state buffer circuit as a result. Note that in the determination result section of Table 1, 1 means MPU normal, and 0 means abnormal or unknown.

【0025】表2は表1の一致,不一致のチェック回路
出力を生じる原因として想定される事例の一部を述べた
ものであるが、(本発明は、異常の際にBPU内の回路
構成を如何に変更し運転継続させるかに主眼があり、異
常発生原因を特定することは本旨ではないので)ここで
の詳細説明を省略する。
[0025] Table 2 describes some of the cases that are assumed to be the causes of the match/mismatch check circuit outputs in Table 1. The main focus is on how to make changes and continue operation, and the main purpose is not to identify the cause of the abnormality, so a detailed explanation will be omitted here.

【0026】[0026]

【表1】[Table 1]

【0027】[0027]

【表2】[Table 2]

【0028】図3,図2,表1,表2を参照して説明し
たように、本発明においては、MPU出力チェック回路
23で以上の論理でMPUの正常,異常を判断する。
As explained with reference to FIGS. 3, 2, Tables 1 and 2, in the present invention, the MPU output check circuit 23 determines whether the MPU is normal or abnormal based on the above logic.

【0029】次に、BPU内各部にその他の異常検出手
法として採用したパリティチェック回路による異常検出
手法について説明する。但し、パリティチェック回路自
体は周知であり任意のものが採用できるので回路につい
ての詳細説明を省略し、ここではパリティエラー検出し
たときの異常個所特定手法について説明する。
Next, a description will be given of an abnormality detection method using a parity check circuit, which is employed as another abnormality detection method in each part of the BPU. However, since the parity check circuit itself is well known and any one can be used, a detailed explanation of the circuit will be omitted, and a method for identifying an abnormal location when a parity error is detected will be described here.

【0030】図2に示すように、ライトアクセス時には
パリティ生成/検査照合回路10乃至15から適宜のパ
リティ信号が付与されてアドレスラインA,データライ
ンDに情報送出され、この異常をパリティチェック回路
250,30,31にて検知する。またリードアクセス
時には、パリティ生成/検査照合回路10乃至15,パ
リティチェック回路250,30,31にて情報の異常
を検知する。これらのパリティチェックは基本的にアド
レスとデータに分けて個別に実施される。そしてアドレ
スについてみると、アドレス情報にパリティエラー検出
したときの異常個所はこのアドレス信号を送出している
バスマスタであり、図2の内部バスの使用権を与えるバ
スアービタ(図示していない)からのバスグラント信号
を監視することでバスマスタとなっている機器(MPU
,キャッシュメモリ,BIU)を特定することができる
。次にデータについてみると、ライトアクセス時にデー
タ情報のパリティエラー検出したときの異常個所はこの
データ信号を送出しているバスマスタである。バスマス
タの特定は、バスアービタのバスグラント信号監視によ
り行われる。最後に、リードアクセス時にデータ情報の
パリティエラー検出したときの異常個所はこのデータ信
号の出力元であり、この特定はこのデータに付属するア
ドレスが指し示しているデバイスをアドレスをデコード
することで特定できる。
As shown in FIG. 2, at the time of write access, appropriate parity signals are applied from the parity generation/check verification circuits 10 to 15 and information is sent to the address line A and data line D, and this abnormality is detected by the parity check circuit 250. , 30, 31. Furthermore, during read access, parity generation/check verification circuits 10 to 15 and parity check circuits 250, 30, and 31 detect abnormalities in information. These parity checks are basically performed separately for addresses and data. Regarding the address, when a parity error is detected in the address information, the abnormality is the bus master that is sending out this address signal, and the bus arbiter (not shown) that gives the right to use the internal bus in Figure 2. The device (MPU) that is the bus master by monitoring the grant signal
, cache memory, BIU). Next, regarding data, when a parity error in data information is detected during write access, the abnormality is the bus master that is sending out this data signal. The bus master is identified by monitoring the bus grant signal of the bus arbiter. Finally, when a parity error is detected in data information during read access, the abnormal location is the output source of this data signal, and this can be identified by decoding the address to the device pointed to by the address attached to this data. .

【0031】この異常個所特定の考え方を論理式にて示
すと以下のようになる。
[0031] The concept of specifying the abnormal location can be expressed as a logical formula as follows.

【0032】《パリティチェックによる異常検出》PT
YGEN/NG=APE・MPU/MST+DPE(W
T・MPU/MST            +RD・
MPU/SND)                 
         ……(4)Cach/NG=APE
・Cach/MST+DPE(WT・Cach/MST
                +RD・Cach/
SND)                    …
…(5)BIU/NG=APE・BIU/MST+DP
E(WT・BIU/MST             
 +RD・BIU/SND)            
            ……(6)SYSBUS/N
G=BIU/NG                 
                   ……(7)但
し、(4)乃至(7)式において、 PTYGEN:パリティ生成/検査照合回路10乃至1
5/NG:パリティ異常 APE:アドレスパリティ異常 ・:論理積 /MST:バスマスタ +:論理和 DPE:データパリティ異常 WT:バスマスタがデータ出力 Cach:キャッシュメモリ RD:バスマスタがデータ入力 /SND:データ出力元 IV.異常時の構成変更制御 BPU内の異常には、MPUからのライトアクセス時に
MPU出力チェック回路で検知されるものと、ライトア
クセス時あるいはキャッシュリードアクセス時にパリテ
ィチェック回路で発見されるものとがある。
<<Abnormality detection by parity check>> PT
YGEN/NG=APE・MPU/MST+DPE(W
T・MPU/MST +RD・
MPU/SND)
...(4) Cach/NG=APE
・Cach/MST+DPE (WT・Cach/MST
+RD・Cach/
SND)...
...(5) BIU/NG=APE・BIU/MST+DP
E(WT・BIU/MST
+RD・BIU/SND)
...(6) SYSBUS/N
G=BIU/NG
...(7) However, in equations (4) to (7), PTYGEN: parity generation/check matching circuits 10 to 1
5/NG: Parity error APE: Address parity error ・: AND/MST: Bus master +: OR DPE: Data parity error WT: Bus master outputs data Cach: Cache memory RD: Bus master inputs data/SND: Data output source IV. Configuration change control during abnormality Abnormalities within the BPU include those detected by the MPU output check circuit during write access from the MPU, and those detected by the parity check circuit during write access or cache read access.

【0033】 〔MPU出力チェック回路による異常検出時の構成変更
〕 前記MPU出力チェック回路23のエラーチェック回路
231の出力Agに応じて3ステートバッファ回路20
0,201が、Cgに応じて203,204が、29g
に応じて29の開閉状態が、夫々表1のように制御され
る。なお、表1において、MPU判定結果Ag=1は2
00,201開、Ag=0は200,201閉に基本的
に対応し、Cg=1は203,204開、Cg=0は2
03,204閉に基本的に対応するが、Bgと29gは
対応関係にはない。29g従って、29の開閉状態は、
Ag=1かつCg=1のときに閉、AgとCgのいずれ
かが1のときは0となった3ステートバッファ回路に向
かう方向の3ステートバッファ回路29のみが開放され
る。以下、表1の各ケースについて、図4の系統構成を
参照してより詳細に説明する。
[Configuration change when an abnormality is detected by the MPU output check circuit] The three-state buffer circuit 20 changes depending on the output Ag of the error check circuit 231 of the MPU output check circuit 23.
0,201 is 203,204 depending on Cg, 29g
The opening/closing states of 29 are controlled as shown in Table 1, respectively. In addition, in Table 1, MPU determination result Ag=1 is 2
00,201 open, Ag=0 basically corresponds to 200,201 closed, Cg=1 is 203,204 open, Cg=0 is 2
It basically corresponds to 03 and 204 closures, but Bg and 29g do not have a corresponding relationship. 29g Therefore, the open/closed state of 29 is:
When Ag=1 and Cg=1, it is closed, and when either Ag or Cg is 1, only the 3-state buffer circuit 29 in the direction toward the 3-state buffer circuit, which is 0, is opened. Each case in Table 1 will be described in more detail below with reference to the system configuration in FIG. 4.

【0034】ケース1:全てのMPU出力が一致し、全
MPU正常である。3ステートバッファ回路200,2
01,203,204が開状態,29が閉状態とされ、
図4(a)のようにMPUAとキャッシュメモリ220
による系統と、MPUCとキャッシュメモリ221によ
る系統とが独立して二重化運用される。
Case 1: All MPU outputs match and all MPUs are normal. 3-state buffer circuit 200,2
01, 203, 204 are in the open state, 29 is in the closed state,
As shown in FIG. 4(a), the MPUA and cache memory 220
The system based on the MPUC and the cache memory 221 are independently operated in a redundant manner.

【0035】ケース2:チェック回路CHKCA のみ
が不一致出力を与えており、MPUBのみが正常と判断
される。図2に示すようにMPUBは他のMPUの参照
用として使用され、キャッシュメモリに出力を与えるよ
うに構成されていないので構成変更しての運転継続不可
能であり、この場合システムダウンとなる。
Case 2: Only the check circuit CHKCA gives a non-coincidence output, and only MPUB is judged to be normal. As shown in FIG. 2, MPUB is used as a reference for other MPUs and is not configured to provide output to the cache memory, so it is impossible to continue operation even after changing the configuration, and in this case, the system will go down.

【0036】ケース3:チェック回路CHKBC のみ
が不一致出力を与えており、MPUAのみが正常と判断
される。この場合には3ステートバッファ回路200,
201が開状態,203,204が閉状態,29はキャ
ッシュメモリ221方向への3ステートバッファ回路の
みが開状態とされる。MPUBとMPUCは停止され、
図4(b)のようにMPUAのみによる単独系統による
運転とされる。キャッシュメモリ221方向への3ステ
ートバッファ回路29のみが開状態とされるのは、キャ
ッシュメモリ記憶内容の同一性保持のためである。
Case 3: Only the check circuit CHKBC is giving a non-coincidence output, and only the MPUA is judged to be normal. In this case, the 3-state buffer circuit 200,
201 is open, 203 and 204 are closed, and only the 3-state buffer circuit 29 toward the cache memory 221 is open. MPUB and MPUC are stopped,
As shown in FIG. 4(b), the system is operated by a single system using only the MPUA. The reason why only the three-state buffer circuit 29 toward the cache memory 221 is kept open is to maintain the sameness of the contents stored in the cache memory.

【0037】ケース4:チェック回路CHKAB のみ
が一致出力を与えており、MPUAとMPUBが正常と
判断される。この場合には3ステートバッファ回路20
0,201が開状態,203,204が閉状態、29は
キャッシュメモリ221方向への3ステートバッファ回
路のみが開状態とされる。この場合にはMPUCを停止
し、図4(c)のようにMPUAとMPUBで二重系を
構成して、MPUBによりMPUAの出力を監視する二
重化運転とされる。キャッシュメモリ221方向への3
ステートバッファ回路29のみが開状態とされるのは、
キャッシュメモリ記憶内容の同一性保持のためである。
Case 4: Only the check circuit CHKAB gives a matching output, and MPUA and MPUB are judged to be normal. In this case, the 3-state buffer circuit 20
0 and 201 are open, 203 and 204 are closed, and only the 3-state buffer circuit 29 toward the cache memory 221 is open. In this case, the MPUC is stopped, a duplex system is configured with MPUA and MPUB as shown in FIG. 4(c), and a duplex operation is performed in which the output of MPUA is monitored by MPUB. 3 toward cache memory 221
Only the state buffer circuit 29 is open because
This is to maintain the identity of the contents stored in the cache memory.

【0038】ケース5:チェック回路CHKAB のみ
が不一致出力を与えており、MPUAとMPUBが異常
,MPUAのみが正常と判断される。この場合には3ス
テートバッファ回路200,201が閉状態,203,
204が開状態,29はキャッシュメモリ220方向へ
の3ステートバッファ回路のみが開状態とされる。この
場合にはMPUAとMPUBを停止し、図4(d)のよ
うにMPUCのみによる単独運転とされる。キャッシュ
メモリ220方向への3ステートバッファ回路29のみ
が開状態とされるのは、キャッシュメモリ記憶内容の同
一性保持のためである。
Case 5: Only the check circuit CHKAB is giving a non-coincidence output, and it is determined that MPUA and MPUB are abnormal and only MPUA is normal. In this case, the three-state buffer circuits 200, 201 are in the closed state, 203,
204 is in an open state, and only the 3-state buffer circuit 29 toward the cache memory 220 is in an open state. In this case, MPUA and MPUB are stopped, and only MPUC operates independently as shown in FIG. 4(d). The reason why only the three-state buffer circuit 29 toward the cache memory 220 is kept open is to maintain the sameness of the contents stored in the cache memory.

【0039】ケース6:チェック回路CHKBC のみ
が一致出力を与えており、MPUCとMPUBが正常と
判断される。この場合には3ステートバッファ回路20
0,201が閉状態,203,204が開状態,29は
キャッシュメモリ220方向への3ステートバッファ回
路のみが開状態とされる。この場合には基本的にケース
4と同様に運用される。
Case 6: Only the check circuit CHKBC gives a matching output, and MPUC and MPUB are judged to be normal. In this case, the 3-state buffer circuit 20
0 and 201 are in the closed state, 203 and 204 are in the open state, and 29, only the three-state buffer circuit toward the cache memory 220 is in the open state. In this case, the operation is basically the same as Case 4.

【0040】ケース7:チェック回路CHKCA のみ
が一致出力を与えており、MPUCとMPUAが正常と
判断される。この場合には参照用MPUの異常なので、
図4(e)ケース7のように、MPUBのみを切離し、
3ステートバッファ回路は何等の変更もせずにMPUC
とMPUAによる二重化運転を継続する。
Case 7: Only the check circuit CHKCA gives a matching output, and MPUC and MPUA are judged to be normal. In this case, the reference MPU is abnormal, so
As in case 7 of Fig. 4(e), only MPUB is separated,
The 3-state buffer circuit can be used as MPUC without any modification.
and continue duplex operation using MPUA.

【0041】ケース8:いずれのチェック回路CHKも
不一致を検出しており、全MPU異常であることから以
後の運転継続不可能である。
Case 8: Since both check circuits CHK have detected a mismatch and all MPUs are abnormal, it is impossible to continue operation from now on.

【0042】以上のようにして、3台のMPUとその周
辺回路(例えばパリティ生成/検査照合回路)の正常性
が確認され、適宜構成変更制御が実施されるが、この表
1はあくまでも照合結果の考え得る組合せを述べたにす
ぎず、実際問題としてはケース2から8の7つの異常事
象が同一確率で発生するわけではない。つまり、このう
ち単一故障のケースは4,6,7の3事例、二重故障は
2,3,5の3事例、三重故障は8のケースであり、良
く知られているように運転継続不能となるケース2,8
を含む多重故障の同時発生確率は単一故障に比べて極め
て低い。しかも、実際には単一故障が進展して多重故障
に至ることが殆どであり、従って単一故障の時点で何等
かの回復対策を施すことで事実上運転継続に支障のない
システム構成とすることができる。なお、本発明では仮
に二重故障が発生したとしても多くの場合に支障無く運
転継続可能であり、この意味においては非常に信頼性の
高いシステムであるといえる。
[0042] As described above, the normality of the three MPUs and their peripheral circuits (for example, parity generation/check verification circuits) is confirmed, and configuration change control is implemented as appropriate. However, Table 1 only shows the verification results. This is merely a description of possible combinations, and in reality, the seven abnormal events in cases 2 to 8 do not occur with the same probability. In other words, among these, there are three cases of single failure (4, 6, and 7), three cases of double failure (2, 3, and 5), and three cases of triple failure (8 cases), and as is well known, operation continues. Cases 2 and 8 where it becomes impossible
The probability of multiple failures including multiple failures occurring simultaneously is extremely low compared to a single failure. Moreover, in reality, in most cases, a single failure progresses and leads to multiple failures, so by taking some kind of recovery measures at the time of a single failure, it is necessary to create a system configuration that virtually does not hinder continued operation. be able to. In addition, in the present invention, even if a double failure occurs, operation can be continued without any trouble in most cases, and in this sense, it can be said that the system is extremely reliable.

【0043】なお、以上の異常事象発生の際に図2には
図示がないが、異常MPUを停止する信号がMPU出力
チェック回路23から発生されてこれを停止し、あるい
は外部出力されて運転員に異常の発生を報知し、以後の
対策の必要性を報知せしめることは当然のこととして行
われる。
Although not shown in FIG. 2, when the above-mentioned abnormal event occurs, a signal to stop the abnormal MPU is generated from the MPU output check circuit 23 and is stopped, or is output externally and sent to the operator. It is a matter of course to notify the user of the occurrence of an abnormality and the necessity of future countermeasures.

【0044】 〔パリティチェックによる異常検出時の構成変更〕前記
のIII 項で述べたようにして、ライトアクセス時あ
るいはキャッシュリードアクセス時に、キャッシュメモ
リ220,221,BIU27−1,27−2の異常個
所が特定できる。次に各異常の時のBPU内部の構成変
更制御について説明する。なお、表3はキャッシュリー
ドアクセス時の各部異常の際にキャッシュメモリ220
,221,BIU27−1,27−2,3ステートバッ
ファ回路29,26,27をどのように制御するのかを
一覧表にしたものである。
[Configuration change when abnormality is detected by parity check] As described in Section III above, abnormal locations in the cache memories 220, 221, BIUs 27-1, 27-2 are changed during write access or cache read access. can be identified. Next, the configuration change control inside the BPU at the time of each abnormality will be explained. Table 3 shows that the cache memory 220 is
, 221, BIU 27-1, 27-2, and how to control the 3-state buffer circuits 29, 26, and 27.

【0045】[0045]

【表3】[Table 3]

【0046】図5は各ケースの時の回路構成を図示した
ものであり、以下表3と図5を参照して説明する。図5
(a)は正常時の信号の流れを示している。この場合、
3ステートバッファ回路29,26は閉、27は開とさ
れており、従ってBIU27−1またはキャッシュメモ
リ220からの情報がMPUA20−1と、MPUB2
0−1に供給され、BIU27−2またはキャッシュメ
モリ221からの情報がMPUC20−3に供給される
。このように、通常はBIU27−1、キャッシュメモ
リ220,MPUA20−1,MPUB20−1が一つ
の組を構成し、BIU27−2,キャッシュメモリ22
1,MPUC20−3が別の一組を構成するように運用
される。
FIG. 5 shows the circuit configuration for each case, which will be explained below with reference to Table 3 and FIG. Figure 5
(a) shows the signal flow during normal operation. in this case,
The 3-state buffer circuits 29 and 26 are closed, and the 3-state buffer circuit 27 is open, so that information from the BIU 27-1 or the cache memory 220 is transferred to the MPUA 20-1 and the MPUB 2.
0-1, and information from the BIU 27-2 or the cache memory 221 is supplied to the MPUC 20-3. In this way, normally the BIU 27-1, the cache memory 220, the MPUA 20-1, and the MPUB 20-1 constitute one set, and the BIU 27-2 and the cache memory 22
1. The MPUC 20-3 is operated to form another set.

【0047】ケース1:キャッシュメモリ220の異常
である。図5(b)のように、キャッシュメモリ220
の出力が停止され、3ステートバッファ回路29はMP
UA20−1側への信号のみが通過するように制御され
、3ステートバッファ回路26は開、27は閉とされる
。これにより、全てのMPUはキャッシュメモリ221
からの共通情報を受け取るように構成されて異常発見後
も運転継続される。なお、3ステートバッファ回路26
を開、27を閉のように正常状態から切替る理由は、論
理的にはキャッシュメモリ220の異常と特定していて
も、キャッシュメモリ220が接続された内部バスの異
常の可能性も否定できず、念のためにキャッシュメモリ
221側に切替るものである。もし、キャッシュメモリ
220が接続された内部バスの異常のときは、3ステー
トバッファ回路29が一方向通信となっているためにM
PUC側にはその影響が現れない。
Case 1: The cache memory 220 is abnormal. As shown in FIG. 5(b), the cache memory 220
The output of MP is stopped, and the 3-state buffer circuit 29
It is controlled so that only the signal to the UA 20-1 side passes through, the 3-state buffer circuit 26 is open, and the 3-state buffer circuit 27 is closed. As a result, all MPUs are connected to the cache memory 221.
The system is configured to receive common information from the system and continues to operate even after an abnormality is detected. Note that the 3-state buffer circuit 26
Although the reason for switching from the normal state such as opening and closing 27 is logically determined to be an abnormality in the cache memory 220, the possibility of an abnormality in the internal bus to which the cache memory 220 is connected cannot be ruled out. First, just to be sure, it is switched to the cache memory 221 side. If there is an abnormality in the internal bus to which the cache memory 220 is connected, the 3-state buffer circuit 22 may
This effect will not be felt on the PUC side.

【0048】ケース2:キャッシュメモリ221の異常
である。図5(c)のように、キャッシュメモリ221
の出力が停止され、3ステートバッファ回路29はMP
UC20−3側への信号のみが通過するように制御され
、これにより全てのMPUはキャッシュメモリ220か
らの共通情報を受取るように構成されて異常発見後も運
転継続される。
Case 2: The cache memory 221 is abnormal. As shown in FIG. 5(c), the cache memory 221
The output of MP is stopped, and the 3-state buffer circuit 29
It is controlled so that only the signal to the UC 20-3 side passes through, so that all MPUs are configured to receive common information from the cache memory 220 and continue to operate even after an abnormality is discovered.

【0049】ケース3,5:BIU270あるいはその
接続されたシステムバス1−1側の異常である。図5(
d),(e)のように、BIU270あるいはその接続
されたシステムバス1−1側を停止し、ケース1と同様
に運用する。
Cases 3 and 5: There is an abnormality in the BIU 270 or the system bus 1-1 connected to it. Figure 5 (
As shown in d) and (e), the BIU 270 or the system bus 1-1 side connected to it is stopped, and the operation is performed in the same manner as in case 1.

【0050】以上のようにして、パリティエラーによる
異常検知されたときは構成変更とともに異常の旨、外部
報知される。
As described above, when an abnormality due to a parity error is detected, the abnormality is notified externally along with the configuration change.

【0051】以上詳細に述べたように、本発明によれば
BPUの内部に異常が発生したとしても、その回路構成
の一部を切離しあるいは情報の流れを変更することによ
って、正常時と同様に運転継続が可能である。このため
データ処理の途中で異常が発生した場合には、(1)切
りの良い時点または、修理保守時期まで当該BPUでの
動作を継続させ、 (2)切りの良い時点または、修理保守時期に当該BP
Uで実行していた処理を他の正常なBPUに引き継がせ
れば良い。
As described in detail above, according to the present invention, even if an abnormality occurs inside the BPU, by disconnecting a part of the circuit configuration or changing the flow of information, the system can be restored as normal. Continued operation is possible. Therefore, if an abnormality occurs during data processing, (1) the operation of the relevant BPU should be continued until a suitable time is reached or it is time for repair/maintenance; The relevant BP
All that is required is to have another normal BPU take over the processing being executed by U.

【0052】この結果、異常発生時のチェックポイント
リスタートに備えてのバックアップ動作が不要となり、
処理性能を向上させることができる。
[0052] As a result, there is no need for backup operations in preparation for checkpoint restart in the event of an abnormality.
Processing performance can be improved.

【0053】V.内部バス接続時の信号処理以上説明し
たように、各部異常の際に内部バスの切替を3ステート
バッファ29を用いて行うが、3ステートバッファ29
の開閉操作は、通常の経路でのライトアクセスに比べて
切替に時間がかかり、しかもバス間で迂回するために時
間がかかる。この改善策としては、図6のように異常発
生時にのみリトライによりバスサイクルを延長するのが
バスサイクルの遅延を生じず有効である。
[0053]V. Signal processing when connecting the internal bus As explained above, the internal bus is switched using the 3-state buffer 29 in the event of an abnormality in each part, but the 3-state buffer 29
Opening/closing operations take longer to switch than normal write access, and it also takes time to make detours between buses. As a countermeasure for this problem, it is effective to extend the bus cycle by retrying only when an abnormality occurs as shown in FIG. 6 without causing a delay in the bus cycle.

【0054】つまり、異常が発見された(ステップS1
,S2)ときには、ステップS4においてリトライをさ
せる信号をアサートし、ステップS5において異常出力
の停止(異常MPUの切離し操作等),正常出力の迂回
処理を実施した後で、ステップS6においてこのバスサ
イクルを終了させる信号をアサ−トして一連の処理を終
了する。なお、正常であるときにはステップS3におい
てこのバスサイクルを終了させる信号をアサ−トするの
みでよい。MPUにバスサイクルを終了させたり、リト
ライをさせたりするための信号線はMPUの種類により
名称が異なるが、多くのMPUではリトライ信号をMP
Uに入力することでMPUが自動的に実行する。表4に
代表的なMPUの信号名を示す。
In other words, an abnormality has been discovered (step S1
, S2), a signal for retrying is asserted in step S4, and after stopping the abnormal output (disconnecting the abnormal MPU, etc.) and detouring the normal output in step S5, this bus cycle is terminated in step S6. The series of processing is completed by asserting a termination signal. Incidentally, when the bus cycle is normal, it is only necessary to assert a signal for terminating this bus cycle in step S3. The name of the signal line that causes the MPU to end the bus cycle or make a retry differs depending on the type of MPU, but in many MPUs, the retry signal is
The MPU automatically executes this by inputting it to U. Table 4 shows typical MPU signal names.

【0055】[0055]

【表4】[Table 4]

【0056】図7,図8は図6のリトライ方式をライト
アクセス時に採用したときの信号の流れを示したもので
あり、図7は正常時、図8は異常時を示す。同図におい
て、縦軸は時間の経過を示し、横軸はMPU出力がキャ
ッシュメモリに至るまでの各部回路を示している。通常
、MPUからはデータ信号に先立って、アドレス信号が
出力される。図7では、アドレス信号,データ信号がと
もに正常であるためにMPU出力チェック回路23,パ
リティチェック回路250では正常と判断され、MPU
には終了信号が返され、キャッシュメモリ220ではデ
ータを格納しバスサイクルが終了する。
FIGS. 7 and 8 show the signal flow when the retry method of FIG. 6 is adopted at the time of write access, with FIG. 7 showing the normal state and FIG. 8 showing the abnormal state. In the figure, the vertical axis shows the passage of time, and the horizontal axis shows each circuit from the MPU output to the cache memory. Usually, an address signal is output from the MPU before a data signal. In FIG. 7, since both the address signal and the data signal are normal, the MPU output check circuit 23 and the parity check circuit 250 determine that they are normal, and the MPU
An end signal is returned to the cache memory 220, and the data is stored in the cache memory 220, and the bus cycle ends.

【0057】図8では、MPUAが異常でアドレス信号
,データ信号がともにMPU出力チェック回路23によ
り異常と判定され、各MPUに終了信号とともにリトラ
イ信号が返されリトライ動作に入る。リトライ動作時に
は3ステートバッファ200、201を閉状態としてM
PUAから内部バスへの信号伝達を阻止し、3ステート
バッファ29を一方向のみ開としてMPUCの出力信号
をキャッシュメモリ250にも供給する。その後、各M
PUには終了信号が返され、動作が終了する。
In FIG. 8, the MPUA is abnormal and both the address signal and the data signal are determined to be abnormal by the MPU output check circuit 23, and a retry signal is returned to each MPU along with a termination signal to enter a retry operation. During retry operation, the 3-state buffers 200 and 201 are closed and M
Signal transmission from the PUA to the internal bus is blocked, the 3-state buffer 29 is opened in only one direction, and the output signal of the MPUC is also supplied to the cache memory 250. Then each M
An end signal is returned to the PU, and the operation ends.

【0058】図9,図10,図11は図6のリトライ方
式をキャッシュリードアクセス時に採用したときの信号
の流れを示したものであり、図9は正常時、図10はア
ドレス信号異常時、図11はデータ信号異常時を夫々示
す。図9では、アドレス信号、データ信号がともに正常
であり異常が見られないために、MPUには終了信号が
返され、MPUはキャッシュメモリ250からのデータ
を格納してバスサイクルを終了する。図10では、MP
UAからのアドレス信号が他と一致せずに異常と判断さ
れ、各MPUに終了信号とともにリトライ信号が返され
リトライ動作に入る。リトライ動作時には3ステートバ
ッファ201を閉状態としてMPUAから内部バスへの
信号伝達を阻止し、3ステートバッファ29を一方向の
み開としてMPUCのアドレス出力信号をキャッシュメ
モリ220に供給し、キャッシュメモリ220は与えら
れたアドレスに格納されているデータをMPUAとMP
UBに供給する。その後、各MPUに終了信号を返して
、リトライ動作が終了する。
FIGS. 9, 10, and 11 show the signal flow when the retry method of FIG. 6 is adopted at the time of cache read access. FIG. 9 shows the normal state, FIG. 10 shows the address signal abnormal state, FIG. 11 shows each case when the data signal is abnormal. In FIG. 9, since both the address signal and the data signal are normal and no abnormality is observed, an end signal is returned to the MPU, and the MPU stores the data from the cache memory 250 and ends the bus cycle. In Figure 10, MP
The address signal from the UA does not match the others and is determined to be abnormal, and a retry signal is returned together with an end signal to each MPU, and a retry operation begins. During retry operation, the 3-state buffer 201 is closed to prevent signal transmission from MPUA to the internal bus, and the 3-state buffer 29 is opened in only one direction to supply the MPUC address output signal to the cache memory 220. MPUA and MP data stored at the given address
Supply to UB. Thereafter, a termination signal is returned to each MPU, and the retry operation is terminated.

【0059】図11では、キャッシュメモリ220から
のデータに異常があり、パリティ生成照合検査回路10
,12,パリティチェック回路250でのパリティチェ
ックにより各常と判断され、各MPUに終了信号ととも
にリトライ信号が返されリトライ動作に入る。リトライ
動作時にはキャッシュメモリ220の出力が阻止され、
3ステートバッファ29を一方向のみ開としてキャッシ
ュメモリ221の出力をMPUAとMPUBに供給する
。なおこの場合、3ステートバッファ回路26を閉、2
7を開のように正常状態から切替え、3ステートバッフ
ァ回路27を通じてキャッシュメモリ221の出力をM
PUBに供給することにより、キャッシュメモリ220
からMPUBへのデータ信号の経路の異常により誤った
データがMPUBへ供給されるのを防ぐことができる。
In FIG. 11, there is an abnormality in the data from the cache memory 220, and the parity generation and verification circuit 10
, 12. The parity check in the parity check circuit 250 determines that each is normal, and a retry signal is returned together with an end signal to each MPU, and a retry operation begins. During the retry operation, the output of the cache memory 220 is blocked,
The 3-state buffer 29 is opened in only one direction and the output of the cache memory 221 is supplied to MPUA and MPUB. In this case, the 3-state buffer circuit 26 is closed and the 2-state buffer circuit 26 is closed.
7, the output of the cache memory 221 is changed to M through the 3-state buffer circuit 27.
By supplying PUB, the cache memory 220
It is possible to prevent incorrect data from being supplied to MPUB due to an abnormality in the data signal path from to MPUB.

【0060】VI.異常発生後の復旧策このように本発
明装置は異常発生後も運転継続できるが、この構成のま
ま永続的に運転することは二次的故障の可能性を考慮す
ると、早急に初期の状態に復旧させるべきであり、次に
、以上発生したBPUの機能を正常に復旧させるための
復旧策について説明する。その方法は、図1のBPUを
1つのプリント板上に形成しておき、異常BPUプリン
ト板を正常BPUプリント板に交換することで達成され
る。
VI. Restoration measures after an abnormality occurs As described above, the device of the present invention can continue to operate even after an abnormality occurs, but if it is operated permanently with this configuration, considering the possibility of secondary failure, it is impossible to return to the initial state as soon as possible. Next, we will explain the recovery measures to restore the BPU functions that occurred above normally. This method is achieved by forming the BPU of FIG. 1 on one printed board and replacing the abnormal BPU printed board with a normal BPU printed board.

【0061】図12は、計算機盤構成を示しており、そ
の扉を開放するとその内部にプリント板を収納するスロ
ット部が形成され、更に各スロットには図1の主記憶装
置3、BPU2,入出力制御装置BIU4を構成する各
プリント板が挿入され、挿入された状態で図11には図
示せぬシステムバスに接続されるようになっている。図
示の例ではスロットSLは12個あり、このうちSL1
,SL3〜SL6にプリント板が挿入され、他のSL2
,SL7〜SL12が空スロットとなっている。スロッ
トSLに挿入されるプリント板PLは通常知られたもの
で良いが、本発明のものではこのプリント板をスロット
SLに固定するためのレバー282,プリント板が停止
中か否かを表わす表示ランプ280を備え、必要に応じ
て適宜プリント板の取外し要求ボタン281が備えられ
る。以下、BPUプリント板の交換手順について説明す
る。
FIG. 12 shows the configuration of a computer board, and when the door is opened, a slot portion for storing a printed board is formed inside, and each slot has the main storage device 3, BPU 2, and input board shown in FIG. Each printed board constituting the output control device BIU4 is inserted, and in the inserted state is connected to a system bus (not shown in FIG. 11). In the illustrated example, there are 12 slots SL, among which SL1
, a printed board is inserted into SL3 to SL6, and the other SL2
, SL7 to SL12 are empty slots. The printed board PL inserted into the slot SL may be of a commonly known type, but the one of the present invention includes a lever 282 for fixing the printed board to the slot SL, and an indicator lamp indicating whether or not the printed board is stopped. 280, and a printed board removal request button 281 as required. The procedure for replacing the BPU printed board will be explained below.

【0062】《BPUプリント板が1枚のときの交換》
図13は、システムバス(説明の都合上一重系で示す)
1にプリント板PLが接続可能なn個のスロットSLの
うち、SL1にその内部で異常発生したBPU,SL2
に主記憶装置3、SLnにIOU4のプリントが夫々挿
入されており、SL3が空きスロットとなっている例を
示す。ここでは、異常BPUに代わり機能すべき新BP
Uは未だスロットに挿入されていない。そしてプリント
板上の表示ランプ280は稼働中のために消灯している
《Replacement when there is only one BPU printed board》
Figure 13 shows the system bus (shown as a single system for convenience of explanation)
Among the n slots SL to which a printed circuit board PL can be connected, the BPU and SL2 in which an abnormality has occurred in SL1
An example is shown in which a print of IOU4 is inserted into the main storage device 3 and SLn, respectively, and SL3 is an empty slot. Here, we introduce a new BP that should function in place of the abnormal BPU.
U has not yet been inserted into the slot. The display lamp 280 on the printed board is off because it is in operation.

【0063】この状態で、旧BPU2Aの機能を正常な
新BPU2Bに引き継ぐには、まず、空きスロットを用
意する。図13の例の場合は、スロットSL3が空きス
ロットとなっているので、次に新BPU2Bを空きスロ
ットSL3に挿入する。
In this state, in order to take over the functions of the old BPU 2A to the normal new BPU 2B, an empty slot is first prepared. In the example of FIG. 13, since the slot SL3 is an empty slot, the new BPU 2B is next inserted into the empty slot SL3.

【0064】BPU2AはBPU2Bの挿入を検知し、
そのオペレーティングシステム(以下OSと略す)の処
理により、旧BPUAで実行中のタスクを新BPU2B
に移管し、旧BPU2Aのプリント板上の表示ランプ2
80を点灯する。以降、オンラインの業務は新BPU2
B により実行される。旧BPU2Aから新BPU2B
への業務移管は瞬時に行われる。その後、旧BPUプリ
ント板上の表示ランプ280が点灯し、該BPUが停止
状態であることを確認した上で、旧BPU2Aを取外す
。以上の手順により、旧BPU2Aを抜く前に、オンラ
イン業務を新BPU2B に移管完了されているため、
システムを停止することなく、またシステム性能を低下
させることなくBPUの交換を実現できる。
[0064] BPU2A detects the insertion of BPU2B,
Through the processing of the operating system (hereinafter referred to as OS), tasks being executed on the old BPUA are transferred to the new BPU2B.
The display lamp 2 on the printed board of the old BPU2A was transferred to
Turn on 80. From then on, online operations will be handled by the new BPU2.
Executed by B. From old BPU2A to new BPU2B
The transfer of business to will be instantaneous. After that, the indicator lamp 280 on the old BPU printed board lights up, and after confirming that the BPU is in a stopped state, the old BPU 2A is removed. By following the above steps, you will have completed transferring online operations to the new BPU2B before removing the old BPU2A.
BPU replacement can be achieved without stopping the system or reducing system performance.

【0065】図14は,図13で示した例についてBP
U交換手順を人による動作と計算機内部の処理に分けて
処理の内容を示したBPU交換手順処理フローである。 BPUを交換する場合、まず空きスロットを用意(St
1)する。空きスロットは、既に未使用の空きスロット
があればそれを用いればよく、また空きスロットがない
場合も、一時的に取り外し可能なハードウェアボードが
あれば、そのボードを抜き、一時的に空きスロットを作
り出し、目的のBPU交換後に、再び該ボードを戻すこ
とにより空スロットを準備することも可能である。次に
、空きスロットに新BPUを挿入(St5)する。その
BPU挿入を、旧BPU2A は割込等の手段で認識(
St4)する。すると、旧BPU2A は現在実行中の
タスクを主記憶装置上に退避(St3)し、新BPU2
B が該タスクの処理を続行できるようにする。新BP
U2B はそれを受けて、該タスクを実行(St5)し
、オンライン業務を開始する。旧BPU2A は自らB
PU上のボード停止ランプを点灯(St6)し、処理を
停止(St7)する。その後、旧BPU上のボード停止
ランプが点灯しているのを人間が確認(St8)後、旧
BPUを取り外す(St9)。これで、BPU交換は完
了である。
FIG. 14 shows the BP for the example shown in FIG.
This is a process flow of a BPU exchange procedure that shows the contents of the U exchange procedure divided into human operations and processing inside the computer. When replacing the BPU, first prepare an empty slot (St
1) Do. If there is an empty slot that is already unused, you can use it, or if there is no empty slot, if there is a temporarily removable hardware board, remove that board and use the temporarily empty slot. It is also possible to prepare an empty slot by creating a board and returning the board again after replacing the target BPU. Next, a new BPU is inserted into the empty slot (St5). The old BPU2A recognizes the BPU insertion through means such as interrupts (
St4). Then, the old BPU2A saves the currently executing task onto the main memory (St3), and the new BPU2A
Allow B to continue processing the task. New BP
Upon receiving this, U2B executes the task (St5) and starts online business. Old BPU2A is B itself
The board stop lamp on the PU is lit (St6) and the process is stopped (St7). Thereafter, after a person confirms that the board stop lamp on the old BPU is lit (St8), the old BPU is removed (St9). The BPU exchange is now complete.

【0066】図15は、上記実施例における、旧BPU
2A 上で実行中のタスクを新BPU2B に引き継ぎ
する手段を詳細に説明した図である。システムバスに旧
BPU2A ,新BPU2B、さらに主記憶装置3の各
々プリント板が装着されている。旧BPU2A  上で
は、あるタスク920ー1が実行中である。その時に、
新BPU2B が挿入されたことの連絡が旧BPU2A
 に入ったとすると、旧BPU2A は、処理を中断し
、実行中のタスク920ー1を主記憶装置3上に退避す
る。一方、新BPU2B は主記憶装置3上に退避され
たタスク920−1に続くタスク920ー2を回復して
、中断したポイントからタスクの処理を続行する。以上
の方式を用いて、交換したBPU間の業務の引き継ぎを
行う。
FIG. 15 shows the old BPU in the above embodiment.
2A is a diagram illustrating in detail a means for handing over a task being executed on BPU 2A to a new BPU 2B. Printed boards for the old BPU 2A, the new BPU 2B, and the main storage device 3 are attached to the system bus. A certain task 920-1 is being executed on the old BPU2A. At that moment,
The notification that the new BPU2B has been inserted is the old BPU2A.
If this occurs, the old BPU 2A interrupts processing and saves the task 920-1 being executed onto the main storage device 3. On the other hand, the new BPU 2B recovers the task 920-2 following the task 920-1 saved on the main storage device 3, and continues processing the task from the point where it was interrupted. The above method is used to transfer business between the replaced BPUs.

【0067】以上が、BPUが1つの場合のBPUの交
換の例である。上記実施例では、BPUが1つの場合で
も、システムを停止することなくBPUの交換が可能で
ある。
The above is an example of BPU replacement when there is one BPU. In the above embodiment, even when there is only one BPU, the BPU can be replaced without stopping the system.

【0068】《BPUプリント板が複数のときの交換》
次にBPUが複数の場合、あるいは挿入したBPUが正
しく動作しなかった場合の対応について説明する。図1
6の本実施例では、BPUが複数装着されている。それ
ぞれのBPUは交換されるべきBPUを指定する手段と
して、ボード取外し要求ボタン281と、プリント板番
号282を具備している。
《Replacement when there are multiple BPU printed boards》
Next, a description will be given of what to do when there is a plurality of BPUs or when the inserted BPU does not operate correctly. Figure 1
In this embodiment No. 6, a plurality of BPUs are installed. Each BPU is provided with a board removal request button 281 and a printed board number 282 as means for specifying the BPU to be replaced.

【0069】システムバス1にプリント板を接続するた
めの、スロットSL1からSL3にはBPU2A,2B
,2Cがそれぞれ装着されている。スロットSL4には
主記憶装置が接続されている。スロットSL5は空きス
ロットである。また、各BPUは、BPUが停止したと
きに点灯する表示ランプ280と、取り外すべきBPU
を指定するために用いるプリント板取外し要求ボタン2
81と、プリント板番号282を有する。ここで、プリ
ント板番号はBPU2A が1、BPU2B が2、B
PU2C が3と約束されている。今、新BPU2D 
をスロットSL2に装着されている旧BPU2Bと交換
する場合には、まず、新BPU2D を空きスロットで
あるスロットSL5に挿入する。それから、スロットS
L1〜SL3に装着されているBPUのうち、交換した
いスロットSL2のBPU2Bの取外し要求ボタン28
1を押す。そうすると、旧BPU2B は実行中のタス
クと自身のプリント板番号を主記憶装置3上に退避し、
新BPU2D が主記憶装置3上に退避されたプリント
板番号を取り込み、退避中タスクを実行する。旧BPU
2B は、表示280を点灯し自ら停止する。その後、
旧BPU2B のボード停止ランプ280が点灯してい
るのを確認後、該BPU2B を取り外す。
BPU2A, 2B are installed in slots SL1 to SL3 for connecting printed boards to system bus 1.
, 2C are installed respectively. A main storage device is connected to slot SL4. Slot SL5 is an empty slot. Each BPU also has an indicator lamp 280 that lights up when the BPU stops, and a BPU that should be removed.
Printed board removal request button 2 used to specify
81 and printed board number 282. Here, the printed board numbers are 1 for BPU2A, 2 for BPU2B, and B
PU2C is promised to be 3. Now, new BPU2D
When replacing the old BPU 2B installed in the slot SL2, the new BPU 2D is first inserted into the empty slot SL5. Then slot S
Among the BPUs installed in L1 to SL3, remove request button 28 for BPU2B in slot SL2 that you want to replace.
Press 1. Then, the old BPU2B saves the task being executed and its own printed board number onto the main storage device 3,
The new BPU 2D takes in the printed board number saved on the main storage device 3 and executes the task being saved. Old B.P.U.
2B turns on the display 280 and stops by itself. after that,
After confirming that the board stop lamp 280 of the old BPU2B is lit, remove the BPU2B.

【0070】図17は、図16で示した例についてのB
PU交換手順を人による動作と計算機内部の処理に分け
て処理の内容を示したBPU交換手順処理フローである
FIG. 17 shows B for the example shown in FIG.
This is a process flow of a BPU replacement procedure that shows the contents of the PU replacement procedure divided into human operations and computer internal processing.

【0071】BPU交換する場合、まず空きスロットを
用意(St1)する。空きスロットは、既に未使用の空
きスロットがあればそれを用いればよく、また空きスロ
ットがない場合も、一時的に取り外し可能なハードウェ
アボードがあれば、そのボードを抜き、一時的に空きス
ロットを作り出し、目的のBPU交換後に、再び該ボー
ドを戻すことにより空スロットを準備することも可能で
ある。
When replacing the BPU, first prepare an empty slot (St1). If there is an empty slot that is already unused, you can use it, or if there is no empty slot, if there is a temporarily removable hardware board, remove that board and use the temporarily empty slot. It is also possible to prepare an empty slot by creating a board and returning the board again after replacing the target BPU.

【0072】次に、空きスロットに新BPU2D を挿
入(St2)する。その後、取り外したい旧BPU2B
 のプリント板取り外し要求ボタンを押す(St3)。 すると、旧BPU2Bは現在実行中のタスクと自プリン
ト板番号を主記憶装置3上に退避(St4)し、新BP
U2Dが該タスクの処理を続行できるようにする。新B
PU2Dはそれを受けて、該タスクを実行(St5)し
、オンライン業務を開始する。旧BPU2B は自らB
PU上の表示ランプを点灯(St6)し、処理を停止(
St7)する。その後、旧BPU2B上の表示ランプが
点灯しているのを確認(St8)後、旧BPU2Bを取
り外す(St9)。これで、BPU交換は完了である。
Next, a new BPU2D is inserted into the empty slot (St2). After that, the old BPU2B that you want to remove
Press the printed board removal request button (St3). Then, the old BPU2B saves the task currently being executed and its own printed board number onto the main storage device 3 (St4), and
Allow U2D to continue processing the task. New B
Upon receiving it, the PU2D executes the task (St5) and starts online business. Old BPU2B is B itself
Turn on the display lamp on the PU (St6) and stop the process (
St7). Thereafter, after confirming that the display lamp on the old BPU 2B is lit (St8), the old BPU 2B is removed (St9). The BPU exchange is now complete.

【0073】図18は、上記実施例における、旧BPU
上で実行中のタスクとプリント板番号を新BPUに引継
ぐ手段を詳細に説明した図である。システムバスに旧B
PUが3台(2A,2B,2C)、新BPU2D 、さ
らに主記憶装置が装着されている。旧BPU2A,2B
,2C上では、夫々タスク1,2,3、旧BPU2C上
ではタスク2が実行中である。また、旧BPU2A,2
B,2Cのプリント板番号282は夫々1,2,3であ
る。その時に、取り外しBPUを指定するために、旧B
PU2Bのプリント板取り外し要求ボタンが押されたと
すると、旧BPU2Bは、処理を中断し、実行中のタス
ク2と自プリント板番号2を主記憶装置3上に退避する
。一方、新BPU2D は主記憶装置3上に退避された
プリント板番号2とタスク2を回復し、中断ポイントか
らタスクの処理を続行する。以上の方式を用いて、交換
したBPU間の業務の引き継ぎを行う。
FIG. 18 shows the old BPU in the above embodiment.
FIG. 4 is a diagram illustrating in detail the means for taking over the task being executed above and the printed board number to a new BPU. old B on the system bus
Three PUs (2A, 2B, 2C), a new BPU 2D, and a main storage device are installed. Old BPU2A, 2B
, 2C, tasks 1, 2, and 3 are being executed, respectively, and task 2 is being executed on the old BPU 2C. Also, old BPU2A, 2
The printed board numbers 282 of B and 2C are 1, 2, and 3, respectively. At that time, in order to specify the removed BPU,
If the printed board removal request button of the PU 2B is pressed, the old BPU 2B interrupts processing and saves the task 2 being executed and its own printed board number 2 onto the main storage device 3. On the other hand, the new BPU 2D recovers the printed board number 2 and task 2 saved on the main memory 3, and continues processing the task from the interruption point. The above method is used to transfer business between the replaced BPUs.

【0074】本実施例によれば、交換されるべきBPU
を指定する手段であるプリント板取外し要求ボタンを設
けることにより、BPUが複数装着されている場合でも
、システムを停止することなく、さらにはシステム性能
を低下させることなくBPUを交換できるという長所が
ある。
According to this embodiment, the BPU to be replaced
By providing a printed board removal request button, which is a means of specifying this, even if multiple BPUs are installed, the BPU can be replaced without stopping the system or degrading system performance. .

【0075】また、交換するBPUに割当てているプリ
ント板番号を交換BPU間で引継ぐことにより、ユーザ
プログラムにより動作プリント板番号が指定されている
場合でも、ユーザプログラムを変更することなくBPU
を交換できるという長所がある。
Furthermore, by inheriting the printed board number assigned to the replaced BPU between replaced BPUs, even if the operating printed board number is specified by the user program, the BPU can be changed without changing the user program.
It has the advantage of being able to be replaced.

【0076】 《挿入されたBPUが正しく作動しなかった場合》一方
、交換された新BPUが万一正常に動作しない場合に、
システムに重大な影響を及ぼすという短所がある。 図19。図20によれば、挿入されたBPUの動作チェ
ックを実行する手段を有し、新しく挿入した新BPUが
万一正常に動作しない場合にもシステムへの影響を与え
ることがない。
<<If the inserted BPU does not operate properly>> On the other hand, in the event that the replaced new BPU does not operate properly,
It has the disadvantage of having a serious impact on the system. Figure 19. According to FIG. 20, there is a means for checking the operation of the inserted BPU, and even if the newly inserted new BPU does not operate normally, the system will not be affected.

【0077】図19は、新BPU2Bが挿入された状態
を示す図であり、このとき旧BPU2Aではあるタスク
が実行中である。新BPU2Bが挿入されると、該BP
U上で動作チェックを行うため、BPU自己診断プログ
ラム925を実行する。診断プログラムが正常に終了す
るまでは旧BPUAにはボード挿入の連絡はしない。該
診断プログラム925により新BPUに故障箇所が発見
されると旧BPUへは連絡せず、自BPU2B の表示
ランプ280を点灯し、処理を停止する。旧BPUでは
、新BPU挿入タイミングでタスク1を中断することな
く、何事もなかったかのようにタスクの処理を続行する
FIG. 19 is a diagram showing a state in which the new BPU 2B has been inserted, and at this time a certain task is being executed in the old BPU 2A. When a new BPU2B is inserted, the corresponding BP
In order to check the operation on the U, the BPU self-diagnosis program 925 is executed. The old BPUA will not be notified of board insertion until the diagnostic program is completed normally. When a failure point is discovered in the new BPU by the diagnostic program 925, the display lamp 280 of the own BPU 2B is turned on and the processing is stopped without contacting the old BPU. The old BPU continues processing the task as if nothing had happened, without interrupting task 1 at the timing of inserting the new BPU.

【0078】図20は、上記実施例における、BPU交
換手順を人による動作と計算機内部の処理に分けて処理
の内容を示したBPU交換手順処理フローである。St
1,St2,St4〜St8,St11〜St13の処
理については、図21と全く同一の処理であるためここ
では説明を省略し、本実施例に特有の処理につき説明す
る。
FIG. 20 is a flowchart of the BPU replacement procedure in the above embodiment, which shows the contents of the BPU replacement procedure divided into human operations and computer internal processing. St
1, St2, St4 to St8, and St11 to St13 are completely the same as those in FIG. 21, so their explanations will be omitted here, and only the processes specific to this embodiment will be explained.

【0079】新BPUが挿入されると、まず該BPUの
動作チェックを実施するため診断プログラムを実行(S
t3)する。該診断プログラムの結果、正常と判定され
た場合には、前実施例と同じく処理St4に移る。しか
し、故障と判定された場合には、挿入された新BPU上
の表示ランプを点灯(St9)し、新BPUの処理を停
止(St10)する。その後、新BPU上の表示ランプ
の点灯を確認(St14)し、新BPUを再度取り外す
(St15)。この結果、BPUの交換は失敗に終った
ものの、旧BPUが処理を継続しているため、オンライ
ンシステムには影響を与えることはない。交換が成功し
たか否かは、BPU挿入後,新旧BPUのどちらの表示
ランプが点灯するかにより判定する。
When a new BPU is inserted, first run a diagnostic program (S
t3). As a result of the diagnostic program, if it is determined to be normal, the process moves to St4 as in the previous embodiment. However, if it is determined that there is a failure, the indicator lamp on the inserted new BPU is turned on (St9) and the processing of the new BPU is stopped (St10). Thereafter, it is confirmed that the display lamp on the new BPU is lit (St14), and the new BPU is removed again (St15). As a result, although the BPU replacement ended in failure, the online system is not affected because the old BPU continues processing. Whether or not the replacement was successful is determined by which indicator lamp of the old or new BPU lights up after the BPU is inserted.

【0080】以上、本実施例の方式により、挿入された
BPUが正常に動作しない場合にも、オンラインシステ
ムには影響を排除することが可能となった。
As described above, according to the method of this embodiment, even if the inserted BPU does not operate normally, it is possible to eliminate the influence on the online system.

【0081】《異常発生前後の構成と処理》以上述べた
旧BPU2Aと新BPU2B内のMPUの処理並びに構
成を時系列的に示したものが図21であり、正常運転時
にはBPU2A の3台のMPUが運転しており、その
多数決結果が出力されている。そして処理Bの実行中に
MPUCに障害が発生するとこれを切離し、MPUAと
MPUBによる多重化回路構成により運転が正常に継続
される。他方MPUAの異常報知により新BPU2B 
のプリント板を空スロットに挿入すると、新BPU2B
 内の各MPUは自己診断を実施し、適宜の時点で処理
を旧BPU2Aから新BPU2Bに移してBPU2B 
の3台のMPU(MPUD,MPUE,MPUF)の多
数決結果による処理Dを実行する。 この処理引継ぎは、切りの良い時点または、修理保守時
期まで、当該BPUでの動作を継続させ、切りの良い時
点または、修理保守時期に当該BPUで実行した処理を
他の正常なBPUに引き継がせれば良く、実際にはソフ
トウェアの都合で最も性能上望ましい時点で行うことが
できる。このようなタイミングとしては、タスク切替の
タイミングが一般的にはふさわしいことは明らかである
。なんとなれば、マルチプロセッサシステムにおけるプ
ロセッサの切替とまったく同一手順でBPUの切替が可
能であり、引き継ぎに伴う余分な性能上のオーバーヘッ
ドを0にすることが可能であるからである。このため本
発明によれば、フォールト発生時のチェックポイントリ
スタートに備えてのバックアップ動作が不要となり、処
理性能を向上させることができる。
<<Configuration and processing before and after abnormality occurrence>> Figure 21 shows the processing and configuration of the MPUs in the old BPU2A and new BPU2B described above in chronological order.During normal operation, the three MPUs of BPU2A is driving, and the majority vote result is output. If a failure occurs in MPUC during execution of process B, it is disconnected, and operation continues normally using the multiplexed circuit configuration of MPUA and MPUB. On the other hand, new BPU2B is activated due to MPUA abnormality notification.
When inserting the printed circuit board into the empty slot, the new BPU2B
Each MPU in the MPU performs self-diagnosis, transfers processing from the old BPU2A to the new BPU2B at an appropriate time, and transfers processing from the old BPU2A to the new BPU2B.
Process D is executed based on the majority vote of the three MPUs (MPUD, MPUE, MPUF). This processing handover allows the operation of the relevant BPU to continue until the appropriate time or repair/maintenance period is reached, and the processing executed by the relevant BPU at the appropriate time or the repair/maintenance period is transferred to another normal BPU. In fact, it can be performed at the most desirable point in terms of performance due to software considerations. It is clear that the timing of task switching is generally appropriate as such timing. This is because it is possible to switch BPUs using exactly the same procedure as switching processors in a multiprocessor system, and it is possible to reduce the extra performance overhead associated with handover to zero. Therefore, according to the present invention, there is no need for a backup operation in preparation for a checkpoint restart when a fault occurs, and processing performance can be improved.

【0082】なお、フォールトが発生した場合には、ハ
ードウェアはフォールトの発生状況をレジスタに記録し
、オペレーティングシステムはコンテクストスイッチ時
や修理保守のための割込み処理時にレジスタを参照し、
処理の引継ぎが必要な場合には、処理引継ぎ先のBPU
に割込みなどで通知し、自BPUでの処理を終了する。 BPU2を構成する要素(MPU,キャッシュメモリな
ど)の一部で故障が発生した場合、他の要素は正常であ
っても、本方式では処理引継ぎ後には、他の正常な要素
も含めてBPU2全体の使用を中止する。
[0082] When a fault occurs, the hardware records the fault occurrence status in a register, and the operating system refers to the register when switching contexts or processing interrupts for repair and maintenance.
If it is necessary to take over the processing, select the BPU to which the processing will be taken over.
This is notified by an interrupt or the like, and the processing in the own BPU is terminated. If a failure occurs in some of the elements that make up BPU2 (MPU, cache memory, etc.), even if other elements are normal, in this method, after processing is taken over, the entire BPU2, including other normal elements, will fail. discontinue use.

【0083】図22に、フォールトトレランスの為に冗
長化したMPUA,MPUB,MPUCが故障などの原
因で障害をうけた場合の引継ぎ時の本発明方式と公知例
との構成の相違を模式的に示す。従来の方法では、障害
をうけたMPUAのみを正常なMPUDと交換する方法
を採っていた。これに対し、本発明による方法では、障
害をうけたMPUAだけでなく、正常なMPUB,MP
UCも新たにMPUD,MPUE,MPUFと交換して
いる。以上の様にすることにより、フォールトトレラン
スの為に冗長化したMPUの組合わせ、すなわちMPU
A,MPUB,MPUCの組合わせを固定化することが
できる。 従ってMPUの組合わせを交換単位にすれば、それぞれ
の組合わせを構成するMPU間を高速のクロックで結合
することができ、高速のフォールトトレラントコンピュ
ータを実現することができる。また従来のように、MP
Uの組替えに伴う種々のハードウェア,ソフトウェアが
不要である。
FIG. 22 schematically shows the difference in configuration between the system of the present invention and the known example at the time of takeover when MPUA, MPUB, and MPUC, which have been made redundant for fault tolerance, are damaged due to a failure or the like. show. In the conventional method, only the failed MPUA is replaced with a normal MPUD. In contrast, in the method according to the present invention, not only the failed MPUA but also the normal MPUB, MP
UC has also been newly replaced with MPUD, MPUE, and MPUF. By doing the above, the combination of MPUs made redundant for fault tolerance, that is, the MPU
The combination of A, MPUB, and MPUC can be fixed. Therefore, if a combination of MPUs is used as a unit of exchange, the MPUs forming each combination can be connected using a high-speed clock, and a high-speed fault-tolerant computer can be realized. Also, as in the past, MP
Various hardware and software associated with recombination of U are not required.

【0084】なお、BPUは単一故障の場合には動作を
継続することができるので、この処理引継ぎは故障発生
後直ちに行う必要は無く、処理の切りの良い時点または
、修理保守時に処理引継ぎを行えばよい。
[0084] Furthermore, since the BPU can continue operating in the case of a single failure, it is not necessary to take over the processing immediately after the occurrence of a failure. Just go.

【0085】本実施例により処理を継続しながら、故障
の発生したBPU20−1の配線基板を引き抜き正常な
配線基板を交換することができる。
According to this embodiment, the wiring board of the faulty BPU 20-1 can be pulled out and a normal wiring board replaced while the processing is continued.

【0086】VII.各部回路の代案変形例以上、本発
明について説明したが、本発明の各部回路等は適宜変更
して実現することができる。以下、これらの代案,変形
例について説明する。
VII. Alternative Modifications of Each Part Circuit Although the present invention has been described above, each part circuit etc. of the present invention can be appropriately changed and realized. These alternatives and modifications will be explained below.

【0087】《多数決論理部》 図23は、図2の多数決論理回路部の組方と切替の様子
を、他の構成要件を省いて簡略化し理解しやすい形にし
て示したものであり、MPUAとMPUCを出力専用に
固定化して用い、MPUBをMPUAとMPUCの健全
性確認の参照用としてのみ用いるとともに、MPUAあ
るいはMPUCの異常時には健全性の確認された方の一
つの出力を共通に用いて2組のキャッシュメモリに供給
するようにしたものである。この方式の場合、MPUの
出力が多数決回路を通らずに直接キャッシュメモリに入
力されるので、多数決回路での遅延時間の分キャッシュ
メモリアクセス時間を短縮できる。
<<Majority Logic Section>> FIG. 23 shows how the majority logic circuit section shown in FIG. and MPUC are fixed for output only, and MPUB is used only as a reference for checking the health of MPUA and MPUC, and in the event of an abnormality in MPUA or MPUC, the output of one of the ones whose health has been confirmed is commonly used. The data is supplied to two sets of cache memories. In this method, the output of the MPU is input directly to the cache memory without passing through the majority circuit, so that the cache memory access time can be shortened by the delay time in the majority circuit.

【0088】本発明においては、以上のようにして多数
決論理を用いて3重系を2重系に切替て運転継続するも
のであり、本発明の変形例としてはこの方式以外にも種
々のものとすることができる。例えば、図25では3つ
のMPUの出力を多数決選択回路210と211に夫々
与え、3つのMPUの中から健全性の確認された1つの
出力を選択する。この場合、故障した方の多数決選択回
路に接続されているキャッシュメモリのデータが破壊さ
れるが、正常な多数決選択回路に接続されているキャッ
シュメモリのデータを用いて運転継続できる。
In the present invention, as described above, the triple system is switched to the double system and operation is continued using the majority logic, and there are various other variations of the present invention in addition to this system. It can be done. For example, in FIG. 25, the outputs of three MPUs are given to majority selection circuits 210 and 211, respectively, and one output whose soundness has been confirmed is selected from among the three MPUs. In this case, data in the cache memory connected to the failed majority selection circuit is destroyed, but operation can be continued using data in the cache memory connected to the normal majority selection circuit.

【0089】また、図24のようにMPUの出力をゲー
ト回路,切替回路等を通さずに直接キャッシュメモリに
入力し、異常となったMPUから信号を受けるキャッシ
ュメモリの動作を停止して以降そのデータを使用しない
ようにすれば、さらにゲート回路,切替回路等の遅延時
間の分キャッシュメモリアクセス時間を短縮することが
できる。しかも多くの信号線からなるアドレスバス,デ
ータバスの切替手段が不要となるのでハード量を減少さ
せることができる。
In addition, as shown in FIG. 24, the output of the MPU is directly input to the cache memory without passing through the gate circuit, switching circuit, etc., and the operation of the cache memory that receives the signal from the abnormal MPU is stopped and then the By not using data, the cache memory access time can be further shortened by the delay time of gate circuits, switching circuits, etc. Moreover, since switching means for address buses and data buses consisting of many signal lines is not required, the amount of hardware can be reduced.

【0090】図26は4台のMPUを備え、MPUAと
MPUCを出力専用に固定し、MPUBとMPUDをそ
れらの参照用に用い、2組の出力一致により出力専用M
PUの出力を夫々与えるものである。なお、MPUの異
常時には、健全側のものに切替て使用する方法とか、異
常となったMPUから信号を受けるキャッシュメモリの
動作を停止して以降そのデータを使用しないようにする
方法等で対応できる。
FIG. 26 has four MPUs, MPUA and MPUC are fixed for output only, MPUB and MPUD are used for reference, and output-only MPU is set by matching the outputs of the two sets.
It gives the output of each PU. In addition, in the event of an abnormality in the MPU, countermeasures can be taken such as switching to a healthy one for use, or stopping the operation of the cache memory that receives signals from the abnormal MPU and preventing the data from being used thereafter. .

【0091】 《キャッシュデータのリードアクセス部》また、キャッ
シュメモリについてみると、キャッシュメモリ220,
221の出力(データ)はパリティチェックにより正常
/異常が判断できるので、図27のようにパリティチェ
ック250により正常と判断されたキャッシュメモリの
出力を切替手段260を通じてMPUA,MPUB,M
PUCに入力する。また、両方のキャッシュメモリが正
常である場合には、キャッシュメモリの主系,従系を予
め決めておき、主系の出力を選択すればよい。
<<Cache data read access section>> Also, looking at the cache memory, the cache memory 220,
Since the output (data) of 221 can be determined to be normal or abnormal by a parity check, the output of the cache memory determined to be normal by the parity check 250 is transferred to MPUA, MPUB, M through the switching means 260 as shown in FIG.
Enter in PUC. Further, if both cache memories are normal, it is sufficient to decide in advance the main system and slave system of the cache memory, and select the output of the main system.

【0092】又、図28のようにMPUA,MPUBは
接続するキャッシュをそれぞれキャッシュメモリを22
0,221に固定しておきMPUBのみに選択したキャ
ッシュメモリの出力を入力してもよい。この場合、いず
れかのキャッシュメモリが故障しても3つのうちの2つ
のMPUに正常な動作をさせることができ、しかもハー
ド量を削減することができる。
Furthermore, as shown in FIG. 28, MPUA and MPUB each have a cache memory of 22
It is also possible to fix it to 0,221 and input the output of the selected cache memory only to MPUB. In this case, even if any of the cache memories fails, two of the three MPUs can operate normally, and the amount of hardware can be reduced.

【0093】[0093]

【発明の効果】本発明では、障害発生時にその一部を切
離し、復旧時にプロセッサの全てを新たな別のプロセッ
サ群に切替てしまうので、プロセッサの組替えに伴う種
々の障害が排除される。
According to the present invention, when a failure occurs, a part of the processors is disconnected, and upon recovery, all of the processors are switched to a new, different processor group, thereby eliminating various failures that occur when processors are rearranged.

【図面の簡単な説明】[Brief explanation of the drawing]

【図1】本発明の全体システム構成を示す図。FIG. 1 is a diagram showing the overall system configuration of the present invention.

【図2】本発明のBPUの構成を示す図。FIG. 2 is a diagram showing the configuration of a BPU of the present invention.

【図3】MPU出力チェック回路の一実施例図。FIG. 3 is a diagram of an embodiment of an MPU output check circuit.

【図4】ライトアクセスでの異常時のBPUの構成を示
す図。
FIG. 4 is a diagram showing the configuration of a BPU when an abnormality occurs in write access.

【図5】リードアクセスでの異常時のBPUの構成を示
す図。
FIG. 5 is a diagram showing the configuration of a BPU when an abnormality occurs in read access.

【図6】バスサイクル制御フロー図。FIG. 6 is a bus cycle control flow diagram.

【図7】MPU正常時のBPU内の信号の流れを示す図
FIG. 7 is a diagram showing the flow of signals within the BPU when the MPU is normal.

【図8】MPU異常時のBPU内の信号の流れを示す図
FIG. 8 is a diagram showing the flow of signals within the BPU when the MPU is abnormal.

【図9】MPU正常時のBPU内の信号の流れを示す図
FIG. 9 is a diagram showing the flow of signals within the BPU when the MPU is normal.

【図10】アドレス信号異常時のBPU内の信号の流れ
を示す図。
FIG. 10 is a diagram showing the flow of signals within the BPU when an address signal is abnormal.

【図11】データ信号異常時のBPU内の信号の流れを
示す図。
FIG. 11 is a diagram showing the flow of signals within the BPU when a data signal is abnormal.

【図12】計算機盤構成を示す図。FIG. 12 is a diagram showing a computer board configuration.

【図13】BPU交換原理説明図。FIG. 13 is a diagram explaining the principle of BPU replacement.

【図14】BPU交換手順を示す図。FIG. 14 is a diagram showing a BPU replacement procedure.

【図15】新旧BPUの処理引継を示す図。FIG. 15 is a diagram showing processing takeover between old and new BPUs.

【図16】マルチプロセッサ時のBPU交換原理説明図
FIG. 16 is an explanatory diagram of the BPU exchange principle in multiprocessor mode.

【図17】マルチプロセッサ時のBPU交換手順を示す
図。
FIG. 17 is a diagram showing a BPU exchange procedure in the case of multiprocessors.

【図18】マルチプロセッサ時の新旧BPU処理引継を
示す図。
FIG. 18 is a diagram showing the inheritance of old and new BPU processing in multiprocessor mode.

【図19】挿入BPU故障時のBPU交換処理を示す図
FIG. 19 is a diagram showing BPU replacement processing when an inserted BPU fails.

【図20】挿入BPU故障時のBPU交換処理フロー図
FIG. 20 is a flow diagram of BPU replacement processing when an inserted BPU fails.

【図21】BPU故障時の処理の引継ぎを示す図。FIG. 21 is a diagram showing the succession of processing when a BPU fails.

【図22】BPU故障時の処理の引継ぎを示す図。FIG. 22 is a diagram showing the succession of processing when a BPU fails.

【図23】3MPUによる比較照合の実施例図。FIG. 23 is an example diagram of comparison and verification using 3MPU.

【図24】3MPUによる比較照合の他の実施例図。FIG. 24 is a diagram showing another example of comparison and verification using 3MPU.

【図25】多数決方式の他の実施例図。FIG. 25 is a diagram showing another embodiment of the majority voting system.

【図26】4MPUによる比較照合の実施例図。FIG. 26 is an example diagram of comparison and verification using 4MPUs.

【図27】キャッシュデータのリードアクセスを示す図
FIG. 27 is a diagram showing read access to cache data.

【図28】キャッシュデータのリードアクセスの他の実
施例図。
FIG. 28 is a diagram showing another embodiment of cache data read access.

【符号の説明】[Explanation of symbols]

1…システムバス、2…BPU、10,11,12,1
3,14,15…パリティ生成/照合回路、20…MP
U、23…MPU出力チェック回路、27…BIU(バ
スインタフェースユニット)、30,31…パリティチ
ェック回路、200乃至205,26,27,29…3
ステートバッファ、220,221…キャッシュメモリ
、234,235…エラーチェック回路。
1...System bus, 2...BPU, 10, 11, 12, 1
3, 14, 15... Parity generation/verification circuit, 20... MP
U, 23... MPU output check circuit, 27... BIU (bus interface unit), 30, 31... parity check circuit, 200 to 205, 26, 27, 29... 3
State buffer, 220, 221... Cache memory, 234, 235... Error check circuit.

Claims (20)

【特許請求の範囲】[Claims] 【請求項1】システムバス,該システムバスに接続され
る主記憶装置,システムバスに接続されるベーシックプ
ロセッシングユニットよりなる高信頼化コンピュータシ
ステムにおいて、前記ベーシックプロセッシングユニッ
トは第1,第2,第3のプロセッサを備えて同一演算を
実行しており、第1のプロセッサの故障時に第2,第3
のプロセッサによる同一演算を実行し、その後第4,第
5,第6のプロセッサによる同一演算に処理を移行して
、第2,第3のプロセッサによる演算を停止することを
特徴とする高信頼化コンピュータシステムの復旧方法。
1. A highly reliable computer system comprising a system bus, a main storage device connected to the system bus, and a basic processing unit connected to the system bus, wherein the basic processing unit includes a first, a second, and a third basic processing unit. It is equipped with two processors to execute the same operation, and when the first processor fails, the second and third processors
High reliability characterized in that the same operation is executed by the first processor, the processing is then shifted to the same operation by the fourth, fifth, and sixth processors, and the operations by the second and third processors are stopped. How to recover your computer system.
【請求項2】システムバス,該システムバスに接続され
る主記憶装置,システムバスに接続され同一演算を実行
する複数プロセッサを備えるベーシックプロセッシング
ユニットよりなる高信頼化コンピュータシステムにおい
て、前記ベーシックプロセッシングユニットの複数プロ
セッサは、その故障発生前と、故障復旧後とでその組が
全く相違するようにされたことを特徴とする高信頼化コ
ンピュータシステムの復旧方法。
2. A highly reliable computer system comprising a basic processing unit comprising a system bus, a main memory connected to the system bus, and a plurality of processors connected to the system bus and executing the same operation, wherein the basic processing unit comprises: a system bus; A method for restoring a highly reliable computer system, characterized in that the plurality of processors have completely different sets before the occurrence of a failure and after recovery from the failure.
【請求項3】同一の演算を実行する複数のプロセッサ,
該プロセッサのうち健全性の確認された複数の出力を選
択する選択回路,選択された複数のプロセッサの出力を
夫々外部出力し、外部入力を取込むための複数のインタ
フェイスユニット,プロセッサでの演算に必要な情報を
記憶する複数のキャッシュメモリ、これらの間に設けら
れた内部バスとから構成され、これらが一つのプロセッ
サボード上に設けられたベーシックプロセッシングユニ
ットにおいて、通常は前記複数のプロセッサを用いて演
算を行い、ベーシックプロセッシングユニットの故障時
には故障部位を除いた残りの構成によって運転継続し、
通常の構成に復旧する際にプロセッサボードを単位とし
て交換することを特徴とするベーシックプロセッシング
ユニットの復旧方法。
[Claim 3] A plurality of processors that execute the same operation;
A selection circuit that selects a plurality of outputs whose soundness has been confirmed among the processors, a plurality of interface units that output the outputs of the selected plurality of processors to the outside and take in external input, and arithmetic operations in the processor. A basic processing unit consists of a plurality of cache memories that store information necessary for processing, and an internal bus provided between them, and these are provided on a single processor board. If the basic processing unit fails, operation continues using the remaining configuration excluding the failed part.
A basic processing unit recovery method characterized by replacing the processor board as a unit when restoring the normal configuration.
【請求項4】複数のシステムバス,該複数のシステムバ
スに接続される主記憶装置,前記複数のシステムバスに
接続される複数のベーシックプロセッシングユニットで
構成される高信頼化コンピュータシステムにおいて、ベ
ーシックプロセッシングユニットは、同一の演算を実行
する複数のプロセッサと、該プロセッサのうち健全性の
確認された複数の出力を選択する選択回路と、選択され
た複数の出力を夫々外部出力し、外部入力を取込むため
の複数のインタフェイスユニットと、プロセッサでの演
算に必要な情報を記憶する複数のキャッシュメモリと、
これらの間に設けられた内部バスとを一つのプロセッサ
ボード上に積載しており、通常は前記複数のプロセッサ
による演算を実行し、ベーシックプロセッシングユニッ
ト内部回路の故障時には故障部位を除いて運転継続し、
通常の構成に復旧する際に前記システムバス上の他のベ
ーシックプロセッシングユニットに処理を移し、故障し
たベーシックプロセッシングユニットを停止することを
特徴とする高信頼化コンピュータシステムの復旧方法。
4. A highly reliable computer system comprising a plurality of system buses, a main storage device connected to the plurality of system buses, and a plurality of basic processing units connected to the plurality of system buses. The unit includes a plurality of processors that execute the same operation, a selection circuit that selects a plurality of outputs whose soundness has been confirmed from among the processors, outputs each of the selected outputs to the outside, and receives an external input. multiple interface units for storing information, multiple cache memories for storing information necessary for calculations in the processor,
The internal bus provided between these units is mounted on a single processor board, and normally the multiple processors execute calculations, and if the internal circuit of the basic processing unit fails, operation continues except for the failed part. ,
A method for restoring a highly reliable computer system, comprising transferring processing to another basic processing unit on the system bus and stopping a failed basic processing unit when restoring the normal configuration.
【請求項5】同一の演算を実行する複数のプロセッサ,
該プロセッサのうち健全性の確認された複数の出力を選
択する選択回路,選択された複数の出力を夫々外部出力
し、外部入力を取込むための複数のインタフェイスユニ
ット,プロセッサでの演算に必要な情報を記憶する複数
のキャッシュメモリ、これらの間に設けられた内部バス
とから構成され、プロセッサとインタフェイスユニット
とキャッシュメモリと内部バスとによる演算単位が独立
に複数組設けられたベーシックプロセッサであって、通
常は複数の演算単位により演算を実行し、ベーシックプ
ロセッサの故障の際に故障側演算単位を停止して正常側
演算単位にて運転継続し、ベーシックプロセッサの復旧
の際に正常側演算単位のみで運転継続しているベーシッ
クプロセッサを別のベーシックプロセッサに交換するこ
とを特徴とするベーシックプロセッサの復旧方法。
Claim 5: A plurality of processors that execute the same operation;
A selection circuit that selects a plurality of outputs whose soundness has been confirmed from among the processors, a plurality of interface units that output each of the selected outputs to the outside and take in external inputs, and a selection circuit that is necessary for calculations in the processor. A basic processor consisting of multiple cache memories that store information, and an internal bus provided between them, and multiple independent calculation units consisting of a processor, an interface unit, a cache memory, and an internal bus. Normally, calculations are executed using multiple calculation units, and when the basic processor fails, the failed calculation unit is stopped and operation is continued with the normal operation unit, and when the basic processor is restored, the normal calculation unit is restarted. A basic processor recovery method characterized by replacing a basic processor that continues to operate only as a unit with another basic processor.
【請求項6】複数のシステムバス,該複数のシステムバ
スに接続される主記憶装置,前記複数のシステムバスに
接続される複数のベーシックプロセッサで構成される高
信頼化コンピュータシステムにおいて、ベーシックプロ
セッサは、同一の演算を実行する複数のプロセッサと、
該プロセッサのうち健全性の確認された複数の出力を選
択する選択回路と、選択された複数の出力を夫々外部出
力し、外部入力を取込むための複数のインタフェイスユ
ニットと、プロセッサでの演算に必要な情報を記憶する
複数のキャッシュメモリと、これらの間に設けられた内
部バスとから構成され、プロセッサとインタフェイスユ
ニットとキャッシュメモリと内部バスとによる演算単位
が独立に複数組設けられ、その故障の際に故障側演算単
位を停止して正常側演算単位にて運転継続し、その復旧
の際に正常側演算単位での運転から新たなベーシックプ
ロセッサに処理を引き継ぎその後停止することを特徴と
する高信頼化コンピュータシステムの復旧方法。
6. A highly reliable computer system comprising a plurality of system buses, a main storage device connected to the plurality of system buses, and a plurality of basic processors connected to the plurality of system buses, wherein the basic processor is , multiple processors performing the same operation,
A selection circuit that selects a plurality of outputs whose soundness has been confirmed among the processors, a plurality of interface units that output the selected outputs to the outside and take in external inputs, and arithmetic operations in the processor. It is composed of a plurality of cache memories for storing information necessary for the processing, and an internal bus provided between them, and a plurality of independent calculation units each consisting of a processor, an interface unit, a cache memory, and an internal bus are provided. The feature is that in the event of a failure, the faulty processing unit is stopped and operation continues in the normal processing unit, and upon recovery, processing is taken over from the operation in the normal processing unit to a new basic processor and then stopped. A method for restoring highly reliable computer systems.
【請求項7】複数のシステムバス,該複数のシステムバ
スに接続される主記憶装置,複数のシステムバスに接続
され一つのプロセッサボードで構成されるベーシックプ
ロセッシングユニットよりなる高信頼化コンピュータシ
ステムにおいて、前記ベーシックプロセッシングユニッ
トは、同一演算を実行するプロセッサと、プロセッサ出
力を外部出力し、外部入力を取込むためのインタフェイ
スユニットと、プロセッサでの演算に必要な情報を記憶
するキャッシュメモリとによる多重系構成とされ、故障
発生したベーシックプロセッシングユニットはその故障
時に故障部位を除いた残りの構成によって運転継続する
とともに、システムバスに接続された新たなベーシック
プロセッシングユニットに処理を移してから停止するこ
とを特徴とする高信頼化コンピュータシステムの復旧方
法。
7. A highly reliable computer system comprising a plurality of system buses, a main storage device connected to the plurality of system buses, and a basic processing unit connected to the plurality of system buses and constituted by one processor board, The basic processing unit is a multi-system system consisting of a processor that executes the same operation, an interface unit that outputs the processor output to the outside and takes in external input, and a cache memory that stores information necessary for the operation in the processor. A basic processing unit that has a failure continues to operate with the remaining configuration excluding the failed part, and also transfers processing to a new basic processing unit connected to the system bus and then stops. A method for restoring highly reliable computer systems.
【請求項8】同一演算を実行する複数プロセッサで構成
されるベーシックプロセッサがシステムバスに接続され
て運用される高信頼化コンピュータシステムにおいて、
故障発生前と復旧後の所定の処理を実行するベーシック
プロセッサの複数プロセッサの積集合が空とされること
を特徴とする高信頼化コンピュータシステムの復旧方法
8. A highly reliable computer system in which a basic processor composed of a plurality of processors that execute the same operation is connected to a system bus and operated,
1. A method for restoring a highly reliable computer system, characterized in that a product set of a plurality of basic processors that execute predetermined processing before a failure occurs and after a failure occurs is emptied.
【請求項9】システムバス上にボードを挿入するための
複数スロットを備え、当該スロットに主記憶装置のボー
ドと、同一演算を実行する複数プロセッサで構成される
一つのベーシックプロセッサボードとが挿入されて作動
する高信頼化コンピュータシステムにおいて、ベーシッ
クプロセッサボードはその一部に作動停止状態を示す表
示手段を有し、一部プロセッサの故障による縮退運転状
態からの復旧が以下のようにして行われる高信頼化コン
ピュータシステムの復旧方法。 a.旧ベーシックプロセッサボードが、空きスロットに
新ベーシックプロセッサボードが挿入され作動可能状態
であることを検知し、実行中のタスクを主記憶装置に退
避する。 b.新ベーシックプロセッサボードが主記憶装置に退避
されたタスクを実行し、旧ベーシックプロセッサボード
の表示手段により停止状態を表示する。 c.旧ベーシックプロセッサボードを停止する。
9. A system bus comprising a plurality of slots for inserting boards, into which a main storage board and one basic processor board composed of a plurality of processors that execute the same operation are inserted. In a high-reliability computer system that operates as a high-reliability computer system, the basic processor board has a display means indicating an inoperable state in a part thereof, and recovery from a degraded operating state due to a malfunction of a part of the processor is performed as follows. How to restore a trusted computer system. a. The old basic processor board detects that the new basic processor board is inserted into an empty slot and is ready for operation, and saves the task being executed to the main memory. b. The new basic processor board executes the task saved in the main memory, and the display means of the old basic processor board displays the stopped state. c. Stop the old basic processor board.
【請求項10】システムバス上にボードを挿入するため
の複数スロットを備え、当該スロットに主記憶装置のボ
ードと、同一演算を実行する複数プロセッサで構成され
るベーシックプロセッサボードとが挿入されて作動する
高信頼化コンピュータシステムにおいて、一部プロセッ
サの故障による縮退運転状態からの復旧が以下のように
して行われる高信頼化コンピュータシステムの復旧方法
。 a.旧ベーシックプロセッサボードが、空きスロットに
新ベーシックプロセッサボードが挿入され作動可能状態
であることを検知し、実行中のタスクを主記憶装置に退
避する。 b.新ベーシックプロセッサボードは、自己診断を実行
し、正常な場合のみ主記憶装置に退避されたタスクを実
行する。 c.旧ベーシックプロセッサボードを停止する。
10. A system bus comprising a plurality of slots for inserting boards, into which a main storage board and a basic processor board consisting of a plurality of processors that execute the same operation are inserted and operated. A recovery method for a highly reliable computer system in which recovery from a degraded operation state due to failure of some processors is performed as follows. a. The old basic processor board detects that the new basic processor board is inserted into an empty slot and is ready for operation, and saves the task being executed to the main memory. b. The new basic processor board performs self-diagnosis and executes the tasks saved in the main memory only when the board is normal. c. Stop the old basic processor board.
【請求項11】システムバス上にボードを挿入するため
の複数スロットを備え、当該スロットに主記憶装置のボ
ードと、同一演算を実行する複数プロセッサで構成され
る複数のベーシックプロセッサボードとが挿入されて作
動する高信頼化コンピュータシステムにおいて、ベーシ
ックプロセッサボードはその一部にボード取外し要求手
段を有しており、一部プロセッサの故障による縮退運転
状態からの復旧が以下のようにして行われる高信頼化コ
ンピュータシステムの復旧方法。 a.旧ベーシックプロセッサボードは、自己に備えられ
たボード取外し要求手段からの信号によって、実行中の
タスクと自己のボードを示す識別番号とを主記憶装置に
退避する。 b.新ベーシックプロセッサボードは、主記憶装置に退
避されたタスクと識別番号とを入力し、旧ベーシックプ
ロセッサボードの実行すべき処理を引続いて実行する。 c.旧ベーシックプロセッサボードを停止する。
11. A system bus comprising a plurality of slots for inserting boards, into which a main storage board and a plurality of basic processor boards each consisting of a plurality of processors that execute the same operation are inserted. In highly reliable computer systems that operate in How to recover a computer system. a. The old basic processor board saves the task being executed and the identification number indicating its own board to the main memory in response to a signal from the board removal request means provided therein. b. The new basic processor board inputs the task and identification number saved in the main memory and continues to execute the processing that the old basic processor board should have executed. c. Stop the old basic processor board.
【請求項12】システムバス上にボードを挿入するため
の複数スロットを備え、当該スロットに主記憶装置のボ
ードと、同一演算を実行する複数プロセッサで構成され
る複数のベーシックプロセッサボードとが挿入されて作
動する高信頼化コンピュータシステムにおいて、ベーシ
ックプロセッサボードはその一部にボード取外し要求手
段を有しており、一部プロセッサの故障による縮退運転
状態からの復旧が以下のようにして行われる高信頼化コ
ンピュータシステムの復旧方法。 a.旧ベーシックプロセッサボードは、自己に備えられ
たボード取外し要求手段からの信号によって、実行中の
タスクと自己のボードを示す識別番号とを主記憶装置に
退避する。 b.新ベーシックプロセッサボードは、自己診断を実施
し、正常である場合のみ主記憶装置に退避されたタスク
と識別番号とを入力し、旧ベーシックプロセッサボード
の実行すべき処理を引続いて実行する。 c.旧ベーシックプロセッサボードを停止する。
12. A system bus comprising a plurality of slots for inserting boards, into which a main storage board and a plurality of basic processor boards each consisting of a plurality of processors that execute the same operation are inserted. In highly reliable computer systems that operate in How to recover computer system. a. The old basic processor board saves the task being executed and the identification number indicating its own board to the main memory in response to a signal from the board removal request means provided therein. b. The new basic processor board performs a self-diagnosis, and only if it is normal, inputs the task and identification number saved in the main memory, and continues executing the process that the old basic processor board should have executed. c. Stop the old basic processor board.
【請求項13】システムバス上にボードを挿入するため
の複数スロットを備え、当該スロットに主記憶装置のボ
ードと、同一演算を実行する複数プロセッサで構成され
、その一部回路に障害が発生したとき障害部位を除いた
残りの構成で運転継続する複数のベーシックプロセッサ
ボードとが挿入されて作動する高信頼化コンピュータシ
ステムにおいて、複数スロットの全てに稼働状態のボー
ドが挿入されているときに任意のボードを取外し、代わ
りに新ベーシックプロセッサボードを挿入し、障害発生
して一部回路で運転継続している旧ベーシックプロセッ
サボードの処理を新ベーシックプロセッサボードに移し
て稼働せしめ、旧ベーシックプロセッサボードを停止し
てスロットから除去し、除去後のスロット位置に前記と
り外した任意のボードを挿入して稼働せしめることを特
徴とする高信頼化コンピュータシステムの復旧方法。
[Claim 13] A computer system comprising a plurality of slots for inserting boards on the system bus, and the slots are composed of a main storage board and a plurality of processors that execute the same operation, and a failure has occurred in some of the circuits. In a high-reliability computer system that operates with multiple basic processor boards inserted, which continues to operate in the remaining configuration except for the faulty part, when all of the multiple slots have operating boards inserted, any Remove the board, insert the new basic processor board in its place, transfer the processing of the old basic processor board that is still operating with some circuits due to a failure to the new basic processor board, and stop the old basic processor board. 1. A method for restoring a highly reliable computer system, comprising: removing the board from the slot, and inserting the removed arbitrary board into the slot position after removal and operating the board.
【請求項14】同一演算を行う複数のプロセッサを搭載
し、その障害発生時に障害プロセッサを除いた残りのプ
ロセッサにより運転継続するプロセッサボード及び主記
憶ボードが、収納ラックのスロットに設置され、これら
ボードがシステムバスを介して結合される高信頼化コン
ピュータシステムにおいて、スロットに設置されたプロ
セッサボード及び主記憶ボードの全てが稼働中であって
、障害発生時の交換用の予備のプロセッサボードをスロ
ット上に設けない高信頼化コンピュータシステム。
14. A processor board and a main memory board that are equipped with a plurality of processors that perform the same calculation and that continue to operate by the remaining processors except for the faulty processor when a fault occurs are installed in slots in a storage rack, and these boards In a highly reliable computer system in which processor boards and main memory boards installed in slots are connected via a system bus, all of the processor boards and main memory boards installed in the slots are in operation, and a spare processor board for replacement in the event of a failure is installed in the slot. A highly reliable computer system that is not installed in
【請求項15】ボード収納ラックに設けられた複数スロ
ットに設置されるボードと、ボード設置状態でボードに
電力供給する手段と、ボードがスロットに設置された状
態でボードと電気的に接続されるシステムバスとを盤内
に備え、前記ボードはプロセッサを搭載したプロセッサ
ボードと、プロセッサでの処理に使用するデ−タを記憶
する主記憶ボードと、外部との間でデ−タの入出力を行
う入出力インターフェイスボードとを含む高信頼化コン
ピュータシステムにおいて、前記プロセッサボードは、
入出力インターフェイスボードからのデータを取り込ん
で、このデータに基づく同一演算を行う3台以上のプロ
セッサを有して健全性の確認されたプロセッサ出力をシ
ステムバスに出力する手段と、その一部プロセッサ障害
時にこれを除いた残りのプロセッサにより運転継続せし
める手段とを有し、ボード設置によりプロセッサ稼働開
始するとともに、複数のプロセッサボードでの処理タス
クは互いに異なるものとされたことを特徴とする高信頼
化コンピュータシステム。
15. A board installed in a plurality of slots provided in a board storage rack, means for supplying power to the board when the board is installed, and electrically connected to the board when the board is installed in the slot. The board is equipped with a system bus inside the panel, and the board performs input/output of data between the processor board equipped with the processor, the main memory board that stores data used for processing by the processor, and the outside. In a highly reliable computer system including an input/output interface board that performs
A means for outputting the output of a processor whose soundness has been confirmed to the system bus by having three or more processors that take in data from an input/output interface board and perform the same calculation based on this data, and a means for preventing failure of some of the processors. High reliability characterized in that the processor starts operating by installing the board, and the processing tasks on the plurality of processor boards are different from each other. computer system.
【請求項16】複数のスロットを有する収納ラック,該
収納ラックのスロットに設置されるボード,該ボードと
接続されたシステムバスとを収納した計算機盤であって
、前記ボードのうちデータ処理を行うプロセッサボード
は、同一演算を実施する複数台のプロセッサと、選択さ
れたプロセッサ出力を外部出力するための出力部と、プ
ロセッサ異常を検知し異常プロセッサを除外する異常検
出部とを当該ボード上に備えることを特徴とする計算機
盤。
16. A computer board that houses a storage rack having a plurality of slots, a board installed in the slot of the storage rack, and a system bus connected to the board, which performs data processing among the boards. The processor board includes a plurality of processors that perform the same operation, an output section for externally outputting a selected processor output, and an abnormality detection section that detects a processor abnormality and excludes the abnormal processor. A computer board characterized by:
【請求項17】複数のスロットを有する収納ラック,該
収納ラックのスロットに設置されるボードであってデー
タ処理を行うプロセッサボードと、データ処理に必要な
データを記憶する主記憶ボードとを含むボード,ボード
に接続されたシステムバスとを収納した計算機盤であっ
て、前記のプロセッサボードは、収納ラックからの取外
しを要求する取外し要求手段と、プロセッサの実行する
タスクを記憶する第1の記憶手段と、プロセッサボード
のボード番号を記憶する第2の記憶手段と、前記取外し
要求に応じてタスクとプロセッサ番号とを主記憶ボード
に移し、当該プロセッサボードでの演算を停止する手段
と、主記憶ボード上のタスクとボード番号とを受取り、
当該プロセッサボードによる演算を開始する手段を備え
ることを特徴とする計算機盤。
17. A storage rack having a plurality of slots, a board installed in the slot of the storage rack that includes a processor board that processes data, and a main memory board that stores data necessary for data processing. , and a system bus connected to the board, the processor board having a removal request means for requesting removal from the storage rack, and a first storage means for storing tasks executed by the processor. a second storage means for storing the board number of the processor board; a means for transferring the task and the processor number to the main memory board in response to the removal request and stopping calculations on the processor board; and a main memory board. Receive the above task and board number,
A computer board characterized by comprising means for starting an operation by the processor board.
【請求項18】複数のプロセッサを備え、プロセッサの
一つが故障したときこのプロセッサと対をなすプロセッ
サであって健全性の確認されたプロセッサの出力を外部
出力するようにされたプロセッサボード収納ラックのス
ロットに設置され、スロットに設置された複数のボード
間がシステムバスにより結合された計算機システムにお
いて、前記のスロットには、前記の故障プロセッサを含
むプロセッサボードから必要なデータの転送を受け、転
送完了により複数プロセッサによる演算を開始すること
のできる他のプロセッサボードが設置可能であることを
特徴とする計算機システム。
18. A processor board storage rack comprising a plurality of processors, wherein when one of the processors fails, the output of the processor paired with this processor and whose health has been confirmed is outputted to the outside. In a computer system that is installed in a slot and in which multiple boards installed in the slot are connected by a system bus, the slot receives the necessary data transfer from the processor board including the failed processor, and the transfer is completed. A computer system characterized in that another processor board capable of starting calculations by multiple processors can be installed.
【請求項19】複数のプロセッサと、このプロセッサの
稼働状態を示す表示手段とを備えるプロセッサボードが
システムバス上に設けられ、このプロセッサボードはシ
ステムバス上に他のプロセッサボードが接続されている
ことを検出する手段,該手段により他のプロセッサボー
ドが接続されていることを検出したとき自己のプロセッ
サボードに保有するデータをシステムバスに送出する手
段,データ送出完了後自己のプロセッサボードの前記表
示手段の表示状態を変更する手段,データ送出完了後自
己のプロセッサボードのプロセッサを停止する手段を有
することを特徴とする計算機システム。
19. A processor board including a plurality of processors and display means for indicating the operating status of the processors is provided on a system bus, and this processor board is connected to other processor boards on the system bus. means for detecting that another processor board is connected, means for transmitting data held in the own processor board to the system bus when the means detects that another processor board is connected, and means for displaying the own processor board after data transmission is completed. 1. A computer system comprising: means for changing the display state of the computer; and means for stopping the processor of its own processor board after data transmission is completed.
【請求項20】複数のプロセッサと、このプロセッサの
稼働状態を示す表示手段とを備えるプロセッサボードが
システムバス上に複数設けられ、これらのプロセッサボ
ードは各プロセッサボードごとの固有の識別番号を記憶
する記憶手段、このプロセッサボードの停止を外部から
指示するための停止要求手段,該停止要求手段からのプ
ロセッサボード停止要求指令を検出する手段,該手段に
より停止要求指令を検出したとき自己のプロセッサボー
ドに保有するデータと、前記記憶手段に記憶された固有
の識別番号をシステムバスに送出する手段,データ等の
送出完了後自己のプロセッサボードの前記表示手段の表
示状態を変更する手段,データ送出完了後自己のプロセ
ッサボードのプロセッサを停止する手段を有することを
特徴とする計算機システム。
20. A system bus includes a plurality of processor boards each having a plurality of processors and display means for indicating the operating status of the processors, and each of these processor boards stores a unique identification number for each processor board. storage means, stop request means for externally instructing the stop of this processor board, means for detecting a processor board stop request command from the stop request means, and when the stop request command is detected by the means, a stop request command is sent to the own processor board; means for transmitting retained data and a unique identification number stored in the storage means to the system bus; means for changing the display state of the display means of its own processor board after completion of transmission of data; and means for changing the display state of the display means of its own processor board after completion of transmission of data A computer system comprising means for stopping a processor on its own processor board.
JP00752091A 1991-01-25 1991-01-25 High-reliability computer system, its recovery method, processor board and its replacement method Expired - Lifetime JP3246751B2 (en)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP00752091A JP3246751B2 (en) 1991-01-25 1991-01-25 High-reliability computer system, its recovery method, processor board and its replacement method
EP92300212A EP0496506B1 (en) 1991-01-25 1992-01-10 Fault tolerant computer system incorporating processing units which have at least three processors
DE69231452T DE69231452T2 (en) 1991-01-25 1992-01-10 Fault-tolerant computer system with processing units that each have at least three computer units
CA002059143A CA2059143C (en) 1991-01-25 1992-01-10 Processing unit for a computer and a computer system incorporating such a processing unit
US08/434,288 US5901281A (en) 1991-01-25 1995-05-03 Processing unit for a computer and a computer system incorporating such a processing unit
US09/188,903 US6216236B1 (en) 1991-01-25 1998-11-10 Processing unit for a computer and a computer system incorporating such a processing unit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00752091A JP3246751B2 (en) 1991-01-25 1991-01-25 High-reliability computer system, its recovery method, processor board and its replacement method

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP17433298A Division JP3256181B2 (en) 1998-06-22 1998-06-22 How to restore a highly reliable computer system
JP17433398A Division JP3325836B2 (en) 1998-06-22 1998-06-22 Computer board

Publications (2)

Publication Number Publication Date
JPH04241038A true JPH04241038A (en) 1992-08-28
JP3246751B2 JP3246751B2 (en) 2002-01-15

Family

ID=11668053

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00752091A Expired - Lifetime JP3246751B2 (en) 1991-01-25 1991-01-25 High-reliability computer system, its recovery method, processor board and its replacement method

Country Status (1)

Country Link
JP (1) JP3246751B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009534738A (en) * 2006-04-21 2009-09-24 ハネウェル・インターナショナル・インコーポレーテッド Error filtering in fault-tolerant computing systems

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009534738A (en) * 2006-04-21 2009-09-24 ハネウェル・インターナショナル・インコーポレーテッド Error filtering in fault-tolerant computing systems

Also Published As

Publication number Publication date
JP3246751B2 (en) 2002-01-15

Similar Documents

Publication Publication Date Title
EP0496506B1 (en) Fault tolerant computer system incorporating processing units which have at least three processors
US6073251A (en) Fault-tolerant computer system with online recovery and reintegration of redundant components
JP3206006B2 (en) Duplex bus control method and device
EP1980943B1 (en) System monitor device control method, program, and computer system
RU2585262C2 (en) Control computer system, method of controlling control computer system and use of control computer system
US5742753A (en) Mesh interconnected array in a fault-tolerant computer system
JPH0812621B2 (en) Information transfer method and device
JP3595033B2 (en) Highly reliable computer system
JP3030658B2 (en) Computer system with power failure countermeasure and method of operation
JPH04241039A (en) High-reliability computer system
JP3256181B2 (en) How to restore a highly reliable computer system
JPH07182189A (en) Computer system, processor chip and fault restoring method
JPH04241038A (en) Recovering method for high-reliability computer system
JPH05313930A (en) Highly reliable information processor
JPH0916535A (en) Multiprocessor computer
JP3325836B2 (en) Computer board
JPH11134210A (en) Redundant method for system
JP5227653B2 (en) Multiplexed computer system and processing method thereof
JPH0916426A (en) Fault tolerant computer with two-port console
JPS62115555A (en) Managing method for duplexing auxiliary storage device of computer system
JP3015537B2 (en) Redundant computer system
JPH06259270A (en) Processor abnormality deciding circuit
JP3055906B2 (en) Emergency operation method
JP3015538B2 (en) Redundant computer system
JPH03273344A (en) Fault tolerant system

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071102

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081102

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081102

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091102

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101102

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111102

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111102

Year of fee payment: 10