JPH07182189A - Computer system, processor chip and fault restoring method - Google Patents

Computer system, processor chip and fault restoring method

Info

Publication number
JPH07182189A
JPH07182189A JP5328975A JP32897593A JPH07182189A JP H07182189 A JPH07182189 A JP H07182189A JP 5328975 A JP5328975 A JP 5328975A JP 32897593 A JP32897593 A JP 32897593A JP H07182189 A JPH07182189 A JP H07182189A
Authority
JP
Japan
Prior art keywords
bus
processor
buses
processors
computer system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5328975A
Other languages
Japanese (ja)
Other versions
JP3424968B2 (en
Inventor
Toshihisa Kamemaru
敏久 亀丸
Kenji Kuroda
健児 黒田
Masashi Shimoyama
雅士 下山
Hiroaki Yasunaga
裕明 安永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP32897593A priority Critical patent/JP3424968B2/en
Publication of JPH07182189A publication Critical patent/JPH07182189A/en
Application granted granted Critical
Publication of JP3424968B2 publication Critical patent/JP3424968B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

PURPOSE:To provide a computer system of high performance which can prevent the deterioration of its performance caused by the multiplication and the fault detecting/switching operation in a highly reliable computer device that has its multiplex component units. CONSTITUTION:One or more of processors 11, 12, 13, 21, 22 and 23 are connected to the triplex system buses 1, 2 and 3. Furthermore three processors operates synchronously with each other on different buses and construct a logical processing unit. The outputs of buses 1-3 are compared with each other by a memory or an I/O device so that the correct output is selected. The I/O device is connected to a triplex, duplex or non-multiplex system bus of a 2nd layer in consideration of the reliability, the economical properties, the universal applicability, etc.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、多重構成による高信
頼化計算機において、特に高周波クロックで動作し、複
数のプロセッシングユニットを備え高性能な処理能力を
有する計算機システムと、障害発生後の障害回復方式に
関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a highly reliable computer having a multiple structure, particularly a computer system which operates with a high frequency clock, has a plurality of processing units and has a high processing capability, and a fault recovery after a fault occurs. It is related to the method.

【0002】[0002]

【従来の技術】フォールトトレラント計算機の分野にお
いて、計算機の信頼性を高める方法として、故障率の高
いモジュールを多重化し、あるモジュールが故障しても
残りのモジュールで正しい動作を行う方式が一般的にと
られている。この、多重化の範囲はCPU、メモリ、バ
スなどであり、これらに種々のエラーチェック機能を付
加して、高信頼化を行っている。
2. Description of the Related Art In the field of fault-tolerant computers, as a method of improving the reliability of computers, it is common to multiplex modules with a high failure rate so that even if one module fails, the remaining modules will operate correctly. It is taken. The range of this multiplexing is a CPU, a memory, a bus, etc., and various error check functions are added to these to achieve high reliability.

【0003】従来例として、例えば、特開昭58−13
7054号では、プロセッシングボード、主記憶、入出
力制御装置が、通称ペア&スペアとよばれる二重化され
た2枚のボードで構成され(プロセッシングユニットと
しては、全体で4個のプロセッサを必要とする)、完全
に同期動作を行う。各ボード内では、出力段の比較照合
を行い、一致しなければ、そのボードは故障したものと
みなし、外部バスへのアクセスをしない。故障したボー
ドの情報はスペア側に伝えられ、スペア側のみでシステ
ムは動作を実行し続けることができる。
As a conventional example, for example, JP-A-58-13
In the 7054, the processing board, main memory, and input / output control device are composed of two redundant boards, which are commonly called pair & spare (the processing unit requires a total of four processors). , Fully synchronized operation. Within each board, the output stages are compared and collated. If they do not match, the board is considered to have failed and no access to the external bus is made. The information of the failed board is passed to the spare side and only the spare side can keep the system running.

【0004】また、特開平2−202636号では、3
つの独立したプロセッシングボード(同一周波数だが位
相が異なるクロックで各々動作する)で構成され、各プ
ロセッシングボードは、プロセッサ、キャッシュメモ
リ、ローカルメモリから成る。各プロセッシングボード
は、グローバルメモリへのアクセス時、およびサイクル
カウンタと称するカウンタのオーバフロー時に同期をと
りながら動作する。
Further, in JP-A-2-202636, 3
It is composed of three independent processing boards (each of which operates at a clock having the same frequency but a different phase), and each processing board consists of a processor, a cache memory, and a local memory. Each processing board operates synchronously when accessing the global memory and when a counter called a cycle counter overflows.

【0005】さらに、特開平4−241038号及び特
開平4−241039号では、同一プロセッシングボー
ドに3つのプロセッサを実装し、同一クロックで完全同
期して動作する。該プロセッサのうち、選択回路により
選択された2つの出力をそれぞれ外部に出力する。プロ
セッサからキャッシュメモリや外部へのアクセス経路
は、選択回路の判定結果に従って内部バスのゲートの開
閉することで決定される。
Further, in Japanese Patent Laid-Open Nos. 4-241038 and 4-241039, three processors are mounted on the same processing board and operate in perfect synchronization with the same clock. The two outputs selected by the selection circuit of the processor are output to the outside. The access path from the processor to the cache memory or the outside is determined by opening or closing the gate of the internal bus according to the determination result of the selection circuit.

【0006】さらに、特開昭59−160899号で
は、同一プロセッシングボードに2つのプロセッサと1
つのキャッシュを実装し、プロセッシングボードが処理
を行なう場合は、命令およびデータを2重化された主記
憶からキャッシュ(ストアインキャッシュ)にロードし
てきて、該2つのプロセッサは同期動作を行ない、実行
結果を比較する。一連の処理が正常に完了する(即ち、
2重化プロセッサの処理が常に一致していた)場合また
はキャッシュがオーバーフローする場合にキャッシュの
内容を主記憶に書き戻す。この方式は、2重化された主
記憶(の少なくとも一方)に常に正しいデータを確保す
ることを保証とすることによって、信頼性を向上してい
る。プロセッシングユニットの障害は、正しく検知さえ
できればよい(該ユニットによる継続はできなくてよ
い)。プロセシングユニットの障害時には、そのユニッ
トが行なった処理を、(古いが)正しい主記憶上のデー
タをもとに別のプロセッシングユニットで再実行する。
Further, in Japanese Patent Laid-Open No. 59-160899, two processors and one processor are provided on the same processing board.
When two caches are installed and the processing board performs processing, instructions and data are loaded from the duplicated main memory into the cache (store-in cache), and the two processors perform a synchronous operation and execute the result. To compare. A series of processing is completed normally (that is,
When the processing of the duplexing processor is always the same) or when the cache overflows, the cache contents are written back to the main memory. This method improves reliability by ensuring that correct data is always secured in (at least one of) the duplicated main memory. The failure of the processing unit only needs to be correctly detected (it is not necessary for the unit to continue). When a processing unit fails, the processing performed by the processing unit is re-executed by another processing unit based on the correct (old) data in the main memory.

【0007】また、図31に示すように、従来の計算機
システムの高信頼化の一方式として、プロセッサを3重
化し、各プロセッサは同一命令を実行し、出力を多数決
回路で、比較・選択し、システムバスに出力する方式が
ある。こうすることによって単一のプロセッサの故障に
対して、システムは正常な運用が続行できる。
Further, as shown in FIG. 31, as one method for improving the reliability of a conventional computer system, the processors are tripled, each processor executes the same instruction, and the outputs are compared and selected by a majority circuit. , There is a method to output to the system bus. This allows the system to continue normal operation in the event of a single processor failure.

【0008】[0008]

【発明が解決しようとする課題】従来の技術によると、
1つの箇所が故障しても、正常に動作を続けるフォール
トトレラント計算機を実現するために、さまざまな方法
がなされているが、これらの方法で、高周波クロックで
動作し、複数のプロセッシングユニットを要する高性能
な計算機を構築しようとすると以下の問題点があった。
According to the prior art,
Various methods have been used to realize a fault-tolerant computer that continues to operate normally even if one part fails, but these methods operate with a high-frequency clock and require multiple processing units. There were the following problems when trying to build a high-performance computer.

【0009】上記従来例の特開昭58−137054号
では、プロセッシングユニットがペア&スペアの2枚で
構成されているため、1プロセッシングユニットあたり
4個のプロセッサが必要である。一般に高速動作可能な
プロセッサチップは、他の部品に比較して非常に高価な
ため、このような構成はコストが高くなる。
In the above-mentioned Japanese Patent Laid-Open No. 58-137054, since the processing unit is composed of two pairs and spares, four processors are required for each processing unit. In general, a processor chip capable of high-speed operation is very expensive as compared with other components, and thus such a configuration has a high cost.

【0010】また、上記従来例の特開平2−20263
6号では、3つの独立したプロセッサボードで構成され
ている。各プロセッサボードは、同一周波数(厳密には
同一ではない)だが位相の異なるクロックで動作するた
め、各プロセッサボード間の同期あわせのための特別な
機構を必要とし、マルチプロセッサ化などの高速性能化
手法を適用するのは困難が伴うと思われる。
Further, Japanese Patent Laid-Open No. 2-20263 of the above-mentioned conventional example.
No. 6 is composed of three independent processor boards. Since each processor board operates with clocks with the same frequency (not exactly the same) but different phases, a special mechanism for synchronization between the processor boards is required, and high-speed performance such as multiprocessors is achieved. It seems difficult to apply the method.

【0011】また、上記従来例の特開平4−24103
8、特開平4−241039号では、プロセッシングユ
ニットを同一のボードで構成し、3つのプロセッサを実
装し、同一クロックで完全同期して動作するもので、マ
ルチプロセッサ化による高性能化も適用できる。しか
し、プロセッサとキャッシュメモリ間にプロセッサの出
力の正当性を確認する回路が入り、プロセッサのノーウ
ェイト動作と高周波数の動作の障害となり、やはり高性
能化を阻害している。
Further, Japanese Patent Laid-Open No. 4-24103 of the above-mentioned conventional example.
In JP-A-4-241039, the processing unit is configured by the same board, three processors are mounted, and they operate in perfect synchronization with the same clock, and high performance due to multiprocessor can be applied. However, a circuit for confirming the validity of the output of the processor is inserted between the processor and the cache memory, which becomes an obstacle to the no-wait operation and the high-frequency operation of the processor, which also hinders the high performance.

【0012】また、上記従来例の特開昭59−1608
99号では、プロセッシングボードは独立クロックで動
作し、内部は2つのプロセッサで構成され、プロセッサ
故障時は、前回のキャッシュメモリのフラッシュタイミ
ングで主記憶に格納された内容から別のプロセッシング
ユニットが処理を再実行するチェックポイント方式で、
通常処理においてもキャッシュメモリのフラッシュなど
のオーバヘッドがあり、障害時にはチェックポイントま
で後戻りする欠点があり、性能が低下する。
Further, Japanese Patent Laid-Open No. 59-1608 of the above-mentioned conventional example.
In No. 99, the processing board operates with an independent clock, the inside is composed of two processors, and when the processor fails, another processing unit processes from the contents stored in the main memory at the previous flash timing of the cache memory. It is a checkpoint method to re-execute,
Even in normal processing, there is an overhead such as flushing of the cache memory, and there is a drawback of returning to the checkpoint in the event of a failure, resulting in poor performance.

【0013】また、図31に示す方式だと、1論理CP
U毎に多数決回路が必要であり、論理CPUの台数が多
いマルチプロセッサの構成を考えた場合、相対的に多く
のH/Wを必要とする。また、CPUの周波数も付加回
路で制約を受けやすいし、キャッシュを有するプロセッ
サの場合、キャッシュのスヌープおよびコヒーレンシを
とるためのバストランザクションが発生するが、このよ
うな処理でオーバヘッドが発生して、性能が低下する。
In the system shown in FIG. 31, one logical CP is used.
A majority decision circuit is required for each U, and considering a multiprocessor configuration having a large number of logical CPUs, a relatively large amount of H / W is required. Further, the frequency of the CPU is also easily restricted by the additional circuit, and in the case of a processor having a cache, a bus transaction for taking snoop and coherency of the cache occurs, but such processing causes an overhead, resulting in performance degradation. Is reduced.

【0014】この発明は、上記のような問題点を解消す
るためになされたもので、高性能なフォールトトレラン
ト計算機、特に最新の技術を用いた標準の高性能なプロ
セッサチップおよび周辺のチップセットの有する高速性
を十分発揮させ、またマルチプロセッサ技術を包含する
最新のオペレーティングシステムを搭載することで、非
常に高い性能を発揮できるフォールトトレラント計算機
を提供することにある。
The present invention has been made in order to solve the above-mentioned problems, and provides a high-performance fault-tolerant computer, particularly a standard high-performance processor chip using the latest technology and a peripheral chip set. It is to provide a fault-tolerant computer capable of exhibiting extremely high performance by fully exhibiting its high speed and incorporating the latest operating system including multiprocessor technology.

【0015】また、上記のような計算機において障害発
生時やその回復処理において、信頼性を低下させない障
害回復方法や、性能を低下させない障害回復方法を有す
る計算機システムを提供する。
Further, there is provided a computer system having a failure recovery method that does not reduce reliability and a failure recovery method that does not degrade performance when a failure occurs in the above-described computer and its recovery processing.

【0016】また、同じハードウェア構成で、信頼性を
要求するシステムと、性能を要求するシステムの両方に
対応できる計算機ハードウェア構成を提供する。
Further, the same hardware configuration provides a computer hardware configuration capable of supporting both a system requiring reliability and a system requiring performance.

【0017】[0017]

【課題を解決するための手段】この発明の計算機システ
ムは、以下の要素を有することを特徴とする。(a)デ
ータを転送する3以上複数のバス、(b)上記複数のバ
スに個々に接続され同一動作する3以上複数のプロセッ
サを備えたプロセッシングユニット、(c)上記プロセ
ッサからバスを介してアクセスされるデバイスと、上記
3以上のバスと上記デバイスの間にあってバスの選択を
行う選択手段と、選択手段により選択されたバスとデバ
イス間のデータ転送を制御する制御部を備えたサブシス
テム。
A computer system according to the present invention is characterized by having the following elements. (A) three or more buses for transferring data, (b) a processing unit having three or more processors individually connected to the plurality of buses and operating in the same manner, (c) access from the processors via the bus Device, a selection unit for selecting a bus between the three or more buses and the devices, and a control unit for controlling data transfer between the bus and the device selected by the selection unit.

【0018】上記プロセッシングユニットは、複数存在
し、ひとつのバスに複数のプロセッサを備えたことを特
徴とする。
A plurality of processing units are provided, and one bus is provided with a plurality of processors.

【0019】上記選択手段は、バスからデバイスへデー
タを転送する場合、複数のバスからひとつのバスを選択
してデバイスと接続し、デバイスからバスへデータを転
送する場合、複数のバスを選択してデバイスと接続する
ことを特徴とする。
The selecting means selects one bus from a plurality of buses when transferring data from the bus to the device and connects the device to the device, and selects a plurality of buses when transferring data from the device to the bus. It is characterized by connecting with a device.

【0020】上記制御部は、上記3以上のバスのデータ
を比較して、障害の発生を検出し、その検出結果に基づ
いて上記選択手段のバスの選択を制御する障害検出手段
を備えたことを特徴とする。
The control unit is provided with a failure detecting means for comparing the data of the three or more buses to detect the occurrence of a failure and controlling the bus selection of the selecting means based on the detection result. Is characterized by.

【0021】上記計算機システムは、上記障害検出手段
の検出結果に基づいて、障害があったバスを切り離す切
り離し手段を備えたことを特徴とする。
The computer system is characterized by comprising disconnecting means for disconnecting a bus having a failure based on the detection result of the failure detecting means.

【0022】上記サブシステムは、主記憶装置であり、
上記デバイスはメモリであり、上記制御部はメモリとバ
ス間のデータ転送を行うメモリ制御部であることを特徴
とする。
The subsystem is a main storage device,
The device is a memory, and the control unit is a memory control unit that transfers data between the memory and the bus.

【0023】上記主記憶装置を複数備え、上記複数のバ
スにそれぞれ接続したことを特徴とする。
It is characterized in that a plurality of the main memory devices are provided and are connected to the plurality of buses, respectively.

【0024】上記サブシステムは、周辺機器システムで
あり、上記デバイスは入出力装置であり、上記制御部は
入出力装置とバス間のデータ転送を行う入出力制御装置
であることを特徴とする。
The subsystem is a peripheral device system, the device is an input / output device, and the control unit is an input / output control device for transferring data between the input / output device and the bus.

【0025】上記周辺機器システムは、上記複数のバス
に対応する3以上の第2バスと、上記バスと第2のバス
をそれぞれ接続する3以上のバスブリッジを備えたこと
を特徴とする。
The peripheral device system is characterized by including three or more second buses corresponding to the plurality of buses and three or more bus bridges respectively connecting the buses and the second buses.

【0026】上記周辺機器システムは、上記選択手段と
上記入出力装置の間にひとつバスから成る第3のバスを
備えたことを特徴とする。
The peripheral device system is characterized in that a third bus consisting of one bus is provided between the selecting means and the input / output device.

【0027】上記周辺機器システムは、上記選択手段を
ふたつ備え、ふたつの選択手段と上記入出力装置の間に
ふたつのバスから成る第4のバスを備えたことを特徴と
する。
The peripheral equipment system is characterized in that it comprises two selection means and a fourth bus composed of two buses between the two selection means and the input / output device.

【0028】上記複数の主記憶装置は、バスに対してデ
ータを送出するプライマリ主記憶装置とバスに対してデ
ータを送出しないセカンダリ主記憶装置を備えたことを
特徴とする。
The plurality of main storage devices are characterized by including a primary main storage device that sends data to the bus and a secondary main storage device that does not send data to the bus.

【0029】上記プライマリ主記憶装置は、バスに転送
するデータの正当性をチェックするチェック手段と、チ
ェック手段のチェック結果に基づいてセカンダリ主記憶
装置とプライマリ主記憶装置を交替する交替手段を備え
たことを特徴とする。
The primary main memory device comprises a checking means for checking the validity of the data transferred to the bus, and a replacement means for replacing the secondary main memory device with the primary main memory device based on the check result of the checking means. It is characterized by

【0030】上記チェック手段は、各バスから転送され
てきたデータの正当性をチェックする冗長コードを生成
する複数の冗長コード生成手段と、生成された複数の冗
長コードから正しい冗長コードを選択して記憶する冗長
コード選択手段を備えたことを特徴とする。
The above-mentioned checking means selects a plurality of redundant code generating means for generating a redundant code for checking the validity of the data transferred from each bus, and selects a correct redundant code from the generated plurality of redundant codes. A redundant code selecting means for storing is provided.

【0031】上記チェック手段は、各バスに対応して冗
長コードをチェックする複数の冗長コードチェック手段
を備えたことを特徴とする。
The checking means is provided with a plurality of redundant code checking means for checking the redundant code corresponding to each bus.

【0032】上記計算機システムは、動作モードとして
3以上のバスを同期動作させる同期動作モードと、3以
上のバスをそれぞれ非同期に動作させる個別動作モード
を備えたことを特徴とする。
The computer system is characterized in that it has, as operation modes, a synchronous operation mode in which three or more buses are operated in synchronization and an individual operation mode in which three or more buses are operated asynchronously.

【0033】上記選択手段は、個別動作モードにおい
て、複数のバスからデバイスへのデータ競合を制御する
とともに、デバイスからデータを対応するいずれかのバ
スに出力することを特徴とする。
In the individual operation mode, the selection means controls data competition from a plurality of buses to the device and outputs data from the device to any of the corresponding buses.

【0034】上記計算機システムは、さらに、同期動作
モードにおいて、複数のバスへ出力されたバス獲得要求
をひとつのバス獲得要求として処理し、個別動作モード
において、複数のバスへ出力されたバス獲得要求ををそ
れぞれ個別のバス獲得要求として処理するアビトレーシ
ョン手段を備えたことを特徴とする。
The computer system further processes the bus acquisition request output to the plurality of buses in the synchronous operation mode as one bus acquisition request, and the bus acquisition request output to the plurality of buses in the individual operation mode. Is provided as an individual bus acquisition request.

【0035】上記計算機システムは、動作モードとして
3以上のバスを同期動作させる同期動作モードと、3以
上のバスをそれぞれ非同期に動作させる個別動作モード
を備え、上記複数の主記憶装置は、個別動作モードにお
いて異なるアドレスを用いてアクセスされるメモリを備
えたことを特徴とする。
The computer system has, as operation modes, a synchronous operation mode for synchronously operating three or more buses and an individual operation mode for asynchronously operating the three or more buses. The plurality of main storage devices individually operate. It is characterized by having a memory that is accessed using different addresses in the modes.

【0036】上記計算システムは、上記動作モードを指
定するモード指定手段と、モード指定手段により指定さ
れたモードに設定するモード設定手段を備えたことを特
徴とする。
The above-mentioned computing system is characterized by comprising a mode designating means for designating the operation mode and a mode setting means for setting the mode designated by the mode designating means.

【0037】この発明のプロセッサチップは、以下の要
素を有することを特徴とする。(a)第1のプロセッ
サ、(b)第2のプロセッサ、(c)上記第1と第2の
プロセッサを個別にリセットするリセット手段、(d)
上記第1と第2のプロセッサの動作を個別に停止させる
停止手段、(e)上記第1と第2のプロセッサのバス使
用要求を個別に出力するバス使要求出力手段、(f)上
記第1と第2のプロセッサへバス使用許可を個別に入力
するバス使用許可入力手段、(g)上記第1と第2のプ
ロセッサのその他の入出力を共通化して行なう共用手
段。
The processor chip of the present invention is characterized by having the following elements. (A) first processor, (b) second processor, (c) reset means for individually resetting the first and second processors, (d)
Stop means for individually stopping the operations of the first and second processors, (e) Bus usage request output means for individually outputting the bus usage requests of the first and second processors, (f) the first And bus use permission input means for individually inputting the bus use permission to the second processor, and (g) common means for commonly performing other input / output of the first and second processors.

【0038】また、3以上のバスと、各バスに対応して
上記プロセッサチップを3以上備え、第1と第2のプロ
セッサをそれぞれ同一のバスに接続したことを特徴とす
る。
Further, it is characterized in that three or more buses and three or more processor chips corresponding to each bus are provided, and the first and second processors are connected to the same bus.

【0039】また、上記バスを4つ備えたことを特徴と
する。
Further, it is characterized in that four buses are provided.

【0040】また、この発明は第1、第2、第3のバス
にそれぞれ個々に接続され同一動作を行なう第1、第
2、第3のプロセッサを備えた第1のプロセッシングユ
ニットと、第1、第2、第3のバスにそれぞれ個々に接
続され同一動作を行なう第4、第5、第6のプロセッサ
を備えた第2のプロセッシングユニットとを備えた計算
機システムの第1のプロセッサに障害が発生した場合の
障害復旧方法において、以下の工程を有することを特徴
とする。(a)第1のプロセッシングユニットで実行中
の処理を第2及び第3のプロセッサにより継続して実行
する継続実行工程、(b)上記継続実行工程後、第1の
プロセッシングユニットの動作を停止させ、第2のプロ
セッシングユニットにより次の処理を開始するシングル
ユニット処理工程。
Further, according to the present invention, there is provided a first processing unit including first, second and third processors which are respectively connected to the first, second and third buses and perform the same operation, and a first processing unit. , A first processor of a computer system having a second processing unit having fourth, fifth and sixth processors respectively connected to the second and third buses and performing the same operation, fails in the first processor. The failure recovery method when it occurs is characterized by having the following steps. (A) a continuous execution step in which the processing being executed in the first processing unit is continuously executed by the second and third processors, and (b) after the continuous execution step, the operation of the first processing unit is stopped. , A single unit processing step in which the next processing is started by the second processing unit.

【0041】上記継続実行工程は、(a)第1のプロセ
ッサと第4のプロセッサの出力を抑止する出力抑止工程
と、(b)第1のバスの動作を第2、第3のバスの動作
に追随させ第4のプロセッサの出力を除く動作を継続実
行させる追随工程を備え、上記シングルユニット処理工
程は、(a)第1のプロセッシングユニットの動作停止
後、第4のプロセッサの出力を許可する許可工程と、
(b)第1のバスを第2、第3のバスに同期させる同期
工程を備えたことを特徴とする。
The above continuous execution step includes (a) an output suppressing step for suppressing the outputs of the first processor and the fourth processor, and (b) an operation of the first bus for the operation of the second and third buses. And a follow-up step for continuously executing the operation excluding the output of the fourth processor, wherein the single unit processing step (a) permits the output of the fourth processor after the operation of the first processing unit is stopped. A permitting process,
(B) A synchronization process for synchronizing the first bus with the second and third buses is provided.

【0042】上記追随工程は、第1のバスの動作を1サ
イクル以上所定サイクル停止させてから第1のバスの動
作を第2、第3のバスの動作に追随させるバス追随工程
と、第4のプロセッサの動作を所定サイクル停止させて
第5、第6のプロセッサから所定サイクル遅れた同期動
作を行なわせるプロセッサ追随工程を備え、上記同期工
程は、第5、第6のプロセッサの動作を所定サイクル停
止させて第4のプロセッサの動作と同期させるプロセッ
サ同期工程と、第1のバスの動作を第2、第3のバスの
動作と同期させるバス同期工程を備えたことを特徴とす
る。
The following steps include a bus following step in which the operation of the first bus is stopped for one cycle or more for a predetermined cycle and then the operation of the first bus is followed by the operations of the second and third buses, and a fourth step. A processor follow-up step of stopping the operation of the processor for a predetermined cycle and performing a synchronous operation delayed from the fifth and sixth processors by a predetermined cycle, wherein the synchronizing step includes the operation of the fifth and sixth processors for a predetermined cycle. A processor synchronization step of stopping and synchronizing the operation of the fourth processor and a bus synchronization step of synchronizing the operation of the first bus with the operation of the second and third buses are provided.

【0043】また、この発明は、第1、第2、第3のバ
スにそれぞれ個々に接続され同一動作を行なう第1、第
2、第3のプロセッサを備えた第1のプロセッシングユ
ニットと、第1、第2、第3のバスにそれぞれ個々に接
続され同一動作を行なう第4、第5、第6のプロセッサ
を備えた第2のプロセッシングユニットとを備えた計算
機システムの第1のプロセッサに障害が発生した場合の
障害復用方法において、(a)第1のプロセッシングユ
ニットで実行中の処理を、第2、第3のプロセッサによ
り継続して実行、第2のプロセッシングユニットで実行
中の処理を、第5、第6のプロセッサにより継続して実
行する継続実行工程、(b)上記継続実行工程中に、第
1と第4のプロセッサを新規なプロセッサを交換する交
換工程、(c)上記交換工程後、第1と第4のプロセッ
サを他のプロセッサと同期させて動作させる同期工程を
備えたことを特徴とする。
Further, according to the present invention, there is provided a first processing unit including first, second and third processors which are individually connected to the first, second and third buses and which perform the same operation, respectively. Failure of the first processor of the computer system including the second processing unit including the fourth, fifth and sixth processors which are respectively connected to the first, second and third buses and perform the same operation In the method for recovering from a failure in the case of occurrence of (a), (a) the process being executed by the first processing unit is continuously executed by the second and third processors, and the process being executed by the second processing unit is executed. A continuous execution step of continuously executing by the fifth and sixth processors, (b) a replacement step of replacing the first and fourth processors with a new processor during the continuous execution step, (c) After exchanging step, and further comprising a first and fourth processor synchronization process to be operated in synchronization with other processors.

【0044】上記同期手段は、(a)第1のバスを第
2、第3のバスの動作から1サイクル以上所定サイクル
遅らせて動作させるバス追随工程と、(b)第1と第4
のプロセッサ他のプロセッサの動作から所定サイクル遅
らせて動作させるプロセッサ追随工程と、(c)上記第
2、第3、第5、第6のプロセッサの動作を所定サイク
ル停止させて第1と第4のプロセッサの動作と同期させ
るプロセッサ同期工程と、(d)第1のバスの動作を第
2、第3のバスの動作と同期させるバス同期工程を備え
たことを特徴とする。
The synchronization means includes (a) a bus following step of operating the first bus by delaying the operation of the second and third buses by one cycle or more by a predetermined cycle, and (b) first and fourth operations.
The processor following step of operating the other processor by delaying the operation of the other processor by a predetermined cycle, and (c) stopping the operation of the second, third, fifth, and sixth processors by a predetermined cycle to perform the first and fourth operations. It is characterized by including a processor synchronization step of synchronizing with the operation of the processor and (d) a bus synchronization step of synchronizing the operation of the first bus with the operation of the second and third buses.

【0045】[0045]

【作用】この発明に係わる計算機システムは、システム
の高性能化のためにプロセッサとシステムバスを一体化
して3重化したものである。この一体化したプロセッサ
とシステムバスを同一クロックで同期動作させることに
より、システムの高性能化が計れる。一方、主記憶装置
等のサブシステムは、プロセッサやシステムバスほど高
速化は要求されないため、かつ多重化する場合に費用が
かかるため3重化されない。プロセッサ及びシステムバ
スが3重化されているのに対してサブシステムが3重化
されていないためサブシステムに対して選択手段を設け
3重化されたバスとの間でのデータ転送を制御する。こ
の発明は従来の様にプロセッサの多重化を行なうだけで
なくシステムプロセッサとシステムバスを一体化して多
重化している点に特徴がある。バスまで多重化すること
によりシステム全体の信頼性を向上させることができ
る。一方サブシステムは、プロセッサやシステムバスに
比べて高性能に動作する必要はなくさほど高速処理が要
求されない。また、主記憶装置等のサブシステムを3重
化することはシステムのコストを増加させてしまうとい
う欠点がある。従って、この発明においては、プロセッ
サとシステムバスを一体化して3重化し、サブシステム
はこれら3重化された出力を選択手段により選択するよ
うにしたものである。また、プロセッサとシステムを3
重化することにより単に2重化した場合に比べて3つの
出力を比較するという簡単な方法によりエラーを検出す
ることが可能になる。プロセッサやバスを単に2重化し
た場合には単に2つの出力を比較しただけではどちらが
障害を起こしているか判断することができずパリティチ
ェックやECC等の冗長コードを用いた特殊なエラー検
出機能を持たせなければならない。これに対し3重化し
た場合には多数決を取るという簡単な回路により障害を
起こしたものを特定することができる。
The computer system according to the present invention is a triple system in which the processor and the system bus are integrated to improve the system performance. By operating the integrated processor and system bus synchronously with the same clock, the system performance can be improved. On the other hand, subsystems such as the main storage device are not tripled because they are not required to be as fast as the processors and system buses, and are expensive when multiplexed. Since the processor and the system bus are tripled, but the subsystem is not tripled, selection means is provided for the subsystem to control data transfer to and from the tripled bus. . The present invention is characterized in that the system processor and the system bus are integrated and multiplexed in addition to the conventional multiplexing of processors. The reliability of the entire system can be improved by multiplexing the bus. On the other hand, the subsystem does not need to operate with higher performance than the processor and the system bus, and does not require high speed processing. In addition, there is a drawback in that the cost of the system increases if the subsystems such as the main storage device are tripled. Therefore, in the present invention, the processor and the system bus are integrated and tripled, and the subsystem selects these tripled outputs by the selection means. In addition, the processor and system 3
By duplicating, it becomes possible to detect an error by a simple method of comparing three outputs as compared with the case of simply duplicating. When the processor or bus is simply duplicated, it is not possible to determine which one is causing a failure by simply comparing the two outputs, and a special error detection function that uses a parity check or redundant code such as ECC is provided. Must have. On the other hand, in the case of triplicate, it is possible to specify the faulty one by a simple circuit of taking a majority vote.

【0046】第2の発明においては、一つのバスに複数
のプロセッサを備え、バスの使用効率を向上する。
In the second invention, a plurality of processors are provided on one bus to improve the bus usage efficiency.

【0047】第3の発明においては、選択手段は複数の
バスから一つのバスを選択してデバイスにデータを転送
し、逆にデバイスからのデータを複数のバスに転送する
ようにしているのでバスが3重化されていてもデータ転
送が矛盾なく行なえる。
In the third invention, the selecting means selects one bus from a plurality of buses and transfers the data to the device, and conversely transfers the data from the device to the plurality of buses. Even if data is tripled, data can be transferred without contradiction.

【0048】第4の発明においては、障害検出手段が単
にバスのデータを比較することにより障害を検出するこ
とができ簡単な構成により障害を検出できる。このよう
にバスが3本以上ある場合にはパリティやECC等の冗
長機能を不要にできる。
In the fourth aspect of the invention, the fault detecting means can detect the fault by simply comparing the data on the buses, and the fault can be detected by a simple structure. When there are three or more buses in this way, redundancy functions such as parity and ECC can be eliminated.

【0049】第5の発明においては、障害が発見された
場合にはそのバスを切り離すため障害のあったバスが他
のバスに影響を及ぼすことはなくなる。
In the fifth aspect of the invention, when a fault is found, the bus is disconnected, and the faulty bus does not affect other buses.

【0050】第6の発明においては、サブシステムが主
記憶装置であることを特徴としている。主記憶装置は価
格的にも高価格であるため、プロセッサやバスと同じ数
だけ多重化することはできない為、複数のプロセッサ及
び複数のバスにより共有化される。
The sixth invention is characterized in that the subsystem is a main memory. Since the main storage device is expensive in price, it cannot be multiplexed in the same number as the processors and buses, and thus is shared by a plurality of processors and a plurality of buses.

【0051】第7の発明においては、主記憶装置を複数
備えそれぞれの主記憶装置を複数のバスに接続したこと
を特徴としている。このように主記憶装置を複数にする
ことにより主記憶装置の信頼性を向上させる。
The seventh invention is characterized in that a plurality of main storage devices are provided and each main storage device is connected to a plurality of buses. By thus providing a plurality of main storage devices, the reliability of the main storage devices is improved.

【0052】第8の発明においては、複数のバスに周辺
機器システムを接続したことを特徴とするものである。
周辺機器システムには、デバイスとして入出力装置が存
在し、制御部として入出力制御装置が存在する。この様
に周辺機器システムをサブシステムとして接続する場合
でも前述した複数のバスとの間でデータの転送を行なう
ことができる。この周辺機器システムにおいても周辺機
器システム内に選択手段があることにより3重化された
プロセッサ及びバスを選択的に入出力装置に接続する。
The eighth invention is characterized in that the peripheral equipment system is connected to a plurality of buses.
The peripheral device system has an input / output device as a device and an input / output control device as a control unit. As described above, even when the peripheral device system is connected as a subsystem, data can be transferred to and from the plurality of buses described above. Also in this peripheral device system, the triple processor and bus are selectively connected to the input / output device by the selection means in the peripheral device system.

【0053】第9の発明においては、上記周辺機器シス
テム内には第2のバス(ローカルバス)が存在してお
り、この第2のバスは前述した複数のバスにそれぞれ対
応して設けられている。第2のバスをそれぞれ接続する
場合にはバスブリッジを介して接続する。この様に周辺
機器システム内にあるローカルバスを多重化することに
より信頼性を高めることができる。
In the ninth invention, a second bus (local bus) exists in the peripheral device system, and the second bus is provided corresponding to each of the plurality of buses described above. There is. When connecting the second buses, they are connected via a bus bridge. In this way, the reliability can be improved by multiplexing the local buses in the peripheral device system.

【0054】第10の発明においては、周辺機器システ
ム内のバスを単一のバスとした場合である。周辺機器シ
ステムの経済性を考えた場合の構成である。
In the tenth aspect of the invention, the bus in the peripheral device system is a single bus. This is a configuration in consideration of the economical efficiency of the peripheral device system.

【0055】第11の発明においては、周辺機器システ
ム内のバスを2重化する場合の構成であり、周辺機器シ
ステム内部のバスを2重化する場合には選択手段を二つ
設け2重化されたバスに対して接続する。このようにし
て3重化されたバスを2重化されたバスのそれぞれに接
続できるようになる。
In the eleventh aspect of the invention, the bus in the peripheral device system is duplicated, and when the bus in the peripheral device system is duplicated, two selecting means are provided to duplicate the bus. Connected to the bus. In this way, the tripled bus can be connected to each of the doubled buses.

【0056】第12の発明においては、主記憶装置が多
重化された場合に、その一つをプライマリ主記憶装置と
して通常バスに対してデータを送出するようにしたもの
である。プライマリ主記憶装置以外はセカンダリ主記憶
装置としてバスに対してデータを送出しない。この様に
して主記憶装置からバスに対してのデータの転送を矛盾
なく行なう。
In the twelfth aspect of the invention, when the main memory devices are multiplexed, one of them is used as the primary main memory device and data is sent to the normal bus. Data other than the primary main memory is not sent to the bus as the secondary main memory. In this way, data transfer from the main memory device to the bus is performed without contradiction.

【0057】第13の発明においては、プライマリ主記
憶装置にデータの正当性をチェックするチェック手段を
設けているためチェック手段により障害発生が検出され
た場合にはいずれかのセカンダリ主記憶装置をプライマ
リ主記憶装置に変更する。
In the thirteenth aspect of the present invention, since the primary main storage device is provided with a checking means for checking the validity of data, when any failure is detected by the checking means, one of the secondary main storage devices is set as the primary storage device. Change to main memory.

【0058】第14の発明においては、各バスに対応し
てデータの正当性をチェックする冗長コードを生成する
複数の冗長コード生成手段を設けており、生成されたコ
ードの中から誤りのないコードを選択して記憶する。従
って生成された冗長コードの信頼性が高まる。
In the fourteenth invention, a plurality of redundant code generating means for generating a redundant code for checking the correctness of data is provided corresponding to each bus, and the generated code is an error-free code. Select and memorize. Therefore, the reliability of the generated redundant code is increased.

【0059】第15の発明においては、各バスに対応し
て冗長コードをチェックする冗長コードチェック手段を
備えているので各バスに出力されるデータの正当性を個
別チェックすることができる。また、主記憶装置内のメ
モリからバスの間で起きる障害をチェックすることがで
きる。
In the fifteenth aspect of the invention, since the redundant code check means for checking the redundant code corresponding to each bus is provided, the validity of the data output to each bus can be individually checked. In addition, it is possible to check for a failure occurring between the memory in the main memory and the bus.

【0060】第16の発明においては前述した複数のバ
スをそれぞれ非同期に動作させる個別動作モードを備え
ている。従って、バスを同期させて動作させる場合には
システムの信頼性が向上すると共に、非同期に個別動作
させる場合には、各プロセッサ及び各バスはそれぞれ別
個の処理をすることができ性能を向上させることができ
る。
In the sixteenth aspect of the invention, there is provided an individual operation mode for operating the above-mentioned plurality of buses asynchronously. Therefore, when operating the buses synchronously, the reliability of the system is improved, and when operating asynchronously individually, each processor and each bus can perform separate processing to improve performance. You can

【0061】第17の発明においては、個別動作モード
において、選択手段が同期動作モードとは異なる動作を
することを特徴としている。個別モード動作においては
各バスが個別に動作するためサブシステムに対するアク
セスが競合する。従って、選択手段はこの競合を制御し
て矛盾なく扱う。一方、デバイスからのデータをバスに
出力する場合には同期動作をしている場合と異なり個別
のバスに出力する。
The seventeenth invention is characterized in that, in the individual operation mode, the selecting means operates differently from the synchronous operation mode. In individual mode operation, each bus operates individually, so that access to subsystems competes with each other. Therefore, the selection means controls this conflict and handles it consistently. On the other hand, when the data from the device is output to the bus, it is output to the individual bus unlike the case where the synchronous operation is performed.

【0062】第18の発明においては、同期動作モード
と個別動作モードにおいて異なる処理を行なうアービト
レーション手段を備えている。同期動作モードにおいて
は複数のバスは同一動作を行なう為、複数のバスからの
バス獲得要求は一つのバス獲得要求として処理し、個別
動作モードの場合は、複数のバスが個別に動作している
為それぞれのバス獲得要求を独立のバス獲得要求として
処理する。
In the eighteenth invention, there is provided arbitration means for performing different processing in the synchronous operation mode and the individual operation mode. Since multiple buses perform the same operation in the synchronous operation mode, bus acquisition requests from multiple buses are processed as one bus acquisition request, and in the individual operation mode, multiple buses operate individually. Therefore, each bus acquisition request is processed as an independent bus acquisition request.

【0063】第19の発明においては、主記憶装置が複
数存在する場合であって、かつ、個別動作を行う場合に
は、主記憶装置の各メモリが異なるアドレス空間に割り
当てられることを特徴としている。個別モード動作の場
合は、プロセッサ及びバスが個別に動作するため主記憶
装置も複数存在する場合はそれぞれ個別にアクセスでき
るようにして広範囲なメモリ空間を提供する。
The nineteenth aspect of the invention is characterized in that, when there are a plurality of main memory devices and individual operations are performed, each memory of the main memory device is assigned to a different address space. . In the case of the individual mode operation, since the processor and the bus operate individually, when there are a plurality of main memory devices, they can be individually accessed to provide a wide range of memory space.

【0064】第20の発明においては、前述した同期動
作モードと個別動作モードを指定するモード指定手段が
存在し、このモード指定手段により指定されたモードに
システムを設定するモード設定手段を備えている。従っ
て、電源投入時やシステムリセット時に所望のモードに
システムを切り替えることができる。
In the twentieth aspect of the invention, there is a mode designating means for designating the synchronous operation mode and the individual operation mode described above, and the mode designating means is provided for setting the system to the mode designated by the mode designating means. . Therefore, the system can be switched to a desired mode when the power is turned on or the system is reset.

【0065】第21の発明においては、二つのプロセッ
サを封入したプロセッサチップに対して、リセット手段
と停止手段とバス使用要求出力手段とバス使用許可入力
手段がそれぞれ第1と第2のプロセッサに対して個別に
働くように設計されている。その他の信号線(データ線
やアドレス線)は第1と第2のプロセッサで共用して用
いられる。この様なプロセッサチップにおいては、第1
と第2のプロセッサを同期させて同一動作をさせること
も可能であるし、また第1と第2のプロセッサを個別に
動作させることも可能になる。
In the twenty-first aspect of the invention, for the processor chip enclosing two processors, reset means, stop means, bus use request output means and bus use permission input means are provided for the first and second processors, respectively. Are designed to work individually. Other signal lines (data line and address line) are shared by the first and second processors. In such a processor chip, the first
The second processor and the second processor can be synchronized to perform the same operation, or the first and second processors can be operated separately.

【0066】第22の発明においては、前述したプロセ
ッサチップを3以上備えたことを特徴としており、各チ
ップの第1と第2のプロセッサは同一バスに接続されて
いる。従って、第1の発明で説明した計算機システムに
おいて同期動作モードと個別動作モードの両方を可能に
するシステムを提供することができる。
The twenty-second aspect of the invention is characterized by including three or more processor chips described above, and the first and second processors of each chip are connected to the same bus. Therefore, it is possible to provide a system that enables both the synchronous operation mode and the individual operation mode in the computer system described in the first invention.

【0067】第23の発明においては、バスを4重化し
た場合でありシステムの信頼性を更に向上させることが
できる。
In the twenty-third aspect of the invention, the bus is quadrupled, and the system reliability can be further improved.

【0068】第24の発明においては、3重化されたシ
ステムにおいて障害が発生した場合の信頼性の低下を回
避する障害復旧方法を提供するものである。第1のプロ
セッサに障害が発生した場合には第2、第3のプロセッ
サにより継続して処理を続行すると共に、第1のプロセ
ッングユニットの処理を適当な時点で終了させ、その後
は、第2のプロセッシングユニットにより処理を行なう
ようにしたことにより、システムが3重化されて動作す
る機会をなるべく多くし、システムの信頼性を維持する
ことができる。
The twenty-fourth aspect of the present invention provides a failure recovery method for avoiding a decrease in reliability when a failure occurs in a triple system. When a failure occurs in the first processor, the second and third processors continue processing, and the processing of the first processing unit is ended at an appropriate time, and then the second processor Since the processing unit is used to perform the processing, it is possible to increase the chances that the system is triplicated and operate, and to maintain the reliability of the system.

【0069】第25の発明においては、障害が発生した
バスを他の正常なバスに追随させる様にして処理を続行
し、第2のプロセッシングユニットにより次の処理を回
避する場合には追随動作を終了させ三つのバスを同期さ
せる様にしたものである。
In the twenty-fifth aspect of the invention, the processing is continued so that the bus in which the failure has occurred follows another normal bus, and the following operation is performed when the next processing is avoided by the second processing unit. It is designed to terminate and synchronize the three buses.

【0070】第26の発明においては、前述した追随動
作の方法をさらに具体化したものであり、第1のバスを
所定サイクル停止させた後に、他のバスに追随させると
共に、第4のプロセッサを所定サイクル停止させて、他
のプロセッサに追随させる様にしたものである。また、
同期を戻す場合には、正常なプロセッサを所定サイクル
停止させて同期させると共に、追随動作しているバスを
他の正常なバスと同期させる様にしたものである。
In a twenty-sixth aspect of the present invention, the above-described method of the follow-up operation is further embodied. After stopping the first bus for a predetermined cycle, the bus is followed by another bus and the fourth processor is provided. A predetermined cycle is stopped so that another processor is made to follow it. Also,
When the synchronization is to be restored, the normal processor is stopped for a predetermined cycle for synchronization, and the bus that is operating following is synchronized with another normal bus.

【0071】第27の発明においては、障害の回復処理
時の性能の低下を回避する。性能を維持する場合は、動
作可能なプロセッサの数を維持して処理をさせることが
望ましい。従って、第1のプロセッサが故障した場合で
も、第2と第3のプロセッサを動作させ続けることによ
り性能を維持する。そして同一バスに接続されている第
4のプロセッサと故障した第1のプロセッサを交換す
る。この第1と第4のプロセッサの交換は、新しく挿入
された第1と第4のプロセッサを他のプロセッサと同期
させて動作させることにより、故障の前後においてプロ
セッサの動作する数が等しくなる。
In the twenty-seventh aspect of the present invention, deterioration of the performance at the time of failure recovery processing is avoided. In order to maintain the performance, it is desirable to maintain the number of operable processors for processing. Therefore, even if the first processor fails, performance is maintained by keeping the second and third processors operating. Then, the failed first processor is replaced with the fourth processor connected to the same bus. In the replacement of the first and fourth processors, the newly inserted first and fourth processors are operated in synchronization with the other processors, so that the number of operating processors before and after the failure becomes equal.

【0072】第28の発明においては、プロセッサを交
換した後の同期動作の手順を示している。具体的には第
一のバスを他のバスに追随させるとともに、第1と第4
のプロセッサを他のプロセッサに追随させる。その後正
常なプロセッサを所定サイクル停止させて第1と第4の
プロセッサと同期させ最後に3つのバスの同期をとるこ
とによりプロセッサ交換後の同期をとることができる。
The twenty-eighth invention shows a procedure of a synchronous operation after replacing the processor. Specifically, the first bus follows other buses, and the first and fourth buses
To let other processors follow other processors. After that, the normal processor is stopped for a predetermined cycle, synchronized with the first and fourth processors, and finally the three buses are synchronized, whereby the synchronization after the processor replacement can be achieved.

【0073】[0073]

【実施例】【Example】

実施例1.図1は、この発明の計算機システムの概略図
である。この図においては、システムバスを3重化し、
各システムバス上のおのおのにプロセッサを接続する。
従って1つの論理CPUが3つのプロセッサで構成さ
れ、通常は同一の命令を実行する。3重化されたシステ
ムバスも同一のトランザクションを同期して実行し、メ
モリアクセスをする場合、そのアクセスのうち動作が正
しいと判断されるものを選択回路で選択し、結果をイン
タフェースユニットで出力し、他のシステムバスもそれ
と同じレスポンスをメモリ装置から受ける。従って、正
常状態では3重化システムバスの動きは同期しつづけ
る。プロセッサの1つに何等かの障害が発生した場合、
そのシステムバスの動きが他2者とは異なるので障害が
選択回路で検知され、選択の対象からはずされる。よっ
て、プロセッサの故障がメモリの内容に影響を及ぼさ
ず、システムは正常な動作を続行できる。このような構
成によれば、複数の論理CPU間に付加回路がない(プ
ロセッサとシステムバスが直結している)ので、キャッ
シュのコヒーレンシが高速にとれる。また、選択回路の
数は論理CPUの数に比例して多くならないので、大規
模なマルチプロセッサ・システムになってもハードウェ
ア量は比較的少なくでき、高性能な高信頼計算機が容易
に構築できる。
Example 1. FIG. 1 is a schematic diagram of a computer system of the present invention. In this figure, the system bus is tripled,
Connect a processor to each on each system bus.
Therefore, one logical CPU is composed of three processors and normally executes the same instruction. When the same transaction is synchronously executed on the tripled system bus and the memory is accessed, the selection circuit selects one of the accesses that is judged to be correct in operation and outputs the result to the interface unit. , Other system buses also receive the same response from the memory device. Therefore, in a normal state, the movement of the triple system bus continues to be synchronized. If something goes wrong with one of the processors,
Since the movement of the system bus is different from that of the other two, the fault is detected by the selection circuit and removed from the selection target. Therefore, the failure of the processor does not affect the contents of the memory, and the system can continue normal operation. According to such a configuration, since there is no additional circuit between the plurality of logical CPUs (the processor and the system bus are directly connected), cache coherency can be taken at high speed. Further, since the number of selection circuits does not increase in proportion to the number of logical CPUs, the amount of hardware can be relatively small even in a large-scale multiprocessor system, and a high-performance and highly reliable computer can be easily constructed. .

【0074】図2は、更にこの発明の他の例を示す図で
ある。図2において、図1と異なる点は論理CPUが2
重化されている点である。論理CPU1と論理CPU2
は個別に動作し、それぞれの論理CPU内のプロセッサ
はすべて同期した同一動作を行なう。この様に論理CP
Uを2重化することにより、バスの使用効率とシステム
の性能が向上する。
FIG. 2 is a diagram showing another example of the present invention. 2 is different from FIG. 1 in that the logical CPU is 2
It is a point that has been duplicated. Logical CPU1 and logical CPU2
Operate independently, and all processors in each logical CPU perform the same operation in synchronization. Logical CP like this
Duplexing U improves bus usage efficiency and system performance.

【0075】図3は、更にこの発明の他の構成を示す図
である。図3において図2と異なる点は主記憶装置を2
重化した点である。メモリAとメモリBは、同一のアド
レス空間に配置されており、同一のデータを記憶する。
図3に示すように、この構成はメモリモジュール、選択
回路、インタフェースユニットを2重化する。メモリへ
のデータライト時には、両メモリ(メモリA、B)へラ
イトし、リード時にはどちらかの内容を3重化システム
バスに出力する。また、このシステムは、メモリおよび
選択回路、インタフェースユニットに対する障害検知能
力を持ち、これらの部位で障害が検知されたら、システ
ムから切り離し、もう片系のメモリ、選択回路、インタ
フェースユニットでシステムの動作を継続する。このよ
うな構成にすると、プロセッサのみならず、メモリ、選
択回路、インタフェース回路の1点故障に対してはシス
テムの正常続行ができ、信頼性のより高い計算機システ
ムが構築できる。
FIG. 3 is a diagram showing another structure of the present invention. 2 is different from FIG. 2 in that the main storage device is
This is a duplicated point. The memory A and the memory B are arranged in the same address space and store the same data.
As shown in FIG. 3, this configuration duplicates the memory module, the selection circuit, and the interface unit. At the time of writing data to the memory, both memories (memories A and B) are written, and at the time of reading, either of the contents is output to the triple system bus. In addition, this system has the ability to detect failures in the memory, selection circuit, and interface unit. If a failure is detected in these parts, disconnect it from the system, and use the other system's memory, selection circuit, or interface unit to operate the system. continue. With such a configuration, the system can continue normally with respect to a one-point failure of the memory, the selection circuit, and the interface circuit as well as the processor, and a computer system with higher reliability can be constructed.

【0076】図4は、この発明の他の構成を示す図であ
る。図1から図3においては、信頼性を向上させるため
3つのシステムバスを同一動作をさせる場合について説
明したが、図4の場合は高性能なシステムを得るために
それぞれのプロセッサを個別に動作させるものである。
この構成においては、S/Wからのコマンドで3重化プ
ロセッサを個別に動作するように切り換えることができ
る。即ち、選択回路が、システムバス間のメモリアクセ
スの競合制御を行ない、逐次アクセスするモードを持
つ。従って、図2のような構成のシステムが2論理CP
Uから6論理CPUに拡張され、システムの演算性能が
向上する。このような構成によれば、1つのハードウェ
ア構成で、信頼性を要求されるシステムとCPUの演算
性能を要求されるシステムの両者に対応でき、効率的な
ハードウェアの使用ができる。また図4は、メモリAと
メモリBが個別のアドレス空間を持つ場合を示してい
る。前述したようにこのシステムS/Wからのコマンド
で、3重化プロセッサを個別に動作するように切り換え
ることができるとともに、2重化されたメモリを別の空
間としてアクセスできるように切り換えることができる
モードを持つ。こうすることによって、CPUの演算能
力が増大し、S/Wから使用できるメモリ空間も増大
し、システム性能が向上する。このようにこの構成によ
れば、1つのハードウェア構成で、信頼性を要求される
システムとシステム性能を要求されるシステムの両者に
対応でき、効果的にハードウェアリソースの利用でき
る。
FIG. 4 is a diagram showing another structure of the present invention. 1 to 3, the case where the three system buses are operated in the same manner to improve reliability has been described, but in the case of FIG. 4, each processor is operated individually to obtain a high-performance system. It is a thing.
In this configuration, the triple processor can be switched to operate individually by a command from the S / W. That is, the selection circuit has a mode in which contention control of memory access between system buses is performed and sequential access is performed. Therefore, the system having the configuration shown in FIG. 2 has two logical CPs.
Expanded from U to 6 logical CPUs, improving the computing performance of the system. According to such a configuration, one hardware configuration can be applied to both a system that requires reliability and a system that requires the computing performance of the CPU, and the hardware can be used efficiently. Further, FIG. 4 shows a case where the memory A and the memory B have separate address spaces. As described above, the triple processor can be switched to operate individually by the command from the system S / W, and the double memory can be switched to be accessible as another space. Have a mode. By doing so, the computing capacity of the CPU is increased, the memory space that can be used from the S / W is also increased, and the system performance is improved. As described above, according to this configuration, one hardware configuration can support both a system requiring reliability and a system requiring system performance, and can effectively use hardware resources.

【0077】図5は、この発明の他の構成を示す図であ
る。図5においては、前述した構成に第2階層システム
バス及びその第2階層システムバスに接続される入出力
装置を接続した点が特徴である。このシステムにおいて
は、第2階層システムバスも3重化されておりこの3重
化された第2階層システムバスに対して選択回路および
インタフェースユニットが接続されている。選択回路と
インタフェースユニットは前述したメモリに用いられる
選択回路およびインタフェースユニットと同様のもので
ある。このように図5においては、第2階層システムバ
スを有している場合でも、これらの第2階層システムバ
スを含んでサブシステムと考えることができる。即ち、
第1階層のシステムバスと第2階層のシステムバスはバ
スアダプターにより接続されており連続したシステムバ
スと同様のものと考えることができる。このように図5
に示す構成においては、3重化されたシステムバスのお
のおのに対してバスアダプタを介して、第2階層システ
ムバスを接続する。従って、第2階層システムバスも3
重化される。3重化されたシステムバスと制御装置は、
選択回路とインタフェースユニットを介してアクセスさ
れる。3重化された第1階層システムバスとバスアダプ
タおよび第2階層システムバスの組は、障害がないとき
は同期動作をおこない、プロセッサやバスアダプタに障
害が発生した場合、動作の同期がくずれ、障害が選択回
路で検知される。そして、障害発生の系を切り離し、正
しいデータのみを制御装置やメモリに提供し、システム
は停止しない。一般に第2階層システムバスは、第1階
層システムバスと比べ、低速ではあるが、安価に制御装
置が作成可能という経済性、前機種のものがそのまま使
えるという互換性、市販されている制御装置がそのまま
つかえるという汎用性を満たすものを選択できる。この
ような構成にすると、経済性、互換性、汎用性を維持し
つつ、最新のテクノロジを利用した高性能で高信頼な計
算機システムが構築できる。
FIG. 5 is a diagram showing another structure of the present invention. A feature of FIG. 5 is that the second layer system bus and the input / output device connected to the second layer system bus are connected to the above-described configuration. In this system, the second hierarchy system bus is also tripled, and the selection circuit and the interface unit are connected to the tripled second hierarchy system bus. The selection circuit and the interface unit are the same as the selection circuit and the interface unit used in the memory described above. As described above, in FIG. 5, even when the system has the second layer system bus, it can be considered as a subsystem including these second layer system buses. That is,
The system bus of the first layer and the system bus of the second layer are connected by a bus adapter and can be considered to be similar to a continuous system bus. As shown in FIG.
In the configuration shown in (2), the second hierarchy system bus is connected to each of the tripled system buses via a bus adapter. Therefore, the second layer system bus is also 3
Be duplicated. The triplicated system bus and controller are
It is accessed through the selection circuit and the interface unit. The triple layered system of the first layer system bus, the bus adapter and the second layer system bus perform synchronous operation when there is no failure, and when the processor or the bus adapter fails, the operation is out of synchronization. The fault is detected by the selection circuit. Then, the system in which the failure has occurred is disconnected, only correct data is provided to the control device and memory, and the system does not stop. Generally, the second-tier system bus is slower than the first-tier system bus, but it is economical to make a control device at a low cost, compatibility that the previous model can be used as it is, and a commercially available control device You can select the one that satisfies the versatility of being used as it is. With such a configuration, it is possible to construct a high-performance and highly reliable computer system using the latest technology while maintaining economy, compatibility and versatility.

【0078】図6は、この発明の他の構成を示す図であ
る。図6が図5と異なる点は、サブシステム内に含まれ
る第2階層システムバスがシングルバスである点であ
る。このように第2階層システムバスがシングルバスで
ある場合には、第1階層システムバスと第2階層システ
ムバスの間に選択回路を設けることによりデータの転送
を行なうことができる。図6に示す構成においては、3
重化したシステムバスのおのおのに対してバスアダプタ
および選択回路を介して第2階層システムバスを接続す
る。障害がないときは、3重化システムバスは同期動作
を行ない、プロセッサやバスアダプタに障害が発生した
場合、動作の同期がくずれ、障害が選択回路で検知され
る。そして、障害発生系の第1のシステムバスを切り離
す。第2階層システムバス上の制御装置やメモリには選
択回路により正しいデータが供給され、システムは停止
しない。図5および図6に示すように第2階層システム
バスは3重化したりあるいは1重化したりすることがで
きる。特に図6に示す第2階層システムバスは、互換
性、汎用性を満足し、しかも経済的に構成できる。ま
た、図5に示す構成に比べて制御装置毎の選択回路が不
要なので、より経済的である。このような構成にする
と、経済性、互換性、汎用性を維持しつつ、最新のテク
ノロジを利用した高性能で高信頼な計算機システムが構
築できる。
FIG. 6 is a diagram showing another structure of the present invention. 6 is different from FIG. 5 in that the second hierarchical system bus included in the subsystem is a single bus. Thus, when the second hierarchy system bus is a single bus, data can be transferred by providing a selection circuit between the first hierarchy system bus and the second hierarchy system bus. In the configuration shown in FIG. 6, 3
The second layer system bus is connected to each of the duplicated system buses via a bus adapter and a selection circuit. When there is no failure, the triple system bus performs a synchronous operation, and when a failure occurs in the processor or bus adapter, the operation is out of synchronization and the failure is detected by the selection circuit. Then, the first system bus of the fault occurrence system is disconnected. Correct data is supplied to the control device and memory on the second hierarchy system bus by the selection circuit, and the system does not stop. As shown in FIGS. 5 and 6, the second layer system bus can be tripled or singled. In particular, the second layer system bus shown in FIG. 6 satisfies compatibility and versatility, and can be economically constructed. Further, as compared with the configuration shown in FIG. 5, a selection circuit for each control device is unnecessary, which is more economical. With such a configuration, it is possible to construct a high-performance and highly reliable computer system using the latest technology while maintaining economy, compatibility and versatility.

【0079】図7はこの発明の他の構成を示す図であ
る。図7が前述した構成と異なる点は第2階層システム
バスが2重化されている点である。第2階層システムバ
スが2重化されている場合には選択回路を2重化するこ
とにより3重化された第1階層システムバスとのインタ
フェースをとることができる。図7に示す構成において
は3重化されたバスアダプタのうち、いずれか一つの出
力を選択する選択回路とインタフェースユニットを2つ
持ち、第2階層システムバスを2重化することができ
る。第2階層システムバスは、エラーの検知機能があ
り、第2階層システムバス上で障害が発生すると、2つ
の選択回路のうち、障害のない方がバスアダプタにアク
セスする。このようにすると、プロセッサ、バスアダプ
タ、メモリ、選択回路/インタフェースユニット、第1
および第2階層システムバスで1つの障害が発生して
も、システムは停止せず、処理が続行できる。このよう
な構成にすると、経済性、互換性、汎用性を維持しつ
つ、最新のテクノロジを利用した高性能で高信頼な計算
機システムが構築できる。
FIG. 7 is a diagram showing another structure of the present invention. 7 is different from the above-mentioned configuration in that the second hierarchical system bus is duplicated. When the second layer system bus is duplicated, the selection circuit is duplicated to interface with the tripled first layer system bus. In the configuration shown in FIG. 7, of the tripled bus adapters, two selection circuits for selecting any one output and two interface units are provided, and the second hierarchy system bus can be duplicated. The second-tier system bus has an error detection function, and when a fault occurs on the second-tier system bus, one of the two selection circuits having no fault accesses the bus adapter. In this way, the processor, the bus adapter, the memory, the selection circuit / interface unit, the first
And even if one failure occurs in the second layer system bus, the system does not stop and the processing can continue. With such a configuration, it is possible to construct a high-performance and highly reliable computer system using the latest technology while maintaining economy, compatibility and versatility.

【0080】図8は前述したような構成において故障し
たCPUを切り離しする場合の動作を説明する図であ
る。この構成においては、第1、第2、第3のシステム
バスから構成され、論理CPUは、第1、第2、第3の
プロセッサを備え、同一の演算を実行しており、論理C
PU2は、第4、第5、第6のプロセッサを備え、別の
同一の演算を実行しており、第1のプロセッサは第1の
システムバスに、第2のプロセッサは第2のシステムバ
スに、第3のプロセッサは第3のシステムバスに、それ
ぞれ接続され、同様に第4のプロセッサは第1のシステ
ムバスに第5のプロセッサは第2のシステムバスに、第
6のプロセッサは第3のシステムバスにそれぞれ接続さ
れる。上記の論理CPU内のプロセッサのうち、いずれ
か一つ(例えば第1のプロセッサ)が故障した時に、故
障したプロセッサの接続されていない残り2つのバス上
のプロセッサ(第2、第3のプロセッサ)により、現在
実行中のプログラムを切りの良いところ(他の論理CP
Uにプログラムの移行が可能となるところ)まで実行さ
せ正常に停止させた後、故障プロセッサを有するバス
(第1のバス)上の故障していないプロセッサ(第4の
プロセッサ)を他の二つのプロセッサ(第5、第6のプ
ロセッサ)と同じ内部状態に復元し、故障のない論理C
PU(論理CPU2)は、同一の命令を実行し、従っ
て、3本のシステムバスは同一の動作を行なう。故障し
た論理CPUで実行していた処理は、別の論理CPU
(論理CPU2=第4、第5、第6のプロセッサ)に移
行する。以上のようにこの復旧方法によれば実行中のプ
ログラムを破棄することなく、故障した論理CPUを切
り離し、正常な論理CPUおよびシステムバスは3重化
の同期動作を継続でき、信頼性の高い計算機システムが
構築できる。
FIG. 8 is a diagram for explaining the operation when disconnecting a defective CPU in the above-mentioned configuration. In this configuration, the system is composed of first, second, and third system buses, and the logical CPU includes the first, second, and third processors, executes the same operation, and executes the logical C
PU2 comprises fourth, fifth and sixth processors performing different identical operations, the first processor being on the first system bus and the second processor being on the second system bus. , The third processor is connected to the third system bus, respectively. Similarly, the fourth processor is connected to the first system bus, the fifth processor is connected to the second system bus, and the sixth processor is connected to the third system bus. Each is connected to the system bus. When any one of the processors in the logical CPU (for example, the first processor) fails, the processors on the remaining two buses (second and third processors) to which the failed processor is not connected Therefore, it is good to turn off the program currently being executed (other logical CP
U is executed until the program can be migrated) and stopped normally, and then the non-failed processor (fourth processor) on the bus having the failed processor (first bus) is replaced by the other two. Restores to the same internal state as the processor (fifth and sixth processors) and has no faulty logic C
The PU (logical CPU 2) executes the same instruction, and therefore the three system buses perform the same operation. The process that was being executed by the failed logical CPU is
(Logical CPU2 = fourth, fifth, and sixth processors). As described above, according to this restoration method, the failed logical CPU can be separated without discarding the program being executed, and the normal logical CPU and the system bus can continue the triple synchronous operation, and the computer with high reliability can be obtained. The system can be built.

【0081】図9は故障したプロセッサを交換する場合
の一例を示す図である。図9に示すように3つのプロセ
ッサが一つのCPUボードに搭載されている場合にはC
PUボード単位の交換が行なわれる。図9に示す構成に
おいては論理CPU(論理CPU1または2)の、各プ
ロセッサ(第1、第2、第3のプロセッサまたは第4、
第5、第6のプロセッサ)が同一の交換モジュール(C
PUボード)内に配置されており、故障したプロセッサ
(例では第1のプロセッサ)を含むCPUボード(CP
Uボード1)を、全てのプロセッサに障害がない正常な
CPUボードと交換する。交換されるCPUボードは、
3重化システムバスにアクセスを抑止され、システムバ
スの動作は妨害されない。交換後はCPUボードは、3
重化システムバスにアクセス可能となる。このように図
9に示す構成においては、システムの運転状態が故障発
生以前の状態に戻り、演算性能が回復し、次の障害にも
耐久性ができるため、高信頼性、高性能性を長期に渡っ
て維持できる計算機システムが構築できる。特に交換モ
ジュールの引き抜き時にもバスの3重化動作が続行で
き、信頼性が低下しない。
FIG. 9 is a diagram showing an example of replacing a failed processor. As shown in FIG. 9, when three processors are mounted on one CPU board, C
The PU board unit is replaced. In the configuration shown in FIG. 9, each processor (first, second, third processor, or fourth processor) of the logical CPU (logical CPU 1 or 2) is
The fifth and sixth processors have the same exchange module (C
CPU board (CP) that is located in the PU board and that contains the failed processor (first processor in the example)
Replace the U board 1) with a normal CPU board with all processors intact. The CPU board to be replaced is
Access to the triple system bus is suppressed, and the operation of the system bus is not disturbed. 3 CPU boards after replacement
The redundant system bus can be accessed. As described above, in the configuration shown in FIG. 9, the operating state of the system returns to the state before the occurrence of the failure, the computing performance is restored, and the durability against the next failure can be achieved. A computer system that can be maintained over a long period can be constructed. Especially, even when the replacement module is pulled out, the triplicate operation of the bus can be continued and the reliability is not deteriorated.

【0082】図10は故障したプロセッサを交換する他
の例を示す図である。図10においては、2つのプロセ
ッサが一つのCPUボードに搭載されている。そして一
つのCPUボードに搭載された二つのプロセッサは同一
のシステムバスに接続されている。このような構成で、
プロセッサが故障した場合には二つのプロセッサを搭載
したCPUボード単位の交換になる。図10に示す構成
においては、同一システムバス(第1または第2または
第3のシステムバス)に接続されている各プロセッサ
(第1と第4、または、第2と第5、または、第3と第
6)が同一交換モジュール(CPUボード)内に配置さ
れており、故障したプロセッサ(例では第1のプロセッ
サ)を含むCPUボード(CPUボード1)を、全ての
プロセッサに障害がない正常なCPUボードと交換す
る。交換されるCPUが接続されるシステムバスは、シ
ステムの他の部位(例えばメモリ)と切り放され、交換
によりシステムは影響を受けない。
FIG. 10 is a diagram showing another example of replacing a failed processor. In FIG. 10, two processors are mounted on one CPU board. The two processors mounted on one CPU board are connected to the same system bus. With such a configuration,
When a processor fails, the CPU board unit with two processors is replaced. In the configuration shown in FIG. 10, each processor (first and fourth, or second and fifth, or third) connected to the same system bus (first or second or third system bus) And 6) are arranged in the same exchange module (CPU board), and the CPU board (CPU board 1) including the failed processor (the first processor in the example) is replaced by a normal one in which all the processors have no failure. Replace with CPU board. The system bus to which the CPU to be replaced is connected is disconnected from other parts of the system (for example, memory), and the system is not affected by the replacement.

【0083】図11は、図10に示した二つのプロセッ
サを搭載したCPUボードを集積化して一つのチップに
封入する場合の構成を示す図である。システムの運転状
態が故障発生以前の状態以前の状態に戻り、演算性能が
回復し、次の障害にも耐久性ができるため、高信頼性、
高性能を長期に渡って維持できる計算機システムが構築
できる。特に交換モジュールのコネクタ部分のピン数が
少なくハードウェア量が減り、小型化、低価格化に有利
である。また、論理CPU数も減少しないので性能低下
がない。図11に示すようにこのシステムにおいては、
同一バスに接続する複数のプロセッサを同一のチップに
パックする。このチップを各システムバス上に接続し3
重化し、高信頼計算機システムを構築する。このような
構成によれば、複数のマイクロプロセッサがパッケージ
ングされたチップを使用し、小型で安価で高性能な高信
頼計算機システムが構築できる。
FIG. 11 is a diagram showing a configuration in the case where the CPU boards having the two processors shown in FIG. 10 are integrated and enclosed in one chip. High reliability, because the operating state of the system returns to the state before the failure occurred, the computing performance is restored, and the durability against the next failure can be achieved.
A computer system that can maintain high performance over a long period of time can be constructed. In particular, the number of pins of the connector portion of the replacement module is small, the amount of hardware is reduced, and it is advantageous for downsizing and cost reduction. Further, since the number of logical CPUs does not decrease, there is no deterioration in performance. As shown in FIG. 11, in this system,
Multiple processors connected to the same bus are packed in the same chip. Connect this chip to each system bus 3
Build a highly reliable computer system. With such a configuration, a compact, inexpensive, high-performance and highly reliable computer system can be constructed by using a chip in which a plurality of microprocessors are packaged.

【0084】実施例2.前述した実施例においては概略
を説明したが、ここでは前述した構成の具体的実施例に
ついて説明する。図12において、1、2、3は3重化
されたシステムバスである。10はプロセッシングユニ
ット、11、12、13はプロセッシングユニット10
を構成する3重化されたプロセッサで、バスインタフェ
ースユニット14、15、16を経由してそれぞれシス
テムバス1、2、3に接続されている。20も同様にプ
ロセッシングユニットで、21、22、22はプロセッ
サ、24、25、26はバスインタフェースユニットで
ある。50は主記憶装置、51はメモリアレイブロッ
ク、52はメモリインタフェースユニット、53は3つ
のシステムバスの出力を一つ選択したりメモリの出力を
複数のシステムバスに送出する選択回路である。60も
同様に主記憶装置で、61はメモリアレイ、62はメモ
リインタフェースユニット、63は選択回路である。9
0はシステムバスの使用者を決定するアービトレーショ
ン回路、101、102、103はシステムバスと第2
層のシステムバスを接続するバスブリッジ、110は3
重化されたバスブリッジの出力の内何れか一つを選択す
る第2階層システムバスインタフェースユニット、10
4は第2階層システムバスである。111、112、1
13は第2階層システムバス104に接続される入出力
制御装置、121、122、123はそれぞれ、入出力
制御装置111、112、113に接続される入出力装
置(フロッピーディスク、磁気テープ、プリンタ)であ
る。また、201、202、203はシステムバスと別
の第2層システムバスを接続するバスブリッジ、20
4、205、206はそれぞれ、バスブリッジ201、
202、203に接続された3重化された第2層のシス
テムバスである。211、212、213第2階層シス
テムバス204、205、206の出力を選択する入出
力インタフェースユニット、221、222、223は
入出力インタフェースユニット211、212、213
に接続される入出力装置制御装置、231、232、2
33は入出力装置制御装置221、222、223に接
続される入出力装置(ディスク、LAN)である。
Example 2. Although the outline has been described in the above-described embodiment, a specific embodiment of the above-described configuration will be described here. In FIG. 12, reference numerals 1, 2, and 3 are tripled system buses. 10 is a processing unit, and 11, 12 and 13 are processing units 10.
Is a triple processor that is connected to the system buses 1, 2, and 3 via bus interface units 14, 15, and 16, respectively. Similarly, 20 is a processing unit, 21, 22, 22 are processors, and 24, 25, 26 are bus interface units. Reference numeral 50 is a main memory device, 51 is a memory array block, 52 is a memory interface unit, and 53 is a selection circuit for selecting one output from the three system buses or sending the memory output to a plurality of system buses. Similarly, 60 is a main memory, 61 is a memory array, 62 is a memory interface unit, and 63 is a selection circuit. 9
0 is an arbitration circuit that determines the user of the system bus, 101, 102 and 103 are the system bus and the second
Bus bridge connecting the system buses of layers, 110 is 3
Second layer system bus interface unit for selecting any one of the outputs of the duplicated bus bridge, 10
Reference numeral 4 is a second layer system bus. 111, 112, 1
Reference numeral 13 is an input / output control device connected to the second layer system bus 104, and 121, 122 and 123 are input / output devices connected to the input / output control devices 111, 112 and 113 (floppy disk, magnetic tape, printer). Is. Also, 201, 202, and 203 are bus bridges that connect a system bus and another layer-2 system bus, and 20.
4, 205 and 206 are the bus bridges 201 and
A system bus of the second layer, which is tripled and connected to 202 and 203. 211, 212, 213 I / O interface units 221, 222, 223 for selecting outputs of the second-level system buses 204, 205, 206 are I / O interface units 211, 212, 213.
I / O device control devices 231, 232, 2 connected to
Reference numeral 33 is an input / output device (disk, LAN) connected to the input / output device control devices 221, 222, and 223.

【0085】(1.正常実行動作)次に正常実行動作に
ついて説明する。プロセッシングユニット10は、プロ
セッサ11、12、13から構成されるが、プロセッサ
11、12、13は同一クロックで動作し、常に同一の
命令を実行している。同様に、プロセッシングユニット
20も、プロセッサ21、22、23から構成される
が、プロセッサ21、22、23は同一クロックで動作
し、常に同一の命令を実行している。また、各プロセッ
シングユニットがシステムバスを使用するときは、各プ
ロセッサ毎に同時にシステムバス要求をアービトレーシ
ョン回路90に送出し、同時にシステムバス使用許可信
号が返され、同一プロセッシングユニットの各プロセッ
サは、同時に同一のバストランザクションを発行する。
また、後述するとおり、バスブリッジ101、102、
103またはバスブリッジ201、202、203のシ
ステムバス上へのバストランザクションも同期してい
る。従って、プロセッシングユニットからシステムバス
1、2、3へのバストランザクションは正常動作時は同
期している。選択回路53、63およびメモリインタフ
ェースユニット52、62はシステムバスからのトラン
ザクションに対して、お互い同期して動作し、メモリラ
イトに対しては、50、60両方の主記憶装置にライト
し、メモリリードに対しては、一方がプライマリ(ここ
では50とする)となり、もう一方がセカンダリ(ここ
では60とする)となり、プライマリ(50)のみが
1、2、3に対して同時にリードされたデータを送出す
る。
(1. Normal execution operation) Next, the normal execution operation will be described. The processing unit 10 is composed of processors 11, 12 and 13, and the processors 11, 12 and 13 operate at the same clock and always execute the same instruction. Similarly, the processing unit 20 is also composed of processors 21, 22 and 23, but the processors 21, 22 and 23 operate at the same clock and always execute the same instruction. When each processing unit uses the system bus, a system bus request is simultaneously sent to each arbitration circuit 90 for each processor, and a system bus use permission signal is returned at the same time, so that the processors of the same processing unit simultaneously receive the same signal. Issue a bus transaction of.
As will be described later, the bus bridges 101, 102,
Bus transactions on the system bus of 103 or the bus bridges 201, 202, 203 are also synchronized. Therefore, the bus transactions from the processing unit to the system buses 1, 2, and 3 are synchronized during normal operation. The selection circuits 53, 63 and the memory interface units 52, 62 operate in synchronization with each other for transactions from the system bus, and for memory writes, write to both 50 and 60 main memory devices, and memory read. For one, one becomes the primary (here, 50) and the other becomes the secondary (here, 60), and only the primary (50) reads the data read simultaneously for 1, 2, and 3. Send out.

【0086】(1.1 CPU動作)ここで、図13
で、上記動作のうちプロセッサ11の動作を詳細に説明
する。図13において、1はシステムバス、11はプロ
セッサ、14はバスインタフェースユニットである。1
4a、14b、14c、14d、14eはドライバであ
る14fは出力イネーブル信号、14hはリセット信号
である。11rはシステムバス要求信号、11gはシス
テムバス使用許可信号である。
(1.1 CPU operation) Here, FIG.
Now, the operation of the processor 11 among the above operations will be described in detail. In FIG. 13, 1 is a system bus, 11 is a processor, and 14 is a bus interface unit. 1
Reference numerals 4a, 14b, 14c, 14d, and 14e are drivers, 14f is an output enable signal, and 14h is a reset signal. Reference numeral 11r is a system bus request signal, and 11g is a system bus use permission signal.

【0087】通常実行時は、リセット信号14hは有意
でないのでプロセッサは動作できる。出力イネーブル信
号14fは有意で、ドライバ14bはプロセッサ11の
出力をシステムバス1に送出する。ドライバ14cはプ
ロセッサ11のシステムバス要求をシステムバス要求信
号11rとしてアービトレーション回路に送出する。ア
ービトレーション回路はシステムバス使用許可信号11
gを用いて該プロセッサがシステムバス1を使用可能な
ことを伝える。
During normal execution, the reset signal 14h is insignificant and the processor can operate. The output enable signal 14f is significant and the driver 14b sends the output of the processor 11 to the system bus 1. The driver 14c sends the system bus request of the processor 11 as a system bus request signal 11r to the arbitration circuit. The arbitration circuit uses the system bus use permission signal 11
Use g to signal that the processor is able to use system bus 1.

【0088】(1.2 主記憶装置の動作)さらに、図
14で、主記憶装置50の動作を詳細に説明する。図1
4において、メモリアレイブロック51は、メモリデー
タバス51a、ECCデータバス51b、メモリアレイ
51c、ECCアレイ51dから構成される。メモリイ
ンタフェースユニット52は、メモリ制御回路52a、
ECC生成回路52b、ECCチェック回路52c、プ
ライマリビット52d、AND素子52e、他プライマ
リ要求出力線52f、自プライマリ要求入力線52g、
ドライバ52h、52i、52j、AND素子52k、
52l、52m、メモリ2重化指定ビット52o、AN
D素子52pから構成される。メモリ制御回路52a
は、メモリアドレス範囲のどの部分に対してアクセスす
るかを指定するメモリアドレス範囲指定レジスタ52a
aを有している。インタフェースユニット53は、セレ
クタ53a、比較回路53b、セレクタ53c、システ
ムバスの状態を保持するレジスタ53j、53k、53
l、ドライバ素子53m、53m、53oから構成され
る。プライマリビット52dは、その主記憶装置がプラ
イマリでリードデータをドライブすることを示すビット
であり、2重化された主記憶装置50、60の一方のプ
ライマリビット52dがプラマリとしてセットされてお
り、もう一方はセカンダリとなりプライマリビット52
dはセットされない。この例では、主記憶装置50がプ
ライマリなので、プライマリビット52dはセットされ
る。主記憶装置60の同等のビット(図にはないが62
dとする)はセットされていないものとする。尚、主記
憶装置60は主記憶装置50と同じ構成をとり、主記憶
装置60内の構成要素は主記憶装置50内のそれの50
番台の番号を60番台にふり直したものとする(例え
ば、52dを62dとするなど)。ここで、各種レジス
タの初期値は、メモリアドレス範囲指定レジスタ52a
aおよび62aaは同じアドレス範囲が設定してあり、
メモリ2重化指定ビット52o、62oは共に1がセッ
トしてあるものとする。これらの設定の手順については
後述する。また、91はプロセッサを個別に実行するか
3重化同期動作させるかを指定する個別実行指定信号、
92はシステムバス選択信号である。ここでの説明では
個別実行指定信号91は3重化同期動作を指定するよう
に固定されているものとする。さらに、主記憶装置50
と60が相互に連絡するために自プライマリ要求入力線
52gと他プライマリ要求入力線62fは接続されてお
り、自プライマリ要求入力線62gと他プライマリ要求
入力線52fは接続されている。
(1.2 Operation of Main Memory Device) Further, the operation of the main memory device 50 will be described in detail with reference to FIG. Figure 1
4, the memory array block 51 includes a memory data bus 51a, an ECC data bus 51b, a memory array 51c, and an ECC array 51d. The memory interface unit 52 includes a memory control circuit 52a,
ECC generation circuit 52b, ECC check circuit 52c, primary bit 52d, AND element 52e, other primary request output line 52f, own primary request input line 52g,
Drivers 52h, 52i, 52j, AND element 52k,
52l, 52m, memory duplication designation bit 52o, AN
It is composed of a D element 52p. Memory control circuit 52a
Is a memory address range specification register 52a that specifies which part of the memory address range to access.
a. The interface unit 53 includes registers 53j, 53k, 53 for holding the states of the selector 53a, the comparison circuit 53b, the selector 53c, and the system bus.
1 and driver elements 53m, 53m and 53o. The primary bit 52d is a bit that indicates that the main storage device is the primary and drives read data. One of the primary bits 52d of the duplicated main storage devices 50 and 60 is set as a primary memory. One becomes secondary and primary bit 52
d is not set. In this example, since the main memory device 50 is primary, the primary bit 52d is set. Equivalent bit in main memory 60 (not shown in the figure, 62
(d) is not set. The main storage device 60 has the same configuration as the main storage device 50, and the constituent elements in the main storage device 60 are the same as those in the main storage device 50.
It is assumed that the number of the number series is changed to the number range of 60 (for example, 52d is changed to 62d). Here, the initial values of the various registers are the memory address range designation register 52a.
a and 62aa have the same address range set,
It is assumed that the memory duplication designation bits 52o and 62o are both set to 1. The procedure for these settings will be described later. Further, reference numeral 91 is an individual execution designating signal that designates whether the processor is to be individually executed or the triplex synchronous operation is performed,
Reference numeral 92 is a system bus selection signal. In the description here, the individual execution designation signal 91 is fixed so as to designate the triplex synchronization operation. Further, the main storage device 50
And 60 communicate with each other, the own primary request input line 52g and the other primary request input line 62f are connected, and the own primary request input line 62g and the other primary request input line 52f are connected.

【0089】システムバス1、2、3よりシステムバス
の動作が比較回路53bで比較され、セレクタ53cを
経由してセレクタ53aに選択信号が伝えられる。そこ
で正常動作しているバスの出力がセレクタ53aで選択
され、メモリデータバス51aに出力される(ここで、
正常動作しているバスとは、他の2者のバスと動作の異
なるバス以外のバスである。つまり、1本のバスが他の
2本のバスと動作が異なる場合、その一本のバスを正常
動作でないバスとみなし、他の2本のバスを正常動作し
ているバスとする)。メモリ制御回路52aはバストラ
ンザクションを解析し、そのアドレスが52aaで指定
する範囲内であれば、自メモリへのアクセス(リードま
たはライト)とし、以下の動作を行う。
The operation of the system buses is compared by the system buses 1, 2, 3 in the comparison circuit 53b, and the selection signal is transmitted to the selector 53a via the selector 53c. Then, the output of the bus that is operating normally is selected by the selector 53a and output to the memory data bus 51a (here,
A bus that is operating normally is a bus other than a bus that operates differently from the other two buses. That is, when the operation of one bus is different from that of the other two buses, that one bus is regarded as a bus that is not operating normally, and the other two buses are regarded as buses that are operating normally). The memory control circuit 52a analyzes the bus transaction, and if the address is within the range specified by 52aa, the memory control circuit 52a determines to access (read or write) its own memory and performs the following operation.

【0090】メモリライト時は、メモリ制御回路52a
がメモリデータバス51a上のデータをメモリアレイ5
1cにライトするべく制御を行い、データはメモリアレ
イ51cに格納される。同時に、51a上のデータ毎に
ECC生成回路52bがECCコードを生成し、ECC
データバス51bを経由してECCアレイ51dにメモ
リ制御回路52aの制御によりECCコードを格納す
る。
At the time of memory write, the memory control circuit 52a
Stores data on the memory data bus 51a in the memory array 5
Control is performed to write to 1c, and the data is stored in the memory array 51c. At the same time, the ECC generation circuit 52b generates an ECC code for each data on the 51a,
The ECC code is stored in the ECC array 51d via the data bus 51b under the control of the memory control circuit 52a.

【0091】メモリリード時は、メモリ制御回路52a
がメモリアレイ51c、ECCアレイ51d内の所望の
アドレスのデータをリードすべく制御を行い、メモリデ
ータはメモリデータバス51aに、ECCデータはEC
Cデータバス51bに出力される。これらのデータより
ECCチェック回路52cがリードされたデータの正当
性をチェックする。データが正当であれば、プライマリ
ビット52dの内容は変化せずセットされたままであ
る。従って、ドライバ52h、52i、52jは、AN
D素子52eおよびAND素子52k、52l、52m
を経由したメモリ制御回路52aの制御により、メモリ
データバス51a上のメモリデータを、システムバス
1、2、3に出力する。
At the time of memory read, the memory control circuit 52a
Performs control to read data at a desired address in the memory array 51c and the ECC array 51d. Memory data is stored in the memory data bus 51a and ECC data is stored in the EC
It is output to the C data bus 51b. The ECC check circuit 52c checks the validity of the read data from these data. If the data is valid, the content of the primary bit 52d remains unchanged and remains set. Therefore, the drivers 52h, 52i and 52j are
D element 52e and AND elements 52k, 52l, 52m
The memory data on the memory data bus 51a is output to the system buses 1, 2 and 3 under the control of the memory control circuit 52a via the.

【0092】メモリアレイ51cやECCアレイ51d
に障害がある場合は、メモリリード時に、ECCチェッ
ク回路52cによりECCエラーとして検知され、1ビ
ット誤りなど自己訂正可能なものであれば、訂正したも
のをメモリデータバス51aに送出すればよい。一方、
自己訂正不能な障害が発生した場合は、ECCチェック
回路52cからの制御によりプライマリビット52dを
リセットし、自主記憶装置はセカンダリになる。同時
に、メモリ2重化ビット52oがセットされているの
で、AND素子52pを経由して、他プライマリ要求出
力線52fが出力される。これによってペアとなってい
る主記憶装置60に、プライマリになる要求を自プライ
マリ要求入力線62gを介して伝え、主記憶装置60の
プライマリビット62dがセットされ、主記憶装置60
がプライマリになり、リードデータを出力する。ここ
で、主記憶装置50、60のプライマリビットのセッ
ト、リセット条件を図15に示す。
Memory array 51c and ECC array 51d
If there is a fault in the memory, the ECC check circuit 52c detects an ECC error during memory read, and if it is a self-correctable error such as a 1-bit error, the corrected error may be sent to the memory data bus 51a. on the other hand,
When a failure that cannot be self-corrected occurs, the primary bit 52d is reset by the control of the ECC check circuit 52c, and the own memory device becomes the secondary memory. At the same time, since the memory duplication bit 52o is set, the other primary request output line 52f is output via the AND element 52p. As a result, the request to become the primary is transmitted to the paired main storage device 60 via the own primary request input line 62g, the primary bit 62d of the main storage device 60 is set, and the main storage device 60 is set.
Becomes the primary and outputs read data. Here, FIG. 15 shows the setting and resetting conditions of the primary bits of the main storage devices 50 and 60.

【0093】以上のような構成であるので、プロセッシ
ングユニット10、20のような高速動作が要求される
部分には、ボータや選択回路が含まれておらず、高速化
の阻害要因とならない。さらに、システムバスが3重化
されているため、バスのデータの正当性を保証するため
の冗長データ、例えば、パリティビットやECCコード
を付加しなくともバスの信頼性および耐障害性は十分と
いえ、これらの冗長コードを省けば、バスの高速化が計
れる。本実施例におけるプロセッサ〜メモリ間の障害検
知、正常系選択のための構成を図にすると図16に示す
ようになる。一方、従来例のものは、一般に図17とし
て表される。これらの図を比較してもわかるように本実
施例により、障害検知、正常系選択のための手段が簡略
かされ、プロセッサ〜メモリ間のデータ転送が高速に行
えることが分かる。また、選択回路を別の構成にするこ
とで、更に高速化(および高信頼化)が図れるが、別の
実施例として後述する。
With the above-mentioned structure, the parts such as the processing units 10 and 20 that require high-speed operation do not include the voter or the selection circuit, and do not become an obstacle to speeding up. Furthermore, since the system bus is tripled, the reliability and fault tolerance of the bus are sufficient without adding redundant data for ensuring the validity of the data on the bus, for example, parity bits or ECC codes. However, if these redundant codes are omitted, the bus speed can be increased. The configuration for fault detection between the processor and the memory and normal system selection in this embodiment is shown in FIG. On the other hand, the conventional example is generally represented as FIG. As can be seen by comparing these figures, it is understood that this embodiment simplifies the means for fault detection and normal system selection, and enables high-speed data transfer between the processor and memory. Further, although the speed can be further increased (and the reliability can be improved) by configuring the selection circuit differently, it will be described later as another embodiment.

【0094】(1.3 入出力装置の動作)入出力装置
は、その入出力装置に求められている要求(信頼性、経
済性、汎用性など)で最適な構成が異なってくる。第2
階層のシステムバスは多重化されていない第2階層シス
テムバス104と、3重化された第2階層システムバス
204、205、206の2つの異なる構成をとり、上
記の要求に応えている。ディスクやLANなどシステム
の根幹である入出力装置は、高い信頼性を要求される。
従って、3重化した第2階層システムバス204、20
5、206に入出力インタフェースユニット211、2
12、213を介して接続する。こうすることで、第2
階層システムバスの障害が発生しても、入出力インタフ
ェースユニット211などで検知され、検知された障害
バスを切り離し、システムとしては正常な運転が継続で
きる。一方、ある種のデバイス、例えば、フロッピーデ
ィスク、磁気テープ、プリンタなどは、それ自体が故障
して使用不能になってもシステムとしては、直ちにダウ
ンにつながることはなく、ユーザや専任のオペレータの
運用で障害が切り抜けられるものもある。しかし、市販
されている様々なデバイスのレパートリィをサポートで
き、しかも安価に接続する必要がある。この様な場合に
は、第2階層システムバス104の構成にすれば良い。
第2階層システムバス104をISA、EISA、VM
Eなどの汎用バスにすれば、市販されている多数のデバ
イスが接続可能となる。また、3重化バスに比べて入出
力インタフェースユニットが不要なので安価になる。
(1.3 Operation of Input / Output Device) The optimum configuration of the input / output device differs depending on the requirements (reliability, economy, versatility, etc.) required for the input / output device. Second
The hierarchy system bus has two different configurations, that is, the second hierarchy system bus 104 which is not multiplexed and the second hierarchy system buses 204, 205 and 206 which are tripled to meet the above demand. High reliability is required for the input / output devices that are the basis of the system such as disks and LANs.
Therefore, the tripled second layer system buses 204, 20
5, 206 to the input / output interface units 211 and 2
12 and 213. By doing this, the second
Even if a fault occurs in the hierarchical system bus, it is detected by the input / output interface unit 211 or the like, the detected faulty bus is disconnected, and the system can continue normal operation. On the other hand, some types of devices, such as floppy disks, magnetic tapes, printers, etc., do not immediately go down as a system even if they themselves fail and become unusable. There are some that can overcome obstacles. However, it is necessary to be able to support the repertoire of various devices on the market and to connect at low cost. In such a case, the configuration of the second hierarchical system bus 104 may be adopted.
The second layer system bus 104 is connected to ISA, EISA, VM.
If a general-purpose bus such as E is used, many commercially available devices can be connected. Further, as compared with the triple bus, the input / output interface unit is unnecessary, so that the cost is reduced.

【0095】図12に戻って、ディスク231から主記
憶装置50、60へのデータ転送について説明する。デ
ィスク231からメモリへのデータ転送要求およびその
データは入出力制御装置221でメモリライトトランザ
クション(データを含む)として発行され入出力インタ
フェースユニット211に送られる。入出力インタフェ
ースユニット211は第2階層システムバス204、2
05、206に該トランザクションを同期して送出し、
それぞれバスブリッジ201、202、203がシステ
ムバス1、2、3を使用して主記憶装置50、60にラ
イトする。このとき、バスブリッジ201、202、2
03は同時にシステムバス要求をアービトレーション回
路90に送出し、同時にアービトレーション回路90か
らシステムバス使用許可信号が返され、従って、同時に
同一のトランザクションが発行される。また、主記憶装
置50、60のライト動作は前述と同様である。
Returning to FIG. 12, data transfer from the disk 231 to the main storage devices 50 and 60 will be described. The data transfer request from the disk 231 to the memory and the data thereof are issued as a memory write transaction (including data) by the input / output control device 221, and sent to the input / output interface unit 211. The input / output interface unit 211 is the second layer system bus 204, 2
The transaction is sent synchronously to 05 and 206,
The bus bridges 201, 202 and 203 respectively write to the main storage devices 50 and 60 using the system buses 1, 2 and 3. At this time, the bus bridges 201, 202, 2
03 simultaneously sends a system bus request to the arbitration circuit 90, and at the same time, the system bus use permission signal is returned from the arbitration circuit 90, so that the same transaction is issued at the same time. The write operation of the main storage devices 50 and 60 is the same as described above.

【0096】逆に主記憶装置50、60からディスク2
31へのデータ転送について説明する。主記憶装置5
0、60へディスク231からのデータリード要求は、
ライトトランザクションと同じ3つの経路で主記憶装置
50、60に伝わる。プライマリである主記憶装置50
がリードデータをシステムバス1、2、3に送出し、主
記憶装置60は送出しない。リードデータは、それぞれ
バスブリッジ201→第2階層システムバス204、バ
スブリッジ202→第2階層システムバス205、バス
ブリッジ203→第2階層システムバス206を経由し
て入出力インタフェースユニット211に到達し、入出
力インタフェースユニット211はデータを選択し入出
力制御装置221に送る。入出力装置231は入出力制
御装置221にデータをライトする。以上の動作は3重
化された部分はすべて同期動作する。
On the contrary, from the main storage devices 50 and 60 to the disk 2
The data transfer to 31 will be described. Main memory 5
The data read request from the disk 231 to 0 and 60 is
It is transmitted to the main storage devices 50 and 60 through the same three routes as the write transaction. Primary main memory 50
Sends the read data to the system buses 1, 2, and 3, and does not send it to the main storage device 60. The read data arrives at the input / output interface unit 211 via the bus bridge 201 → second hierarchy system bus 204, bus bridge 202 → second hierarchy system bus 205, bus bridge 203 → second hierarchy system bus 206, respectively. The input / output interface unit 211 selects data and sends it to the input / output control device 221. The input / output device 231 writes data to the input / output control device 221. In the above operation, all the tripled parts operate in synchronization.

【0097】ここで、入出力インタフェースユニット2
11の動作を図18において、説明する。図において、
204、205、206は3重化された第2階層のシス
テムバス、211は入出力インタフェースユニット、2
11aはセレクタ、211bは比較回路、211c、2
11d、211eはドライバ素子、211f、211g
はバスモニタ、211hはドライバ素子である。
Here, the input / output interface unit 2
The operation 11 will be described with reference to FIG. In the figure,
Reference numerals 204, 205, and 206 denote triple-layered second-level system buses, 211 denotes an input / output interface unit, and 2
11a is a selector, 211b is a comparison circuit, 211c, 2
11d and 211e are driver elements, 211f and 211g.
Is a bus monitor and 211h is a driver element.

【0098】図において、第2階層のシステムバス20
4、205、206は、同期動作をしている。第2階層
のシステムバス204、205、206から入出力制御
装置221へ向う信号は、比較回路211bで比較され
正常動作しているシステムバスを判定し、セレクタ21
1aで選択し出力する。バスモニタ211gによりバス
トランザクションを監視し、入出力制御装置221へ送
出すべき信号を判定し、該信号をドライバ素子211h
が入出力制御装置221に送出する。入出力制御装置2
21から第2階層システムバス204、205、206
へ向う信号は、バスモニタ211fが監視し、送出すべ
き信号を判定し、該信号をドライバ211c、211
d、211eを経由して第2階層システムバス204、
205、206に送出する。
In the figure, the system bus 20 of the second layer
4, 205 and 206 are operating in synchronization. The signals from the system buses 204, 205, 206 of the second layer to the input / output control device 221 are compared by the comparison circuit 211b to determine the system bus that is operating normally, and the selector 21
1a selects and outputs. The bus monitor 211g monitors the bus transaction, determines a signal to be sent to the input / output control device 221, and outputs the signal to the driver element 211h.
Is sent to the input / output control device 221. I / O controller 2
21 to the second layer system bus 204, 205, 206
The bus monitor 211f monitors the signal going to the driver, determines the signal to be sent, and outputs the signal to the drivers 211c, 211c.
the second layer system bus 204 via d, 211e,
It is sent to 205 and 206.

【0099】次に図12に戻って、磁気テープ122か
ら主記憶装置50、60へのデータ転送を説明する。入
出力制御装置112は磁気テープ122のデータをリー
ドし、メモリライトトランザクションを発行し、第2階
層システムバス104を経由し、第2階層システムバス
インタフェースユニット110に到達する。第2階層シ
ステムバスインタフェースユニット110は3つのバス
ブリッジ101、102、103にメモリライトトラン
ザクションを送出し、それぞれバスブリッジ101→シ
ステムバス1、バスブリッジ102→システムバス2、
バスブリッジ103→システムバス3を経由して主記憶
装置50、60に到達する。主記憶装置50、60は受
信したデータをそれぞれメモリアレイ51、61にライ
トする。逆に、主記憶装置50、60から磁気テープ1
22へのデータ転送について説明する。入出力制御装置
112はメモリリードトランザクションを第2階層シス
テムバス104に発行し、メモリライトトランザクショ
ンと同じ3つの経路で主記憶装置50、60に到達す
る。プライマリである主記憶装置50がリードデータを
システムバス1、2、3に送出し、主記憶装置60は送
出しない。リードデータは、それぞれバスブリッジ10
1、102、103を経由して第2階層システムバスイ
ンタフェースユニット110で選択され第2階層システ
ムバス104に送出される。入出力装置112が第2階
層システムバス104のリードデータを受信し、磁気テ
ープ122にライトする。以上3重化された部位は、す
べて同期動作をしている。
Next, returning to FIG. 12, data transfer from the magnetic tape 122 to the main storage devices 50 and 60 will be described. The input / output control unit 112 reads data from the magnetic tape 122, issues a memory write transaction, and reaches the second layer system bus interface unit 110 via the second layer system bus 104. The second layer system bus interface unit 110 sends a memory write transaction to the three bus bridges 101, 102 and 103, and the bus bridge 101 → system bus 1 and the bus bridge 102 → system bus 2, respectively.
The main storage devices 50 and 60 are reached via the bus bridge 103 and the system bus 3. The main storage devices 50 and 60 write the received data in the memory arrays 51 and 61, respectively. On the contrary, from the main storage device 50, 60 to the magnetic tape 1
The data transfer to 22 will be described. The I / O controller 112 issues a memory read transaction to the second level system bus 104, and reaches the main storage devices 50 and 60 through the same three routes as the memory write transaction. The primary main memory device 50 sends the read data to the system buses 1, 2, 3 and the main memory device 60 does not send it. The read data is the bus bridge 10 respectively.
It is selected by the second layer system bus interface unit 110 via 1, 102, 103 and sent to the second layer system bus 104. The input / output device 112 receives the read data from the second layer system bus 104 and writes it on the magnetic tape 122. The above-mentioned tripled parts are all synchronized.

【0100】ここで、インタフェースユニット110の
動作を図19に基づいて、説明する。図において、10
1、102、103は3重化されたバスブリッジ、10
4は第2階層システムバス、110はインタフェースユ
ニット、110aはセレクタ、110bは比較回路、1
10c、110d、110eはドライバ素子、101
f、101gはバスモニタ、101hはドライバ素子で
ある。
Now, the operation of the interface unit 110 will be described with reference to FIG. In the figure, 10
1, 102 and 103 are triple bus bridges, 10
4 is a second layer system bus, 110 is an interface unit, 110a is a selector, 110b is a comparison circuit, 1
10c, 110d and 110e are driver elements, 101
f and 101g are bus monitors, and 101h is a driver element.

【0101】図において、バスブリッジ101、10
2、103は、同期動作をしている。バスブリッジ10
1、102、103から第2階層システムバス104へ
向う信号は、比較回路110bで比較され、正常動作し
ているシステムバスを判定し、セレクタ110aで選択
する。バスモニタ101gでバストランザクションを監
視し、第2階層システムバス104へ送出すべき信号を
判定し、ドライバ素子101hが該信号を第2階層シス
テムバス104へ出力する。第2階層システムバス10
4からバスブリッジ101、102、103へ向う信号
は、バスモニタ101fが監視し、バスブリッジ10
1、102、103に送出する必要のある信号を判定
し、ドライバ110c、110d、110eを経由して
バスブリッジ101、102、103に送出する。
In the figure, bus bridges 101, 10
Reference numerals 2 and 103 are synchronously operating. Bus bridge 10
The signals going from the first, 102, and 103 to the second layer system bus 104 are compared by the comparison circuit 110b, the normally operating system bus is determined, and the selector 110a selects it. The bus monitor 101g monitors the bus transaction, determines a signal to be sent to the second layer system bus 104, and the driver element 101h outputs the signal to the second layer system bus 104. Second level system bus 10
The signal going from the bus bridge 4 to the bus bridges 101, 102, 103 is monitored by the bus monitor 101f, and
The signals that need to be sent to the first, the second, and the third, 103, and 103 are determined and sent to the bus bridges 101, 102, and 103 via the drivers 110c, 110d, and 110e.

【0102】(2.プロセッサの障害時の動作及び復旧
処理)次に一つのプロセッサが障害を発生した場合につ
いて説明する。障害発生から回復までの動作は、正常動
作時とは異なり、信頼性か性能かのどちらかが犠牲にな
り低下する。別の言い方をすれば、信頼性を維持する
か、性能を維持するかで障害発生から回復までの処理が
異なる。また、それにともない、プロセッサのオンライ
ン交換の単位が異なる。信頼性を維持する場合は、故障
プロセッサを含むプロセッシングユニット以外のプロセ
ッシングユニットは常に3重化同期動作を行うべきであ
り、従って、オンライン交換の単位はプロセッシングユ
ニット単位が望ましい。一方、性能を維持する場合は、
故障プロセッサを含むシステムバス以外のプロセッサは
常に動作を行い正常時と同等のプロセッシングユニット
数を維持すべきであり、従って、オンライン交換の単位
はシステムバス単位が望ましい。以下にその両方の場合
について説明する。
(2. Operation and Restoration Processing When Processor Fails) Next, a case where one processor fails will be described. The operation from failure occurrence to recovery is different from the normal operation, and either reliability or performance is sacrificed and deteriorates. In other words, the processing from failure occurrence to recovery differs depending on whether reliability is maintained or performance is maintained. Along with this, the units for online replacement of processors are different. In order to maintain reliability, the processing units other than the processing unit including the failed processor should always perform the triple synchronization operation, and therefore the unit of online exchange is preferably the processing unit unit. On the other hand, to maintain performance,
Processors other than the system bus including the failed processor should always operate and maintain the same number of processing units as in the normal state. Therefore, the unit of online replacement is preferably the system bus unit. Both cases will be described below.

【0103】(2.1 信頼性維持の場合)図12に基
づいて説明する。二つのプロセッシングユニットは、そ
れぞれ別の演算を行なっている状態で、プロセッシング
ユニット10のプロセッサ11に障害が発生したケース
について説明する。プロセッサ11の故障により、シス
テムバス1の動作は、他のシステムバスと動作が異な
り、選択回路53および63で故障が検知される。選択
回路は、すぐさま、システムバス1上のプロセッサ1
1、21の出力をディセーブル(図13のドライバ14
fを有意にしない)し、替りに主記憶装置50がシステ
ムバス2の出力をシステムバス1に送出する追随モード
になる。したがって、システムバス1上のトランザクシ
ョンは、プロセッサ11が故障したといえども正常なも
のを送出でき、システムバス1に接続された他のプロッ
サ21はプロセッサ22、23との同期動作を継続する
ことができる。従って、故障したプロセッシングユニッ
ト10をS/Wの都合のよいタイミング(たとえばタス
クの切り換え時)に停止させ、以降バストランザクショ
ンが発生しないようにする。一旦プロセッシングユニッ
ト10が停止したら、システムバス1を追随モードから
3者比較モードに戻すことが可能である。なぜなら、プ
ロセッサ11の障害にもかかわらずプロセッサ21は追
随モードによりプロセッサ22、23と同一の演算を実
行し続けたので内部状態は、他のプロセッサと同一であ
る。プロセッサ21の出力をイネーブルにし、メモリ制
御回路を追随モードから3者比較モードに戻すとプロセ
ッサ21、22、23の同期動作による3者比較が可能
になる。続いて、プロセッサ11を含むプロセッシング
ユニット10をオンラインで交換し、システムが再度使
用を開始すればもとの状態に回復する。
(2.1 Case of Maintaining Reliability) Description will be made with reference to FIG. A case where the processor 11 of the processing unit 10 has a failure while the two processing units are performing different calculations will be described. Due to the failure of the processor 11, the operation of the system bus 1 differs from that of other system buses, and the failure is detected by the selection circuits 53 and 63. Immediately after the selection circuit, the processor 1 on the system bus 1
The outputs of 1 and 21 are disabled (driver 14 in FIG.
f is not significant), and instead the main memory device 50 enters the follow-up mode in which the output of the system bus 2 is sent to the system bus 1. Therefore, a transaction on the system bus 1 can be sent normally even if the processor 11 has failed, and another processor 21 connected to the system bus 1 can continue the synchronous operation with the processors 22 and 23. it can. Therefore, the failed processing unit 10 is stopped at a timing convenient for S / W (for example, when switching tasks) so that a bus transaction will not occur thereafter. Once the processing unit 10 is stopped, the system bus 1 can be returned from the follow-up mode to the three-party comparison mode. This is because, despite the failure of the processor 11, the processor 21 continues to execute the same operation as the processors 22 and 23 in the follow-up mode, so that the internal state is the same as the other processors. When the output of the processor 21 is enabled and the memory control circuit is returned from the follow-up mode to the three-way comparison mode, the three-way comparison by the synchronous operation of the processors 21, 22, and 23 becomes possible. Subsequently, the processing unit 10 including the processor 11 is replaced online, and when the system starts to use again, the original state is restored.

【0104】システムバス1が追随モードの場合、図1
4に示した比較回路53bでは、システムバス2、3の
比較のみ行い、システムバス1は比較および選択の対象
にしない。また、メモリリード時にはAND素子52e
からのドライバ制御信号を、比較回路53bからの制御
信号を入力するAND回路52kでマスクすることで抑
止し、ドライバ52hはデータをドライブしない。一
方、比較回路53bの制御により、クロック毎にシステ
ムバス3の内容が保持されたレジスタ53eの内容をド
ライバ53eを経由して出力する。こうすることで、シ
ステムバス3(システムバス2と同じ)の内容がシステ
ムバス1に出力される。但し、1サイクル遅い状態が伝
播される。
When the system bus 1 is in the follow mode, FIG.
In the comparison circuit 53b shown in FIG. 4, only the system buses 2 and 3 are compared, and the system bus 1 is not a target for comparison and selection. Also, when reading a memory, the AND element 52e
The driver control signal from 1 is suppressed by masking it with the AND circuit 52k to which the control signal from the comparison circuit 53b is input, and the driver 52h does not drive the data. On the other hand, under the control of the comparison circuit 53b, the contents of the register 53e, which holds the contents of the system bus 3 for each clock, are output via the driver 53e. By doing so, the contents of the system bus 3 (same as the system bus 2) are output to the system bus 1. However, a state that is delayed by one cycle is propagated.

【0105】(2.2 性能維持の場合)再度図12に
基づいて説明する。二つのプロセッシングユニットはそ
れぞれ別の演算を行なっている状態で、プロセッシング
ユニット10のプロセッサ11に障害が発生したケース
について説明する。プロセッサ11の故障により、シス
テムバス1の動作は、他のシステムバスと動作が異な
り、選択回路53および63で故障が検知される。シス
テムバス1の動作は選択回路53でマスクされ、システ
ムバス1の動作がメモリに伝わることはない。性能維持
の場合はシステムバス1に接続されるプロセッサ11、
21が一つのオンライン交換の単位とし、これらをオン
ラインで交換する。このときプロセッサ12と13、2
2と23は同期動作を継続し、性能は故障発生以前もの
が維持できる。オンライン交換後、システムバス1を追
随モードにし、システムバス2、3と同期動作をさせ
る。続いて、プロセッシングユニット10をS/Wの都
合のよいタイミング(たとえばタスクの切り換え時)に
初期化する。こうすることで、新規挿入されたプロセッ
サ11がプロセッサ12、13と同期動作開始する。さ
らに、同様にプロセッシングユニット20をS/Wの都
合のよいタイミング(たとえばタスクの切り換え時)に
初期化する。同様に新規挿入されたプロセッサ21がプ
ロセッサ22、23と同期動作開始する。プロセッサ1
1、21の出力をイネーブルにし、メモリ制御回路を追
随モードから3者比較モードに戻すともとの同期動作に
復旧する。
(2.2 When Performance is Maintained) The operation will be described again with reference to FIG. A case where the processor 11 of the processing unit 10 has a failure while the two processing units are performing different calculations will be described. Due to the failure of the processor 11, the operation of the system bus 1 differs from that of other system buses, and the failure is detected by the selection circuits 53 and 63. The operation of the system bus 1 is masked by the selection circuit 53, and the operation of the system bus 1 is not transmitted to the memory. In the case of performance maintenance, the processor 11 connected to the system bus 1,
21 is one online exchange unit, and these are exchanged online. At this time, processors 12 and 13, 2
2 and 23 continue the synchronous operation, and the performance can be maintained as before the failure. After the online exchange, the system bus 1 is set to the follow-up mode and is operated in synchronization with the system buses 2 and 3. Then, the processing unit 10 is initialized at a convenient S / W timing (for example, when switching tasks). By doing so, the newly inserted processor 11 starts the synchronous operation with the processors 12 and 13. Further, similarly, the processing unit 20 is initialized at a convenient timing of S / W (for example, when switching tasks). Similarly, the newly inserted processor 21 starts synchronous operation with the processors 22 and 23. Processor 1
The outputs of Nos. 1 and 21 are enabled, and the memory control circuit is returned from the follow-up mode to the three-way comparison mode to restore the original synchronous operation.

【0106】(3.高信頼モード/高性能モードの切り
換え)ここで、同一ハードウェア構成で、高信頼な計算
機システムと高性能な計算機システムをとる例について
説明する。図20の表に示すとおり、本実施例の計算機
ハードウェアは、高信頼を実現する高信頼モードと高性
能を実現する高性能モードをもち、高信頼モードでは、
プロセッサの3重化、主記憶装置の2重化により信頼性
と連続運転性を高め、一方、高性能モードでは、プロセ
ッサを個別動作させプロセッシングユニットの数を増大
させ、主記憶装置も別々のアドレス範囲のデータを格納
することで広いアドレス空間をサポートすることで高性
能を実現する。
(3. Switching between High-Reliability Mode / High-Performance Mode) Here, an example will be described in which a high-reliability computer system and a high-performance computer system are used with the same hardware configuration. As shown in the table of FIG. 20, the computer hardware of this embodiment has a high-reliability mode for achieving high reliability and a high-performance mode for achieving high performance.
Reliability and continuous operation are improved by triple processor and dual main memory. On the other hand, in high-performance mode, each processor operates individually to increase the number of processing units, and main memory also has different addresses. High performance is achieved by supporting a wide address space by storing a range of data.

【0107】図21でアービトレーション回路90の内
部について説明する。図において、90aは、CPU高
性能/高信頼を指定するCPU個別実行指定ビット、9
0b、90cは3者の入力の多数決をとる多数決回路、
90d、90e、90f、90g、90h、90iはセ
レクタ、90jは4者からの1者を選択するアービトレ
ーション回路、90kは12者から1者を選択するアー
ビトレーション回路、90l、90m、90nはOR素
子、90o、90pは多数決回路、90q、90r、9
0s、90t、90u、90vはセレクタ、90w、9
0x、90yはOR素子、91はCPU個別実行モード
指定信号、92は90l、90m、90nの出力を束ね
たもので個別実行モードでどのシステムバスが選択され
ているかを示すシステムバス選択信号である。信号線1
1r〜23rはそれぞれプロセッサ11〜23からのシ
ステムバスリクエスト信号で該プロセッサがシステムバ
スを要求していることを表し、信号線11g〜23gは
プロセッサ11〜23へのシステムバス使用許可信号で
該プロセッサにシステムバスの使用を許可したことを表
す。信号線101r〜103r、201r〜203rは
それぞれバスブリッジ101〜103、201〜203
からのシステムバスリクエスト信号で該バスブリッジが
システムバスを要求していることを表し、信号線101
g〜103g、201g〜203gはバスブリッジ10
1〜103、201〜203へのシステムバス使用許可
信号で該プロセッサにシステムバスの使用を許可したこ
とを表す。
The inside of the arbitration circuit 90 will be described with reference to FIG. In the figure, 90a is a CPU individual execution designation bit for designating CPU high performance / high reliability, and 9
0b and 90c are majority circuits that take the majority of the three inputs,
90d, 90e, 90f, 90g, 90h and 90i are selectors, 90j is an arbitration circuit for selecting one from four parties, 90k is an arbitration circuit for selecting one from 12 parties, 90l, 90m and 90n are OR elements, 90o, 90p are majority circuits, 90q, 90r, 9
0s, 90t, 90u, 90v are selectors, 90w, 9
0x and 90y are OR elements, 91 is a CPU individual execution mode designating signal, and 92 is a system bus selection signal which bundles the outputs of 90l, 90m, and 90n and indicates which system bus is selected in the individual execution mode. . Signal line 1
1r to 23r are system bus request signals from the processors 11 to 23, which indicate that the processor requests the system bus. Signal lines 11g to 23g are system bus use permission signals to the processors 11 to 23. Indicates that the system bus is allowed to be used. The signal lines 101r to 103r and 201r to 203r are bus bridges 101 to 103 and 201 to 203, respectively.
The system bus request signal from indicates that the bus bridge requests the system bus.
g-103g, 201g-203g is the bus bridge 10
The system bus use permission signals 1 to 103 and 201 to 203 indicate that the processor is permitted to use the system bus.

【0108】高性能モードの動作について説明する。図
21において、アービトレーション回路90のCPU個
別実行モードビット90aをセットし、CPUを個別実
行させ処理性能を向上させる。また、図20において、
選択回路50、60のメモリ2重化指定ビット52o、
62oによりメモリ個別アクセスを設定し、プライマリ
ビット52d、62dをともにセットし、メモリアドレ
ス範囲指定レジスタ52aa、62aaにメモリアドレ
スのを範囲ををれぞれセットする。メモリアドレス範囲
指定レジスタ52aaと62aaにセットするアドレス
範囲は異なる(重ならないで連続するものが望ましい)
ようにセットする。以上のレジスタおよびビットのセッ
トをシステムのパワーオン直後か、システムリセットの
直後に行うことで、以後そのシステムを高性能モードで
使用することができる。
The operation in the high performance mode will be described. In FIG. 21, the CPU individual execution mode bit 90a of the arbitration circuit 90 is set to individually execute the CPU and improve the processing performance. In addition, in FIG.
Memory duplication designation bits 52o of the selection circuits 50 and 60,
The individual memory access is set by 62o, the primary bits 52d and 62d are set together, and the range of the memory address is set in the memory address range designation registers 52aa and 62aa, respectively. The address ranges set in the memory address range specification registers 52aa and 62aa are different (preferably consecutive without overlapping).
To set. By setting the above registers and bits immediately after powering on the system or immediately after resetting the system, the system can be used in the high performance mode thereafter.

【0109】6個のプロセッサおよび6個のバスブリッ
ジは、それぞれ信号線11r〜23rでシステムバス使
用要求をアービトレーション回路に伝え、12者から1
者を選択するアービトレーション回路90kで1個のプ
ロセッサが選択される。以降、例えばプロセッサ11が
選択されたとする。アービトレーション回路90kから
の出力がセレクタ90dを経由して、プロセッサ11に
対するバス使用権信号11gが出力されプロセッサ11
に伝えられる。CPU個別実行モードビット90aがセ
ットされているので、セレクタ90dは、アービトレー
ション回路90jの出力ではなくアービトレーション回
路90kの出力を選択する。また、同時にアービトレー
ション回路90kの出力はOR素子90lを経由して、
システムバス選択信号92として出力される。CPU個
別実行モードビット90aの内容も、CPU個別実行指
定モード信号91として出力される。続いて、図14
で、CPU個別実行指定モード信号91により、セレク
タ53cはシステムバス選択信号92を選択し、この信
号でセレクタ53aは、システムバス1を選択し、プロ
セッサ11がメモリにアクセスすることができる。この
ようにして、6個のプロセッサは独立に動作を実行する
ことができる。各プロセッサがキャッシュを持っていれ
ば、少ないバスアクセスで多くの処理を実行できるの
で、2個のプロセッシングユニットで実行していたとき
より、格段の性能向上が期待できる。
The six processors and the six bus bridges transmit the system bus use request to the arbitration circuit through the signal lines 11r to 23r, respectively, and one of the twelve parties receives one.
One processor is selected by the arbitration circuit 90k for selecting a person. After that, for example, it is assumed that the processor 11 is selected. An output from the arbitration circuit 90k passes through the selector 90d, and a bus use right signal 11g for the processor 11 is output to the processor 11d.
Be transmitted to. Since the CPU individual execution mode bit 90a is set, the selector 90d selects the output of the arbitration circuit 90k instead of the output of the arbitration circuit 90j. At the same time, the output of the arbitration circuit 90k passes through the OR element 90l,
It is output as the system bus selection signal 92. The contents of the CPU individual execution mode bit 90a are also output as the CPU individual execution designation mode signal 91. Then, in FIG.
Then, the selector 53c selects the system bus selection signal 92 by the CPU individual execution designation mode signal 91, the selector 53a selects the system bus 1 by this signal, and the processor 11 can access the memory. In this way, the six processors can perform operations independently. If each processor has a cache, a large amount of processing can be executed with a small number of bus accesses, so that a marked improvement in performance can be expected compared to the case where the processing is executed by two processing units.

【0110】また、メモリアクセスに際しては、2つの
主記憶装置50、60において、メモリアクセス範囲指
定レジスタ52aaに個別の値がセットされていて、プ
ライマリビット52d、62d共にセットされているの
で、主記憶装置はそれぞれ個別のメモリ空間に対してプ
ライマリ(即ち、リード/ライト可能)として動作す
る。メモリ2重化指定ビット52oをセットし、AND
回路52pでマスクすることで、ECCチェック回路5
2cの出力がもう一方の主記憶装置に影響を及ぼすのを
防いでいる。このようにして、メモリを2重化して使用
したときより大容量なメモリ空間をサポートすることが
可能になり、メモリを多く使用するアプリケーションや
非常に多くのプログラムを並行して処理するケースに対
しては、メモリのディスクへの退避の頻度を減少させる
ことができ性能の向上が期待できる。
Further, at the time of memory access, in the two main storage devices 50 and 60, the individual values are set in the memory access range designation register 52aa, and both the primary bits 52d and 62d are set. The device operates as a primary (that is, read / write) for each individual memory space. Set the memory duplication designation bit 52o and AND
The ECC check circuit 5 is masked by the circuit 52p.
It prevents the output of 2c from affecting the other main memory. In this way, it is possible to support a larger memory space than when using dual memory, and for applications that use a lot of memory and cases where a large number of programs are processed in parallel. As a result, the frequency of saving the memory to the disk can be reduced, and improvement in performance can be expected.

【0111】ここで、パワーオン直後または、システム
のリセット直後からの高性能モードまたは高信頼モード
の設定手順について説明する。図22にそのフローを示
す。本実施例の計算機がパワーオンされたり、リセット
が入りそれが解除されるとプロセッサは主記憶装置、バ
ス、プロセッサ自身などハードウェアリソースの診断を
実行する。このときは、モードは高性能でも高信頼でも
都合のよい方でよい。診断でOKであれば、あるプロセ
ッシングユニットは、これから設定すべき実行モードを
判定する。実行モードは、計算機外部のスイッチ情報、
不揮発性のメモリの内容、通常の主記憶装置の特定アド
レスの内容、あるいはシステムコンソールからの入力な
どの手段およびそれらの組み合わせなどで決定される。
実行モードが決ると該プロセッシングユニットは、モー
ドを指定するための各種レジスタ(90a、52aa、
52d、52o、62aa、62d、62o)に値をセ
ットする。セットする値の一例を図23に示す。これら
のレジスタをセットし終ると所望のモードになる。続い
て、オペレーティングシステムを立ちあげ、システムを
稼働状態にする。オペレーティングシステムはこのとき
現在認識できるプロセッシングユニットまたは、メモリ
空間に応じて、プロセッサ管理テーブルやメモリ管理テ
ーブルを生成すればよく、標準のオペレーティングシス
テムの移植性は損なわれない。
Now, the procedure for setting the high performance mode or the high reliability mode immediately after power-on or system reset will be described. FIG. 22 shows the flow. When the computer of this embodiment is powered on or reset and released, the processor executes the diagnosis of hardware resources such as the main memory, the bus and the processor itself. At this time, the mode may be either high performance or high reliability, whichever is more convenient. If the diagnosis is OK, a processing unit determines the execution mode to be set. The execution mode is switch information outside the computer,
It is determined by the content of the non-volatile memory, the content of a specific address of a normal main storage device, or means such as input from the system console and a combination thereof.
When the execution mode is determined, the processing unit determines various registers (90a, 52aa,
52d, 52o, 62aa, 62d, 62o). FIG. 23 shows an example of values to be set. Once these registers are set, the desired mode is reached. Next, the operating system is started up and the system is put into operation. At this time, the operating system may generate the processor management table and the memory management table according to the currently recognized processing unit or memory space, and the portability of the standard operating system is not impaired.

【0112】以上のように、この実施例は、システムバ
スとこのシステムバスに接続される主記憶装置、システ
ムバスに接続される1つまたは複数のプロセッシングユ
ニットからなる高信頼計算機システムにおいて、各プロ
セッシングユニットと主記憶装置は、同一の動作を実行
する3本以上の複数のシステムバスで接続され、各プロ
セッシングユニットは同一の演算を実行する3台以上の
プロセッサで構成され、上記プロセッサはバスインタフ
ェースユニットによりシステムバスに個別に接続され、
主記憶装置は、データを格納するメモリアレイと、上記
3つのシステムバスのうちいずれか一つの出力を選択す
る選択回路と、選択された出力をメモリアレイにライト
し、またメモリアレイからリードしたデータをシステム
バスに出力するためのメモリインタフェースユニットか
ら構成され、上記回路の故障部位を取り除いた残りの構
成によって運転継続させる故障検出と故障部切り離し機
構とから構成されることを特徴とする。
As described above, in this embodiment, each processing is performed in the high-reliability computer system including the system bus, the main storage device connected to the system bus, and one or a plurality of processing units connected to the system bus. The unit and the main storage device are connected by a plurality of system buses of three or more that execute the same operation, each processing unit is composed of three or more processors that execute the same operation, and the processor is a bus interface unit. Individually connected to the system bus by
The main memory device includes a memory array for storing data, a selection circuit for selecting one of the outputs of the three system buses, a selected output, and a data read from the memory array. Of the memory interface unit for outputting to the system bus, and is composed of a failure detection and a failure part disconnection mechanism for continuing the operation by the remaining configuration of the circuit except the failure part.

【0113】また、主記憶装置は2台以上複数が3本以
上複数のシステムバスに接続され、同一のデータを保持
し、各主記憶装置は、保持したデータの誤りを検出する
手段を有することを特徴とする。
Also, two or more main memory devices are connected to a plurality of system buses, three or more, and hold the same data, and each main memory device has means for detecting an error in the held data. Is characterized by.

【0114】また、これらシステムバスに接続される同
一の動作を実行する3台以上のバスブリッジを有し、そ
れぞれに第2階層のシステムバスが接続され、上記3本
の第2階層のシステムバスのうちいずれか一つの出力を
選択する選択回路と、選択された出力を入出力制御装置
に出力し、また入出力制御装置からのデータを取り込む
ための入出力インタフェースユニットを有することを特
徴とする。
Further, there are three or more bus bridges connected to these system buses for executing the same operation, and the system buses of the second layer are connected to the respective bus bridges. A selection circuit for selecting any one of the outputs, and an input / output interface unit for outputting the selected output to the input / output control device and for receiving data from the input / output control device. .

【0115】また、これらシステムバスに接続される同
一の動作を実行する3台以上のバスブリッジを有し、上
記3つバスブリッジのうちいずれか一つの出力を選択す
る選択回路、選択された出力を第2階層システムバスに
出力し、また、第2階層システムバスからの信号を3台
のバスブリッジに送出する機能を有する第2階層システ
ムバスインタフェースユニットを有することを特徴とす
る。
Further, there are three or more bus bridges connected to these system buses for executing the same operation, and a selection circuit for selecting any one output of the above three bus bridges and a selected output. Is output to the second layer system bus and a signal from the second layer system bus is sent to the three bus bridges.

【0116】この実施例は、さらに、前記システムバス
は第1、第2、第3のシステムバスから構成され、同一
の動作を行い、前記各プロセッシングユニットは第1、
第2、第3のプロセッサを備えて、同一の演算を実行し
ており、第1のプロセッサは第1のシステムバスに、第
2のプロセッサは第2のシステムバスに、第3のプロセ
ッサは第3のシステムバスにそれぞれ接続されており、
同様に第4のプロセッサは第1のシステムバスに、第5
のプロセッサは第2のシステムバスに、第6のプロセッ
サは第3のシステムバスにそれぞれ接続されており、プ
ロセッシングユニットが1つのオンライン交換単位であ
る高信頼計算機システムにおいて、上記3つのプロセッ
サの内いずれか一つが故障した時に、残りの2つのプロ
セッサにより現在実行中のプログラムの実行を正常に停
止させた後、そのプログラムの再開は第4、第5、第6
のプロセッサによる同一演算に処理を移行することを特
徴とする。
In this embodiment, the system bus is composed of a first system bus, a second system bus, and a third system bus, and performs the same operation.
The second processor and the third processor perform the same operation, and the first processor is on the first system bus, the second processor is on the second system bus, and the third processor is on the third system bus. It is connected to each of the 3 system buses,
Similarly, the fourth processor is connected to the first system bus and the fifth processor.
Is connected to the second system bus and the sixth processor is connected to the third system bus. In the high reliability computer system in which the processing unit is one online exchange unit, any one of the above three processors is connected. When one of them fails, the remaining two processors normally stop the execution of the program currently being executed, and then the program is restarted at the 4th, 5th and 6th.
The processing is transferred to the same calculation by the processor.

【0117】また、プロセッサの故障をそれが接続され
るシステムバスの動作を監視することで検知する機能
と、各プロセッサの出力を個別に抑止する機能と、シス
テムバスの動作を他のシステムバスの動作に強制的に同
期動作(追随動作)させるシステムバス追随機能を有
し、第1のプロセッサが故障した場合、第1のプロセッ
サの出力を抑止し、同時に第1のシステムバスに接続さ
れた第4のプロセッサの出力を抑止し、第1のシステム
バスは第2または第3のシステムバスと同じ動作を実行
し、故障していない第4のプロセッサを第5、第6のプ
ロセッサと同じ演算を実行させ、第2、第3のプロセッ
サが停止した後、第4のプロセッサの出力を再び許可
し、第1のシステムバスが第2、第3のシステムバスと
の同期動作を再開することを特徴とする。また、各プロ
セッサは、そのバスに障害が検知された場合、1サイク
ルまたは複数サイクル停止する機能と、他のシステムバ
スに対して追随動作を実行しているシステムバスは、1
サイクルまたは複数サイクル遅れた追随動作を行う機能
と、および、指令により、任意のプロセッサを1サイク
ルまたは複数サイクル停止する機能を有し、第1のプロ
セッサが故障した場合、第1のプロセッサの出力を抑止
し、第1のシステムバスに接続された第4のプロセッサ
の出力を抑止するとともに、1または複数サイクル停止
させることで、第1のシステムバスは第2または第3の
システムバスに1または複数サイクル遅れてと同じ動作
を実行し、故障していない第4のプロセッサを第5、第
6のプロセッサに一定サイクル遅れた同期動作を行い、
第2、第3のプロセッサが停止した後は、指令により第
5、第6のプロセッサを1または複数サイクル停止さ
せ、第4のプロセッサの出力を許可し、その後、第1の
システムバスが第2、第3のシステムバスと同期動作を
再開することを特徴とする。
The function of detecting a processor failure by monitoring the operation of the system bus to which it is connected, the function of individually suppressing the output of each processor, and the operation of the system bus of other system buses. Has a system bus follow-up function for forcibly synchronizing with operation (following operation), suppresses output of the first processor when the first processor fails, and simultaneously connects to the first system bus The output of the fourth processor is suppressed, the first system bus executes the same operation as the second or third system bus, and the fourth processor which has not failed performs the same operation as the fifth and sixth processors. After the second processor and the third processor are stopped, the output of the fourth processor is permitted again, and the first system bus restarts the synchronous operation with the second and third system buses. The features. In addition, each processor has a function of stopping for one cycle or a plurality of cycles when a failure is detected in the bus and a system bus that is performing a follow-up operation with respect to another system bus.
Has a function of performing a follow-up operation delayed by a cycle or a plurality of cycles, and a function of stopping an arbitrary processor for one cycle or a plurality of cycles by a command. When the first processor fails, the output of the first processor is output. By suppressing the output of the fourth processor connected to the first system bus and stopping the output for one or more cycles, the first system bus can be connected to the second or third system bus one or more times. The same operation is executed after a cycle delay, and the fourth processor, which has not failed, is synchronized with the fifth and sixth processors by a fixed cycle delay,
After the second and third processors are stopped, the command causes the fifth and sixth processors to stop for one or more cycles to allow the output of the fourth processor, and then the first system bus changes to the second , And resumes synchronous operation with the third system bus.

【0118】また、同一システムバスに接続されるプロ
セッサ(第1と第4、第2と第5、第3と第6)が一つ
のオンライン交換単位である高信頼計算機システムにお
いて、第1のプロセッサが故障した場合、第2と第3、
第5と第6のそれぞれのプロセッサが同期動作を継続す
る機能を有し、第1と第4のプロセッサを含む交換単位
を、第2と第3、第5と第6のプロセッサを動作させな
がら交換したあと、第1のシステムバスを第2または第
3のシステムバスに追随動作ができる機能を有し、第1
のプロセッサの動作を、第2または第3のプロセッサの
動作にあわせ、続いて、第4のプロセッサの動作を、第
5または第6のプロセッサの動作にあわせることを特徴
とする。
In the high reliability computer system in which the processors (first and fourth, second and fifth, third and sixth) connected to the same system bus are one online exchange unit, the first processor If is broken, the second and third,
Each of the fifth and sixth processors has a function of continuing the synchronous operation, and the exchange unit including the first and fourth processors is operated while operating the second and third processors and the fifth and sixth processors. After the replacement, the first system bus has a function of following the second or third system bus.
The operation of the processor is matched with the operation of the second or third processor, and subsequently the operation of the fourth processor is matched with the operation of the fifth or sixth processor.

【0119】また、各プロセッサボードは、システムバ
スへの出力を抑止する手段を有し、メモリインタフェー
スユニットは、システムバスの出力を他のシステムバス
の動作の一定サイクル遅れた信号変化を出力する手段を
有し、プロセッシングユニットを構成するプロセッサ
(例えば、第1、第2、第3のプロセッサ)の内、任意
の一つのプロセッサを他の2つのプロセッサに比べて、
一定サイクル遅れてリセットを解除する手段を有し、各
プロセッサおよび各システムバスは、一定サイクル動作
を停止する手段を有し、第1、第4のプロセッサをオン
ライン交換した場合、第1のシステムバスを第2、第3
のシステムバスに一定サイクル遅れた追随動作をさせ、
第1のプロセッサの動作を、第2または第3のプロセッ
サの動作にあわせるとき、第1のプロセッサのリセット
を第2、第3のプロセッサのリセットを解除するより一
定サイクル遅らせて解除し、第1のプロセッサの動作
を、第2または第3のプロセッサの一定サイクル遅れた
動作にあわせ、同様に、第4のプロセッサの動作を、第
5または第6のプロセッサの一定サイクル遅れた動作に
あわせ、以上が完了した後、第2、第3、第5、第6の
プロセッサおよび、第2、第3のシステムバスを一定サ
イクル動作を停止し、同時に第1、第4のプロセッサの
出力を許可し、バスインタフェースユニットは、第1の
システムバスを追随モードから他の2本のシテムバスと
の比較するモードに変更し、第1のプロセッサは第2、
第3のプロセッサと、第4のプロセッサは第5、第6の
プロセッサと、第1のシステムバスは第2、第3のシス
テムバスと同期動作を回復することを特徴とする。
Further, each processor board has means for suppressing output to the system bus, and the memory interface unit outputs means for outputting a signal change in which the output of the system bus is delayed by a fixed cycle of the operation of another system bus. Of the processors (for example, the first, second, and third processors) that form the processing unit, and has one of the processors compared to the other two processors,
Each processor and each system bus have means for canceling the reset after a certain cycle delay, and each processor and each system bus have means for stopping a certain cycle operation. When the first and fourth processors are replaced online, the first system bus The second, the third
The following system bus is made to follow a certain cycle delay,
When the operation of the first processor is matched with the operation of the second or third processor, the reset of the first processor is released after a certain cycle delay from the release of the reset of the second and third processors. The operation of the processor is matched with the operation of the second or third processor delayed by a fixed cycle, and the operation of the fourth processor is matched with the operation of the fifth or sixth processor delayed by the fixed cycle. After the completion of the above, the second, third, fifth, and sixth processors and the second and third system buses are stopped for a fixed cycle, and at the same time, the outputs of the first and fourth processors are permitted, The bus interface unit changes the first system bus from the follow-up mode to the mode for comparing with the other two system buses, and the first processor changes the second,
It is characterized in that the third processor, the fourth processor, and the fifth and sixth processors and the first system bus restore synchronous operation with the second and third system buses.

【0120】また、この実施例は上記の高信頼計算機シ
ステムにおいて、第1および第2の主記憶装置を有し、
第1の主記憶装置は第1のメモリインタフェースユニッ
ト、第1の選択回路、第1のメモリアレイを有し、第2
の主記憶装置は第2のメモリインタフェースユニット、
第2の選択回路、第2のメモリアレイを有し、各選択回
路は、それぞれ3本のシステムバスに接続され、システ
ムバスを比較し、故障したシステムバスの故障を検知
し、故障していないシステムバスの信号を選択して主記
憶装置に取り込む手段を有し、また、第1および第2の
メモリインタフェースユニットは、通常時は同期動作
し、選択されたシステムバスの信号を第1、第2のメモ
リアレイに同時に送出する手段と、第1、第2のメモリ
アレイからのリードデータを正当性をチェックするため
のチェックコードを生成する手段、上記チェックコード
よりリードデータの正当性をチェックする手段、プライ
マリおよびセカンダリというモードを保持する手段を有
し、上記プライマリ状態のメモリインタフェースユニッ
トは、システムバスに信号を送出し、セカンダリ状態の
メモリインタフェースユニットは、システムバスへは信
号を送出せず、第1と第2のメモリインタフェースユニ
ットは排他的にプライマリとセカンダリのモードにな
り、メモリインタフェースユニットをプライマリとする
主記憶装置の保持するデータが自己訂正不可能な誤りを
有する場合、2つのメモリインタフェースユニットのプ
ライマリとセカンダリを交換する機能を有することを特
徴とする。
In addition, this embodiment has the first and second main memory devices in the high reliability computer system,
The first main memory device has a first memory interface unit, a first selection circuit, a first memory array, and a second memory
The main memory of the second memory interface unit,
A second selection circuit and a second memory array are provided, and each selection circuit is connected to three system buses, respectively, compares the system buses, detects a failure of the failed system bus, and does not fail. It has means for selecting a signal of the system bus and loading it into the main memory device. Further, the first and second memory interface units normally operate synchronously, and the signals of the selected system bus are first and second. Means for simultaneously sending to the two memory arrays, means for generating a check code for checking the read data from the first and second memory arrays, and the check data for checking the correctness of the read data. Means, primary and secondary modes are retained, and the memory interface unit in the primary state is connected to the system bus. The memory interface unit in the secondary state does not send a signal to the system bus, the first and second memory interface units are exclusively in the primary and secondary modes, and the memory interface unit is set to the primary mode. When the data held in the main storage device has an error that cannot be self-corrected, it has a function of exchanging the primary and the secondary of the two memory interface units.

【0121】また、同一の演算を実行する3台以上のプ
ロセッサが指令によって異なる演算を実行するモードを
有し、選択回路は3本のシステムバスの出力を競合制御
を実施して逐次的にメモリに出力するモードをもち、ま
たメモリからのデータをいずれかのシステムバスに出力
する手段を持つメモリインタフェースユニットを有する
ことを特徴とする。
Further, there is a mode in which three or more processors executing the same operation execute different operations in response to a command, and the selection circuit sequentially controls the outputs of the three system buses to perform memory control. And a memory interface unit having means for outputting data from the memory to any of the system buses.

【0122】また、システムバスの使用権は各プロセッ
サからの使用要求をアービトレーション回路で裁定する
高信頼計算機システムにおいて、システムバスのアービ
トレーション回路は、3重化同期動作のモードと個別動
作のモードを有し、3重化同期動作のモードにおいて
は、同一動作が期待されている3つのプロセッシングユ
ニットおよび3つのバスブリッジからのバス要求信号は
多数決回路で一つにまとめたあと、バスアービトレショ
ンを行う手段と、個別動作のモードでは、すべてのプロ
セッシングユニットとすべてのバスブリッジからのバス
要求信号に対してバスアービトレションを行う手段を有
し、上記2つの手段がソフトウェアからの指令によって
選択できる手段を有することを特徴とする。
Further, in the high-reliability computer system in which the right to use the system bus decides the use request from each processor by the arbitration circuit, the arbitration circuit of the system bus has a triple synchronous operation mode and an individual operation mode. In the triple synchronous operation mode, however, the bus request signals from the three processing units and the three bus bridges, which are expected to have the same operation, are combined into one by the majority circuit, and then the bus arbitration is performed. And means for performing bus arbitration for bus request signals from all processing units and all bus bridges in the individual operation mode, and the two means can be selected by a command from software. It is characterized by having.

【0123】また、同一の演算を実行する3台以上のプ
ロセッサが指令によって異なる演算を実行するモードを
有し、選択回路は各システムバスの出力を競合制御を実
施して逐次的にメモリに出力するモードをもち、またメ
モリからのデータをいずれかのシステムバスに出力する
手段を持つメモリインタフェースユニットを有し、2つ
のメモリは異なるアドレスでアクセスされるメモリであ
るようなモードを有することを特徴とする。
In addition, there is a mode in which three or more processors that execute the same operation execute different operations depending on the command, and the selection circuit sequentially outputs the output of each system bus to the memory by performing contention control. And a memory interface unit having means for outputting data from the memory to any system bus, and the two memories are modes accessed at different addresses. And

【0124】また、外部スイッチや特定アドレスのメモ
リや不揮発性のメモリ素子などにより、システムバスの
動作モードおよび主記憶装置の動作モードを指定する手
段と、ソフトウェアで動作モードおよび主記憶装置の動
作モードを設定する手段を有し、システムの電源投入直
後または、リセット直後に、外部スイッチ情報あるいは
特定アドレスのメモリあるいは不揮発性のメモリの内容
から、システムバスの動作モードまたは、主記憶装置の
動作モードを読み、モード設定に必要な手段により該モ
ードをセットし、それらが完了した後オペレーティング
システムを立ちあげる手順を有することを特徴とする。
Further, means for designating the operation mode of the system bus and the operation mode of the main memory device by an external switch, a memory of a specific address, a non-volatile memory element, etc., and an operation mode and an operation mode of the main memory device by software. Just after the system is powered on or reset, the system bus operating mode or main memory operating mode can be set based on the external switch information, the memory of a specific address, or the contents of the non-volatile memory. It is characterized by having a procedure of reading, setting the mode by means necessary for mode setting, and booting the operating system after they are completed.

【0125】このシステムによれば、CPUの高性能化
のために、プロセッサ、キャッシュメモリ、システムバ
スを一体化して3重化し、それらを同一クロックで同期
動作させる。プロセッサ程高速化が要求されない主記憶
装置は、3重化されたシステムバスとインタフェース装
置で接続される。主記憶装置の信頼性を要求する場合
は、これを2重化する。I/O装置は、I/Oの要求さ
れる性質(信頼性、経済性、汎用性、互換性)などによ
り構成上のバリエーション(I/Oバスの3重化、2重
化、非冗長)がある。
According to this system, in order to improve the performance of the CPU, the processor, the cache memory, and the system bus are integrated and tripled, and they are operated synchronously with the same clock. A main memory device that is not required to be as fast as a processor is connected to a tripled system bus by an interface device. When the reliability of the main storage device is required, this is duplicated. I / O devices have variations in configuration (I / O bus triple, double, non-redundant) due to the required properties of I / O (reliability, economy, versatility, compatibility). There is.

【0126】また、このシステムによれば3重化された
システムバスのうち、障害発生・回復処理を必要とする
プロセッサが接続されているシステムバスを他のシステ
ムバスに追随させることで、障害発生時の信頼性の低下
を回避する構成や回復処理時の性能の低下を回避する構
成をとれる。
Further, according to this system, among the tripled system buses, the system bus to which the processor requiring the failure occurrence / recovery processing is connected follows another system bus, thereby causing the failure occurrence. It is possible to adopt a configuration that avoids a decrease in reliability during time or a configuration that avoids a decrease in performance during recovery processing.

【0127】さらに、このシステムによれば3重化され
たシステムバスおよびそれに接続されたプロセッサを個
別に動作させるモード、2重化された主記憶装置を個別
のアドレス空間として認識できるようにさせるモード、
多重化されたI/Oバスを個別にアクセスできるモード
を持つことで、同一のハードウェアで高性能な計算機シ
ステムが構築できる。
Further, according to this system, the mode in which the triplicated system bus and the processors connected thereto are individually operated, and the mode in which the duplicated main memory device is recognized as an individual address space ,
By having a mode in which the multiplexed I / O buses can be individually accessed, a high-performance computer system can be constructed with the same hardware.

【0128】実施例3.実施例1とは異なる第2階層の
システムバスの構成例を示す。図24に基づいて、以
下、この実施例を説明する。図において、図1と同一符
号は図1と同一又は担当部分を示し、その説明を省略す
る。301、302はバススイッチ、303、304は
第2階層システムバス、311、312は第2階層シス
テムバス303、304の出力を選択する入出力インタ
フェースユニット、321、322は入出力制御装置、
331、332は入出力装置(ディスク、LAN)であ
る。
Example 3. A configuration example of a system bus of a second layer different from that of the first embodiment is shown. This embodiment will be described below with reference to FIG. In the figure, the same reference numerals as those in FIG. 1 indicate the same parts as those in FIG. 301 and 302 are bus switches, 303 and 304 are second-level system buses, 311, and 312 are input / output interface units that select the output of the second-level system buses 303 and 304, 321 and 322 are input / output control devices,
Reference numerals 331 and 332 are input / output devices (disk, LAN).

【0129】CPUからのメモリアクセスに関しては、
実施例1と同等なので説明省略する。ここでは、入出力
装置331、332からのメモリアクセスについて説明
する。この実施例における、第2階層システムバス30
3、304はバス上にパリティなどの障害検知機能を付
加する必要がある。パリティ生成は、バスブリッジまた
はバススイッチおよび入出力インタフェースユニットに
よってなされ、これにより、第2階層システムバスの障
害を入出力インタフェースユニットやバススイッチが検
知し、正しいバスのデータを選択できる。この場合を実
施例1の3重化された第2階層システムバス201、2
02、203と信頼性および経済性を比較すると、実施
例1の3重化バスに比べれば、入出力インタフェースユ
ニットが小型で安価にでき、経済的である(信頼性に関
しては一部の制御線にパリティを付加できなければ、信
頼性上問題が残ることがある)。また、パリティ等のな
い非冗長バスに比べれば、経済的には不利であるが、障
害発生時に障害検知・切り離しによる連続運転ができる
ので信頼性はかなり高いといえる。
Regarding memory access from the CPU,
The description is omitted because it is the same as that of the first embodiment. Here, memory access from the input / output devices 331 and 332 will be described. The second level system bus 30 in this embodiment.
3, 304 need to add a fault detection function such as parity on the bus. The parity generation is performed by the bus bridge or the bus switch and the input / output interface unit, so that the input / output interface unit or the bus switch can detect the fault of the second hierarchy system bus and select the correct data of the bus. In this case, the tripled second layer system buses 201 and 2 of the first embodiment are used.
Comparing reliability and economic efficiency with Nos. 02 and 203, the input / output interface unit can be made smaller and less expensive than the triple bus of the first embodiment, which is economical. If you can not add parity to, there may remain reliability problems). Further, it is economically disadvantageous as compared with a non-redundant bus without parity etc., but it can be said that reliability is considerably high because continuous operation by failure detection / isolation can be performed when a failure occurs.

【0130】ここで、ディスク331から主記憶装置5
0、60へのデータ転送を説明する。ディスク331か
らメモリへのデータ転送要求およびデータは入出力制御
装置321でライトトランザクションになり入出力イン
タフェースユニット311に送られる。入出力インタフ
ェースユニット311は第2階層システムバス303、
304にトランザクション(データを含む)を送出し、
それぞれバススイッチ301、302に到達する。バス
スイッチ301と302のうちの一方がプライマリとな
り、バスブリッジ101、102、103にトランザク
ションを送出し、それぞれ、システムバス1、2、3を
経由して主記憶装置50、60にライトする。もし、第
2階層システムバスに障害があれば、パリティなどのバ
スの障害検知機構によりバススイッチ301、302で
検知され、障害がなかった方がプライマリとなり、バス
ブリッジ101、102、103にトランザクションを
送出する。したがって、第2階層システムバスに障害が
発生してもシステムは停止せず処理を続行できる。
Here, from the disk 331 to the main storage device 5
Data transfer to 0 and 60 will be described. The data transfer request and data from the disk 331 to the memory are converted into a write transaction by the input / output control device 321 and sent to the input / output interface unit 311. The input / output interface unit 311 is a second layer system bus 303,
Send a transaction (including data) to 304,
The bus switches 301 and 302 are reached, respectively. One of the bus switches 301 and 302 becomes the primary, sends the transaction to the bus bridges 101, 102 and 103, and writes the transactions to the main storage devices 50 and 60 via the system buses 1, 2 and 3, respectively. If there is a failure in the second-tier system bus, the failure detection mechanism of the bus such as parity detects it in the bus switches 301 and 302, and the one without failure becomes the primary, and the transaction is sent to the bus bridges 101, 102 and 103. Send out. Therefore, the system can be continued without stopping even if a failure occurs in the second layer system bus.

【0131】逆に主記憶装置50、60からディスク3
31へのデータ転送をする場合について説明する。主記
憶装置50、60のメモリデータのディスク331から
の転送要求は、ライトトランザクションと同じ3つの経
路で主記憶装置50、60に伝わる。プライマリである
主記憶装置50がリードデータをシステムバス1、2、
3に送出し、主記憶装置60は送出しない。リードデー
タは、バススイッチ101、102、103を経由して
バススイッチ301、302に到達し、バススイッチ3
01、302がバススイッチ101〜103からのデー
タを比較し、正しいデータをそれぞれ第2階層システム
バス303、304に送出し、入出力インタフェースユ
ニット311がその両者のデータを受け、正しい方を選
択し、入出力制御装置321に転送する。入出力制御装
置321はメモリからのリードデータをディスク331
に格納する。もし、第2階層システムバス303または
304に障害があれば、パリティなどのバスの障害検知
機構により入出力インタフェースユニット311で検知
され、入出力インタフェースユニット311は障害がな
い方のデータを選択し、入出力制御装置321に転送す
る。したがって、第2階層システムバスに障害が発生し
てもシステムは停止せず処理を続行できる。
On the contrary, from the main memory 50, 60 to the disk 3
A case where data is transferred to 31 will be described. The transfer request for the memory data of the main storage devices 50 and 60 from the disk 331 is transmitted to the main storage devices 50 and 60 through the same three routes as the write transaction. The primary main memory device 50 transfers the read data to the system buses 1, 2,
3 to the main storage device 60, but not to the main storage device 60. The read data reaches the bus switches 301, 302 via the bus switches 101, 102, 103, and the bus switch 3
01 and 302 compare the data from the bus switches 101 to 103 and send the correct data to the second layer system buses 303 and 304, respectively, and the input / output interface unit 311 receives the both data and selects the correct one. , To the input / output control device 321. The input / output control device 321 transfers the read data from the memory to the disk 331.
To store. If there is a failure in the second hierarchical system bus 303 or 304, it is detected by the input / output interface unit 311 by a bus failure detection mechanism such as parity, and the input / output interface unit 311 selects the data having no failure, Transfer to the input / output control device 321. Therefore, the system can be continued without stopping even if a failure occurs in the second layer system bus.

【0132】ここでバススイッチ301の動作を、図2
5に基づいて説明する。図において、101、102、
103はバスブリッジ、303は第2階層システムバス
で、通常バス303aとパリティバス303bから構成
される。301はバススイッチで、セレクタ301a、
比較回路301b、ドライバ素子301c、301d、
301e、パリティチェック回路301f、パリティ生
成回路301g、ドライバ素子301h、プライマリビ
ット301i、他プライマリ要求出力信号301j、自
プライマリ要求入力信号301k、バスモニタ301
l、ドライバ素子301m、バスモニタ301o、AN
D素子301pから構成される。通常は、プライマリビ
ット301iと302i(バススイッチ302のプライ
マリビット)のうち一方が排他的にセットされる。ここ
では、プライマリビット301iがセットされていると
する。
The operation of the bus switch 301 will now be described with reference to FIG.
It will be described based on 5. In the figure, 101, 102,
Reference numeral 103 is a bus bridge, and 303 is a second layer system bus, which is composed of a normal bus 303a and a parity bus 303b. Reference numeral 301 denotes a bus switch, which is a selector 301a,
Comparing circuit 301b, driver elements 301c, 301d,
301e, parity check circuit 301f, parity generation circuit 301g, driver element 301h, primary bit 301i, other primary request output signal 301j, own primary request input signal 301k, bus monitor 301
l, driver element 301m, bus monitor 301o, AN
It is composed of a D element 301p. Normally, one of the primary bits 301i and 302i (the primary bit of the bus switch 302) is exclusively set. Here, it is assumed that the primary bit 301i is set.

【0133】バスブリッジ101、102、103から
第2階層システムバス303、304に送出する信号の
場合、バスブリッジ101、102、103は同期動作
をし、その出力信号が比較回路301bで比較され、正
常動作している出力がセレクタ301aで選択・出力さ
れる。その出力をバスモニタ301lが監視し、通常バ
ス303aに出力すべき信号を判定し、該信号をドライ
バ301hが第2階層システムバスの通常バス303a
に出力する。同時にパリティ信号がパリティ生成回路3
01gで生成され、ドライバ素子301hでパリティバ
ス303bに出力される。この場合バススイッチ301
のペアとなるバススイッチ302も全く同じ動作をする
ので、バススイッチ302により第2階層システムバス
303と304は同期動作をする。
In the case of a signal to be sent from the bus bridges 101, 102, 103 to the second layer system buses 303, 304, the bus bridges 101, 102, 103 perform a synchronous operation and their output signals are compared by the comparison circuit 301b. The normally operating output is selected and output by the selector 301a. The output is monitored by the bus monitor 301l to determine a signal to be output to the normal bus 303a, and the driver 301h detects the signal and outputs the signal to the normal bus 303a of the second layer system bus.
Output to. At the same time, the parity signal is the parity generation circuit 3
01g and is output to the parity bus 303b by the driver element 301h. In this case, bus switch 301
The bus switch 302, which is a pair of, operates exactly the same, so that the second hierarchical system buses 303 and 304 operate synchronously by the bus switch 302.

【0134】一方、第2階層システムバス303、30
4からバスブリッジ101、102、103に送出する
信号の場合、第2階層システムバス303、304は同
期動作をしているので、バススイッチ301と302は
同期動作をしている。バスモニタ301oはバストラン
ザクションを監視し、バススイッチ101、102、1
03に送出すべき信号がある場合、パリティ信号303
bと通常バス303aの信号をパリティチェック回路3
01fがチェックし、第2階層システムバス303の正
当性をチェックする。もし、誤りがなければ、プライマ
リビット301iはセットされたままなので301oか
らの出力制御信号がAND素子301pを経由してドラ
イバ301c、301d、301eに伝えられる。そこ
で、通常バス303aの信号をドライバ301c、30
1d、301eが出力し、バススイッチ101、10
2、103が受信する。誤りがあれば、プライマリビッ
ト301iはリセットされ、バススイッチ301は第2
階層システムバス303の信号を出力しない。同時に他
プライマリ要求信号301jが出力され、ペアのバスス
イッチ302は自プライマリ要求入力信号302kとし
て入力され、プライマリビット302iがセットされ、
第2階層システムバス304に誤りがなければ、その信
号を出力し、バススイッチ101、102、103が受
信する。
On the other hand, the second layer system buses 303, 30
In the case of a signal to be sent from 4 to the bus bridges 101, 102, 103, since the second layer system buses 303, 304 are in synchronous operation, the bus switches 301 and 302 are in synchronous operation. The bus monitor 301o monitors the bus transaction, and the bus switches 101, 102, 1
03, if there is a signal to be sent, the parity signal 303
b and the signal of the normal bus 303a are checked by the parity check circuit 3
01f checks the validity of the second layer system bus 303. If there is no error, since the primary bit 301i remains set, the output control signal from 301o is transmitted to the drivers 301c, 301d and 301e via the AND element 301p. Therefore, the signals of the normal bus 303a are transmitted to the drivers 301c, 30
1d and 301e output, bus switch 101, 10
2, 103 receives. If there is an error, the primary bit 301i is reset and the bus switch 301 is set to the second
No signal is output from the hierarchical system bus 303. At the same time, the other primary request signal 301j is output, the paired bus switch 302 is input as its own primary request input signal 302k, and the primary bit 302i is set,
If there is no error in the second layer system bus 304, that signal is output and the bus switches 101, 102 and 103 receive it.

【0135】ここで、入出力インタフェースユニット3
11の動作について、図26に基づいて説明する。図に
おいて、303aは第1の第2階層システムバスの通常
バス、303bは同パリティバス、304aは第2の第
2階層システムバスの通常バス、304bは同パリティ
バス、311aはセレクタ、311bはパリティチェッ
ク回路、311c、311dはパリティ生成回路、31
1fはドライバ素子、311gはバスモニタ、321は
入出力制御装置である。
Here, the input / output interface unit 3
The operation 11 will be described with reference to FIG. In the figure, 303a is a normal bus of the first second hierarchy system bus, 303b is the same parity bus, 304a is a normal bus of the second second hierarchy system bus, 304b is the same parity bus, 311a is a selector, 311b is parity. Check circuits 311c and 311d are parity generation circuits, 31
1f is a driver element, 311g is a bus monitor, and 321 is an input / output control device.

【0136】図において、第2階層のシステムバス30
3、304は、同期動作をしていて第2階層のシステム
バス、303、304から入出力制御装置321へ向う
信号は、比較回路311bで両第2階層システムバスの
パリティをチェックし正常動作している第2階層システ
ムバスを判定し、セレクタ311aで選択し出力する。
バスモニタ311eによりバストランザクションを監視
し、入出力制御装置321へ送出すべき信号を判定し、
該信号をドライバ素子311fが入出力制御装置321
に送出する。入出力制御装置321から第2階層システ
ムバス303、304へ向う信号は、バスモニタ311
gが監視し、送出すべき信号を判定し、該信号をドライ
バ211h、211iを経由して通常バス303a、3
04aに送出する。同時にパリティ生成回路311c、
311dでパリティデータが生成されパリティバス30
3b、304bに送出される。
In the figure, the system bus 30 of the second layer
Reference numerals 3 and 304 indicate a synchronous operation of the system bus of the second layer, and signals from 303 and 304 to the input / output control unit 321 are checked by the comparison circuit 311b for parity of both system buses of the second layer to operate normally. The second-tier system bus that is operating is determined, and the selector 311a selects and outputs it.
The bus monitor 311e monitors the bus transaction and determines the signal to be sent to the input / output control device 321.
The driver element 311f outputs the signal to the input / output control device 321.
Send to. A signal sent from the input / output control device 321 to the second hierarchical system buses 303 and 304 is a bus monitor 311.
g monitors the signal, determines the signal to be transmitted, and sends the signal via the drivers 211h and 211i to the normal bus 303a, 3b.
04a. At the same time, the parity generation circuit 311c,
Parity data is generated at 311d and the parity bus 30 is generated.
3b, 304b.

【0137】以上のように、この実施例は、各プロセッ
シングユニットは同一の演算を実行する3台以上のプロ
セッサで構成され、上記プロセッサはバスインタフェー
スユニットによりシステムバスに個別に接続され、これ
らシステムバスに接続される同一の動作を実行する3台
以上のバスブリッジを有し、上記3つバスブリッジのう
ちいずれか一つの出力を選択する2つの選択回路、選択
された出力を第2階層システムバスに出力し、また、第
2階層システムバスからの信号を3台のバスブリッジに
送出する2つの第2階層システムバスインタフェースユ
ニットを有することを特徴とする。
As described above, in this embodiment, each processing unit is composed of three or more processors that execute the same operation, and the processors are individually connected to the system bus by the bus interface unit. Which have three or more bus bridges that perform the same operation and are connected to each other, and two selection circuits that select one of the outputs of the three bus bridges, and the selected output is a second hierarchical system bus. And two second layer system bus interface units for outputting the signals from the second layer system bus to three bus bridges.

【0138】実施例4.実施例1で示した主記憶装置
は、信頼性の点で、次の問題点がある。メモリライト時
にメモリデータバス51aのデータを使用して、ECC
生成回路52bがECCを生成するが、セレクタ53a
からECC生成回路52bまでのパスでメモリデータバ
ス51aに障害があった場合、変更された不正なデータ
に対してECC生成回路52bはECCを生成してしま
い、そのデータをリードする時にはECCチェック回路
52cでデータのエラーを検知できない。従って、その
主記憶装置がプライマリであれば誤ったデータをそのま
ま3重化システムバスに出力してしまう。また、メモリ
リード時には、本主記憶装置がプライマリの場合、メモ
リデータバス51a上のECCチェック回路52cがデ
ータを取り込む地点からシステムバス1、2、3に分岐
する地点の間で障害があった場合、ECCチェック回路
52cがエラーを検知していない正しいデータが変更さ
れ、不正なデータとしてシステムバス1、2、3に送出
されてしまう。このようなことが起れば、システムが誤
動作してしまう。
Example 4. The main storage device shown in the first embodiment has the following problems in terms of reliability. When the memory is written, the data on the memory data bus 51a is used to
The generation circuit 52b generates the ECC, but the selector 53a
If there is a failure in the memory data bus 51a on the path from to the ECC generation circuit 52b, the ECC generation circuit 52b will generate ECC for the changed illegal data, and when reading the data, the ECC check circuit Data error cannot be detected at 52c. Therefore, if the main storage device is the primary memory, erroneous data will be output to the triple system bus as it is. Further, at the time of memory read, when the main storage device is a primary memory and there is a failure between the point where the ECC check circuit 52c on the memory data bus 51a takes in the data and the point where the system bus 1, 2, 3 branches. , The ECC check circuit 52c has not detected an error, the correct data is changed and is sent to the system buses 1, 2, and 3 as invalid data. If this happens, the system will malfunction.

【0139】そこで別の実施例として、選択回路を実施
例1で示したものより高性能化、高信頼化した例を図2
7に示す。図において、メモリアレイブロック51は、
メモリデータバス51a、ECCデータバス51b、メ
モリアレイ51c、ECCアレイ51dから構成され
る。メモリインタフェースユニット52は、メモリ制御
回路52a、プライマリビット52d、AND素子52
e、他プライマリ要求出力線52f、自プライマリ要求
入力線52g、ECCチェック回路52h、52i、5
2j、OR素子52n、メモリデータバスドライバ52
k、52l、52mから構成される。インタフェースユ
ニット53は、セレクタ53a、比較回路53b、シス
テムバスドライバ53c、53d、53e、ECC生成
回路53f、53g、53h、セレクタ53iから構成
される。プライマリビット52dは、その主記憶装置が
プライマリでリードデータをドライブすることを示すビ
ットであり、主記憶装置50、60で2重化された主記
憶装置の一方のプライマリビットがプラマリとしてセッ
トされており、もう一方のプライマリビットはセカンダ
リとしてセットされていない。この例では、主記憶装置
50がプライマリなので、プライマリビット52dはセ
ットされていて、主記憶装置60の同等のビット(図に
はないが62dとする)はセットされていないものとす
る。
Therefore, as another embodiment, an example in which the selection circuit has higher performance and higher reliability than those shown in the first embodiment is shown in FIG.
7 shows. In the figure, the memory array block 51 is
It is composed of a memory data bus 51a, an ECC data bus 51b, a memory array 51c, and an ECC array 51d. The memory interface unit 52 includes a memory control circuit 52a, a primary bit 52d, an AND element 52.
e, other primary request output line 52f, own primary request input line 52g, ECC check circuits 52h, 52i, 5
2j, OR element 52n, memory data bus driver 52
It is composed of k, 52l and 52m. The interface unit 53 includes a selector 53a, a comparison circuit 53b, system bus drivers 53c, 53d, 53e, ECC generation circuits 53f, 53g, 53h, and a selector 53i. The primary bit 52d is a bit indicating that the main storage device is the primary and drives read data. One primary bit of the main storage device duplicated in the main storage devices 50 and 60 is set as a primary. And the other primary bit is not set as secondary. In this example, since the main storage device 50 is the primary storage device, the primary bit 52d is set and the equivalent bit of the main storage device 60 (not shown, 62d) is not set.

【0140】システムバス1、2、3よりシステムバス
の動作が53b比較回路で比較され、正常動作している
バスの出力がセレクタ53aで選択され、メモリデータ
バス51aに出力される。同時にECC生成回路53
f、53g、53hがシステムバス1、2、3のデータ
よりECCデータを生成し、正常動作しているバスのデ
ータから生成されたECCデータがセレクタ53iによ
り選択され、ECCデータバス51bに出力される。メ
モリ制御回路52aはバストランザクションを解析し、
自メモリへのアクセス(リードまたはライト)であれ
ば、以下の動作を行う。
The operation of the system buses from the system buses 1, 2 and 3 is compared by the 53b comparison circuit, and the output of the bus which is operating normally is selected by the selector 53a and output to the memory data bus 51a. At the same time, the ECC generation circuit 53
f, 53g, and 53h generate ECC data from the data of the system buses 1, 2, and 3, and the ECC data generated from the data of the bus that is operating normally is selected by the selector 53i and output to the ECC data bus 51b. It The memory control circuit 52a analyzes the bus transaction,
If it is an access (read or write) to its own memory, the following operation is performed.

【0141】メモリライト時は、メモリ制御回路52a
がメモリデータバス51a上のデータをメモリアレイ5
1cにライトするべく制御を行い、データはメモリアレ
イ51cに格納される。同時に、ECCデータバス51
b上のECCデータをECCアレイ51dにメモリ制御
回路52aの制御により格納する。実施例1に比べ、E
CCデータデバイス53bによる障害検知とECC生成
回路53f、53g、53hによるECC生成が同時
に、また、メモリアレイ51cとECCアレイ51dへ
の書込みが同時にできるため、メモリライト動作が短い
時間で完了する。この様子を図28に示す。また、EC
Cを生成するためのデータを51aとは別のシステムバ
ス1、2、3から直接取っているので、メモリデータバ
ス51aが障害を発生して、不正データをメモリアレイ
51cにライトしたら、リード時にECCエラーとして
検出できる。また、ECC生成回路53f、53g、5
3hの近辺のバスが障害を発生した場合は、セレクタ5
3iで不正なECCコードが選択されECCアレイ51
dにライトされるが、やはりリード時にそれを検知でき
る。
At the time of memory write, the memory control circuit 52a
Stores data on the memory data bus 51a in the memory array 5
Control is performed to write to 1c, and the data is stored in the memory array 51c. At the same time, the ECC data bus 51
The ECC data on b is stored in the ECC array 51d under the control of the memory control circuit 52a. Compared with Example 1, E
Since the failure detection by the CC data device 53b and the ECC generation by the ECC generation circuits 53f, 53g, and 53h can be performed at the same time, and the writing to the memory array 51c and the ECC array 51d can be performed at the same time, the memory write operation is completed in a short time. This state is shown in FIG. Also, EC
Since the data for generating C is directly taken from the system buses 1, 2, and 3 different from 51a, if the memory data bus 51a fails and the illegal data is written to the memory array 51c, at the time of reading. It can be detected as an ECC error. Further, the ECC generation circuits 53f, 53g, 5
If a bus near 3h fails, the selector 5
An incorrect ECC code is selected in 3i and the ECC array 51 is selected.
Although written in d, it can still be detected at the time of reading.

【0142】メモリリード時は、メモリ制御回路52a
がメモリアレイ51c、ECCアレイ51d内の所望の
アドレスのデータをリードすべく制御を行い、メモリデ
ータはメモリデータバス51aに、ECCデータはEC
Cデータバス51bに出力される。これらのデータはメ
モリデータバスドライバ52k、52l、52mを経由
した後、ECCチェック回路52h、52i、52jに
より正当性をチェックされる。ECCチェック回路52
h、52i、52jのいずれかがECC2ビットエラー
を検知すると、それらの出力がOR素子を経由してプラ
イマリビット52dをリセットする。データが正当であ
れば、プライマリビット52dの内容は変化せずセット
されたままである。従って、システムバスドライバ53
c、53d、53eは、AND素子52eを経由したメ
モリ制御回路52aの制御により、メモリデータバス5
1a上のメモリデータを、システムバス1、2、3に出
力する。このようにしているので、メモリアレイブロッ
ク51、メモリインタフェースユニット52、インタフ
ェースユニット53内のデータパスの1点の障害は、E
CCチェック回路52h、52i、52jで検知される
か、検知されなくとも誤って不正データを送出するのは
システムバス1、2、3のうち一本に限られ、システム
の誤動作は回避できる。
At the time of memory read, the memory control circuit 52a
Performs control to read data at a desired address in the memory array 51c and the ECC array 51d. Memory data is stored in the memory data bus 51a and ECC data is stored in the EC
It is output to the C data bus 51b. These data are passed through the memory data bus drivers 52k, 52l, 52m and then checked for validity by the ECC check circuits 52h, 52i, 52j. ECC check circuit 52
When any of h, 52i, and 52j detects an ECC2 bit error, those outputs reset the primary bit 52d via an OR element. If the data is valid, the content of the primary bit 52d remains unchanged and remains set. Therefore, the system bus driver 53
c, 53d, and 53e are controlled by the memory control circuit 52a via the AND element 52e so that the memory data bus 5
The memory data on 1a is output to the system buses 1, 2, and 3. Since this is done, the failure at one point of the data path in the memory array block 51, the memory interface unit 52, and the interface unit 53 is E
Only one of the system buses 1, 2 and 3 can detect incorrect data even if it is detected by the CC check circuits 52h, 52i and 52j, or if it is not detected, the system malfunction can be avoided.

【0143】以上のように、この実施例は、メモリデー
タの正当性のチェックコードの生成手段を3重化し、3
つのシステムバスのそれぞれに接続し、システムバスの
比較回路の出力により、それらのうち1つを選択し、格
納する機能を有することを特徴とする。また、チェック
コードによるメモリデータの正当性のチェック手段を3
重化し、3重化システムバスへのデータパスのそれぞれ
に接続したことを特徴とする。
As described above, in this embodiment, the means for generating the check code for the validity of the memory data is tripled, and the check code generation means is tripled.
It is characterized in that it is connected to each of the two system buses and has a function of selecting and storing one of them according to the output of the comparison circuit of the system bus. In addition, 3 means for checking the validity of the memory data by the check code are provided.
It is characterized in that it is connected to each of the data paths to the redundant and triple system buses.

【0144】実施例5.更に、別の実施例として、複数
のプロセッサを1チップに封入した例を図29に示す。
図において、1はシステムバス、41は2つのプロセッ
サが封入されているLSIで、内部にプロセッサ11と
12を有し、41aはプロセッサ11のリセット信号、
41bはプロセッサ12のリセット信号、41cはプロ
セッサ11のシステムバス要求信号、41dはプロセッ
サ12のシステムバス要求信号、41eは11のシステ
ムバス使用許可信号、41fはプロセッサ12のシステ
ムバス使用許可信号、41gはプロセッサ11および1
2に対するその他の入出力信号でアドレス、データ、制
御線を含む。42はバスインタフェースユニット、42
a〜42hはドライバ素子、42iは出力イネーブル信
号、42jはプロセッサ11のリセット信号、42kは
プロセッサ12リセット信号である。
Example 5. Further, as another embodiment, FIG. 29 shows an example in which a plurality of processors are enclosed in one chip.
In the figure, 1 is a system bus, 41 is an LSI in which two processors are enclosed, and has processors 11 and 12 inside, 41a is a reset signal of the processor 11,
41b is a reset signal of the processor 12, 41c is a system bus request signal of the processor 11, 41d is a system bus request signal of the processor 12, 41e is a system bus use permission signal of 11, 41f is a system bus use permission signal of the processor 12, 41g Are processors 11 and 1
Other input / output signals for 2 include address, data and control lines. 42 is a bus interface unit, 42
a to 42h are driver elements, 42i is an output enable signal, 42j is a reset signal for the processor 11, and 42k is a processor 12 reset signal.

【0145】動作について説明する。プロセッサ11、
12は個別に演算を行い、システムバス1を使用する要
求が発生したら、それぞれシステムバス要求信号41
c、41dをアービトレーション回路に送出し、それが
アービトレーション回路からそれぞれシステムバス使用
許可信号41e、41fを受信すると入出力信号41g
を用いてドライバ42a、42bを経由してシステムバ
ス1を使用する。ここで、システムバス11を使用する
のはアービトレーション回路によってプロセッサ11、
12のうちの一方に限られるから、リセット、システム
バス要求、システムバス使用許可信号以外の信号は一度
に一方しか使わないので、共通にできる。一方、システ
ムバス要求、システムバス使用許可信号はバスの使用者
を外部回路に明確にするため共通にしない。また、リセ
ットも、プロセッサごとにリセットをかけられるよう共
通にしない。
The operation will be described. Processor 11,
12 performs individual calculations, and when a request to use the system bus 1 is generated, the system bus request signal 41
c and 41d are sent to the arbitration circuit, and when they receive the system bus use permission signals 41e and 41f from the arbitration circuit, respectively, the input / output signal 41g.
To use the system bus 1 via the drivers 42a and 42b. Here, the system bus 11 is used by the arbitration circuit by the processor 11,
Since it is limited to one of 12, only one signal other than reset, system bus request, and system bus use permission signal is used at a time, so that they can be commonly used. On the other hand, the system bus request and the system bus use permission signal are not common to clarify the user of the bus to the external circuit. Also, the reset is not common so that it can be reset for each processor.

【0146】プロセッサ毎にリセット、バスの使用権を
明確に区別することによって、システムが実行中に一方
のプロセッサが停止していても、もう一方のプロセッサ
は追随モードで処理を同期実行することができる。従っ
て、プロセッシングユニットの再同期処理によるリセッ
ト、初期化処理による通常処理の中断は、一度には一つ
のプロセッサの実行中断に限られ、性能低下は少なく押
えられる。
By clearly distinguishing the reset and bus usage rights for each processor, even if one processor is stopped while the system is running, the other processor can execute the processing synchronously in the follow-up mode. it can. Therefore, the reset of the processing unit due to the resynchronization processing and the interruption of the normal processing due to the initialization processing are limited to the interruption of the execution of one processor at a time, and the performance degradation can be suppressed.

【0147】以上のように、この実施例は、第1と第
4、第2と第5、第3と第6ののプロセッサをそれぞれ
同一チップに封入し、同一チップ内と言えども、プロセ
ッサ毎にチップ外部からリセットが入力でき、プロセッ
サ毎にチップ外部からプロセッサの停止を制御する手段
を有し、外部へのシステムバスの使用要求出力およびそ
の返答であるバス使用許可入力は、プロセッサごとに制
御可能であることを特徴とする。
As described above, according to this embodiment, the first and fourth processors, the second and fifth processors, and the third and sixth processors are enclosed in the same chip, and even if they are in the same chip, each processor is A reset can be input from outside the chip to each processor, and each processor has a means to control the stop of the processor from outside the chip. The system bus use request output to the outside and the bus use permission input that is the response are controlled per processor. It is characterized by being possible.

【0148】このように、複数のプロセッサを一部の入
力信号(リセット、バス許可信号)をプロセッサ毎に分
離し、それ以外の信号線を共通化して一つのLSIに封
入することで、少ないI/Oピンで高性能なチップを実
現できる。
As described above, by separating a part of the input signals (reset, bus enable signal) of a plurality of processors for each processor and commonizing the other signal lines and enclosing them in one LSI, a small number of I High-performance chips can be realized with / O pins.

【0149】また、複数プロセッサを1チップに封入
し、大部分の入出力信号を共通のピンにすることで、同
一性能を得るのに少ない部品数、少ないピン数で実現さ
れ、信頼性が向上する。
Further, by enclosing a plurality of processors in one chip and using most of the input / output signals as common pins, it is possible to realize the same performance with a small number of parts and a small number of pins, and the reliability is improved. To do.

【0150】実施例6.更に、この発明の別の実施例を
図に基づいて説明する。図30において、1、2、3、
4は4重化されたシステムバスである。10はプロセッ
シングユニット、11、12、13、14はプロセッシ
ングユニット10を構成する4重化されたプロセッサ
で、バスインタフェースユニット15、16、17、1
8を経由してそれぞれシステムバス1、2、3、4に接
続されている。20も同様にプロセッシングユニットで
あり、21、22、22、24はプロセッサ、25、2
6、26、27はバスインタフェースユニットである。
50は主記憶装置であり、51はメモリアレイブロッ
ク、52はメモリインタフェースユニット、53は4つ
のシステムバスの出力を一つ選択する選択回路である。
60も同様に主記憶装置であり、61はメモリアレイ、
62はメモリ制御回路、63は選択回路である。90は
システムバスの使用者を決定するアービトレーション回
路、101、102、103、104はシステムバスと
第2層システムバスを接続するバスブリッジ、110は
4重化されたバスブリッジの出力の内何れか一つを選択
する第2階層システムバスインタフェースユニット、1
05は第2階層システムバスである。111、112、
113は、第2階層システムバス105に接続される入
出力制御装置、121、122、123はそれぞれ、入
出力制御装置111、112、113に接続される入出
力装置である。
Example 6. Further, another embodiment of the present invention will be described with reference to the drawings. In FIG. 30, 1, 2, 3,
Reference numeral 4 is a quadruple system bus. Reference numeral 10 is a processing unit, and 11, 12, 13, and 14 are quadruple processors constituting the processing unit 10, and bus interface units 15, 16, 17, 1,
8 are connected to the system buses 1, 2, 3, and 4, respectively. Similarly, 20 is a processing unit, and 21, 22, 22, and 24 are processors, 25, and 2.
Reference numerals 6, 26 and 27 are bus interface units.
50 is a main memory device, 51 is a memory array block, 52 is a memory interface unit, and 53 is a selection circuit for selecting one of the four system bus outputs.
Similarly, 60 is a main memory, 61 is a memory array,
62 is a memory control circuit, and 63 is a selection circuit. 90 is an arbitration circuit that determines the user of the system bus, 101, 102, 103 and 104 are bus bridges that connect the system bus and the second layer system bus, and 110 is one of the outputs of the quadrupled bus bridge. Second layer system bus interface unit to select one, 1
Reference numeral 05 is a second layer system bus. 111, 112,
Reference numeral 113 is an input / output control device connected to the second hierarchical system bus 105, and reference numerals 121, 122 and 123 are input / output devices connected to the input / output control devices 111, 112 and 113, respectively.

【0151】続いて、動作について説明する。正常動作
時には、プロセッサ11、12、13、14は同じ演算
を実行し、プロセッサ21、22、23、24も同じ演
算を実行し、バスブリッジ101、102、103、1
04は同じ処理を行い、従って、システムバス1、2、
3、4は同じ動作を行う。
Next, the operation will be described. During normal operation, the processors 11, 12, 13, 14 perform the same operation, the processors 21, 22, 23, 24 also perform the same operation, and the bus bridges 101, 102, 103, 1
04 performs the same processing, and therefore the system buses 1, 2,
3 and 4 perform the same operation.

【0152】一つのプロセッサ(例えばプロセッサ1
1)に障害が発生した場合、システムバス11の動作が
他の3者と異なり、選択回路53、63および第2階層
システムバスインタフェースユニット110は、障害を
発生したシステムバス1を選択せず、システムは正常実
行を続けられる。つまり、プロセッサ12、13、14
は同じ演算が継続でき、プロセッサ22、23、24も
同じ演算が継続でき、バスブリッジ102、103、1
04も同じ演算が継続でき、従って、システムバス2、
3、4は同じ動作を継続する。
One processor (eg processor 1
When a failure occurs in 1), the operation of the system bus 11 is different from the other three, and the selection circuits 53 and 63 and the second hierarchical system bus interface unit 110 do not select the system bus 1 in which the failure has occurred. The system can continue to run normally. That is, the processors 12, 13, 14
Can continue the same operation, the processors 22, 23, 24 can also continue the same operation, and the bus bridges 102, 103, 1
The same calculation can be continued in 04, so that the system bus 2,
3 and 4 continue the same operation.

【0153】この状態で、オペレータや保守員によって
プロセッサ11が交換されるのを待つ。この間、通常は
数時間から1日程度が望ましいが、場合によっては、数
日程度待たねばならないこともありうる。この間に別の
プロセッサが更に故障する可能性もある。しかし、この
場合もシステムバスは3重化同期動作をしているので、
その故障を選択回路53、63、第2階層システムバス
インタフェースユニット110は正しく検知し、切り離
す(即ち選択しないということ)ことができ、システム
は正常に動作を続けることができる。
In this state, the operator or maintenance staff waits for the processor 11 to be replaced. During this period, it is usually desirable to have several hours to one day, but in some cases, it may be necessary to wait for several days. During this time, another processor may further fail. However, in this case as well, the system bus is operating in triple synchronization,
The failure can be correctly detected by the selection circuits 53 and 63 and the second hierarchical system bus interface unit 110 and can be disconnected (that is, not selected), and the system can continue to operate normally.

【0154】プロセッサ11が交換されたあと、システ
ムバス1を追随モードにし、他のシステムバス2、3、
4と同じ動作をさせ、続いて、プロセッサ11、12、
13、14を同時にリセット・初期化し、内部状態を合
わせ、同様に、プロセッサ21、22、23、24を同
時にリセット・初期化し、内部状態を合わせ、システム
バス1の追随モードを解除し、システムは正常実行状態
にもどる。
After the processor 11 is replaced, the system bus 1 is set to the follow-up mode and the other system buses 2, 3,
4 and then the processors 11, 12,
13 and 14 are reset / initialized at the same time to match the internal states, similarly, the processors 21, 22, 23 and 24 are reset / initialized at the same time to match the internal states, and the tracking mode of the system bus 1 is released. Return to the normal execution state.

【0155】上記に示すようにシステムバスを4重化す
ることによって、1つのプロセッサに障害が発生して
も、プロセッサの交換作業が完了するまで、システムバ
スを3重化同期動作させることで、各選択回路はいわゆ
る多数決による正常バスの判定ができ、もう一つの別の
プロセッサの障害に対しても正しく障害を検知、切り離
しができる。従って、障害発生時に性能も信頼性も低下
させない構成が可能である。
By quadrupling the system bus as described above, even if one processor fails, the system bus is tripled and synchronized until the replacement of the processor is completed. Each selection circuit can determine a normal bus by a so-called majority vote, and can correctly detect and isolate a failure even with respect to the failure of another processor. Therefore, it is possible to realize a configuration in which performance and reliability are not deteriorated when a failure occurs.

【0156】実施例7.この構成で、別の動作例につい
て説明する。図30において、正常動作時には、プロセ
ッサ11、12、13は同じ演算を実行し、プロセッサ
21、22、23も同じ演算を実行し、バスブリッジ1
01、102、103は同じ処理を行い、従って、シス
テムバス1、2、3は同じ動作を行う。プロセッサ1
4、24およびバスブリッジ104は予備用として、停
止している。従って、プロセッサ14、24、バスブリ
ッジ104の動作時に比べて消費電力は少なくなる。
Example 7. With this configuration, another operation example will be described. 30, in normal operation, the processors 11, 12, and 13 execute the same operation, and the processors 21, 22, and 23 also execute the same operation, and the bus bridge 1
01, 102, 103 perform the same processing, and therefore the system buses 1, 2, 3 perform the same operation. Processor 1
4, 24 and the bus bridge 104 are stopped as spares. Therefore, the power consumption is smaller than when the processors 14 and 24 and the bus bridge 104 are operating.

【0157】一つのプロセッサ(例えばプロセッサ1
1)に障害が発生した場合、システムバス11の動作が
他の2者と異なり、選択回路53、63および第2階層
システムバスインタフェースユニット110は、障害を
発生したシステムバス1を選択せず、システムは正常実
行を続けられる。つまり、プロセッサ12、13は同じ
演算が継続でき、プロセッサ22、23も同じ演算が継
続でき、バスブリッジ102、103も同じ演算が継続
でき、従って、システムバス2、3は同じ動作を継続す
る。
One processor (eg processor 1
When a fault occurs in 1), the operation of the system bus 11 is different from the other two, and the selection circuits 53 and 63 and the second hierarchical system bus interface unit 110 do not select the faulty system bus 1, The system can continue to run normally. That is, the processors 12 and 13 can continue the same operation, the processors 22 and 23 can also continue the same operation, and the bus bridges 102 and 103 can also continue the same operation, so that the system buses 2 and 3 continue the same operation.

【0158】プロセッサ11、21、バスブリッジ10
1を停止したあと、プロセッサ14、24、バスブリッ
ジ104を動作開始させ(ここでは、他のプロセッサと
の同期動作はしていない)、続いて、システムバス4を
追随モードにし、他のシステムバス2、3と同じ動作を
させる。プロセッサ12、13、14を同時にリセット
・初期化し、内部状態を合わせ、同様に、プロセッサ2
2、23、24を同時にリセット・初期化し、内部状態
を合わせ、システムバス4の追随モードを解除し、シス
テムはシステムバス2、3、4の3重化同期実行状態に
なる。
Processors 11 and 21, bus bridge 10
1 is stopped, then the processors 14 and 24 and the bus bridge 104 are started to operate (here, the synchronous operation with other processors is not performed), and then the system bus 4 is set to the follow-up mode and the other system bus Do the same operation as a few. The processors 12, 13 and 14 are reset and initialized at the same time to adjust the internal states, and the processor 2
2, 23, 24 are reset / initialized at the same time, the internal states are matched, the follow-up mode of the system bus 4 is released, and the system enters the triplex synchronous execution state of the system buses 2, 3, 4.

【0159】この状態で、オペレータや保守員によって
プロセッサ11が交換されるのを待つ。この間、通常は
数時間から1日程度が望ましいが、場合によっては、数
日程度待たねばならないこともありうる。この間に別の
プロセッサが更に故障する可能性もある。しかし、この
場合もシステムバスは3重化同期動作をしているので、
その故障を選択回路53、63、第2階層システムバス
インタフェース110は正しく検知し、切り離す(即ち
選択しないということ)ことができ、システムは正常に
動作を続けることができる。
In this state, the operator or maintenance staff waits for the processor 11 to be replaced. During this period, it is usually desirable to have several hours to one day, but in some cases, it may be necessary to wait for several days. During this time, another processor may further fail. However, in this case as well, the system bus is operating in triple synchronization,
The failure can be correctly detected by the selection circuits 53 and 63 and the second layer system bus interface 110, and can be disconnected (that is, not selected), and the system can continue to operate normally.

【0160】プロセッサ11が交換されたあと、プロセ
ッサ14、24、バスブリッジ104を停止させ、続い
て、プロセッサ11、21、バスブリッジ101を動作
開始させる。続いて、システムバス1を追随モードに
し、他のシステムバス2、3と同じ動作をさせ、続い
て、プロセッサ11、12、13を同時にリセット・初
期化し、内部状態を合わせ、同様に、プロセッサ21、
22、23を同時にリセット・初期化し、内部状態を合
わせ、システムバス1の追随モードを解除し、システム
は元の正常実行状態にもどる。
After the processor 11 is replaced, the processors 14 and 24 and the bus bridge 104 are stopped, and then the processors 11 and 21 and the bus bridge 101 are started to operate. Subsequently, the system bus 1 is set to the follow-up mode, the same operation as that of the other system buses 2 and 3 is performed, and then the processors 11, 12, and 13 are simultaneously reset / initialized, the internal states are adjusted, and similarly, the processor 21 ,
22 and 23 are reset and initialized at the same time, the internal states are matched, the follow-up mode of the system bus 1 is released, and the system returns to the original normal execution state.

【0161】上記に示すようにシステムバスを4重化
し、そのうち3本を同期動作させ、一本を予備とするこ
とによって、1つのプロセッサに障害が発生しても、プ
ロセッサの交換作業が完了するまで、システムバスを3
重化同期動作させることで、各選択回路はいわゆる多数
決による正常バスの判定ができ、もう一つの別のプロセ
ッサの障害に対しても正しく障害を検知、切り離しがで
きる。従って、障害発生時に性能も信頼性も低下させな
い構成が可能である。しかも、通常システムバス3本分
しか動作していないので、実施例5に比べて消費電力が
少なくて済み、また容量の小さい電源で済むので経済的
に有利である。
As described above, the system bus is quadrupled, three of them are operated synchronously, and one of them is spare, so that even if one processor fails, the replacement work of the processor is completed. Up to 3 system buses
By performing the redundant synchronous operation, each selection circuit can determine a normal bus by a so-called majority vote, and can correctly detect and disconnect the failure even for the failure of another processor. Therefore, it is possible to realize a configuration in which performance and reliability are not deteriorated when a failure occurs. Moreover, since only three system buses are normally operated, the power consumption is smaller than that in the fifth embodiment, and a power source having a small capacity is sufficient, which is economically advantageous.

【0162】以上のように、この実施例は、前記システ
ムバスは第1、第2、第3、第4のシステムバスから構
成され、同一の動作を行い、前記各プロセッシングユニ
ットは第1、第2、第3、第4のプロセッサを備えて、
同一の演算を実行しており、第1のプロセッサは第1の
システムバスに、第2のプロセッサは第2のシステムバ
スに、第3のプロセッサは第3のシステムバスに、第4
のプロセッサは第4のシステムバスそれぞれ接続されて
おり、同様に第5のプロセッサは第1のシステムバス
に、第6のプロセッサは第2のシステムバスに、第7の
プロセッサは第3のシステムバスに、第8のプロセッサ
は第4のシステムバスにれぞれ接続されており、同一シ
ステムバスに接続されるプロセッサ(第1と第5、第2
と第6、第3と第7、第4と第8)が一つのオンライン
交換単位である高信頼計算機システムにおいて、第1の
プロセッサが故障した場合、第2と第6、第3と第7、
第4と第8のそれぞれのプロセッサが同期動作を継続す
る機能を有し、第1と第5のプロセッサを含む交換単位
を、第2と第6、第3と第7、第4と第8のプロセッサ
を動作させながら交換したあと、第1のシステムバスを
第2または第3または第4のシステムバスに追随動作が
できる機能を有し、第1のプロセッサの動作を、第2ま
たは第3または第4のプロセッサの動作にあわせ、続い
て、第5のプロセッサの動作を、第6または第7または
第8のプロセッサの動作にあわせることを特徴とする。
As described above, in this embodiment, the system bus is composed of the first, second, third and fourth system buses, performs the same operation, and each processing unit has the first and second processing buses. With second, third and fourth processors,
Performing the same operation, the first processor is on the first system bus, the second processor is on the second system bus, the third processor is on the third system bus, and the fourth processor is on the fourth system bus.
Are connected to the fourth system bus, similarly, the fifth processor is connected to the first system bus, the sixth processor is connected to the second system bus, and the seventh processor is connected to the third system bus. In addition, the eighth processor is connected to the fourth system bus respectively, and the processors (first, fifth, and second) connected to the same system bus are connected.
And 6th, 3rd and 7th, 4th and 8th) are one online exchange unit, and in the case of a failure of the 1st processor, the 2nd and 6th, 3rd and 7th ,
Each of the fourth and eighth processors has a function of continuing the synchronous operation, and an exchange unit including the first and fifth processors is referred to as a second and a sixth, a third and a seventh, and a fourth and an eighth. Has a function of following the first system bus with the second, third, or fourth system bus after replacing the first processor with the second processor or the third system bus. Alternatively, the operation of the fifth processor is subsequently adjusted to the operation of the fourth processor, and the operation of the fifth processor is then adjusted to the operation of the sixth, seventh, or eighth processor.

【0163】また、前記システムバスは第1、第2、第
3、第4のシステムバスから構成され、上記プロセッシ
ングユニットは第1、第2、第3、第4のプロセッサを
備えて、第1のプロセッサは第1のシステムバスに、第
2のプロセッサは第2のシステムバスに、第3のプロセ
ッサは第3のシステムバスに、第4のプロセッサは第4
のシステムバスそれぞれ接続されており、同様に別のプ
ロセッシングユニットは、第5、第6、第7、第8のプ
ロセッサを備えて、第5のプロセッサは第1のシステム
バスに、第6のプロセッサは第2のシステムバスに、第
7のプロセッサは第3のシステムバスに、第8のプロセ
ッサは第4のシステムバスにれぞれ接続されており、第
1、第2、第3のシステムバスは同一の動作を行い、第
4のシステムバスは待機系として停止しており、第1、
第2、第3のプロセッサは同一の演算を実行し、第4の
プロセッサは停止しており、また、第5、第6、第7の
プロセッサは同一の演算を実行し、第8のプロセッサは
停止しており、同一システムバスに接続されるプロセッ
サ(第1と第5、第2と第6、第3と第7、第4と第
8)が一つのオンライン交換単位である高信頼計算機シ
ステムにおいて、第1のプロセッサが故障した場合、第
2と第6、第3と第7のそれぞれのプロセッサが同期動
作を継続する手段と、直ちに第4のプロセッサを第2ま
たは第3のプロセッサの状態に、第8のプロセッサを第
6または第7の状態に同期させる手段を有し、第1と第
5のプロセッサを含む交換単位を、第2と第6、第3と
第7、第4と第8のプロセッサを動作させながら交換し
たあと、第1のシステムバスを第2または第3または第
4のシステムバスに追随動作ができる機能を有し、第1
のプロセッサの動作を、第2または第3または第4のプ
ロセッサの動作にあわせ、続いて、第5のプロセッサの
動作を、第6または第7または第8のプロセッサの動作
にあわせることを特徴とする。
The system bus comprises first, second, third and fourth system buses, and the processing unit comprises first, second, third and fourth processors. To the first system bus, the second processor to the second system bus, the third processor to the third system bus, and the fourth processor to the fourth system bus.
The respective processing buses are connected to each other, and similarly, the other processing unit includes fifth, sixth, seventh, and eighth processors, and the fifth processor is connected to the first system bus and the sixth processor. Is connected to the second system bus, the seventh processor is connected to the third system bus, and the eighth processor is connected to the fourth system bus. The first, second, and third system buses are connected. Perform the same operation, and the fourth system bus is stopped as a standby system.
The second and third processors execute the same operation, the fourth processor is stopped, the fifth, sixth, and seventh processors execute the same operation, and the eighth processor A high-reliability computer system in which the processors (first and fifth, second and sixth, third and seventh, fourth and eighth) that are stopped and connected to the same system bus are one online exchange unit In the case where the first processor fails, means for the second and sixth, third and seventh processors to continue the synchronous operation, and immediately to bring the fourth processor into the state of the second or third processor. And an exchange unit including means for synchronizing the eighth processor to the sixth or seventh state, the exchange unit including the first and fifth processors, the second and sixth, the third and seventh, and the fourth. After replacing the 8th processor while operating, It has a feature that allows follow operation in the second or third or fourth system bus Mubasu, first
The operation of the second processor is matched with the operation of the second, third or fourth processor, and subsequently the operation of the fifth processor is matched with the operation of the sixth, seventh or eighth processor. To do.

【0164】[0164]

【発明の効果】以上のように、この発明によれば、プロ
セッサの高周波数動作の阻害要因が入らないかたちで、
プロセッサの3重化による高信頼化を行える。また、高
性能な高信頼計算機が構築でき、また、I/Oも信頼性
の要求される構成がとれるし、経済性が要求される構成
もとれる効果がある。
As described above, according to the present invention, the factors that hinder the high frequency operation of the processor are not included,
Higher reliability can be achieved by triple processor. In addition, a high-performance and highly reliable computer can be constructed, and I / O can be configured to require reliability, and there is an effect that a configuration requiring economic efficiency can be obtained.

【0165】さらに、障害発生・回復処理時に信頼性の
低下しない計算機システムや性能の低下しない計算機シ
ステムが構築できる効果がある。
Further, there is an effect that it is possible to construct a computer system whose reliability is not deteriorated and a computer system whose performance is not deteriorated at the time of failure occurrence / recovery processing.

【0166】さらに、同一のハードウェアで、高信頼性
を要求されるシステムと高性能を要求されるシステムの
両者が構築できる効果がある。
Further, it is possible to construct both a system requiring high reliability and a system requiring high performance with the same hardware.

【0167】さらに、1つのパッケージに複数のプロセ
ッサを封入することにより、高性能なシステムが、より
小型に実現できる効果がある。
Furthermore, by enclosing a plurality of processors in one package, a high-performance system can be realized in a smaller size.

【0168】特に第1の発明によれば、プロセッサとシ
ステムバスを3重化しているので、多重化計算機の高性
能化が計れる。
In particular, according to the first aspect of the invention, since the processor and the system bus are tripled, the performance of the multiplexed computer can be improved.

【0169】第2の発明によれば、1つのバスに複数の
プロセッサが存在するためさらに、計算機システムの性
能が向上する。
According to the second invention, since a plurality of processors are present on one bus, the performance of the computer system is further improved.

【0170】第3の発明によれば、選択回路によりデー
タの転送を制御するので多重化されたバスと多重化され
ていないデバイスとの間でのデータ転送が、矛盾なく行
なえる。
According to the third invention, since the data transfer is controlled by the selection circuit, the data transfer between the multiplexed bus and the non-multiplexed device can be performed without contradiction.

【0171】第4の発明によれば、バスが3重化されて
いるため障害検出手段が容易に障害を検出することがで
きる。
According to the fourth invention, since the bus is tripled, the fault detecting means can easily detect the fault.

【0172】第5の発明によれば、障害のあったバスを
切り離すため障害が発生しても信頼性が低下しないシス
テムを提供することができる。
According to the fifth invention, it is possible to provide a system in which reliability is not deteriorated even if a failure occurs because the failed bus is disconnected.

【0173】第6の発明によれば、主記憶装置を3重化
したバスに接続するため主記憶装置までのデータ転送の
高信頼化が計れる。
According to the sixth invention, since the main storage device is connected to the tripled bus, the reliability of data transfer to the main storage device can be improved.

【0174】第7の発明によれば、主記憶装置を2重化
しているのでメモリ部分の高信頼化が計れる。
According to the seventh invention, since the main memory device is duplicated, the reliability of the memory portion can be improved.

【0175】第8の発明によれば、周辺機器システムを
3重化されたシステムに接続することが可能になる。
According to the eighth invention, it becomes possible to connect the peripheral equipment system to the triple system.

【0176】第9の発明によれば、周辺機器システム内
のシステムを3重化しているので周辺機器システム自身
が高信頼化できる。
According to the ninth invention, the system in the peripheral device system is tripled, so that the peripheral device system itself can be made highly reliable.

【0177】第10の発明によれば、周辺機器システム
内のバスをシングルバスとしているため周辺機器システ
ムを安価に作成することができる。
According to the tenth aspect of the invention, since the bus in the peripheral device system is a single bus, the peripheral device system can be manufactured at low cost.

【0178】第11の発明によれば、周辺機器システム
内部のバスを2重化しており前述したような3重化され
たバスよりも安価にできると共にシングルバスに比べて
高信頼化が計れる。
According to the eleventh invention, the bus inside the peripheral device system is duplicated, so that it can be made cheaper than the triplicated bus as described above, and higher in reliability than the single bus.

【0179】第12の発明によれば、主記憶装置が複数
存在する場合にでも、データの送出をプライマリ記憶装
置に行なわせることにより矛盾なくデータの転送が行な
える。
According to the twelfth aspect of the invention, even when there are a plurality of main storage devices, the data can be transferred without contradiction by causing the primary storage device to transmit the data.

【0180】第13の発明によれば、チェック手段によ
りデータの正当性がないと判断された場合にはプライマ
リ主記憶装置を交換することができるので故障が生じた
場合でも正当なデータを転送することができる。
According to the thirteenth invention, when the checking means determines that the data is not valid, the primary main memory device can be replaced, so that the valid data is transferred even if a failure occurs. be able to.

【0181】第14の発明によれば、チェックコードの
生成を3重化したため主記憶装置の高信頼化が計れる。
According to the fourteenth aspect, since the check code generation is tripled, the reliability of the main storage device can be improved.

【0182】また、第15の発明によれば、チェック手
段を3重化したため主記憶装置の高信頼化が計れる。
Further, according to the fifteenth invention, since the checking means is tripled, the reliability of the main storage device can be improved.

【0183】第16の発明によれば、同期動作モードと
個別動作モードを備えているため高信頼な計算機と高性
能な計算機を同一のハードウェアで実現することができ
る。
According to the sixteenth invention, since the synchronous operation mode and the individual operation mode are provided, a highly reliable computer and a high performance computer can be realized by the same hardware.

【0184】第17の発明によれば、個別動作モードに
おいては選択回路が個別動作用の制御を行なうため個別
動作モードにおいてもその他の部分に対して特別な変更
を要しない。
According to the seventeenth invention, in the individual operation mode, the selection circuit performs control for the individual operation, so that no special change is required to the other parts in the individual operation mode.

【0185】第18の発明においては、アービトレーシ
ョン手段が同期動作モードと個別動作モードに対応でき
るためいずれの動作モードにおいてもバスの獲得を正常
に行なうことができる。
In the eighteenth invention, the arbitration means can support the synchronous operation mode and the individual operation mode, so that the bus can be normally acquired in any operation mode.

【0186】第19の発明によれば、複数の主記憶装置
が存在する場合個別モードにおいてはそれぞれのアドレ
ス空間を異ならせるようにしているため、より広いアド
レス空間に対してアクセスすることが可能になる。
According to the nineteenth invention, when a plurality of main memory devices are present, each address space is made different in the individual mode, so that it is possible to access a wider address space. Become.

【0187】第20の発明によれば、モード指定手段と
モード設定手段によりシステムの立ち上げ時あるいはシ
ステムのリセット時にいずれかのモードを任意にセット
することができる。
According to the twentieth aspect, either mode can be arbitrarily set by the mode designating means and the mode setting means when the system is started up or when the system is reset.

【0188】第21の発明によれば、1つのチップに2
つのプロセッサを封入しながらも個別にプロセッサを制
御することができる。
According to the twenty-first invention, two chips are provided in one chip.
It is possible to control the processors individually while enclosing one processor.

【0189】第22の発明によれば、前述したプロセッ
サチップをシステムに用いているため高性能なシステム
がより小型に実現できる。
According to the twenty-second aspect, since the processor chip described above is used in the system, a high performance system can be realized in a smaller size.

【0190】第23の発明によれば、バスを4重化した
ため、さらに信頼性のあるシステムを得ることができ
る。
According to the twenty-third aspect, since the bus is quadrupled, a more reliable system can be obtained.

【0191】第24の発明によれば、障害が発生した場
合にも信頼性を維持するような方法でプロセッサを動作
させるため障害時においても信頼性を維持することがで
きる。
According to the twenty-fourth aspect, since the processor is operated in such a manner that the reliability is maintained even when a failure occurs, the reliability can be maintained even when the failure occurs.

【0192】第25の発明によれば、障害の発生時及び
障害の復旧後においても高信頼な計算機システムを提供
することができる。
According to the twenty-fifth aspect, it is possible to provide a highly reliable computer system even when a failure occurs and after the failure is recovered.

【0193】第26の発明によれば、障害の復旧を複数
サイクル停止するだけで行なうことができる。
According to the twenty-sixth aspect, failure recovery can be performed by simply stopping a plurality of cycles.

【0194】第27の発明によれば、障害発生時にも高
性能なシステムを提供することができる。
According to the twenty-seventh invention, a high-performance system can be provided even when a failure occurs.

【0195】第28の発明によれば、前述した障害発生
時であっても性能を維持しながら処理を続行する障害復
旧方法を一定サイクルの遅延のみで実現することができ
る。
According to the twenty-eighth aspect of the invention, it is possible to realize a failure recovery method for continuing the processing while maintaining the performance even with the occurrence of the failure described above, with only a fixed cycle delay.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の概略構成図である。FIG. 1 is a schematic configuration diagram of the present invention.

【図2】この発明の論理CPUが2台の場合の概略構成
図である。
FIG. 2 is a schematic configuration diagram in the case of two logical CPUs according to the present invention.

【図3】この発明のメモリが2重化された場合の概略構
成図である。
FIG. 3 is a schematic configuration diagram when the memory of the present invention is duplicated.

【図4】この発明の高性能モードの概略構成図である。FIG. 4 is a schematic configuration diagram of a high performance mode of the present invention.

【図5】この発明の周辺機器システムを有した概略構成
図である。
FIG. 5 is a schematic configuration diagram having a peripheral device system of the present invention.

【図6】この発明の周辺機器システムを有した概略構成
図である。
FIG. 6 is a schematic configuration diagram having a peripheral device system of the present invention.

【図7】この発明の周辺機器システムを有した概略構成
図である。
FIG. 7 is a schematic configuration diagram having a peripheral device system of the present invention.

【図8】この発明の故障したCPUを切り離す場合の動
作を説明する図である。
FIG. 8 is a diagram for explaining an operation when disconnecting a defective CPU according to the present invention.

【図9】この発明のCPUボードの交換を示す図であ
る。
FIG. 9 is a diagram showing replacement of the CPU board of the present invention.

【図10】この発明のCPUボードの交換を示す図であ
る。
FIG. 10 is a diagram showing replacement of the CPU board of the present invention.

【図11】この発明のプロセッサチップの概略図であ
る。
FIG. 11 is a schematic diagram of a processor chip of the present invention.

【図12】この発明の一実施例による高信頼計算機のブ
ロック図である。
FIG. 12 is a block diagram of a high reliability computer according to an embodiment of the present invention.

【図13】この発明の一実施例によるプロセッサまわり
のブロック図である。
FIG. 13 is a block diagram around a processor according to an embodiment of the present invention.

【図14】この発明の一実施例による主記憶装置のブロ
ック図である。
FIG. 14 is a block diagram of a main memory device according to an embodiment of the present invention.

【図15】この発明の一実施例によるプライマリビット
のセット/リセットを示す図である。
FIG. 15 is a diagram showing setting / resetting of a primary bit according to an embodiment of the present invention.

【図16】この発明の一実施例による障害検知の手段を
表す図である。
FIG. 16 is a diagram showing a failure detection means according to an embodiment of the present invention.

【図17】従来例による障害検知の手段を表す図であ
る。
FIG. 17 is a diagram illustrating a failure detection unit according to a conventional example.

【図18】この発明の一実施例による入出力インタフェ
ースユニットのブロック図である。
FIG. 18 is a block diagram of an input / output interface unit according to an embodiment of the present invention.

【図19】この発明の一実施例によるインタフェースユ
ニットのブロック図である。
FIG. 19 is a block diagram of an interface unit according to an embodiment of the present invention.

【図20】この発明の一実施例による高信頼モード/高
性能モードを表す図である。
FIG. 20 is a diagram showing a high reliability mode / high performance mode according to an embodiment of the present invention.

【図21】この発明の一実施例によるアービトレーショ
ン回路のブロック図である。
FIG. 21 is a block diagram of an arbitration circuit according to an embodiment of the present invention.

【図22】この発明の一実施例によるパワーオン/リセ
ット直後のフロー図である。
FIG. 22 is a flowchart immediately after power-on / reset according to an embodiment of the present invention.

【図23】この発明の一実施例によるモード設定関連レ
ジスタの設定例を示す図である。
FIG. 23 is a diagram showing a setting example of a mode setting related register according to an embodiment of the present invention.

【図24】この発明の別の実施例による高信頼計算機の
ブロック図である。
FIG. 24 is a block diagram of a high reliability computer according to another embodiment of the present invention.

【図25】この発明の別の実施例による第2階層システ
ムバスインタフェースユニットのブロック図である。
FIG. 25 is a block diagram of a second layer system bus interface unit according to another embodiment of the present invention.

【図26】この発明の別の実施例による入出力インタフ
ェースユニットのブロック図である。
FIG. 26 is a block diagram of an input / output interface unit according to another embodiment of the present invention.

【図27】この発明の別の実施例による主記憶装置のブ
ロック図である。
FIG. 27 is a block diagram of a main memory device according to another embodiment of the present invention.

【図28】この発明の別の実施例による障害検知の手段
を表す図である。
FIG. 28 is a diagram showing means for detecting a failure according to another embodiment of the present invention.

【図29】この発明の別の実施例によるプロセッサまわ
りのブロック図である。
FIG. 29 is a block diagram around a processor according to another embodiment of the present invention.

【図30】この発明の別の実施例による高信頼計算機の
ブロック図である。
FIG. 30 is a block diagram of a high reliability computer according to another embodiment of the present invention.

【図31】従来の高信頼計算機のブロック図である。FIG. 31 is a block diagram of a conventional high reliability computer.

【符号の説明】[Explanation of symbols]

1 システムバス 2 システムバス 3 システムバス 10 プロセシングユニット 11 プロセッサ 12 プロセッサ 13 プロセッサ 14 バスインタフェースユニット 15 バスインタフェースユニット 16 バスインタフェースユニット 20 プロセシングユニット 20 プロセシングユニット 21 プロセッサ 22 プロセッサ 23 プロセッサ 24 バスインタフェースユニット 25 バスインタフェースユニット 26 バスインタフェースユニット 50 主記憶装置 51 メモリアレイ 52 メモリインタフェースユニット 53 選択回路 60 主記憶装置 61 メモリアレイ 62 メモリインタフェースユニット 63 選択回路 90 アービトレーション回路 101 バスブリッジ 102 バスブリッジ 103 バスブリッジ 104 第2階層システムバス 110 第2階層システムバスインタフェースユニット 111 入出力制御装置 112 入出力制御装置 113 入出力制御装置 121 入出力装置 122 入出力装置 123 入出力装置 201 バスブリッジ 202 バスブリッジ 203 バスブリッジ 204 第2階層システムバス 205 第2階層システムバス 206 第2階層システムバス 211 入出力インタフェースユニット 212 入出力インタフェースユニット 213 入出力インタフェースユニット 221 入出力制御装置 222 入出力制御装置 223 入出力制御装置 231 入出力装置 232 入出力装置 233 入出力装置 1 System Bus 2 System Bus 3 System Bus 10 Processing Unit 11 Processor 12 Processor 13 Processor 14 Bus Interface Unit 15 Bus Interface Unit 16 Bus Interface Unit 20 Processing Unit 20 Processing Unit 21 Processor 22 Processor 23 Processor 24 Bus Interface Unit 25 Bus Interface Unit 26 bus interface unit 50 main storage device 51 memory array 52 memory interface unit 53 selection circuit 60 main storage device 61 memory array 62 memory interface unit 63 selection circuit 90 arbitration circuit 101 bus bridge 102 bus bridge 103 bus bridge 104 second level system Mubus 110 Second layer system Bus interface unit 111 Input / output control device 112 Input / output control device 113 Input / output control device 121 Input / output device 122 Input / output device 123 Input / output device 201 Bus bridge 202 Bus bridge 203 Bus bridge 204 Second layer system Bus 205 Second layer system bus 206 Second layer system bus 211 Input / output interface unit 212 Input / output interface unit 213 Input / output interface unit 221 Input / output control device 222 Input / output control device 223 Input / output control device 231 Input / output device 232 Input / output Device 233 Input / output device

───────────────────────────────────────────────────── フロントページの続き (72)発明者 安永 裕明 鎌倉市上町屋325番地 三菱電機株式会社 コンピュータ製作所内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Hiroaki Yasunaga 325 Kamimachiya, Kamakura City Mitsubishi Electric Corporation Computer Works

Claims (28)

【特許請求の範囲】[Claims] 【請求項1】 以下の要素を有する計算機システム
(a)データを転送する3以上複数のバス、(b)上記
複数のバスに個々に接続され同一動作する3以上複数の
プロセッサを備えたプロセッシングユニット、(c)上
記プロセッサからバスを介してアクセスされるデバイス
と、上記3以上のバスと上記デバイスの間にあってバス
の選択を行う選択手段と、選択手段により選択されたバ
スとデバイス間のデータ転送を制御する制御部を備えた
サブシステム。
1. A computer system having the following elements: (a) three or more buses for transferring data, (b) a processing unit comprising three or more processors individually connected to the plurality of buses and operating in the same manner. (C) A device accessed from the processor via a bus, a selection unit that selects a bus between the three or more buses and the device, and a data transfer between the bus and the device selected by the selection unit. A subsystem having a control unit for controlling the.
【請求項2】 上記プロセッシングユニットは、複数存
在し、ひとつのバスに複数のプロセッサを接続したこと
を特徴とする請求項1記載の計算機システム。
2. The computer system according to claim 1, wherein there are a plurality of processing units, and a plurality of processors are connected to one bus.
【請求項3】 上記選択手段は、バスからデバイスへデ
ータを転送する場合、複数のバスからひとつのバスを選
択してデバイスと接続し、デバイスからバスへデータを
転送する場合、複数のバスを選択してデバイスと接続す
ることを特徴とする請求項1記載の計算機システム。
3. The selecting means, when transferring data from a bus to a device, selects one bus from a plurality of buses to connect with the device, and when transferring data from the device to the bus, the selecting means selects a plurality of buses. The computer system according to claim 1, wherein the computer system is selected and connected to a device.
【請求項4】 上記制御部は、上記3以上のバスのデー
タを比較して、障害の発生を検出し、その検出結果に基
づいて上記選択手段のバスの選択を制御する障害検出手
段を備えたことを特徴とする請求項1記載の計算機シス
テム。
4. The control unit includes failure detection means for comparing the data of the three or more buses to detect the occurrence of a failure and controlling the bus selection of the selection means based on the detection result. The computer system according to claim 1, wherein
【請求項5】 上記計算機システムは、上記障害検出手
段の検出結果に基づいて、障害があったバスを切り離す
切り離し手段を備えたことを特徴とする請求項1記載の
計算機システム。
5. The computer system according to claim 1, wherein the computer system comprises disconnecting means for disconnecting a bus having a failure based on the detection result of the failure detecting means.
【請求項6】 上記サブシステムは、主記憶装置であ
り、上記デバイスはメモリであり、上記制御部はメモリ
とバス間のデータ転送を行うメモリ制御部であることを
特徴とする請求項1、2、3、4、又は5記載の計算機
システム。
6. The sub-system is a main storage device, the device is a memory, and the control unit is a memory control unit that transfers data between the memory and the bus. The computer system according to 2, 3, 4, or 5.
【請求項7】 上記主記憶装置を複数備え、上記複数の
バスにそれぞれ接続したことを特徴とする請求項6記載
の計算機システム。
7. The computer system according to claim 6, comprising a plurality of the main storage devices, each of which is connected to each of the plurality of buses.
【請求項8】 上記サブシステムは、周辺機器システム
であり、上記デバイスは入出力装置であり、上記制御部
は入出力装置とバス間のデータ転送を行う入出力制御装
置であることを特徴とする請求項1、2、3、4、又は
5記載の計算機システム。
8. The subsystem is a peripheral device system, the device is an input / output device, and the control unit is an input / output control device for performing data transfer between the input / output device and the bus. The computer system according to claim 1, 2, 3, 4, or 5.
【請求項9】 上記周辺機器システムは、上記複数のバ
スに対応する3以上の第2バスと、上記バスと第2のバ
スをそれぞれ接続する3以上のバスブリッジを備えたこ
とを特徴とする請求項8記載の計算機システム。
9. The peripheral device system includes three or more second buses corresponding to the plurality of buses, and three or more bus bridges respectively connecting the buses and the second buses. The computer system according to claim 8.
【請求項10】 上記周辺機器システムは、上記選択手
段と上記入出力装置の間にひとつバスから成る第3のバ
スを備えたことを特徴とする請求項8記載の計算機シス
テム。
10. The computer system according to claim 8, wherein the peripheral device system comprises a third bus consisting of one bus between the selecting means and the input / output device.
【請求項11】 上記周辺機器システムは、上記選択手
段をふたつ備え、ふたつの選択手段と上記入出力装置の
間にふたつのバスから成る第4のバスを備えたことを特
徴とする請求項8記載の計算機システム。
11. The peripheral device system comprises two selection means, and a fourth bus composed of two buses between the two selection means and the input / output device. The described computer system.
【請求項12】 上記複数の主記憶装置は、バスに対し
てデータを送出するプライマリ主記憶装置とバスに対し
てデータを送出しないセカンダリ主記憶装置を備えたこ
とを特徴とする請求項7記載の計算機システム。
12. The main storage device comprises a primary main storage device that sends data to the bus and a secondary main storage device that does not send data to the bus. Computer system.
【請求項13】 上記プライマリ主記憶装置は、バスに
転送するデータの正当性をチェックするチェック手段
と、チェック手段のチェック結果に基づいてセカンダリ
主記憶装置とプライマリ主記憶装置を交替する交替手段
を備えたことを特徴とする請求項12記載の計算機シス
テム。
13. The primary main memory device comprises a check means for checking the validity of data transferred to the bus, and a replacement means for replacing the secondary main memory device with the primary main memory device based on the check result of the checking means. The computer system according to claim 12, further comprising:
【請求項14】 上記チェック手段は、各バスから転送
されてきたデータの正当性をチェックする冗長コードを
生成する複数の冗長コード生成手段と、生成された複数
の冗長コードから正しい冗長コードを選択して記憶する
冗長コード選択手段を備えたことを特徴とする請求項1
3記載の計算機システム。
14. The checking means selects a plurality of redundant code generating means for generating a redundant code for checking the correctness of the data transferred from each bus, and a correct redundant code from the plurality of generated redundant codes. 2. A redundant code selecting means for storing the data in a stored form.
The computer system according to 3.
【請求項15】 上記チェック手段は、各バスに対応し
て冗長コードをチェックする複数の冗長コードチェック
手段を備えたことを特徴とする請求項13記載の計算機
システム。
15. The computer system according to claim 13, wherein said checking means includes a plurality of redundant code checking means for checking a redundant code corresponding to each bus.
【請求項16】 上記計算機システムは、動作モードと
して3以上のバスを同期動作させる同期動作モードと、
3以上のバスをそれぞれ非同期に動作させる個別動作モ
ードを備えたことを特徴とする請求項1記載の計算機シ
ステム。
16. The synchronous operation mode in which the computer system synchronously operates three or more buses as an operation mode,
2. The computer system according to claim 1, further comprising an individual operation mode for operating three or more buses asynchronously.
【請求項17】 上記選択手段は、個別動作モードにお
いて、複数のバスからデバイスへのデータ競合を制御す
るとともに、デバイスからデータを対応するいずれかの
バスに出力することを特徴とする請求項16記載の計算
機システム。
17. The selection means controls data competition from a plurality of buses to a device in the individual operation mode, and outputs data from the device to any of the corresponding buses. The described computer system.
【請求項18】 上記計算機システムは、さらに、同期
動作モードにおいて、複数のバスへ出力されたバス獲得
要求をひとつのバス獲得要求として処理し、個別動作モ
ードにおいて、複数のバスへ出力されたバス獲得要求を
をそれぞれ個別のバス獲得要求として処理するアビトレ
ーション手段を備えたことを特徴とする請求項16記載
の計算機システム。
18. The computer system further processes a bus acquisition request output to a plurality of buses as one bus acquisition request in the synchronous operation mode, and a bus output to a plurality of buses in the individual operation mode. 17. The computer system according to claim 16, further comprising arbitration means for processing the acquisition requests as individual bus acquisition requests.
【請求項19】 上記計算機システムは、動作モードと
して3以上のバスを同期動作させる同期動作モードと、
3以上のバスをそれぞれ非同期に動作させる個別動作モ
ードを備え、上記複数の主記憶装置は、個別動作モード
において異なるアドレスを用いてアクセスされるメモリ
を備えたことを特徴とする請求項7記載の計算機システ
ム。
19. The synchronous operation mode in which the computer system synchronously operates three or more buses as an operation mode,
8. An individual operation mode for asynchronously operating three or more buses, wherein the plurality of main memory devices include memories that are accessed using different addresses in the individual operation modes. Computer system.
【請求項20】 上記計算システムは、上記動作モード
を指定するモード指定手段と、モード指定手段により指
定されたモードに設定するモード設定手段を備えたこと
を特徴とする請求項16又は19記載の計算機システ
ム。
20. The computing system according to claim 16, further comprising a mode designating means for designating the operation mode, and a mode setting means for setting the mode designated by the mode designating means. Computer system.
【請求項21】 以下の要素を有するプロセッサチップ
(a)第1のプロセッサ、(b)第2のプロセッサ、
(c)上記第1と第2のプロセッサを個別にリセットす
るリセット手段、(d)上記第1と第2のプロセッサの
動作を個別に停止させる停止手段、(e)上記第1と第
2のプロセッサのバス使用要求を個別に出力するバス使
要求出力手段、(f)上記第1と第2のプロセッサへバ
ス使用許可を個別に入力するバス使用許可入力手段、
(g)上記第1と第2のプロセッサのその他の入出力を
共通化して行なう共用手段。
21. A processor chip (a) first processor, (b) second processor having the following elements:
(C) resetting means for individually resetting the first and second processors, (d) stopping means for individually stopping the operations of the first and second processors, (e) the first and second Bus usage request output means for individually outputting the bus usage request of the processor, (f) bus usage permission input means for individually inputting the bus usage permission to the first and second processors,
(G) Sharing means for sharing the other inputs and outputs of the first and second processors.
【請求項22】 3以上のバスと、各バスに対応して上
記請求項21記載のプロセッサチップを3以上備え、第
1と第2のプロセッサをそれぞれ同一のバスに接続した
ことを特徴とする計算機システム。
22. Three or more buses and three or more processor chips according to claim 21 corresponding to each bus are provided, and the first and second processors are respectively connected to the same bus. Computer system.
【請求項23】 上記バスを4つ備えたことを特徴とす
る請求項1、2、3、4、又は5記載の計算機システ
ム。
23. The computer system according to claim 1, wherein the bus is provided with four buses.
【請求項24】 第1、第2、第3のバスにそれぞれ個
々に接続され同一動作を行なう第1、第2、第3のプロ
セッサを備えた第1のプロセッシングユニットと、第
1、第2、第3のバスにそれぞれ個々に接続され同一動
作を行なう第4、第5、第6のプロセッサを備えた第2
のプロセッシングユニットとを備えた計算機システムの
第1のプロセッサに障害が発生した場合の障害復旧方法
において、以下の工程を有することを特徴とする障害復
旧方法(a)第1のプロセッシングユニットで実行中の
処理を第2及び第3のプロセッサにより継続して実行す
る継続実行工程、(b)上記継続実行工程後、第1のプ
ロセッシングユニットの動作を停止させ、第2のプロセ
ッシングユニットにより次の処理を開始するシングルユ
ニット処理工程。
24. A first processing unit comprising first, second and third processors respectively connected to the first, second and third buses respectively and performing the same operation, and first and second processing units. , A second processor including fourth, fifth, and sixth processors that are respectively connected to the third bus and perform the same operation.
In a failure recovery method when a failure occurs in a first processor of a computer system including the processing unit of (1), a failure recovery method including the following steps (a) being executed by the first processing unit: (B) After the continuous execution step, the operation of the first processing unit is stopped and the second processing unit executes the next processing. Single unit processing step to start.
【請求項25】 上記継続実行工程は、(a)第1のプ
ロセッサと第4のプロセッサの出力を抑止する出力抑止
工程と、(b)第1のバスの動作を第2、第3のバスの
動作に追随させ第4のプロセッサの出力を除く動作を継
続実行させる追随工程を備え、 上記シングルユニット処理工程は、(a)第1のプロセ
ッシングユニットの動作停止後、第4のプロセッサの出
力を許可する許可工程と、(b)第1のバスを第2、第
3のバスに同期させる同期工程を備えたことを特徴とす
る請求項24記載の障害復旧方法。
25. The continuous execution step comprises: (a) an output suppressing step of suppressing the outputs of the first processor and the fourth processor; and (b) an operation of the first bus for the second and third buses. The following single-unit processing step includes (a) stopping the operation of the first processing unit and then outputting the output of the fourth processor. 25. The failure recovery method according to claim 24, further comprising: a permitting step of permitting, and (b) a synchronizing step of synchronizing the first bus with the second and third buses.
【請求項26】 上記追随工程は、 第1のバスの動作を1サイクル以上所定サイクル停止さ
せてから第1のバスの動作を第2、第3のバスの動作に
追随させるバス追随工程と、第4のプロセッサの動作を
所定サイクル停止させて第5、第6のプロセッサから所
定サイクル遅れた同期動作を行なわせるプロセッサ追随
工程を備え、 上記同期工程は、第5、第6のプロセッサの動作を所定
サイクル停止させて第4のプロセッサの動作と同期させ
るプロセッサ同期工程と、第1のバスの動作を第2、第
3のバスの動作と同期させるバス同期工程を備えたこと
を特徴とする請求項25記載の障害復旧方法。
26. A bus tracking step of stopping the operation of the first bus for a predetermined cycle or more for a predetermined number of cycles and then causing the operation of the first bus to follow the operations of the second and third buses. A processor tracking step of stopping the operation of the fourth processor for a predetermined cycle and performing a synchronous operation delayed by a predetermined cycle from the fifth and sixth processors is provided, wherein the synchronizing step includes the operations of the fifth and sixth processors. A processor synchronization step of stopping a predetermined cycle to synchronize with the operation of the fourth processor and a bus synchronization step of synchronizing the operation of the first bus with the operation of the second and third buses are provided. Item 25. The failure recovery method according to Item 25.
【請求項27】 第1、第2、第3のバスにそれぞれ個
々に接続され同一動作を行なう第1、第2、第3のプロ
セッサを備えた第1のプロセッシングユニットと、第
1、第2、第3のバスにそれぞれ個々に接続され同一動
作を行なう第4、第5、第6のプロセッサを備えた第2
のプロセッシングユニットとを備えた計算機システムの
第1のプロセッサに障害が発生した場合の障害復旧方法
において、(a)第1のプロセッシングユニットで実行
中の処理を、第2、第3のプロセッサにより継続して実
行、第2のプロセッシングユニットで実行中の処理を、
第5、第6のプロセッサにより継続して実行する継続実
行工程、(b)上記継続実行工程中に、第1と第4のプ
ロセッサを新規なプロセッサを交換する交換工程、
(c)上記交換工程後、第1と第4のプロセッサを他の
プロセッサと同期させて動作させる同期工程を備えたこ
とを特徴とする障害復旧方法。
27. A first processing unit having first, second and third processors respectively connected to the first, second and third buses and performing the same operation, and first and second processing units. , A second processor including fourth, fifth, and sixth processors that are respectively connected to the third bus and perform the same operation.
In a failure recovery method when a failure occurs in the first processor of the computer system including the processing unit of (1), (a) the processing being executed in the first processing unit is continued by the second and third processors. And execute the processing being executed in the second processing unit,
A continuous execution step of continuously being executed by the fifth and sixth processors, (b) an exchange step of exchanging a new processor for the first and fourth processors during the continuous execution step,
(C) A failure recovery method comprising a synchronization step of operating the first and fourth processors in synchronization with another processor after the replacement step.
【請求項28】 上記同期手段は、(a)第1のバスを
第2、第3のバスの動作から1サイクル以上所定サイク
ル遅らせて動作させるバス追随工程と、(b)第1と第
4のプロセッサ他のプロセッサの動作から所定サイクル
遅らせて動作させるプロセッサ追随工程と、(c)上記
第2、第3、第5、第6のプロセッサの動作を所定サイ
クル停止させて第1と第4のプロセッサの動作と同期さ
せるプロセッサ同期工程と、(d)第1のバスの動作を
第2、第3のバスの動作と同期させるバス同期工程を備
えたことを特徴とする請求項27記載の障害復旧方法。
28. The synchronizing means comprises: (a) a bus following step of operating the first bus by delaying the operation of the second and third buses by one cycle or more by a predetermined cycle, and (b) the first and fourth operations. The processor following step of delaying the operation of the other processor by a predetermined cycle from the operation of the other processor, and (c) stopping the operation of the second, third, fifth, and sixth processors for a predetermined cycle to perform the first and fourth operations. 28. The fault according to claim 27, further comprising a processor synchronization step of synchronizing the operation of the processor with (d) a bus synchronization step of synchronizing the operation of the first bus with the operation of the second and third buses. How to recover.
JP32897593A 1993-12-24 1993-12-24 Computer system, processor chip and fault recovery method Expired - Fee Related JP3424968B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32897593A JP3424968B2 (en) 1993-12-24 1993-12-24 Computer system, processor chip and fault recovery method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32897593A JP3424968B2 (en) 1993-12-24 1993-12-24 Computer system, processor chip and fault recovery method

Publications (2)

Publication Number Publication Date
JPH07182189A true JPH07182189A (en) 1995-07-21
JP3424968B2 JP3424968B2 (en) 2003-07-07

Family

ID=18216212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32897593A Expired - Fee Related JP3424968B2 (en) 1993-12-24 1993-12-24 Computer system, processor chip and fault recovery method

Country Status (1)

Country Link
JP (1) JP3424968B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002514815A (en) * 1998-05-14 2002-05-21 モトローラ・インコーポレイテッド Controlling a bus with multiple system hosts
JP2002514821A (en) * 1998-05-14 2002-05-21 モトローラ・インコーポレイテッド Multi-configuration backplane
JP2006072492A (en) * 2004-08-31 2006-03-16 Fujitsu Ltd System control device, system control method and system control program
CN111338855A (en) * 2018-12-18 2020-06-26 现代自动车株式会社 Redundancy method and redundancy system of three-dimensional stacked memory
US10740199B2 (en) 2017-03-22 2020-08-11 Nec Corporation Controlling device, controlling method, and fault tolerant apparatus
JP2020204877A (en) * 2019-06-17 2020-12-24 ルネサスエレクトロニクス株式会社 Semiconductor device and method for operating the same

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006344087A (en) * 2005-06-10 2006-12-21 Hitachi Ltd Task management device for controller and task management method for controller
DE102006050715A1 (en) * 2006-10-10 2008-04-17 Robert Bosch Gmbh Valid signal generating method for application program in signal processing system, involves switching signal processing system into comparison operating mode after occurrence of error during termination of application program
JP5227653B2 (en) * 2008-05-14 2013-07-03 株式会社東芝 Multiplexed computer system and processing method thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61212138A (en) * 1985-03-01 1986-09-20 ホランドセ シグナールアパラーテン ベスローテン フェンノートシャップ Local area network
JPH01267701A (en) * 1988-04-20 1989-10-25 Toshiba Corp Digital controller for controlling power
JPH0523257U (en) * 1991-09-04 1993-03-26 三菱電機株式会社 Memory circuit

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61212138A (en) * 1985-03-01 1986-09-20 ホランドセ シグナールアパラーテン ベスローテン フェンノートシャップ Local area network
JPH01267701A (en) * 1988-04-20 1989-10-25 Toshiba Corp Digital controller for controlling power
JPH0523257U (en) * 1991-09-04 1993-03-26 三菱電機株式会社 Memory circuit

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002514815A (en) * 1998-05-14 2002-05-21 モトローラ・インコーポレイテッド Controlling a bus with multiple system hosts
JP2002514821A (en) * 1998-05-14 2002-05-21 モトローラ・インコーポレイテッド Multi-configuration backplane
JP2006072492A (en) * 2004-08-31 2006-03-16 Fujitsu Ltd System control device, system control method and system control program
US7779293B2 (en) 2004-08-31 2010-08-17 Fujitsu Limited Technology to control input/output device bridges
JP4630023B2 (en) * 2004-08-31 2011-02-09 富士通株式会社 System control apparatus, system control method, and system control program
US10740199B2 (en) 2017-03-22 2020-08-11 Nec Corporation Controlling device, controlling method, and fault tolerant apparatus
CN111338855A (en) * 2018-12-18 2020-06-26 现代自动车株式会社 Redundancy method and redundancy system of three-dimensional stacked memory
CN111338855B (en) * 2018-12-18 2024-08-20 现代自动车株式会社 Redundancy method and redundancy system of three-dimensional stacked memory
JP2020204877A (en) * 2019-06-17 2020-12-24 ルネサスエレクトロニクス株式会社 Semiconductor device and method for operating the same

Also Published As

Publication number Publication date
JP3424968B2 (en) 2003-07-07

Similar Documents

Publication Publication Date Title
US5384906A (en) Method and apparatus for synchronizing a plurality of processors
EP0372579B1 (en) High-performance computer system with fault-tolerant capability; method for operating such a system
US5317726A (en) Multiple-processor computer system with asynchronous execution of identical code streams
US5423024A (en) Fault tolerant processing section with dynamically reconfigurable voting
US5295258A (en) Fault-tolerant computer system with online recovery and reintegration of redundant components
US5890003A (en) Interrupts between asynchronously operating CPUs in fault tolerant computer system
US20090044044A1 (en) Device and method for correcting errors in a system having at least two execution units having registers
US7933966B2 (en) Method and system of copying a memory area between processor elements for lock-step execution
JP6098778B2 (en) Redundant system, redundancy method, redundancy system availability improving method, and program
JPS5925257B2 (en) Multi-processor system
US20060149903A1 (en) Fault tolerant computer system and a synchronization method for the same
JP3595033B2 (en) Highly reliable computer system
CN104798059A (en) Multiple computer system processing write data outside of checkpointing
JP3424968B2 (en) Computer system, processor chip and fault recovery method
JP4182948B2 (en) Fault tolerant computer system and interrupt control method therefor
JPS59106056A (en) Failsafe type data processing system
JPH06242979A (en) Dual computer device
JPH05313930A (en) Highly reliable information processor
JP3255934B2 (en) Basic processing unit and highly reliable computer system
Yao et al. A fault-tolerant single-chip multiprocessor
JPH08190494A (en) High-reliability computer with dual processors
JPH08278950A (en) Multiplexed computer system and fault restoring method
JPH04241038A (en) Recovering method for high-reliability computer system
JPH06124242A (en) Duplex shared memory equivalency guarantee system
JPH0936863A (en) Redundancy system

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030415

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040520

LAPS Cancellation because of no payment of annual fees