JPH02202638A - 多重プロセッサを備えたフォールトトレラントなコンピュータシステム - Google Patents

多重プロセッサを備えたフォールトトレラントなコンピュータシステム

Info

Publication number
JPH02202638A
JPH02202638A JP1322463A JP32246389A JPH02202638A JP H02202638 A JPH02202638 A JP H02202638A JP 1322463 A JP1322463 A JP 1322463A JP 32246389 A JP32246389 A JP 32246389A JP H02202638 A JPH02202638 A JP H02202638A
Authority
JP
Japan
Prior art keywords
cpus
cpu
processor
memory
interrupt
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1322463A
Other languages
English (en)
Other versions
JPH079626B2 (ja
Inventor
Richard W Cutts Jr
リチャード・ダブリュー・カッツ・ジュニア
Douglas E Jewett
ダグラス・イー・ジュウエット
A Southworth Richard
リチャード・エー・サウスワース
C Dibecker Kenneth
ケニス・シー・ディベッカー
A Mehta Nikhil
ニキール・エー・メータ
David Allison John
ジョン・デイビッド・アリソン
W Horst Robert
ロバート・ダブリュー・ホースト
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tandem Computers Inc
Original Assignee
Tandem Computers Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tandem Computers Inc filed Critical Tandem Computers Inc
Publication of JPH02202638A publication Critical patent/JPH02202638A/ja
Publication of JPH079626B2 publication Critical patent/JPH079626B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/18Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits
    • G06F11/183Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits by voting, the voting not being performed by the redundant components
    • G06F11/184Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits by voting, the voting not being performed by the redundant components where the redundant components implement processing functionality
    • G06F11/185Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits by voting, the voting not being performed by the redundant components where the redundant components implement processing functionality and the voting is itself performed redundantly
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
    • G06F11/0724Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU] in a multiprocessor or a multi-core unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1666Error detection or correction of the data by redundancy in hardware where the redundant component is memory or memory area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1675Temporal synchronisation or re-synchronisation of redundant processing components
    • G06F11/1683Temporal synchronisation or re-synchronisation of redundant processing components at instruction level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1675Temporal synchronisation or re-synchronisation of redundant processing components
    • G06F11/1687Temporal synchronisation or re-synchronisation of redundant processing components at event level, e.g. by interrupt or result of polling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1675Temporal synchronisation or re-synchronisation of redundant processing components
    • G06F11/1691Temporal synchronisation or re-synchronisation of redundant processing components using a quantum
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2017Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where memory access, memory control or I/O control functionality is redundant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/17Interprocessor communication using an input/output type connection, e.g. channel, I/O port
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1008Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1405Saving, restoring, recovering or retrying at machine instruction level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1629Error detection by comparing the output of redundant processing systems
    • G06F11/1641Error detection by comparing the output of redundant processing systems where the comparison is not performed by the redundant processing components
    • G06F11/1645Error detection by comparing the output of redundant processing systems where the comparison is not performed by the redundant processing components and the comparison itself uses redundant hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1675Temporal synchronisation or re-synchronisation of redundant processing components
    • G06F11/1679Temporal synchronisation or re-synchronisation of redundant processing components at clock signal level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/18Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits
    • G06F11/181Eliminating the failing redundant component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/18Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits
    • G06F11/182Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits based on mutual exchange of the output between redundant processing components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2015Redundant power supplies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/85Active fault masking without idle spares
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/70Masking faults in memories by using spares or by reconfiguring
    • G11C29/74Masking faults in memories by using spares or by reconfiguring using duplex memories, i.e. using dual copies

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Hardware Redundancy (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、コンピュータシステムに関し、より詳細に
は、多重CPUを用いたフォールトトレラント(fau
lt −tolerant)システムにおける同期法に
関する。
(従来の技術と発明が解決しようとする課題)高信頼性
のデジタル処理、冗長性を用いた様々なコンピュータア
ーキテクチャにおいて達成される。例えば、TMR(3
重・モジュラ・冗長性)システムは、同じ命令のストリ
ーム(流れ)を実行する3個のCPUを、機能を重複す
る3個の分離した主メモリユニットと分離したI10装
置と共に使用できる。そのため、もし各タイプの要素の
中の1つが誤りをしても、システムは動作し統ける。他
のフォールトトレラントタイプのシステムが、カッラマ
ン等に対して発行されタンデム・コンピューターズ・イ
ンコーホレイテッドに対して譲渡された「多重プロセッ
サシステム」と題する米国特許第4,228.496号
に示される。
様々な方法が、冗長性システムにおいて装置を同期させ
るために使用されて来た。例えば、「多重プロセッサを
同期させるための方法と装置」と題するアール・ダブリ
ユウ・ホーストにより1987年11月9日に出願され
、同様にタンデム・コンピューターズ・インコーホレイ
テッドに譲渡された米国特許出願第118.503号に
おいて、「緩い」同期法が開示されているが、これは、
「フォールトトレラント計算のための中央処理装置」と
題されストラス・コンピュータ・インコーホレイテッド
に譲渡された米国特許第4.453.215号において
示されているような単独のクロックを用いたロック・ス
テップ同期を使用した他のシステムと対照的である。「
同期ボーティング(synchronization 
voting) Jと呼ばれる技法がデビス(Davi
es)及びウェイカリ(Wakerly)著「冗長性シ
ステムにおける同期とマツチングJ  (IEEEトラ
ンザクションズ参オン・コンピュータ(IEEE Tr
ansactions on computer) 、
 1978年6月号531−539ページ)に開示され
ている。
冗長性のフォールトトレラントシステムにおける割り込
み同期の方法が、ヨンディ(Yondea)ほか著「緩
く同期したTMRシステムのための割り込み取り扱いの
実行」 (7オールトトレラント計算についての第15
回年次シンポジウムのプロシーディング(1985年6
月)246−251ページ)に開示されている。「フォ
ールトトレラントリアルタイムクロック」と題する米国
特許第4゜644.498号は、TMRコンピュータシ
ステムにおける使用のための3重モジュラ冗長性クロッ
ク構成を開示している。[多重に冗長なコンビュ−タの
フレーム同期」と題する米国特許第4.733,353
号は、同期フレームを実行することにより周期的に同期
される別々のクロックで動作するCPUを用いる同期法
を開示している。
25MHzで動作するインテル80386やモトローラ
68030のような高性能マイクロプロセッサ装置が、
高速クロックと大きな能力を備えて使用できるようにな
った。また、メモリ、ディスクドライブなどのコンピュ
ータシステムの他の要素もこれに対応してより安価にか
つより大きな能力を備えるようになった。このため、高
信頼性のプロセッサが同じ傾向に追随することが要求さ
れている。さらに、コンピュータ産業におけるいくつか
のオペレーティングシステムでの標準化は、アプリケー
ションソフトウェアの利用性を大きく拡大した。そのた
め、同様な要求が高信頼性システムの分母でもなされ、
すなわち、標準的オペレーティングシステムを利用でき
る必要がある。
したがって、この発明の主な目的は、特にフォールトト
レラントタイプの改良された高信頼性コンピユータシス
テムを提供することである。この発明の他の目的は、改
良された冗長性でフォールトトレラントタイプのコンピ
ュータシステムであって、高性能と低コストが両立する
ものを提供することである。特に、改良されたシステム
が、高度に冗長なシステムにおいて通常上じる実行負荷
を避けることが好ましい。この発明の別の目的は、速度
とソフトウェアの両立性とともに信頼性について測定さ
れる場合に、性能が改良されている一方、コストも他の
より低い性能のコンピュータシステムと同じぐらいであ
る高信頼性コンピユータシステムを提供することである
。この発明のさらに他の目的は、デマンドページングを
用いた仮想メモリ管理を使用し、保護された(上位から
の監視、すなわち「核(カーネル: kernel) 
J )モードを備えたオペレーティングシステムを実行
できる高信頼性コンピユータシステムを提供することで
ある。とくに、オペレーティングシステムは、多重プロ
セスの実行が、すべて高レベルの性能で可能でなければ
ならない。
(課題を解決するための手段、作用及び発明の効果) この発明の一実施例によれば、コンピュータシステムは
、典型的には同じ命令ストリームを実行する3個の同一
のCPUを使用し、同じデータの複製を格納する2個の
同一の自己診断メモリモジュールを備える。したがって
、古典的TMRシステムにおけるような3個のCPUと
3個のメモリよりはむしろ、3個のCPUと2個のメモ
リの構成が使用される。3giのCPUによるメモリ参
照(meraory reference)は、2個の
メモリの各の3個の別のボートに接続された3個のバス
により行われる。フォールトトレラント動作の実行負荷
を全CPU自身に課することを避けるため、また、フォ
ールトトレラントクロック動作の費用、複雑さ及びタイ
ミングの問題を課することを避けるため、3個のCPU
はそれぞれ、それ自身のために独立したクロックを別々
に備えるが、メモリ参照のようなイベント(event
)を検出することにより、すべてのCPUが、同時に機
能を実行するまで他のCPUの前にある任意のCPUを
ストールすることにより、緩く同期されている。割り込
みもまた、全CPUに同期され、全CPUが命令ストリ
ームの同じ点で割り込みを実行することを保証する。別
々のCPU−メモリ・バスを介しての3個の非同期のメ
モリ参照は、メモリ要求のときに各メモリモジュールの
3個の別々のボートでボートされるが、リードデータは
、全CPUに戻されたときにボートされない。
2個のメモリは、共に、全CPUまたは全l10(すな
わち入力/出力)バスから受け取ったすべてのライト要
求を実行するので、両メモリは、最新に保たれる。しか
し、ただIllのメモリモジュールは、リード要求に対
応して全CPUまたはI10バスに戻る。リードデータ
を作る1個のメモリモジュールが「プライマリ」(「主
」)と呼ばれ、他方はバックアップである。従って、入
って来るデータは、ただ1つのソースからであり、ボー
トされない。2個のメモリモジュールへのメモリ要求は
、ボート続行中は実行されるが、従って、リードデータ
は、最後のCPUが要求を行った後で少し遅れて全CP
Uに対し利用できる。これらのメモリモジュールのため
に使用されるDRAMが単にリード動作を行いリフレッ
シュするためにライトサイクルの大部分を使用するので
、ライトサイクルでさえも実質的に重複し得る。そこで
、ライトサイクルの最後の部分のためにストローブされ
ないならば、リード動作は非破壊的でない。
従って、ライトサイクルは、最初のCPUが要求をする
と直ちに開始されるが、最後の要求が受信され、良好で
あるとボートされるまで完了しない。
ボートされないリードデータの戻りと重なったアクセス
の特徴は、高性能のフォールトトレラント動作を、最小
の複雑さと費用で可能にする。
110機能は、2つの同一のI10バス(各バスはただ
1個のメモリモジュールと別々に接続される)を用いて
実行される。多数のI10プロセッサが2つのI10バ
スに接続され、I10装置は、複数の対のI10プロセ
ッサに接続されるが、ただ1個のI10プロセッサによ
ってアクセスされる。1個のメモリモジュールがプライ
マリとして表されるので、このモジュールのためのただ
1個のI10バスが、全110プロセツサを制御する。
そして、メモリモジュールとIloとの間のトラフィッ
クは、ボート(vote)されない。全CPUは全11
プロセツサをメモリモジュールを介してアクセスできる
。(ここで、各アクセスは、まさにメモリアクセスがボ
ートされるようにボートされる。)しかし、全110プ
ロセツサは、全メモリモジュールをアクセスできるだけ
であり、全CPUをアクセスできない。全110プロセ
ツサは、全CPUに割り込みを送ることができるだけで
あり、この割り込みは、全CPUに示される前にメモリ
モジュール内に集められる。こうして、I10装置アク
セスのための同期オーバヘッドは、全CPUにとって重
荷にならず、7オールトトレラント性が備えられる。も
し1個のI10プロセッサが誤ったならば、その対の他
方のI10プロセッサが、オペレーティングシステムに
より維持されるI10ページテーブル内のI10装置に
対して用いられるアドレスを単に変えるだけで、このI
10プロセッサのためのI10装置の制御を代わって行
うことができる。このように、I10装置のフォールト
トレラント性と再統合は、システムシャットダウンなし
に、そしてさらに、これらの■10バスにおけるボーテ
ィングに伴うハードウェア費用と実行ペナルティなしに
可能である。
説明された実施例において使用されるメモリシステムは
、複数のレベルで階層的である。各CPUは、それ自身
のキャシュ(cache)を備え、本質的にCPUのク
ロック速度で動作する。そこで、各CPUは、他のCP
Uによりアクセスできないローカルメモリを備え、仮想
メモリ管理は、オペレーティングシステムの核と現在の
タスクのページを全3個のCPUのためのローカルメモ
リの中にあることを許可し、課されたボーティングまた
は同期のようなフォールトトレラント性のオーバヘッド
なしに高速でアクセス可能にする。次に、グローバルメ
モリとして呼ばれるメモリモジュールレベルがあり、こ
こで、ボーティングと同期化が行われ、アクセスタイム
の負荷が導入される。
しかし、グローバルメモリの速度は、ディスクアクセス
よりもずっと速い。従って、このレベルは、デマンドペ
ージングの第1レベルのためにディスクを使用するため
よりはむしろ、最速のエリアに最も使用されるデータを
保つためのローカルメモリとの、ページのスワツピング
のために使用される。
この発明の開示された実施例の1つの特徴は、システム
をシャットダウンすることなしにCPUモジュールやメ
モリモジュールのような故障部品を交換する能力である
。こうして、このシステムは、部品が故障し、取り換え
ねばならない場合でさえも、連続的な使用ができる。さ
らに、高レベルのフォールトトレラント性がより少ない
部品で達成できる。例えば、フォールトトレラントなり
ロック動作が必要でなく、3個でなく2個のメモリモジ
ュールだけが必要であり、ボーティング回路が最小にで
きる。このことは、故障する部品が少なく、信頼性が増
大したことを意味する。すなわち、部品がより少ないの
で、故障がより少なく、故障があるとき、システムをラ
ンさせたまま、その部品が分離され、システムシャット
ダウンなしに取り換えできる。
このシステムのCPUは、好ましくは、UNIX(登録
商1ll)のようなオペレーティングシステムが使用可
能な市販の高性能マイクロプロセッサチップを使用する
。システムをフォールトトレラントにする部分は、オペ
レーティングシステムに対して透明であるか、またはオ
ペレーティングシステムに対して容易に適合できる。従
って、高性能なフォールトトレラントシステムは、−時
的に広く使用されるマルチタスクのオペレーティングシ
ステムとアプリケーションソフトウェアとの同等性を可
能にして提供される。
1つの実施例によれば、本発明は、複数のプロセッサを
緩く同期する方法と装置に向けられる。
本発明による装置は、フォールトトレラントなりロック
回路を必要とせずに故障検出装置又はフォールトトレラ
ントな装置内に2個以上のプロセッサが配置されること
を可能にする。プロセッサは、クロック速度の違いによ
って又は「追加の」クロツタサイクルの発生のため、同
じアルゴリズムを異なった速度で自由に実行できる。「
追加の」りaツクサイクルは、エラーリトライやキャシ
ュヒツト速度の変化のため、また、非同期論理の結果と
して発生し、あるプログラムを実行中には通常は起こら
ないクロックサイクルをいう。外部割り込みは、各プロ
セッサが、最大の割り込み潜在時間について当然の考慮
を払って実行中に同じ点で割り込みに応答するように同
期される。
本発明の1実施例では、各プロセッサは、それ自身の独
立のクロックからはずれる。プロセッサは、1本のライ
ンで所定のプロセッサイベントの発生を示し、ウェイト
ステートを開始するために他のラインで信号を受け取る
。プロセッサイベントは、明白にあるいはプロセッサで
ランされるコードによって内在的に定義できる。好まし
くは、各マイクロプロセッサライト動作のために1つの
グロセッサイベント信号を発生する。各プロセッサは、
イベントカウンタ呼ばれるカウンタを備え、プロセッサ
が同期された最後の時間以後に示されたプロセッサイベ
ントの数を計数する。
この実施例では、システム設計者が自由に任意の同期イ
ベントを定義できるけれども、プロセッサは、典型的に
は、外部割り込みが起こった時にはいつでも同期される
。各プロセッサに関連する比較回路は、システム内の他
の全イベントカウンタをテストし、その関連するプロセ
ッサが他のプロセッサに遅れているか否かを決定する。
もしそうならば、同期論理回路は、次のプロセッサイベ
ントまでウェイト信号を除く。比較回路は、その関連す
るプロセッサがなお遅れているか否かを次に再びチエツ
クする。プロセッサは、そのイベントカウンタが最速の
プロセッサのイベントカウンタに一致すると最終的に停
止される。各イベントカウンタが同じ値となり全プロセ
ッサが停止されるまで、処理が続く。この点に達すると
、プロセッサは、プログラムの同じ点ですべて停止され
る。
ウェイト信号は除かれ、各プロセッサへの割り込みライ
ンが主張され、全プロセッサが、同期イベントを取り扱
うために再スタートされる。
イベントカウンタがその最大値に達する前に同期イベン
トが起こらないならば、イベントカウンタのオーバーフ
ローが再同期を強行する。影響されたプロセッサは、続
行の前に、他のプロセッサのイベントカウンタもオーバ
ーフローするまでウェイトをする。他方、もし同期イベ
ントが発生するが、最悪の場合の割り込み潜在時間を満
足するほどプロセッサイベントがしばしば発生しないな
らば、サイクルカウンタとよばれる他のカウンタが、最
後のプロセッサイベント以後のプロセッサイベントの数
を計数するために備えられる。サイクルカウンタは、最
大の割り込み潜在時間を越える前の1点でオーバー70
−するようにセットされる。サイクルカウンタのオーバ
ー70−は、割り込み同期要求信号と*IP:J込み信
号を発生することにより再同期を強行する。プロセッサ
が割り込みを供給するとき、割り込みルーチン内のコー
ドは、イベントを発生させるように強行する。こうして
、内部で発生された同期要求信号は、割り込みルーチン
により発生されたイベントに対して再同期を起こさせる
。次に、全プロセッサは、未決定割り込みを供給できる
他の実施例では、CPUのrラン」サイクルがイベント
カウンタ(この場合はサイクルカウンタである)で計数
される。すなわち、すべての非ストールサイクル(ここ
でパイプラインが進む)が、計数されるイベントである
。ここで、外部割り込みの形での同期要求に際して、全
CPUは、各CPUが、割り込みがそのCPUに対して
示される前に(同じサイクル計数で命令を実行して)同
じイベントにあるまでウェイトすることにより同期に保
たれる。こうして、1個のCPUは、異なった「リアル
タイム」に割り込みを受け取り得るが、実行されている
命令について測れば他のCPUと同時に割り込みを受け
取る。それで、CPUは、割り込みによって必ずしも「
リアルタイム」同期には戻されない。この割り込み同期
法は、他の同期技法とともに使用される。後者では、外
部メモリ参照がボートされ、全CPUが同じ参照をする
まで(または誤りが検出されるまで)メモリ参照が実施
されず、そうして、リアルタイム同期を強行する。さら
に、サイクルカウンタのオーバー70−は同期を生じ、
そのため、もしメモリ参照が選択された期間(サイクル
カウンタレジスタの長さによって表わされる)内に起こ
らないならば、同期動作が全CPUが余りに離れてドリ
フトしないように行われる。
(以下余白) (実施例) 以下、添付の図面を参照して本発明の詳細な説明する。
第1図を参照して、本発明の特徴を用いたコンピュータ
システムは、一実施例において、論理プロセッサとして
動作する3個の同一のプロセッサ11.12及び13(
以下、それぞれCPU−A。
CPU−B及びCPU−Cという。)を備え、これら3
個は、典型的には同じ命令ストリームを実行する。3個
のプロセッサが同じ命令ストリームを実行しない唯一の
時間は、システム起動自己テスト、診断などの動作であ
る。3個のプロセッサは、2個のメモリモジュール14
と15(メモリ#l。
メモリ#2と呼ばれる)と接続され、各メモリは、同じ
アドレス空間に同一のデータを格納する。好ましい実施
例においては、各プロセッサ11S 12及びL3は、
その固有のローカルメモリ16を含み、このメモリを含
むプロセッサによってのみアクセス可能である。
各プロセッサ1112及び13は、各メモリモジュール
14と15と同様に、それ自身の固有の別々のクロック
発振器17を備える。この実施例において、全プロセッ
サは、「ロックステップ」でランされず、その代わり、
上述の米国出願第118.503号で明らかにされたよ
うな方法により、すなわち、これらのCPUを同期化さ
せる外部メモリ参照のようなイベントを使用して、緩く
同期される。外部の割り込みは、各プロセッサから他の
2個のプロセッサへ割り込み要求とスティタスを結合す
るための1組のバスを使用する技法によって、3個のC
PUの間で同期化される。各プロセッサCPU−A、C
PU−B及びCPU−Cは、それ自身と他の2個との3
個の割り込み要求に対して応答的であり、命令ストリー
ムの同じ点においてこれらのCPUに割り込み要求を示
す。
メモリモジュール14と15は、メモリ参照をポートし
、全3個のCPUが同じ要求(故障に対する準備ととも
に)を行ったときにのみ、メモリ参照が進むことを許可
する。このように、これらのプロセッサは、外部のイベ
ント(メモリ参照)の時に同期化され、その結果、プロ
セッサは、典型的には、同じ命令ストリームを、同じシ
ーケンスで、ただし必ずしも同期イベントの間の時間に
おける平行した時間サイクルの間ではないが、実行する
。さらに、外部の割り込みは、同期化されて、各CPU
の命令ストリームにおける同一の点で実行される。
CPU−Aプロセッサ11は、バス21を介して、メモ
リ#lモジュール14とメモリ#2モジュール15に接
続される。同様に、CPU−Bプロセッサ12は、バス
22を介して、メモリ#lモジュール14とメモリ#2
モジュール15に接続される。そして、CP U−Cプ
ロセ・7す13は、バス23を介して、メモリモジュー
ル14.15に接続される。これらのバス21,22.
23は、32ビット多重アドレス/データバス、コマン
ドバス、及びアドレスとデータのストローブのための制
御ラインを含む。これらのCPUは、これらのバス21
22及び23の制御を備え、そのため、アービトレーシ
ョン(arbitration)またはバス要求やバス
使用承認(bus grant)はない。
各メモリモジュール14と15は、それぞれの入出力バ
ス24又は25に別々に接続され、各バスは、2個(ま
たはそれ以上)の入出カプロセッサに接続される。この
システムは、個々のシステム構成のために必要なI10
装置を収容するために必要な多数のI10プロセッサを
備えることができる。各入出カプロセッサ26.27は
、バス28に接続される。バス28は、VMEバス(登
録商標)のような標準の構成であってもよい。そして、
各バス28は、標準のI10コントローラ30とのイン
ターフェースのための1個以上のバスインターフェース
モジュール(BIM)29に接続されている。各バスイ
ンターフェースモジュール29は、2個のバス28に接
続され、従って、1個のI10プロセッサ26または2
7の故障、または1個のバスチャンネル28の故障は、
許容される。I10プロセッサ26と27を、CPU1
1.12及び13によってメモリモジュール14と15
を通してアドレス指定することができ、I10プロセッ
サ26.27はメモリモジュールを介して全CPUに割
り込み信号を出力することができる。ディスクドライブ
、CRTスクリーンとキーボードを備えたターミナル、
及びネットワークアダプタは、I10コントローラ30
により作動される典型的な周辺装置である。I10コン
トローラ30は、データブロックのような転送のために
メモリモジュール14と15に対しDMAタイプの参照
をすることができる。各I10プロセッサ26.27な
どは、バス要求、バス使用承認等のために各メモリモジ
ュールに直接に接続された個々のラインを備える。これ
らの点から点への接続ラインは、「ラジアル」と呼ばれ
、ラジアルライン31のグループに含まれる。
システムスティタスバス32は、各素子のスティタス情
報を与える目的のためは、上記各CPU11.12.1
3、各メモリモジュール14.15、各I10プロセッ
サ26.27に、個々に接続される。このスティタスバ
スは、システムに現在存在し適当に動作しているCPU
、メモリモジュール及びI10プロセッサについての情
報を提供する。
3個のCPUと2個のメモリモジュールを接続する肯定
応答/スティタスバス33は、メモリ要求が全CPUに
よって行われたときにモジュール14.15が全CPU
に肯定応答信号を送信する個々のラインを含む。同時に
、スティタスフィールドが、コマンドのスティタスとコ
マンドが正しく実行されたか否かとについて報告するた
めに送信される。メモリモジュールは、グローバルメモ
リから読み出されたデータまたは書き込まれたデータの
パリティを検査するだけでなく、メモリモジュールを介
してI10バス24と25へまたはバス24.25から
のデータのパリティを検査し、またコマンドの正当性を
検査する。これらの検査がCPUII、12及び13に
報告されるのは、バス33のスティタスラインを介して
であり、もし誤りが発生すると、故障ルーチンを、故障
部品を分離するためにエンターすることができる。
2個のメモリモジュール14と15がグローバルメモリ
に同じデータを格納し、すべてのメモリ参照を2重に行
うように動作しているが、任意の与えられた時間では、
1個のメモリモジュールがプライマリと指定され、他方
は、バックアップと指定される。メモリライト動作は、
両メモリモジュールにより実行されるので、両方とも使
用可能状態(current)であり、またメモリリー
ド動作も両方により実行される。しかし、プライマリの
メモリモジュールのみが、バス21,22及び23に実
際にリードデータをロードし、そして、プライマリのメ
モリモジュールのみがマルチマスタバス24と25のた
めのアービトレーシヨンを制御する。プライマリのメモ
リモジュールとバックアップのメモリモジュールに同じ
動作の実行を続けるために、バス34がプライマリから
バックアップへ制御情報を伝送する。どちらかのメモリ
モジュールが、ブートアップにおいてプライマリの役割
を取り、この役割は、ソフトウェアの制御の下に動作の
間に交換できる。当該役割は、選択されたエラー条件が
全CPUまたはシステムの他のエラ一応答性部分によっ
て検出されるときに、交換できる。
全CPUにおいて発生されたある割り込みは、また、メ
モリモジュール14と15によってボートされる。全C
PUがそのような割り込み状態となったとき(及びスト
ールされないとき)、全CPUは割り込みバス35の個
々のラインによって全メモリモジュールに割り込み要求
を出力する。
そこで、3個のCPUからの3個の割り込み要求をボー
トすることができる。すべての割り込みがボートされた
とき、メモリモジュールは、それぞれバス35を介して
3個のCPUにボートされた割り込み要求信号を送信す
る。この割り込みのボーティングは、また、全CPUの
動作についての検査のために機能する。3個のCPUは
、CPU間バス18を介してこのボートされた割り込み
をCPU割り込み信号に同期し、命令ストリームの共通
の点で全プロセッサに割り込みを示す。この割り込み同
期は、どのCPUもストールせずに達成される。
<CPUモジュール〉 第2図を参照して、1個のプロセッサ11,12又は1
3がさらに詳細に示される。全3個のCPUモジュール
は、好ましい実施例では、同じ構成であり、従って、C
PU−Aのみがここで説明される。価格を競争力のある
範囲内に保つために、そして、既に発展されているソフ
トウェアとオペレーティングシステムへのアクセスをた
だちに提供するために、好ましくは、市販のマイクロプ
ロセッサチップが使用され、多数のデバイスの中の任意
の1個が選択できる。RISC(縮小命令セット)アー
キテクチャは、後述する緩い同期を実行することにおい
て利点がある。しかし、モトローラ68030デバイス
やインテル80386デバイス(20MHzと25MH
zで使用できる)などのより通常的なCl5C(複雑な
命令セット)マイクロプロセッサが使用できる。高速3
2ビツトRISCマイクロプロセツサデバイスは、3個
の基本的なタイプで複数の製造者から入手できる。
すなわち、モトローラは、部品番号88000としてデ
バイスを製造し、MIPSコンピュータ・システムズ・
インコーホレイテッドなどは、MIPSタイプと呼ばれ
るチップセットを製造し、サン・マイクロシステムズは
、いわゆる5PARC(登録商標)タイプ(スケール可
能なプロセッサアーキテクチャ)を発表している。カリ
フォルニア州すンホセのサイプレス・セミコンダクタは
、例えば、部品番号CY7C601と呼ばれるマイクロ
プロセッサ(SPARC標準をサポートし、33MHz
のクロックを用い、20MIPSの(1秒当たり100
万命令)を与える)を製造し、富士通は、同様に5PA
RC標準をサポートするCMOSRISOマイクロプロ
セッサ(部品番号S−25)を製造している。
図示された実施例におけるCPUボードすなわちモジュ
ールは、−例として使用され、マイクロプロセッサチッ
プ40を用いる。このチップ40は、この場合MI P
Sコンピュータ・システムズ・インコーホレイテッドに
より設計されたR2000デバイスであり、また、イン
チグレイテッド・デバイス・テクノロジー・インコーホ
レイテッドによって製造される。このR2000デバイ
スハ、RISCアーキテクチャを用いた32ビツトプロ
セツサであり、例えば、16.67MHzのクロックで
12MIPsの高性能を示す。25MHzのクロックで
20MIPSを示すR3000のようなこのデバイスの
より高速のバージョンを代わりに用いても良い。プロセ
ッサ40はまた、論理アドレスから物理アドレスへの翻
訳をキャッシュするタメのトランスレーションルッタア
サイドバッファを含むメモリ管理のために使用されるコ
プロセッサを備える。プロセッサ40は、データバス、
アドレスバス、および制御バスを備えたローカルバスに
接続される。別々の命令とデータのキャシュメモリ44
と45が、このローカルバスに接続される。これらのキ
ャシュは、それぞれ64にバイトサイズであり、プロセ
ッサ40の1つのクロックサイクル内でアクセスされる
。もし追加の性能がこれらのタイプの計算のために必要
ならば、数値計算用すなわち浮動小数点コプロセッサ4
6が、このローカルバスに接続される。この数値計算用
プロセッサデバイスも、MIPSコンピュータ・システ
ムズ・インコーホレイテッドから部品番号R2010と
して市販されている。ローカルバス41.42.43は
、ライトバッファ50とり一ドバッファ51を介して内
部バス構造に接続される。このライトバッファは、入手
可能なデバイス(部品番号R2020)であり、ライト
動作のためにライトバッファ50にデータとアドレスを
格納した後に、ライトが実行されている間にストールサ
イクルを実行しなければならないことよりはむしろ、プ
ロセッサ4oにラン(Run)サイクルを実行し続けさ
せるように機能する。
ライトバッファ50を通るバスに加え、プロセッサ40
がライトバッファ50をバイパスしてライト動作を実行
することを可能にするためのバスが設けられる。このバ
スは、ソフトウェアの選択の下で、プロセッサに同期の
ライト動作を行うことを可能にする。もしライトバッフ
ァバイパス52がイネーブルされ(ライトバッファ5o
がイネーブルされず)、プロセッサがライト動作を実行
するならば、プロセッサは、ライト動作が完了するまで
ストール(−時停止)する。対照的に、ライトバッファ
がディスエーブルの状態でライト動作が実行されるとき
、データがライトバッファ50に書き込まれるので(ラ
イトバッファが満杯でないならば)、プロセッサはスト
ールしない。もしプロセッサ40がライト動作を実行す
るときにライトバッファがイネーブルされるならば、ラ
イトバッファ50は、バス43からの制御と同様に、バ
ス4Iからの出力データとバス42からのアドレスを捕
捉する。ライトバッファ50は、主メモリへのデータの
通過を待機する間に最大4個のそのようなデーターアド
レスセットを保持できる。
ライトバッファはプロセッサチップ40のりC77り1
7と同期して動作し、このため、プロセッサからバッフ
ァへの転送は同期状態でかつプロセッサのマシンサイク
ル速度で行われる。ライトバッファ50は、もし満杯で
あってデータを収容できないならば、プロセッサに信号
を送信する。プロセッサ40によるリード動作は、フォ
ーディーグ・ライトバッファ50に含まれるアドレスに
対uて検査され、そこで、もしメモリ16すなわちグロ
ーバルメモリに書き込まれるためにライトバッファで待
機しているデータに対してリード動作が試みられるなら
ば、リード動作は、ライト動作が完了するまでストール
される。
ライトバッファ50とリードバッファ51は、データバ
ス53、アドレスバス54および制御バス55を備えた
内部バス構造に接続される。ローカルメモリI6は、こ
の内部バスによってアクセスされ、この内部バスに接続
されたバスインターフェース56は、システムバス21
(または他のCPUのためのバス22または23)をア
クセスするために使用される。この内部バスの別々のデ
ータバス53とアドレスバス54(ローカルバス(7)
/<ス41と42から得られる)は、システムバス2■
内の多重化アドレス/データバス57に変換され、コマ
ンドラインと制御ラインは、対応して、この外部バス内
のコマンドライン58と制御ライン59に変換される。
バスインターフェースユニット56は、また、メモリモ
ジュール14と15から肯定応答/スティタスライン3
3を受信する。これらのライン33において、別々のス
ティタスライン33−1または33−2は、モジュール
14及び15のそれぞれから接続され、その結果、両メ
モリジュールからの応答を、後述するように、複数のC
PUとグローバルメモリの間の転送(リードまたはライ
ト)の発生の場合に評価できる。
一実施例においては、ローカルメモリ16は、約8Mバ
イトのRAMからなり、プロセッサ40の約3個または
4個のマシンサイクル内でアクセスでき、このアクセス
は、このCPUのクロック17と同期している。これに
反し、モジュール14と15へのメモリアクセスタイム
は、ローカルメモリへのそれに比べて非常に長く、メモ
リモジュール14.15へのこのアクセスは、非同期で
あり、すべてのCPUが要求とボーティングとを行うこ
とを待機することにより課される同期のオーバーヘッド
をこうむる。比較のため、I10プロセッサ26.27
、及び29を介しての典型的な市販のディスクメモリへ
のアクセスは、ミリ秒で測定され、すなわち、モジュー
ル14と15へのアクセスよりもかなり遅い。こうして
、CPUチップ40によるメモリアクセスの階層構造が
ある。
最高は、命令キャシュ44とデータキャシュ45であり
、64にバイトのキャシュサイズと適当なフィルアルゴ
リズム(fill a1gorith+m)を使用した
ときに多分95%のヒツト率を示す。最高の次は、ロー
カルメモリ16であり、再び一時的仮想メモリ管理アル
ゴリズムを使用することにより、ローカルメモリのサイ
ズが約8Mバイトである場合に、キャシュミスが発生し
、ローカルメモリにおけるヒツトが見いだされ、おそら
く95%のヒツト率が、メモリ参照に対して得られる。
プロセッサチップの観点からの正味の結果は、メモリ参
照(I10参照でなく)のおそらく99%以上が同期し
、同じマシンサイクルまたは3個または4個のマシンサ
イクル内に起こることである。
ローカルメモリ16は、メモリコントローラ60によっ
て内部バスからアクセスされる。このメモリコントロー
ラ60は、アドレスバス54からのアドレスと制御バス
55からのアドレスストローブを受信し、例えば、もし
ローカルメモリ16が通常のように多重アドレス指定で
DRAMを使用するならば、別々の行と列のアドレスと
、RASとCASの制御を発生する。データは、データ
バス53を介してローカルメモリに書き込まれ、読み出
される。さらに、オペレーティングシステムによって使
用可能なので、NVRAMや高速PROMのような不揮
発性メモリ62と同様に、数個のローカルレジスタ61
が、内部バスによってアクセスされる。メモリのこの部
分のいくつかが電源投入のためにのみ使用され、いくつ
かがオペレーティングシステムによって使用され、キャ
シュ44内でほとんど連続的であり、他は、メモリマツ
プのキャシュでない部分内に有り得る。
外部割り込みは、第2rMのCPUモジュールの割り込
み回路65から制御バス43または55でビンの中の1
本によってプロセッサ40に印加される。このタイプの
割り込みは、回路65でポートされるので、割り込みが
プロセッサ40によって実行される前に、全3個のCP
Uが割り込みを示されるか否かが決定される。この目的
のために、回路65は、他の2個のCPU12と13か
ら割り込み未決定(pending)入力を受信し、こ
の他の2個のCPUにライン67を介して割り込み未決
定信号を送信する。これらのラインは、3個のCPUI
I、12及び13をともに接続するバス18の一部であ
る。また、他のタイプの割り込み例えばCPUにより発
生された割り込みをポートするために、回路65は、こ
のCPUから両メモリモジュール14.15ヘバス35
のライン68により割り込み要求信号を送信することが
でき、そして、ライン69と70を介してメモリモジュ
ールから別々のポートされた割り込み信号を受信する。
両メモリモジュールは、行われるべき外部割り込みを与
える。1mのI10チャンネル28でのキーボードまた
はディスクドライブのような外部ソースにて発生された
割り込みは、例えば、各CPUII% 12又は13が
、後述されるように、命令ストリーム内の同じ点にある
まで、回路65からチップ40の割り込みピンに印加さ
れない。
プロセッサ40は別々のクロック発生器17によってタ
ロツクが供給されるので、周期的にプロセッサ40を同
期状態に戻すためのいくつかのメカニズムが必要である
。クロック発生器17が名目上同じ周波数でありこれら
のデバイスの許容誤差が約25 p p m (par
ts per +n1llion)であったとしても、
これらのプロセッサは、周期的に同期に戻されないなら
ば、位相が多くのサイクルでずれてしまう可能性がある
。もちろん、外部割り込みが発生する毎に、全CPUは
、(割り込み同期メカニズムによって)その命令ストリ
ームの同じ点で割り込まれるという意味で、同期化され
る。
しかし、これは、サイクル計数値を同期化させることを
援助しない。メモリモジュール14と15内のメモリ参
照をボートするメカニズムは、後述されるように全CP
Uをリアルタイムで同期状態にする。しかし、ある条件
は、長い周期においてメモリ参照が起こらないという結
果を生じ、そこで、別のメカニズムが、プロセッサ40
を同期に戻すためのストールサイクルを導入するために
使用される。サイクルカウンタ71は、ランサイクル(
ストールサイクルでなく)であるマシンサイクルを計数
するために、クロック17とプロセッサ40の制御ビン
に制御バス43を介して接続される。このカウンタ71
は、全CPUの間の最大の許容可能なドリフトが発生す
る周期(結晶発振子の特定の許容誤差を考慮して)を表
すように選択された最大計数値を有するカウントレジス
タを含ム。このカウントレジスタがオーバー70−する
と、より遅いプロセッサが追い付くまで、より速いプロ
セッサをストールする動作が開始される。
このカウンタ71は、メモリモジュール14と15への
メモリ参照によって同期がなされるときはいつでもリセ
ットされる。また、リフレッシュカウンタ72は、後述
されるように、ローカルメモリ16でリフレッシュサイ
クルを実行するために使用される。さらに、カウンタ7
3は、カウンタ71のように、ランサイクルであってス
トールサイクルでないマシンサイクルを計数する。しか
し、このカウンタ73は、メモリ参照によってリセット
されない。カウンタ73は、以下に説明されるように、
割り込み同期のために使用され、この目的のために、割
り込み同期回路65に出力信号Cc−4とCG−8を発
生する。
プロセッサ40は、RISC命令セットを備え、このセ
ットは、メモリからメモリへの命令をサポートシないが
、その代わり、メモリからレジスタへの命令またはレジ
スタからメモリへの命令(たとえばロードまたはストア
)をサポートする。ローカルメモリにしばしば使用され
るデータや現在実行中のコードを保持することは重要で
ある。従って、ブロック転送動作は、バスインターフェ
ース56に結合されたDMAステートマシン74により
なされる。プロセッサ40は、コマンドとして機能させ
るためにDMA回路74のレジスタにlワードを書き込
み、この回路74のレジスタにブロックのスタートアド
レスと長さを書き込む。
実施例では、DMA回路がブロック転送を引き継ぎ実行
する間に、マイクロプロセッサはストールをして、バス
53−55及び21によって必要なアドレス、コマンド
及びストローブを発生する。
このブロック転送を開始するためにプロセッサ40によ
って実行されるコマンドは、DMA回路74のレジスタ
からのリードであってもよい。UNIXオペレーティン
グシステムにおけるメモリ管理はデマンドページングを
当てにしているので、これらのブロック転送は、最もし
ばしばグローバルメモリとローカルメモリとI10トラ
フィックの間に動かされるページである。1ページは4
にバイトである。もちろん、バス21,22及び23は
、CPUとグローバルメモリの間の1ワードのリード転
送とライト転送をサポートする。参照されるブロック転
送は、ローカルメモリとグローバルのメモリの間でのみ
可能である。
くプロセッサ〉 第3図を参照して、実施例のR2000タイプまたはR
3000タイプのプロセッサ40がさらに詳細に示され
る。このデバイスは、32個の32ビツトの一般目的の
レジスタ76.32ビツトのALU77、Oビットから
64ビツトへのシ7り78、および32X32の多重/
分割回路79を備える32ビツトのメインCPU75を
備える。
このCPUは、また、プロセッサバス構造81に接続さ
れ、このプロセッサバス構造81は、ローカルデータバ
ス41に接続され、データバス41を介してフェッチさ
れる命令を実行するための関連する制御ロジックを備え
た命令デコーダ82に接続される。32ビツトのローカ
ルアドレスバス42は、オンチップメモリ管理コプロセ
ッサ内のトランスレーションルッタアサイドバッファ(
TLB)83を含む仮想メモリ管理装置によって駆動さ
れる。TLB83は、仮想アドレスバス84を介してマ
イクロプロセッサブロック75から受け取られた仮想ア
ドレスと比較されるべき64個のエントリを備える。バ
ス42の下位の16ビツトの部分85は、この仮想アド
レスバス84の下位部分によって駆動され、上位部分は
、もし仮想アドレスが物理的アドレスとして使用される
ならば、バス84からであり、あるいは、もし仮想アド
レス指定が使用され、ヒツトが起こるならば、出力86
を介してのTLB83からのタダエントリである。ロー
カルバスの制御ライン43は、パイプライン及びバス制
御回路87に接続され、内部バス構造81と制御ロジッ
ク82から駆動される。
プロセッサ40のマイクロプロセッサブロック75は、
RISCタイプであり、多くの命令が1マシンサイクル
で実行され、命令セットは、ALU動作に伴うメモリ参
照を含む複雑な命令を含むよりはむしろ、レジスタから
レジスタへの命令やロード/ストア命令を使用する。複
雑なアドレス指定スキーム(例えば、レジスタAIとレ
ジスタA2の内容の和であるアドレスのオペランドを、
レジスタBの内容によりアドレスされる主メモリの位置
に見いだされるアドレスのオペランドに加え、レジスタ
Cに見いだされるアドレスの位置に主メモリにその和の
結果をストアせよ。)は、命令セットの一部として含ま
れない。その代わり、この動作は、次の多数の単純なレ
ジスタからレジスタへの命令やロード/ストア命令にて
なされる。
すなわち、レジスタA2をレジスタAIに加算せよ、レ
ジスタB内のアドレスのメモリ位置からレジスタBlを
ロードせよ、レジスタAIとレジスタBlを加算せよ、
レジスタCによりアドレスされたメモリ位置にレジスタ
Blをストアせよ。
コンパイラ技法は、32個のレジスタ76の使用を最大
にするために使用され、すなわち、大部分の動作が既に
レジスタセットにあるオペランドを見いだすことを保証
する。ロード命令は、実際に、lマシンサイクルより長
くかかる。このためl命令の潜在(1atency)が
導入される。ロード命令によってフェッチされるデータ
は、第2サイクルまで使用されず、もし可能ならば、そ
の間に入るサイクルが、ある他の命令のために使用され
る。
メインCPU75は、マシンサイクル当たりの命令実行
を平均化する目的を容易にするために高度にパイプライ
ン化されている。第4図を参照して、1つの命令が5マ
シンサイクルを含む周期にわたって実行される。ここで
、lマシンサイクルは、16.67MHzのクロック1
7に対してlクロック周期すなわち60nsecである
。この5サイクルすなわちパイプステージは、IF(1
キヤシユ44からの命令7エツチ)、RD(レジスタセ
ット76からのリードオペランド)、ALU(ALU7
7での要求される命令を実行)、MEM(もし要求され
たならDキャシュ45をアクセスせよ)、及びWB (
ALUの結果をレジスタファイル76に書け)として呼
ばれる。第5図かられかるように、これらの5個のパイ
プステージは、重なっているので、与えられたマシンサ
イクル、例えばサイクル5において、命令■#5は、そ
の第1パイプステージすなわちIFパイプステージにあ
り、命令I#1は、その最後のステージすなわちWBス
テージにあり、その他の命令は、その間に入るバイブス
テージにある。
〈メモリモジュール〉 第6図を参照して、1個のメモリモジュール14または
15が詳細に示される。両メモリモジュールは、好まし
い実施例において、同じ構成であるので、メモリ#lモ
ジュールのみが示される。
メモリモジュールは、それぞれ、CPUII、12.1
3から来る3個のバス21,22.23に接続される3
個の入力/出力ボート91,92.93を含む。これら
のボートへの入力は、レジスタ94.95.96にラッ
チされ、各ラッチは、データ、アドレス、コマンド、及
びライト動作のためのストローブ、または、アドレス、
コマンド、及びリード動作のためのストローブをストア
するための別々のセクションを備える。これらの3個の
レジスタの内容は、全3個のレジスタのみがすべてのセ
クションに接続される入力を備えたボート回路100に
よってボートされる。もし全3個のCPUII、12.
13が同じメモリ要求(同じアドレス、同じコマンド)
を行うならば(全CPUは典型的には同じ命令ストリー
ムを実行するのでそのような場合がありうる)、メモリ
要求は完了することを許容される。しかし、第1メモリ
要求が、3個のラッチ94,95.96のいずれかにラ
ッチされると直ちにメモリアクセスを開始するために通
過される。この目的のために、アクセス、データ及びコ
マンドは、データバス101、アドレスバス102およ
びコマンドバス103t−含む内部バスに印加される。
この内部バスから、メモリ要求は、アドレスに依存して
、そしてシステム構成に依存して様々なリソースにアク
セスする。
一実施例において、大きなりRAM104が、メモリコ
ントローラ105を用いて、内部バスによってアクセス
される。このメモリコントローラ105は、アクセスバ
ス102からアドレスと制御バス103からメモリ要求
とストローブとを受信し、データ入力とデータ出力がデ
ータバス101に出力されるようにDRAMのための多
重の行と列のアドレスを発生する。このDRAM104
はまた、グローバルメモリと呼ばれ、一実施例において
は多分32Mバイトのサイズである。さらに、内部バス
101−103は、制御・スティタスレジスタ106、
多数の不揮発性RAM107及びライトプロテクト10
8をアクセスできる。
CPUによるメモリ参照は、また、メモリモジュール1
4または15内のメモリをバイパスでき、内部バス1o
t−103に接続される入力を備えタハスインターフエ
ースによってI10バス24.25にアクセスできる。
もしメモリモジュールがプライマリメモリモジュールで
あるならば、各メモリモジュール内のバスアービトレー
タ110は、バスインターフェース109を制御する。
もしメモリモジュールがバックアップモジュールである
ならば、バス34はバスインターフェース109を制御
する。
DRAM104へのメモリアクセスは、第1の要求が1
個のラッチ94.95、又は96にラッチされると直ち
に開始されるが、故障に備えて、多数の要求が同じであ
ることをボート回路100が決定されなければ、完了を
許容されない。3個の要求の中の第1の要求の到達は、
DRAMIO4へのアクセスを開始させる。リードに対
して、DRAM104がアドレス指定され、センスアン
プがストローブされ、データ出力がDRAM入力で生じ
る。そして、もし第3の要求が受信された後でボートが
良いならば、要求されたデータはCPUに直ちに転送す
るために用意される。このように、ボーティングの動作
はDRAMアクセス動作と重なる。
第7図を参照して、バス21,22.23は、図示され
た7オーマツトにてメモリモジュール14.15のボー
ト91,92.93にメモリ要求を与える。これらのバ
スの各々は、32本の双方向多重アドレス/データライ
ン、13本の1方向コマンドライン及び2本のストロー
ブからなる。
コマンドラインは、リード、ライト、ブロック転送、単
独転送、I10リードまたはI10ライトなどのバスア
クティビティのタイプを特定するフィールドを含む。ま
た、lフィールドは、4バイトに対するバイトイネーブ
ルとして機能する。上記のストローブは、AS(アドレ
スストローブ)とDS(データストローブ)である。C
PUI 1゜12.13は、それぞれ、自分自身のバス
2122又は23を制御する。この実施例において、こ
レラは、マルチマスタバスではなく、争いすなわちアー
ビトレーションはない。ライトに対して、CPUは、ア
ドレスストローブAS(アクティブでローレベル)で1
サイクル内でバスにアドレスとコマンドを送り、統(サ
イクル(おそらく次のサイクル、しかし必ずしもそうで
なくてもよい)でデータストローブと同時にバスのアド
レス/データラインにデータを送信する。各CPUから
のアドレスストローブASは、ストローブが現れたとき
、ボート91,92又は93にアドレスとコマンドを生
じさせて、レジスタ94.95.96のアドレス・コマ
ンドセクションにラッチさせ、次に、データストローブ
DSがデータをラッチさせる。バス21122.23の
多数(この実施例では3の中の2)が同じメモリ要求を
ラッチ94.95.96に送信するとき、ボート回路1
00は、バス103に最後のコマンドを通過させ、メモ
リアクセスが実行される。もしコマンドがライトならば
、ライトが実行されると直ちに、肯定応答ACK信号が
ライン112(特にメモリ#lのラインl l 2−1
とメモリ#2のラインI l 2−2)によって各CP
Uに送り返され、同時にスティタスピットが、第7図の
時間T3に各CPUに肯定応答/スティタスバス33(
特にメモリ#lのライン33−1とメモリ#2のライン
33−2)を介して送信される。最後のストローブDS
(もしリードならばAS)とT3でのACKの間の遅延
T4は、メモリ要求のときにCPUが何サイクル同期位
置からずれているかに依存して、また、ボーティング回
路における遅延とCPUクロック17に比べてメモリモ
ジュール14又は15の内部の独立なりロック17の位
相に依存して、変わり得る。
もしCPUにより出力されるメモリ要求がリードである
と、次に、ライン112−1と112−2のACK信号
とライン33−1と33−2のスティタスピットが、時
間T3の間に、データがアドレス/データバスに出され
るのと同時に送信される。
これは、CPUにストールをリリースし、こうして同一
の命令に対してCPUチップ40を同期させる。すなわ
ち、最速のCPUは、より遅いCPUが追い付くのを待
っているので、より多くのストールサイクル(stal
l cycle)を実行し、こうして、クロック17が
たぶん位相がずれているが、全3個が同時にリリースさ
れる。全3個のCPUがストールから出て来たとき、こ
れらのCPUによって最初に実行される命令は同じであ
る。
メモリモジュール14又は15からCPU11゜12.
13に送信されるすべてのデータは、そのデータがDR
AM104から又はメモリ位置106−108からのリ
ードデータであるか、バス24.25からのI10デー
タであるかに拘わらず、レジスタ114を通過する。こ
のレジスタ114は、内部データバス101からロード
され、このレジスタからの出力は、時間T3にボート9
1192.93でバス2122.23のためのアドレス
/データラインに印加される。パリティは、データがこ
のレジスタにロードされたときに検査される。DRAM
104に書き込まれたすべてのデータと、■10バスの
すべてのデータは、それに関連したパリティビットを持
つ。しかし、パリティビットは、バス21.22.23
でcpuモジュールに転送されない。リードレジスタ1
14で検出されたパリティエラーは、スティタスバス3
3−1.33−2を介してCPUによって報告される。
プライマリとして指定されたメモリモジュール14又は
15のみが、そのレジスタ114内のデータをバス21
.22.23に出力する。バックアップ又はセカンダリ
として指定されたメモリモジュールは、レジスタ114
をロードする点まで連続して行われるリード動作とパリ
ティチエツクを完了し、バックアップ33−1と33−
2にスティタスを報告する。しかし、データは、バス2
1122.23に出力されない。
各メモリモジュール14又は15内のコントローラ11
7は、このモジュールのためのクロツク発振器17によ
りステートマシーンとして動作し、バス103とバス2
1−23から様々なコマンドラインからのデータ(例え
ばレジスタとバスをロードするための制御ビットの発生
、外部制御信号の発生など)を受信する。現在プライマ
リとして指定されているモジュール14又は15内のこ
のコントローラ117は、共通のバス101−103へ
のアクセスのためにI10側(インターフェース)とC
PU側(ポート9l−93)の間でアービトレータ11
0を介してアービトレートする。
プライマリメモリモジュール14又は15のコントロー
ラ117によるこの決定は、ライン34によって他のメ
モリモジュールのコントローラ117に伝送されて、他
のメモリモジュールに同じアクセスを実行させる。
(以下余白) 各メモリモジュール内のコントローラ117はまたこの
モジュールのためのクロック発振器17からパルスを受
信するりフレッシュカウンタ118に基づいて、DRA
M104にリフレッシエサ2リフレツシユサイクルを受
信しなければならず、従って平均して約15ミリ秒毎に
リフレッシュサイクルが導入される。こうして、カウン
タl18は、15ミリ秒毎にコントローラ117にオー
バー70−信号を発生する。そして、もしアイドル条件
(cPUアクセスまたはI10アクセスが実行されない
)が存在するならば、リフレッシュサイクルがバス10
3に出力されたコマンドによって実施される。もし動作
が進行中ならば、現在の動作が完了したときに、す7レ
ツシユが実行される。メモリのページングに使用される
ブロック転送のような長い動作のために、数個のりフレ
ッシュサイクルがバックアップでき、転送が完了した後
でバーストモードで実行される。この目的のために、最
後のリフレッシュサイクルがカウンタ118に関連した
レジスタに格納されるので、カウンタ118のオーバー
フローの数が用いられる。
CPUによって発生された割り込み要求は、割り込みバ
ス35のライン68によって個々に各CPUII、12
.13から受信される。これらの割り込み要求は、各メ
モリモジュール14.15に送信される。バス35のこ
れ゛らの要求ライン68は、割り込みポート回路119
に接続されて、この回路119はこれらの要求を比較し
、バス35の出力ライン69にポートされた割り込み信
号を出力する。CPUはそれぞれ、バス35を介して2
本のライン(各モジュール14.15から1本)にポー
トされた割り込み信号を受信する。各メモリモジュール
14.15からのポートされた割り込み信号に対して論
理和の演算が行われ、その演算結果が割り込み同期回路
65に出力される。
ソフトウェアの制御の下に、CPUはどのCPUが割り
込みをするかを決定する。I10プロセッサ又はI10
コントローラで発生される外部割り込みはまた、バス3
5のライン69.70を介してメモリモジュール14.
15を介してCPUに信号として送信される。同様に、
CPUはただプライマリモジュール14又は15からの
割り込みに応答する。
<x7oプロセッサ〉 第8図において、1個のI10プロセッサ26又は27
が詳細に示される。I10プロセッサは2個の同じポー
ト(110バス24への1個のポー)121とI10パ
ス25への他のポート122)を備える。各110バス
24.25は、32ビット双方向多重アドレス/データ
バス123(32ビツトの外に4ビツトのパリティを含
む)、リード、ライト、ブロックリード、ブロックライ
トなどの実行される動作のタイプを定義する双方向コマ
ンドバス124、内部から■10プロセッサへの又はバ
ス28のどのロケーションにアドレス指定するかを示す
アドレスライン、バイトマスク、及び最後に、アドレス
ストローブ、データストローブ、アドレス肯定応答及び
データ肯定応答を含む制御ラインから構成される。バス
31のラジアルラインは、各I10プロセッサから各メ
モリモジュールへの個々のラインを含む。すなわち、I
10プロセッサからメモリモジュールへのバス要求、メ
モリモジュールからI10プロセッサへのバスグランド
、I10プロセッサからメモリモジュールへの割り込み
要求ライン、及びメモリモジュールからI10プロセッ
サへのリセットラインである。どのメモリモジュールが
プライマリであるかを示すラインは、システムスティタ
スバス32を介して各110プロセツサに接続される。
第8図のI10プロセッサのコントローラすなわちステ
ートマシーン126は、コマンドライン、制御ライン、
スティタスライン、ラジアルラインからのデータ、内部
データ、及びバス28からのコマンドラインからのデー
タを受信し、さらに、バス24.25の内容を受信し情
報をバスに伝送するために保持するラッチ127,12
8の動作を含むI10プロセッサの内部動作を定義する
メモリモジュールからI10プロセッサへのバス24.
25での転送は、別々に肯定応答されたアドレスとデー
タを用いて第9図に示されるプロトコルを使用する。プ
ライマリと指定されたメモリモジュール内のアービトレ
ータ回路110は、T10バス24.25の所有権(o
wnership)のためのアービトレーションを行う
。CPUからIloへの転送が必要なとき、CPU要求
がメモリモジュールのアービトレーション論理回路11
0に出力される。アービトレーション論理回路110が
この要求を承認したとき、メモリモジュールは、アドレ
スとコマンドを(両バス24.25の)バス123.1
24に、アドレスストローブが(2つのバス24と25
の)第9図の時間T1に主張されたときと同時に、バス
125に印加する。コントローラ126がアドレスをラ
ッチ127又は128にラッチさせたとき、アドレス肯
定応答がバス125に主張され、次に、メモリモジュー
ルは時間T2にデータを(両バス24.25を介して)
バス123に出力し、ライン125にデータストローブ
を出力する。時間T2の後で、コントローラは、21の
ラッチ127.128にデータをラッチさせ、データ肯
定応答信号がライン125に出力され、そうして、デー
タ肯定応答の受信の際に、両メモリモジュールは、アド
レスストローブ信号の主張をやめることによりバス24
.25をリリースする。
I10プロセッサからメモリモジュールへの転送におい
て、I10プロセッサがI10バスを使う必要があると
き、I10プロセッサは、両バス24.25に、ラジア
ルバス31にラインによってバス要求を主張し、次に、
プライマリメモリモジュール14又は15にアービトレ
ータ回路110からバス使用承認信号を待つ。バス使用
承認ラインもラジアルラインの1本である。バス使用承
認が主張されたとき、コントローラ126は、前の転送
が完了されたことを(誤って)意味する、バス125上
でアドレスストローブとアドレス肯定応答信号の主張が
解除されるまで待機する。そのとき、コントローラ12
6は、ラッチ127.128からライン123ヘアドレ
スを出力させ、コマンドをライン124に出力させ、ア
ドレスストローブを両バス24.25のバス125に出
力させる。アドレス肯定応答が両バス24.25から受
信されたとき、データがアドレス/データバスにデータ
ストローブとともに出力され、転送は、メモリモジュー
ルからI10プロセッサへのデータ肯定応答信号で完了
される。
ラッチ127と128は、アドレスバス129a、デー
タバス129b、及び制御バス129cを含む内部バス
129に接続される。内部バス129は、バス32によ
って供給されるスティタスを保持するなどのために、コ
ントローラステートマシーン126によって実行される
コマンドをセットアツプするために用いられる内部ステ
ィタス・制御レジスタ130をアドレス指定することが
できる。これらのレジスタ130は、CPUのアドレス
空間においてCPUからリードまたはライトのためにア
ドレス指定可能である。バスインターフェース131は
、コントローラ131の制御の下に、VMEバス28と
通信する。バス28は、アドレスバス28a、データバ
ス28b、制御/<ス28c及びラジアル28dを備え
、これらの全ラインは、バスインターフェースモジュー
ル29を介してI10コントローラ30に接続される。
バスインター7エースモジユール29は、一方又は他方
の又は両方のI10プロセッサからの、1セツトだけの
パスライン28をコントローラ30に駆動させるための
マルチプレクサ132を備える。コントローラ30の内
部で、コマンド、制御、スティタス、データのレジスタ
133があり、(このタイプの周辺コントローラにおい
て標準的プラクティスとして’)CPU11,12.1
3から、開始するべきリードとライトのためにアドレス
指定可能であり、I10装置における動作を制御する。
VMEバス28上での各I10コントローラ30は、8
1M29のマルチプレクサ132を介して両I10プロ
セッサ26.27との接続機能を備え、いずれか1個に
よって制御されるが、CPUによって実行されるプログ
ラムによって一方または他方に限られる。特定のアドレ
ス(又1組のアドレス)は、各コントローラ30を示す
制御・データ転送レジスタ133のために確定され、こ
れらのアドレスは、オペレーティングシステムによりI
10ページテーブル(通常は、ローカルメモリの核デー
タ区分)に維持される。これらのアドレスは、両方では
なく、どちらかのI10プロセッサ#lまたは#2を介
してのみアドレス指定が可能であるように、各コントロ
ーラ30を関連づける。すなわち、I10プロセッサ2
7と比較すると、ある異なったアドレスは、I10プロ
セッサ26を介して特定のレジスタ133に到達させる
ために使用される。バスインターフェース131 (及
びコントローラ126)は、マルチプレクサ132を切
り換えて一方または他方からバス28上のデータを受信
する。これは、CPUから■10プロセッサのレジスタ
130へのライトによってなされる。こうして、デバイ
スドライバがこのコントローラ30をアクセスするため
にコールされたとき、オペレーティングシステムはペー
ジテーブルにおけるこのアドレスを七のために使用する
。プロセッサ40は、ライトバッファ50を介してより
もむしろ、バイバスバッファパス52を用いてこれらの
コントローラの制御・データ転送レジスタ133へのI
10ライトによってコントローラ30をアクセスする。
従って、これらは、これは、回路100によってボート
され、メモリ、モジュールを通してバス24又は25へ
、従って選択されたバス28への同期化されたライト動
作である。プロセッサ40は、このライト動作が完了す
るまでストールする。第8図のI10プロセッサボード
は、ある誤り(例えば不適当なコマンド、VMEバス2
8で応答が受信しないまま期限がすぎたこと、実行され
たときのパリティチエツク)を検出するように形成され
、1個の誤りが検出されると、■10プロセッサは、バ
ストラフィックへの応答を止め、すなわち、第9図に関
連して上述されたアドレス肯定応答とデータ肯定応答を
送信することを中止する。これは、バスインターフェー
ス56によってバスフォールトとして検出され、後述さ
れるように割り込みを生じ、可能ならば自己訂正作用が
なされる。
くエラーリカバリ〉 上記バス21,22,23を介しての転送のためのメモ
リモジュール14と15による応答を評価するために、
CPUl 1,12.13によって用いられるシーケン
スは、次に説明される。このシーケンスは、バスインタ
ーフェースユニット56におけるステートマシンによっ
て定義されかつCPUによって実行されるコードにおい
て定義される。
第1の場合、リード転送において、データの誤りがプラ
イマリのメモリからのライン33にスティタスビットに
示されないと仮定する。ここで、メモリ参照によって始
められるストールは、各マイクロプロセッサ40で命令
実行を続けることを可能にするために、制御バス55と
43を介してレディ信号を主張することにより終了する
。しかし、肯定応答がライン112において他の(プラ
イマリでない)メモリモジュールから受信されるまで(
または時間切れになるまで)、開始されない。もしいず
れかのスティタスフィールド(ライン33−1または3
3−2)においてエラーが検出されたなら、又はもしプ
ライマリでないメモリが時間切れになったならば、割り
込みはポスト(post)される。
第2の場合、リード転送において、データエラーがプラ
イマリメモリからスティタスライン33に指示されたこ
と、あるいは、プライマリメモリから応答が受信されな
かったことが仮定される。
CPUは、他方のメモリから肯定応答を待ち、もし他の
メモリからのスティタスビットにデータエラーが見いだ
されないならば、バスインターフェース56の回路が所
有権(プライマリのメモリスティタス)の変化を起こさ
せ、従って、データが新しいプライマリから正しくリー
ドされたか否かを確認するために、リトライが設定され
る。もし良好なスティタスが新しいプライマリから受信
されたなら、次にストールは前のように終了して、割り
込みはシステムを更新するために(1個のメモリを悪い
と気付き、異なったメモリをプライマリとし)ポストさ
れる。しかしながら、もしデータエラー又は時間切れが
新しいプライマリからリードをするという試みから生じ
たなら、次に割り込みが制御バス55と43を介してプ
ロセッサ40に主張される。
ライトバッファ50がバイパスされたライト転送におい
て、第1の場合では、どちらのメモリからもスティタス
ビットにエラーが示されない。ストールは終了され命令
の続行が許可される。再び、もしエラーがどちらかのス
ティタスフィールドに検出されたならば割り込みがポス
トされる。
ライトバッファ50がバイパスされたライン転送におい
て、第2の場合では、データエラーがプライマリメモリ
からスティタスに指示されるか、または、応答が、プラ
イマリメモリから受け取られない。各CPUのインター
フェースコントローラは、他のメモリモジュールからの
肯定応答を待つ。そして、もしデータエラーが他のメモ
リからのステータスに見いだされないならば、所有権の
変化が強制され、割り込みがポストされる。しかし、も
しデータエラー又は時間切れが他方の(新しいプライマ
リの)メモリモジュールのために起こるならば、次に割
り込みがプロセッサ40に対して主張される。
ライトバッファ50がイネーブルされたライト転送にお
いて、CPUチップはライト動作によってストールされ
ず、第1の場合は、どちらのメモリモジュールからもス
ティタスにエラーが指示されない。転送は終えられて、
他のバス転送が開始される。
ライトバッファ50をイネーブルとしたライト転送にお
いて、第2の場合、データエラーは主メモリからのステ
ィタスに示されるか、又は、応答が主メモリから受信さ
れない。メカニズムは、他のメモリからの肯定応答を待
つ。そして、もし他のメモリからのスティタスにデータ
エラーが見い出されないならば、次に所有権の変化が強
行され、割り込みはポストされる。しかし、もしデータ
エラー又は時間切れが他のメモリにおいて生じるならば
、次に割り込みがポストされる。
メモリモジュール14又は15は、いま説明したメカニ
ズムによって一旦決定されると、フォールト条件がオペ
レータに対し信号として示されるが、システムは動作を
続けることができる。オペレータは、おそらく故障のモ
ジュールを含むメモリボードを交換することを希望する
だろう。これは、システムが起動され動作している間に
行うことができる。次に、システムは、停止せずに新し
いメモリボードを再統合できる。このメカニズムは、ソ
フトのエラーによってライトを実行できないがテストで
良好なとされ物理的に交換する必要がないメモリモジュ
ールを再生するためにも役立つ。タスクは、データが他
方のメモリモジュールと同じである状態にそのメモリモ
ジュールを戻すことである。この再生モードは、2ステ
ツプのプロセスである。まず、メモリがイニシャライズ
されておらず、パリティエラーを含むかも知れないこと
を仮定する。そこで良好なパリティの良好なデータが、
すべてのロケーションに書き込まなければならない。こ
れは、この点ですべてゼロである。しかし、すべてのラ
イト動作が2個のメモリで実行されるので、この第1ス
テツプが達成される方法は、良好なメモリモジュールの
ロケーションをリードし、次にこのデータを両メモリモ
ジュール14と15の同じロケーションにライトするこ
とである。これは、通常の動作が進行中に、実行中のタ
スクに挿入されて行われる。I10バス24又は25か
ら生じるライトは、第1ステツプでのこの再生ルーチン
において無視される。こうしてすべてのロケーションに
ライトされた後は、次のステップは、■10アクセスも
またライトされることを除いて第1ステツプと同じであ
る。すなわち、I10バス24又は25からのI10ラ
イトは、実行するタスクにおいて通常のトラフイ7りに
おいて発生するときに、良好なメモリのすべてのロケー
ションをリードしこの同じデータを両メモリモジュール
の同じロケーションにライトすることを挿入して実行さ
れる。この第2ステツプでモジュールがゼロから最大ア
ドレスまでアドレス指定されたときに、両メモリは同一
になる。この第2の再生ステップの間に、CPUとI1
0プロセッサの両方が、エラーなしに全ての動作を行う
ようにメモリモジュールが再生されることを期待する。
I10プロセッサ26.27は、データリード転送の間
に再生されるメモリモジュールによって示されるデータ
を使用しない。再生プロセスが完了した後で、再生され
たメモリは、(必要ならば)プライマリと指定できる。
同様な再プロセスがCPUモジュールに対しても備えら
れる。1個のCPUが(メモリポート回路100による
場合等のように)故障と検出されるとき、他の2個のC
PUは動作を続けるが、悪いCPUボードは、システム
を停止せずに交換できる。新しいCPUボードがオンボ
ードROM63から起動自己テストルーチンを実行する
とき、他のCPUにこのことを示す信号を出力して、再
生ルーチンが実行される。まず、2債の良好なCPUが
その状態をグローバルメモリにコピーし、次に全3個の
CPUが「ソフトリセット」を実行する。ここで、CP
UはROM内のイニシャライズルーチンから実行をリセ
ットし開始する。そうして、全CPUは、命令ストリー
ムの正確に同じ点に来て、同期化され、次に、保存され
ていた状態が全3(1のCPUにコピーして戻され、前
に実行されていたタスクが続行される。
上述したように、各メモリモジュール内のポート回路1
00は、全3債のCPUが同一のメモリ参照をしている
か否かを決定する。もしそうならば、メモリ動作は、完
了まで進むことを許可される。もしそうでなければ、C
PU故障モードに入る。ボート回路100によって検出
されるように、異なったメモリ参照を送信するCPUは
、バス33−1及び/又は33−2で戻されるスティタ
スで同定される。割り込みはボストされ、ソフトウェア
は引き続いて故障CPUをオフラインとする。
このオフラインスティタスは、スティタスバス32に反
映される。故障が検出されているメモリ参照は、3つか
ら2つを選択するポートに基づき完了することを許可さ
れる。つぎに、悪いCPUボードが交換されるまで、ボ
ート回路100は、メモリ参照の進行を許可する前に、
2個の良好なCPUからの2個の同一のメモリ要求を必
要とする。
システムは、通常は、1個の(2個でなく)CPUオフ
ラインで動作を続けるように構成されている。しかし、
1個の良好なCPUだけで動作することが希望されるな
らば、別の方法が利用できる。
CPUは、もし異なったデータがメモリ要求で検出され
るならばボート回路100によって、又は時間切れによ
って、故障とポートされる。もし2個のCPUが同一の
メモリ要求を送信するが、第3のCPUがあらかじめ選
択された時間切れ期間にどんな信号も送信しないならば
、CPUは故障と仮定され、前のようにオフラインとさ
れる。
システムのI10装置は故障の場合にソフトウェア再統
合のためのメカニズムを備える。すなわち、CPUとメ
モリモジュールコアは、いま説明したように、故障に対
して保護されたハードウェアである。しかし、システム
の110部分は故障に対して保護されたソフトウェアで
ある。1個の110プロセツサ26または27が誤ると
、上述したようにソフトウェアによってI10プロセッ
サに限定されたコントローラ30は、ソフトウェアによ
って他方のI10プロセッサヘスイッチされる。オペレ
ーティングシステムは、同じコントローラに対する新し
いアドレスを用いてI10ページテーブルのアドレスを
書き直し、その後は、コントローラは他方のI10コン
トローラ26又は27に限定される。エラーすなわち故
障は、バスインターフェース56でバスサイクルを終え
るバスエラーによって検出でき、例外の原因を決定する
例外処理ルーチンを通して核内に急送される例外を発生
し、次に、■10テーブルのアドレスを書き換えること
により)全コントローラ30を、誤ったI10プロセッ
サ26又は27から他方へ動かす。
バスインターフェース56はいま説明したようにバスエ
ラーを検出すると、故障は、再統合スキームが使用され
る前に分離されねばならない。1個のI10プロセッサ
26または27へ、あるいは1個のバス28の1個のI
10コントローラ30へ(すなわち1個のI10素子に
おける1個の制御レジスタ又はスティタスレジスタ、又
はデータレジスタへ)のいずれかにCPUがライト動作
を行うとき、これは、メモリモジュールにおけるバイパ
ス動作であり、両メモリモジュールは動作を実行して、
2個のI10バス24と25にそれを通過させる。2個
のI10プロセッサ26と27は、ともにバス24と2
5をモニタし、パリティをチエツクし、コントローラ1
26を介して適正なシンタックスでコマンドをチエツク
する。例えば、もしCPUがI10グロセッサ26また
は27内のレジスタにライトを実行するならば、もしど
ちらかのメモリモジュールが正当なアドレス、正当なコ
マンド及び正当なデータを示すならば(パリティエラー
がないことと適正なプロトコルによって証明されるよう
に)、アドレス指定された■10プロセッサは、アドレ
ス指定されたロケーシヨンにデータをライトし、ライト
動作が成功して完了したという肯定応答指示でメモリモ
ジュールに応答する。両メモリモジュール14と15は
、I10プロセッサ26又は27からの応答(第9図の
アドレスとデータの肯定応答信号)をモニタしていて、
両メモリモジュールは、ライン33−1と33−2の動
作スティタスでCPUに応答する。
(もしこれがリードであるならば、プライマリのメモリ
モジュールのみがデータを戻すが、しかし両方がスティ
タスを戻す。’)CPUは、両方がライトを正しく実行
したか、1個だけであったか、無しであったかを決定で
きる。もし1個だけが良好なスティタスを戻し、それが
プライマリならば、所有権を変える必要は無い。しかし
もしバックアップが良好に戻され、プライマリが悪く戻
されるならば、所有権の変更が強行され、正しく実行し
たものをプライマリにする。どちらの場合も、割り込み
が故障を報告するために入れられる。この点で、CPU
は、悪いのがメモリモジュールであるか、メモリモジュ
ールの下流側の何かであるかを知らない。それで、同様
なライトがI10プロセッサに対して試みられる。しか
し、これが成功するならば、メモリモジュールが悪いこ
とを必ずしも証明する必要が無い。なぜなら、初めにア
ドレス指定されたI10プロセッサが例えばバス24ま
たは25のラインに接続され、パリティエラーを起こし
たからである。それで、システムは、選択的に、■10
プロセッサのシャットオフと操作のりトライを行い、両
メモリモジュールが同じI10プロセッサにライト動作
を正しく実行できるかを見る。もしそうならば、システ
ムは、交換され再統合されるまで悪いI10プロセッサ
をオフラインにして動作を実行できる。しかし、もしリ
トライが1個のメモリから悪いスティタスをなお与える
ならば、メモリをオフラインにでき、あるいは、他の要
素において故障がメモリにあるか無いかを確実にするた
めに故障分離ステップがさらに採られる。これは、全コ
ントローラ30を1個のI10プロセッサ26又は27
に切り換えてオフのI10プロセッサにリセットコマン
ドを送り、生きている両メモリモジュールでオンライン
のI10プロセッサとのりトライの通信を出力すること
を含む。そして、もしリセットI10プロセッサがバス
24又は25を悪化させているならば、そのバスドライ
バは、リセットによって切られ、そうして、もしオンラ
インI10プロセッサへの通信のりトライが(両バス2
4と25を介して)良好なスティタスを返すならば、リ
セットI10プロセッサが故障であることが分かる。と
にかく、各バスエラーに対して、あるタイプの故障分離
シーケンスが実行され、どのシステム部品がオフライン
にしなければならないかを決定する。
く同期〉 図示される実施例において使用されるプロセッサ40は
、第4図と第5図を参照して上に説明したように、重な
った命令実行を行うパイプラインアーキテクチャである
。この実施例において使用される同期技法は、サイクル
計数、すなわち、命令が実行される毎に第2図のカウン
タ71とカウンタ73をインクリメントすることによる
ので(米国出願第118.503号に一般的に開示され
ているように)、何がプロセッサ40における命令の実
行であるかを定義しなければならない。まっすぐな定義
は、パイプラインが進むごとに命令が実行されることで
ある。コントロールバス43の1本のコントロールライ
ンは、パイプラインがストールされることを示す信号ラ
ン#である。ラン#が高レベルであるときは、パイプラ
インはストールされ、ラン#が低レベル(論理O)であ
るときは、パイプラインは各マシンサイクル毎に進む。
このラン#信号は、数値プロセッサ46においてプロセ
ッサ40のパイプラインをモニタするために用いられ、
そうして、このプロセッサ46は、関連するプロセッサ
40とともにロックステップでランすることができる。
コントロールバス43でのこのラン#信号は、クロック
17とともにランサイクルを計数するためにカウンタ7
1と73によって用いられる。
好ましい実施例において、カウンタレジスタ71のサイ
ズは、4096すなわち2″に選ばれる。
これが選択された理由は、クロック17に使用される結
晶発振子の許容範囲が、平均して約4にランサイクルに
おけるドリフトがプロセッサチップ40によってランさ
れるサイクル数において1個のスキューすなわち差を生
じるようなものだからである。この差は、以下に説明さ
れるように割り込み同期の正しい動作を正当に許容する
ようなものである。1つの同期メカニズムは、カウンタ
71がオーバーフローするときはいつでもCPUに同期
を起こさせるように作用を強いることである。
1つのそのような作用は、カウンタ71からのオーバー
70−信号0VFLに対応してキャシュミスを強いるこ
とである。これは、次のIキャシュのためのコントロー
ルバス43の誤ったミス信号(例えばセットされないタ
ダバリッドビット(TagValid bit)を単に
発生することによって行うことができ、こうしてキャシ
ュミス例外ルーチンをエンターさせ、その結果生じたメ
モリ参照は、任意のメモリ参照が行われるように同期を
確立させる。カウンタ71のオーバーフローに対して同
期させる他の方法は、プロセッサ40にストールをさせ
ることである。これは第2図の論理回路71aを介して
コントロールバス43にCPビジー(コプロセッサビジ
ー)信号を発生するオーバーフロー信号0VFLを用い
て行うことができる。
このCPビジー信号はCPビジーが主張されなくなるま
で、常にプロセッサ40にストールをエンターすること
になる。全3個のプロセッサは、同じコードを実行して
いてそのカウンタ71に同じサイクルを計数するので、
このストールをエンターする。しかし、CPUがストー
ルをエンターする実際の時間は変化する。論理回路71
aは、入力R#を介して他の2個のプロセッサのバス4
3からラン#を受信し、そうして全3個がストールした
ときに、CPビジー信号がリリースされ、プロセッサは
、再び同期してストールから出る。
こうして、2つの同期技法が説明された。第2の技法で
は、同期はメモリモジュールの回路100におけるメモ
リ参照から生じ、第2の技法では、いま説明したように
、カウンタ71のオーバーフローによって生じる。さら
に、以下に説明されるように、割り込みが同期化される
。しかし、注意するべき重要なことは、プロセッサ40
は、基本的にはそれ自身のクロックで自由にランしてい
て、同期イベントが発生する場合を除いて、実質的に相
互に結合されていない。マイクロプロセッサが第4図と
第5図に示されたように使用される事実は、単独のクロ
ックを用いてのロックステップ同期をより困難にしてい
て、性能を低下させている。
また、ライトバッファ50の使用は、プロセッサを結合
しないように役立ち、ましてプロセッサの密接な結合に
有効ではないであろう。同様に、命令キャシュとデータ
キャシュ及びTLB83を用いた仮想メモリ管理からな
る高性能は、密接な結合が使用されたならばさらに困難
になり、性能は悪影響を受けるだろう。
割り込み同期技法は、リアルタイムといわゆるr仮想タ
イム」を区別しなければならない。リアルタイムは、外
部の実際の時間、壁の時計の時間であり、秒単位で測定
され、又は便宜上例えば60nsecの分割であるマシ
ンサイクルで測定される。もちろん、クロック発生器1
7はそれぞれリアルタイムでクロックパルスを発生する
。仮想タイムは、各プロセッサチップ40の内部サイク
ル計数タイムであり、各のサイクルカウンタ71と73
で測定される。すなわち、プロセッサチップによって実
行される命令の命令数であり、ある任意の開始点からの
命令において測定される。第10図を参照して、リアル
タイム(toからt12として示される)と仮想タイム
(命令数(カウントレジスタ73のモジューロ16計数
)■。から■、として示される)との間の関係が図示さ
れる。
第1O図の各行は、1個のCPU−A、−B又は−Cの
サイクル計数であり、各列は、リアルタイムでの「点」
である。CPUに対するクロックは、位相がずれ易い。
そこで、実際の時間の相関は、第10a図に示されるよ
うなものであり、ここで、命令数(列)は完全には並ん
でおらず、すなわち、サイクル計数は、並べられたリア
ルタイムマシンサイクルの境界で変化しない。しかし、
第1O図の図示は、説明の目的には十分である。第1O
図において、リアルタイムt3でCPU−Aは第3の命
令にあり、CPU−Bは計数9にあり9番目の命令を実
行していて、CPU−Cは4番目の命令にある。リアル
タイムも仮想タイムも進むことが可能なだけであること
に注意する。
CPUのプロセッサチップ40は、リソースが利用出来
ないある条件の下でストールする。例えば、ロードまた
は命令フェッチの間のDキャシュ45または■キャシュ
44のミス、ライトバッファ50がストア動作の間に一
杯であるという信号、コプロセッサ46がビジーである
(コプロセッサが、データ依存性又は制限された処理リ
ソースにより取り扱えない命令を受信した)というコン
トロールバス43を介しての「CPビジー」信号、また
はマルチグライア/デバイダ79がビジーである(内部
のマルチグライア/デバイダ回路が、プロセッサが結果
レジスタをアクセスしようとしたときに動作を完了して
いなかった)ことである。
もちろん、キャシュ44と45は、プロセッサ40によ
る介在なしに状態を変化しない「パッシブリソース」で
ある。しかし、残りのものは、プロセッサがなんら作用
しなくても状態を変化出来るアクティブリソースである
。例えば、ライトバッファ50は、(プロセッサが他の
ストア動作を行わない限り)プロセッサによる作用なし
にフルからエンプティに変化する。そこでストールに、
パッシブリソースのストールとアクティブリソースのス
トールの2つのタイプがある。アクティブリソースのス
トールは、インターロックストールと呼ばれる。
CPU−A、−B、−Cで実行されるコードストリーム
が同一であるので、3個のCPUのキャシュ44と45
のようなパッシブリソースの状態は、仮想タイムの総て
の点で必然的に同じである。もしストールがパッシブリ
ソース(例えばデータキャシュ45)での衝突の結果で
あれば、全3個のプロセッサはストールを行い、ただ1
つの変数は、ストールの長さである。第11図を参照し
て、キャシュミスが■、で発生し、このミスの結果のグ
ローバルメモリ14又は15へのアクセスが8クロツク
(実際には8クロツク以上であってもよい)の時間がか
かったと仮定する。この場合、CPU−Cは、tlでグ
ローバルメモリ14又は15へのアクセスを開始し、グ
ローバルメモリのコントローラ117は、第1のプロセ
ッサCPU−Cがメモリアクセスの開始を信号するとき
にメモリアクセスを開始する。コントローラ117は、
CPU−BとCPU−Cがそれぞれメモリアクセスに必
要な8クロツクより少なくストールするけれども、アク
セス8クロツク遅れてt、で完了する。その結果、全C
PUは、リアルタイムでも仮想タイムでも同期される。
この例は、また、DRAMIO4へのアクセスの重複と
回路100でのボーティングとの利点を示す。
インターロックストールは、パッシブリソースストール
から異なった状況を示す。1個のCPUは、他のCPU
が全くストールをしないときにインターロックストール
をすることが出来る。第12図を参照して、ライトバッ
ファ50によって起こされるインターロックストールが
図示される。
CPU−AとCPU−Bのサイクル計数が示され、CP
U−AとCPU−Bのライトバッファ50からのフル(
full)フラグA。とB1.が、サイクル計数の下に
示される(ハイレベルすなわち論理lはフルを意味し、
ローレベルすなわち論理0はエンプティを意味する)。
CPUはストア動作が実行される毎に、フルフラグの状
態をチエツクする。
もしフル7ラグがセットされるならば、CPUは、フル
フラグがクリアされストア動作を完了するまでストール
する。ライトバッファ50は、もしストア動作がバッフ
ァを満たすならば、フルフラグをセットし、ストア動作
がバッファからlワードを流出して次のCPUストア動
作のための位置をフリーにするときはいつでもフルフラ
グをクリアする。時間【。で、CP U−Bは、3クロ
ックCPU−Aの先にあり、ライトバッファは共にフル
である。ライトバッファがグローバルメモリにライト動
作を行っていると仮定すると、このライトがt、の間に
完了するとき、ライトバッファフルフラグはクリアされ
る。このクリアは、リアルタイムでt、に同期して起こ
るが(第11図に図示される理由により)、仮想タイム
では同期していない。いま、サイクル計数I、での命令
は、ストア動作であると仮定すると、CPU−Aは、ラ
イトバッファフルフラグがクリアされた後でt、てこの
ストアを実行するが、しかし、CPU−Bはt。
でこのストア命令を実行し、そうして、ライトバッファ
フルフラグがなおセットされていることを見いだして3
クロツクの間ストールをしなければならない。こうして
、CP U−Bはストールをするが、CPU−Aはスト
ールをしない。
tiのCPUはストールをするかも知れず他のCPUは
ストールをしないかも知れないという性質は、サイクル
カウンタ71の解釈に制限を課する。第12図において
、割り込みがサイクル計数17で(cP U−Bが■、
全命令らストールをしている間に)複数のCPUに示さ
れたと仮定する。
サイクル計数■、に対するランサイクルは、tアで両C
PUに対して起こる。もしサイクルカウンタだけがCP
Uに割り込みを示すなら、CPU−Aはサイクル計数1
7で割り込みを見るが、CPU−Bはサイクル計数1.
から生じるストールサイクルの間に割り込みを見る。そ
うして、割り込みを示すこの方法が、この2個のCPU
に異なった命令での例外、もし全CPUがストールされ
るか又はストールされていない場合には起こらないよう
な条件が採用される。
サイクルカウンタの解釈についての別の制限は、サイク
ル計数の検出と作用の実行との間に遅れがあってはなら
ないことである。再び第12図を参照して、割り込みが
サイクル計数!、でCPUに示されるが、実行の制限の
ために余分のクロックの遅れがサイクル計数1.の検出
とCPUへの割り込みの提示の間に介在すると仮定する
。その結果は、CPU−Aが、この割り込みをサイクル
計数■、で確認するが、CPU−Bは、サイクル計数■
、からのストールの間に割り込みを確認して、2個のC
PUに異なった命令で例外を採らせる。
再び、リアルタイムで命令パイプラインの状態をモニタ
することの重要性が図示される。
く割り込み同期〉 第1図から第3図までの3個のCPUは、単独の論理プ
ロセッサとして機能することが要求され、従って、3個
のCPUのプログラミングモデルが単独の論理プログラ
ミングのプログラミングモデルであることを保証するた
めにその内部状態に関しである制限を実行することを要
求する。誤りモードや診断モードを除いて、上記3個の
CPUの命令ストリームは同一であることが要求される
もし同一でなかったら、第6図のボーティング回路10
0でのグローバルメモリアクセスのボーティングが困難
になるだろう。すなわち、ポートするものは、1個のC
PUが故障しているのか、異なったシーケンスの命令を
実行しているのか分からない。同期スキームは、もし任
意のCPUのコードストリームが、その他のCPUのフ
ードストリームから分岐するならば故障が起こったと仮
定するように設計される。割り込み同期は、単独のCP
Uイメージを維持する1つのメカニズムを提供する。
すべての割り込みは、仮想タイムに同期して起こること
が要求され、3個のプロセッサCPU−A、CPU−B
とCPU−Cの命令ストリームが割り込みの結果として
分岐しないことを保証する(分岐する命令ストリームに
は他の原因もある。例えば、1個のプロセッサが他のプ
ロセッサによってリードされたデータと異なったデータ
をリードすること)。仮想タイムに対して非同期に起こ
る割り込みがフードストリームを分岐させるシナリオは
、いくつかある。例えば、プロセスAが完了する前にコ
ンチクストスイッチをオンにさせるがプロセスAが他の
CPUで完了した後でフンチクストスイッチをオンにさ
せる割り込みは、その後のある点で、1個のCPUがプ
ロセスAの実行を統けるが他方のCPUはプロセスAが
既に完了しているためプロセスAを実行出来ないという
状況をもたらす。もしこの場合に割り込みが仮想タイム
に非同期に起こるならば、例外プログラムカウンタが異
なるという事実が問題を起こすであろう。
例外グログラムカウンタの値をグローバルメモリに書き
込む行為は、ポーターが3個のCPUから異なったデー
タを検出し、ポートフォールトを生じるという結果にな
るだろう。
CPUにおけるあるタイプの例外は、本来仮想タイムに
同期している。1つの例は、ブレークポイント命令の実
行によって生じるブレークポイント例外である。全CP
Uの命令ストリームが同一なので、ブレークポイント例
外は3個のCPUにおける仮想タイムにて同じ点で生じ
る。同様に、全てのそのような内部例外は、本来仮想タ
イムに同期して生じる。例えば、TLB例外は本来同期
する内部例外である。TLB例外は仮想ページ数がTL
B83のどのエントリにも適合しないために生じる。ア
ドレスを解釈するということが(ブレークポイント例外
におけるように正確に)単に命令ストリームの機能なの
で、解釈は、本来仮想タイムに同期する。TLB例外が
仮想タイムに同期することを確実にするために、TLB
83の状態は全3個のCPUII、12.13において
同一でなければならず、これは、TLB83がソフトウ
ェアだけによって変更できるので、保証される。再び、
全CPUが同じ命令ストリームを実行するので、TLB
83の状態は常に仮想タイムに同期して変化される。そ
うして、−殻内経験則として、もし行動がソフトウェア
により実行されるなら、その行動は仮想タイムに同期し
ている。もし行動がサイクルカウンタを用いないハード
ウェアにより実行されるなら、その行動は一般にリアル
タイムに同期である。
外部の例外は、本来仮想タイムに同期していない。!1
0装置26.27又は28は、3個のCPUII、12
、及び13の仮想タイムについて情報を有しない。従っ
て、I10装置によって発生される全ての割り込みは、
以下に説明するように、CPUに示される前に仮想タイ
ムに同期されなければならない。浮動点例外は、浮動点
コプロセッサ46がCPU内でマイクロプロセッサ40
に堅く結合されるので、I10装置割り込みと異なって
いる。
外部装置は、3個のCPUを1つの論理的プロセッサと
して見て、CPU間の同期や同期の欠乏についての情報
を有しない。従って、外部割り込みは、各CPUの個々
の命令ストリーム(仮想タイム)と同期である割り込み
を生成することが出来ない。どのような種類の同期も無
ければ、もしある外部装置がリアルタイム1.の時間に
割り込みを駆動し、その割り込みがその時間に全CPU
に直接水されるならば、3個のCPUは、異なった命令
で例外トラップをとり、3個のCPUのアクセプトされ
ない状態が生じる。これは、リアルタイムに同期である
が仮想タイムに同期しないイベント(割り込みの主張)
の例である。
複数の割り込みは、第1図から第3図までのシステムに
おいて、割り込みについて分散されたボートを実行し、
決定されたサイクル計数でプロセッサに割り込みを示す
ことにより、仮想タイムに同期する。第13図は、第2
図の割り込み同期論理回路65のより詳細なブロック図
を示す。各CPUは、モジュール14又は15から生じ
るライン69又は70からの外部割り込みを捕捉する分
配器135を含む。この捕捉はあらかじめ決定されたサ
イクル計数で、例えばカウンタ71から入力ラインCC
−4上で信号が出力される計数−4で起こる。捕捉され
た割り込みは、CPU間バス18を介して他の2個のC
PUへ分配される。これらの分配された割り込みは、未
決定割り込みと呼ばれる。各CPUII、12.13か
ら1個の3個の未決定割り込みがある。ボータ回路13
6は、未決定割り込みを捕捉出力、全CPUが外部割り
込み要求を受信したかを確認するボートを行う。
(サイクルカウンタ71で検出される)あらかじめ決定
されたサイクル計数で、この例では入力ラインCC−8
により受け取られたサイクル8で、割り込みボータ13
6は、ライン137とバス55と43を介して各マイク
ロプロセッサ400割り込みピンに割り込みを示す。割
り込みを示すために用いられるサイクル計数があらかじ
め決定されているので、全マイクロプロセッサ40は、
同じサイクル計数で割り込みを受け取り、こうして、割
り込みが仮想タイムに同期されている。
第14図は、仮想タイムに対して割り込みを同期するた
めのイベントのシーケンスを示す。CPU−A、CPU
−B及びCP U−Cと示された行は、リアルタイムで
の1点での各CPUのカウンタ71におけるサイクル計
数を示す。IRQ  A  PENDING、IRQ 
 B  PENDING及びIRQ  B  PEND
INGと示された行は、ボータ136の入カヘCPU間
バス18を介して結合される割り込みの状態を示す(l
は、未決定ビットがセットされていることを意味する)
。IRQA、IRQ  B、及びIRQ  Cと示され
た行は、マイクロプロセッサ40の割り込み入力ピンの
状態(ライン137の信号)を示し、ここで1は割り込
みが入力ピンに存在することを意味する。
第14図で、外部の割り込み(EX  IRQ)は、t
oでライン69に主張される。もし割り込み分配器13
5が割り込みを捕捉し、CPU間バス18にサイクル計
数4で分配するならば、IRQCPENDINGは時間
1.で1になり、IRQ  B  PENDINGは時
間t、でlになり、IRQ  A  PENDINGは
時間t、でlになる。もし割り込みボータ136がサイ
クル計数8で割り込み未決定ビットをボートするならば
、IRQ  Cは時間t、でlになり、IRQBは時間
t、でlになり、IRQ  Cは時間t、でlになる。
その結果、割り込みは、リアルタイムでは異なった点で
あるが仮想タイムでは同一の点(すなわちサイクル計数
8)でCPUに示される。
第15図に、第14図に示されたアルゴリズムを必要と
するシナリオを変更して示す。ここではサイクルカウン
タ71がモジューロ8カウンタにより表されることに注
意する。外部割り込み(EX  IRQ)は時間t、で
主張される。割り込み分配器135はこの割り込みを捕
捉し、サイクル計数4でCPU間バス18に割り込みを
分配する。
CPU−BとCPU−Cが時間t1の前にサイクル計数
を実行しているので、その割り込み分配器は外部割り込
みを捕捉することができない。しかし、CPU−Aは時
間t、の前にサイクル計数を実行する。その結果、CP
U−Aは時間t4で外部割り込みを捕捉して分配する。
しかし、もし割り込みボータ136がサイクル計数7で
割り込み未決定ビットを捕捉してボートするならば、C
PU−Aの割り込みボータ136は、他の2個の割り込
み未決定ビットがセットされていないとき、時間t、で
IRQ  A  PEND信号を捕捉する。CPU−A
の割り込みボータ136は全てのCPUが外部割り込み
を分配していないことを認識し、捕捉された割り込み未
決定ビットを保持レジスタ138に出力されて格納され
る。CP U−BとCPU−Cの割り込みボータ136
は単独の割り込み未決定ビットをそれぞれ時間り、とt
、に捕捉する。CPU−Aの割り込みボータのように、
これらのボータは、全ての割り込み未決定ビットがセッ
トされていないことを認識し、こうして、セットされた
単独の割り込み未決定ビットが保持レジスタ138に出
力されて格納される。各CPUのサイクルカウンタ7I
は、サイクル計数7に達するとき、ロールオーバーし、
サイクル計数Oで計数を開始する。外部割り込みはまだ
主張されているので、CP U−BとCP U−Cの割
り込み分配器135は、それぞれ時間t10とt、で外
部割り込みを捕捉する。これらの時間は、サイクル計数
が4に等しくなったときに対応する。時間tI!で、C
PU−Cの割り込みボークは、CPU間バス18に割り
込み未決定ビットを捕捉する。ボータ136は、全C外
部割り込みを捕捉して分配することを決定し、プロセッ
サチップ40に割り込みを示す。時間t1.と時間t’
sに、CP U−BとCPU−Aの割り込みボータ13
6は、割り込み未決定ビットを捕捉し、割り込みをプロ
セッサチップ40に示す。その結果、全プロセッサチッ
プが同じ命令で外部割り込み要求を受信したことになり
、保持レジスタに保存されていた情報は必要で無くなる
く保持レジスタ〉 第15図に関して上述に示された割り込みシナリオにお
いて、ボータ136は、若干のステート割り込み情報を
保存するために保持レジスタ138を使用する。特に、
保存されたステートは、全CPUでなくいくつかのCP
Uが外部割り込みを捕捉し分配したことであった。もし
システムが(第15図の状況のように)どんな故障もし
無い場合は、前の例に示したように、外部割り込みが保
持レジスタの使用なしに仮想タイムに同期出来るのテ、
コノステート情報は必要でない。アルゴルズムは、割り
込みボータ136が割り込み未決定ビットをあらかじめ
決定されたサイクル計数で捕えボートすることである。
全ての割り込み未決定ビットが主張されるとき、割り込
みは、そのあらかじめ決定されたサイクル計数でプロセ
ッサチップに示される。第15図の例において、割り込
みはサイクル計数7でボートされた。
第15図を参照して、もしCPU−Cが誤りをし、誤り
モードが割り込み分配器135が正しく機能しないよう
なものであれば、このとき、もしプロセッサチップ40
に割り込みを示す前に全割り込み未決定ビットがセット
されるまで割り込みボータ136が待つならば、その結
果、割り込みは示されるようになることは無い。こうし
て、ただ1個のCPUのただ1個の誤りが全CPUにつ
いての全体の割り込みのチェーンを機能できないように
する。
保持レジスタ138は、最後の割り込みボートサイクル
が全部ではないが少なくとも1個の割り込み未決定ビッ
トを捕捉したことをボータ136が知るメカニズムを提
供する。割り込みボートサイクルは、割り込みボータが
割り込み未決定ビットを捕捉しボートするサイクル計数
で起こる。数個の割り込み未決定ビットがセットされる
結果となる2つだけのシナリオがある。1つは、第15
図に関連して示された示されたシナリオであって、ここ
では、外部割り込みは、あるCPUの割り込み分配サイ
クルの前であるがその他のCPUの割り込み分配サイク
ルの後に主張される。第2のシナリオでは、少なくとも
1個のCPUが、割り込み分配器をディスニーゾルにす
るような誤りをする。もし数個の割り込み未決定ビット
だけが割り込みポートサイクルでセットされる理由が第
1のシナリオであるならば、割り込みボータは、全割り
込み未決定ビットが次の割り込みボートサイクルでセッ
トされることが保証される。従って、もし保持レジスタ
がセットされていて全部でない割り込み未決定ビットが
セットされていることを割り込みポータが発見するなら
ば、エラーが1個以上のCPUに存在するはずである。
これは、各CPUの保持レジスタ138が割り込みサー
ビス時にクリアされることを仮定する。そのため、保持
レジスタの状態は割り込み未決定ビットについての新鮮
でない状態を表さない。エラーの場合、割り込みポータ
136は、プロセッサチップ40に割り込みを示すこと
ができ、同時に、エラーが割り込み同期論理回路によっ
て検出されたことを示す。
割り込みポータ136は、実際にはどんなボーティング
もせず、その代わり割り込み未決定ビットと保持レジス
タ137の状態を検査して、プロセッサチップ40に割
り込みを示すか否かと割り込み論理回路にエラーを示す
か否かを決定するだけである。
〈モジューロサイクルカウンタ〉 第15図の割り込み同期の例は、割り込みカウンタをモ
ジューロNカウンタ(例えばモジューロ8カウンタ)と
して表した。モジューロNサイクルカウンタの使用は、
割り込みボートサイクルの概念を可能にすることにより
、割り込みボーティングアルゴリズムの説明を筒単にし
た。モジューロNサイクルカウンタを使用すると、割り
込みボートサイクルは、0とN−1(Nはサイクルカウ
ンタのモジューロである)の間にある単独のサイクル計
数として説明できる。サイクルカウンタのどんな数も割
り込みボートサイクルのために選択でき、サイクル計数
は、Nサイクル計数毎に起こることが保証される。モジ
ューロ8カウンタに対して第15図に示されるように、
割り込みボートサイクルは8計数毎に起こる。割り込み
ボートサイクルは、モジューロNサイクルカウンタの周
期的性質を説明するためにだけここで用いられる。
モジューロNサイクルカウンタの特定のサイクル計数に
キーとなるどのイベントもNサイクル計数毎に起こるこ
とが保証される。明らかに、不定数(すなわち非反復性
カウンタ71)は使用できない。
Nの値は、システムに正の効果を持つシステムパラメー
タを最大にし、システムに負の効果を持つシステムパラ
メータを最小にするように選択される。まず、いくつか
のパラメータが示される。
C1とC4は、それぞれ、割り込みボートサイクルと割
り込み分配サイクルである(第13図の回路では、これ
らはそれぞれCC−8とCC−4である)。CC−8と
CC−4の値は、0とN−1(Nはサイクルカウンタの
モジューロである)の間の範囲にあらねばならない。D
71.は、同期論理回路によって許容され得る3個のプ
ロセッサCPU−A。
CPU−B及びCPU−Cの間のサイクル計数ドリフト
の最大量である。このプロセッサドリフトは、リアルタ
イムの1点で各CPUからサイクルカウンタ71のスナ
ップショットをとることにより決定される。ドリフトは
、最も遅いCPUのサイクル計数を最速のCPUのサイ
クル計数から差し引くこと(モジューロN減算としてな
される)により計算される。D +++ a wの値は
、NとC1とC7の関数として表される。
まず、D * m tは、差C,−C,の関数として表
される。ここに、差演算はモジューロN減算として実行
される。これは、D +++ m wを最大にするC1
とC4の値を選択することを可能にする。第16図のシ
ナリオを参照し、C,−8と04−9を仮定する。
第16図から、プロセッサドリフトはり、、、−4であ
ると計算出来る。ライン69の外部割り込みは、時間t
、で主張される。この場合、CPU−Bは、時間1.で
割り込みを捕捉し分配する。このシナリオは、前に示さ
れた割り込み同期アルゴリズムとつじつまが合わない。
なぜなら、CPU−Aが割り込み分配サイクルを行った
前にCPU−Bがその割り込みボートサイクルを実行す
るからである。このシナリオの欠陥は、CvとC4の差
よりも更に離れてドリフトすることである。この関係は
、形式的に次のように書くことができる。
方程式(1)  Cv−c、  <  D+sam−e
ここに、eは、CPU間バス18に伝達される割り込み
未決定ビットのために必要な時間である。
前の例では、eは0と仮定されていた。壁時計の時間が
クロックサイクル(ランサイクル)のインクリメントで
量子化されているので、eも量子化出来る。こうして、
次の式が得られる。
方程式(2)  c、−c、  <  Dsmm−iこ
こに、D、、は、サイクル計数の整数値として表される
次に、最大のドリフトがNの関数として表すことができ
る。第17図は、N−4でプロセッサドリフトD−3の
場合のシナリオを示す。C4−0と仮定する。各プロセ
ッサのサイクル計数Oにおける減算は、命令サイクル計
数の商の部分(Q)を表す。サイクル計数がいまモジュ
ーロNにて示されるので、サイクルカウンタの値は、I
/N(Iは、時間上〇以来実行された命令数である)の
剰余である。命令サイクル計数のQは、I/Nの整数部
分である。もし外部割り込みが時間t、に主張されるな
らば、CPU−Aは、時間t4に割り込みを捕え分配し
、CPU−Bは、時間t、に割り込み分配サイクルを実
行する。CPU−Aに対する割り込み分配サイクルがQ
−1でありCP U−Bに対する割り込み分配サイクル
がQ−2であるので、これは問題を示す。同期論理回路
は、問題が無いかのように続行し、こうして等しいサイ
クル計数でプロセッサに割り込みを示す。しかし、各プ
ロセッサのQは異なっているので、割り込みは異なった
命令で複数のプロセッサに示される。従って、Nの関数
としてのり11.の関係は次式で表される。
方程式(3)  N/2  >  I)、、。
ここに、Nは偶数であり、D+ma*はサイクル計数の
整数として表される。ここで、方程式(2)と(3)は
共に標本化理論におけるナイキストの定理に等価である
ことを示すことができる。方程式(2)と(3)とを結
合することによって次式を得る。
方程式(4)  C,−Cm  <  N/2 1ここ
に、Nの与えられた値に対してCvとC4の最適の値が
選択できる。
上述の全方程式は、Nが出来るだけ大きくあるべきであ
ることを示唆する。Nを小さくさせようとする唯一の因
子は、割り込みの潜在である。割り込みの潜在は、ライ
ン69での外部割り込みの主張とライン137でのマイ
クロプロセッサチップへの割り込みの提示との間の時間
間隔である。
どのプロセッサが割り込みの潜在を決定するために使用
されるべきかは明快な選択でない。3個のマイクロプロ
セッサは、クロック源における結晶発振子におけるわず
かな違いや他の因子のために異なった速度で動作する。
最も高速のプロセッサと、最も遅いプロセッサと、その
他のプロセッサがある。システムの性能は最も遅いプロ
セッサの性能によって最終的に決定されるので、最も遅
いプロセッサに関して割り込みの潜在を定義することは
合理的である。最大の割り込みの潜在は、方程式(5)
  L、、、−2N−1 であり、ここに、LI114mは、サイクル計数で表さ
れた最大の割り込みの潜在である。最大の割り込みの潜
在は、最速のプロセッサの割り込み分配サイクルC4の
後であるが最も遅いプロセッサの割り込み分配サイクル
C1の前に外部割り込みが主張されたときに、最大の割
り込みの潜在が起こる。
平均の割り込みの潜在の計算は、最速のプロセッサの割
り込み分配サイクルの後でかつ最も遅いプロセッサの割
り込み分配サイクルの前に外部割り込みが起こる確率に
依存するので、さらに複雑である。この確率は、多数の
外部因子によって順番に決定されるプロセッサ間のドリ
フトに依存する。
もしこれらの確率が0であるならば、平均の潜在は次の
式で表される。
方程式(6)  L、、、−N/2− (c、−c*)
これらの関係式を用いて、N、C,、及びC4の値が、
Dll、と割り込みの潜在とに対するシステムの要請を
使用して決定される。例えば、N=128、(c,−C
4)=I O,L、、、−74又は約4゜4マイクロ秒
(ストールサイクルなしで)を選択する。4ビツト(4
つの2進ステージ)71aが割り込み同期カウンタとし
て使用され、分配出力とポート出力が説明したようにC
C−4とCC−8にある好ましい実施例を用いて、N−
16,C。
−8,c、−4であることが分かり、そうして、L、、
、−16/2+ (8−4)−12サイクルすなわち0
.7ミリ秒である。
くローカルメモリのためのリフレッシュ制御〉リフレッ
シュカウンタ72は、カウンタ71と71aがまさに計
数するのと同様に、(マシンサイクルでなく)非ストー
ルサイクルを計数する。
目的は、リアルタイムよりはむしろ仮想タイムで測定し
て、同じサイクル計数で各CPUにリフレッシュサイク
ルを導入ことである。好ましくは、各CPUは、命令ス
トリームにおいて他のCPUと同じ点でリフレッシュサ
イクルを課する。ローカルメモリ16のDRAMは、グ
ローバルなメモリについて上述したように8m5ec毎
に512サイクルの周期でり7レツシユされねばならな
い。
こうして、カウンタ72は、512の1行をアドレスし
て、15ms e c毎に1回DRAM16にリフレッ
シュコマンドを出力しなければならない。
もしメモリ動作がリフレッシュの間に要求されたならば
、リフレッシュが終了するまでビジ一応答が生じる。し
かし、各CPUにそれ自身のローカルメモリのリフレッ
シュをリアルタイムで他のCPUに独立に処理させるこ
とは、CPUを同期から外れさせ、従って、余分な制御
が必要になる。
例えば、もし丁度除算命令が始まるようにリフレッシュ
モードがエンターされるならば、タイミングは、1個の
CPUが他のCPUより2クロツクだけ長くかかるよう
なタイミングになる。又は、もし割り込み可能でないシ
ーケンスがより高速なCPUによりエンターされ他のC
PUがこのルーチンにエンターする前にリフレッシュに
入るならば、CPUは、相互に離れていく。しかし、こ
れらの問題のいくつかを避けるためのサイクルカウンタ
71を(リアルタイムの代わりに)使用することは、ス
トールサイクルが計数されないことを意味する。そして
、もしループに入って多くのストールを生じさせるなら
ば(7対lのストール・ラン比を生じさせることが可能
ならば)、周期が15m5ecの数値から著しく減少さ
れないならば、リフレッシュの仕様に合わず、性能を劣
化させる。
この理由のために、第2図に示されるように、ストール
サイクルは第2カウンタ72aでも計数され、このカウ
ンタがり7レツシユカウンタ72で計数されるのと同じ
数に達する毎に、追加のリフレッシュサイクルが導入さ
れる。例えば、リフレッシュカウンタ72は、カウンタ
71と歩調を合わせて、2′すなわち256ランサイク
ルを計数し、オーバーフローのときにリフレッシュ信号
が制御バス43を介して出力される。一方、カウンタ7
2aは、(ラン#信号とクロック17に応答して)26
ストールサイクルを計数し、オーバーフローする毎に第
2カウンタ72aがインクリメントされる(カウンタ7
2bは単に8ビツトカウンタ72aのためのビット9か
ら11であってもよい)。
そうして、リフレッシュモードが最後にエンターされ、
CPUはカウンタレジスタ72bの数によって示される
多数の追加のリフレッシュを行う。こうして、もし長期
間のストールインテンシブな実行が起こるならば、リフ
レッシュの平均数は、15マイクロ秒毎に1つの範囲内
にあり、もし7×256までのストールサイクルが介在
されるならば、最後にリフレッシュモードに行くときに
リフレッシュされた行の数が名目上のリフレッシュ速度
まで追い付くので、リフレッシュサイクルを任意に短く
することにより性能の劣化はない。
くメモリ管理〉 第1図から第3図までのCPUII、12、及び13は
、第18図に図示されるように組織されたメモリ空間を
備える。ローカルメモリ16が8Mバイトであり、グロ
ーバルメモリ14又は15が32Mバイトである例を用
いて、ローカルメモリ16が、キャシュすなわち別のメ
モリ空間であるよりはむしろ、CPUメモリアクセス空
間の同じ連続的な0から40Mバイトまでのマツプの一
部である。0から8Mバイトまでの部分を(3個のCP
Uモジュールで)3重化し、8から40Mバイト部分を
2重化しているが、論理的には単に1つの0から40M
バイトまでの物理アドレス空間があるだけである。バス
54で8Mバイトを越えたアドレスは、バスインターフ
ェース56にメモリモジュール14と15に要求をさせ
るが、しかし、8Mバイト以下のアドレスは、CPUモ
ジュールそれ自身内でローカルメモリI6にアクセスす
る。性能は、ローカルメモリ16で実行されるアプリケ
ーションにより使用されるメモリをより多く配置するこ
とにより改善される。そして、もしメモリチップが高密
度でより低コストでより高速で利用できるならば、追加
のローカルメモリが、追加のグローバルメモリと同様に
付加される。例えば、ローカルメモリが32Mバイトで
あって、グローバルメモリが128Mバイトであっても
よい。一方、非常に低コストのシステムが必要ならば、
性能は主要な決定的なファクタではなく、システムは、
ローカルメモリなしに動作でき、そのような構成では性
能の不利益が高いけれども、すべてのメインメモリはグ
ローバルメモリエリア(メモリモジュール14と15)
である。
第18図のマツプのローカルメモリ部分141の内容は
、3個のCPUll512及び13における内容と同一
である。同様に、2個のメモリモジュール14と15は
、どの与えられた瞬間でもその空間142内の同じデー
タを全く同様に含む。
ローカルメモリ部分141内にはUNIXオペレーティ
ングシステムのための核143(コード)が格納され、
このエリアは、各CPUのローカルメモリ16の固定さ
れた部分内に物理的にマツピングされる。同様に、核デ
ータは、各ローカルメモリ16の固定されたエリア14
1に割り当てられる。ブートアップの時を除いて、これ
らのブロックは、グローバルメモリ又はディスクへ、又
はグローバルメモリ又はディスクから交換されない。
ローカルメモリの他の部分145は、ユーザプログラム
(及びデータ)のページのために使用され、これらのペ
ージは、オペレーティングシステムの制御の下にグロー
バルメモリ14と15のエリア146に交換される。グ
ローバルメモリエリア142は、エリア146における
ユーザーページのためのステージングエリア(stag
ing area)として、またエリア147における
ディスクバッファとして使用される。もし全CPUが1
ブロツクのデータのライトを行うコード又はローカルメ
モリ16からディスク148へのコードを実行するなら
ば、ディスクバッファエリア147にコピーをするため
の時間はI10プロセッサ26と27に直接にそしてI
10コントローラ30を介してディスク148にコピー
をする時間に比べて無視できるので、シーケンスは、そ
の代わりディスクバッファエリア147にライトを行う
ことである。次に、全CPUが他のコードの実行を進め
る間に、このディスクにライトをする動作が行われて、
全CPUに対してトランスペアレントに、そのブロック
をエリア147からディスク148へ移動する。
同様な方法で、グローバルメモリエリア146は、ディ
スク以外のI10アクセス(例えばビデオ)の同様な処
理のために、I10ステージングエリア149を含んで
マツピングされる。
第18図の物理的メモリマツプは、各CPU内のプロセ
ッサ40の仮想メモリ管理システムと関連する。第19
図は、実施例において使用されたR20007”ロセッ
サチップの仮想アドレスマツプを図示する。しかしなが
ら、ページングと保護メカニズムを備えた仮想メカニズ
ム管理を支持する他のプロセッサチップが対応する特徴
を備えるであろうことが理解される。
第19図において、2つの別々の2Gバイトの管理アド
レス空間150と151が図示される。
プロセッサ40は、2つのモード、ユーザーモードと核
モード、の1つで動作する。当該プロセッサはただ、ユ
ーザーモードにおいてエリア150をアクセスでき、も
しくは核モードにおいて両エリア150と151をアク
セスすることができる。
核モードは、多くの計算機に備えられている監視モード
と同類である。プロセッサ40は、例外が検出されてモ
ードを核モードに強いるまでは、通常はユーザーモード
で動作するように構成され、ここで、例外からのりスト
ア(RF E)命令が実行されるまで核モードにとどま
る。メモリアドレスが翻訳されすなわちマツピングされ
る方法は、マイクロプロセッサのオペレーティングモー
ドに依存し、これはスティタスレジスタの1ビツトによ
って定義される。ユーザーモードにあるときに、2Gバ
イトの”kuseg”として参照される単独の−様な仮
想アドレス空間150を利用できる。
各仮想アドレスはまた、最大64個のユーザープロセス
のための一義的仮想アドレスを形成するために、6ビツ
トのプロセスアイデンティファイア(PID)フィール
ドを用いて拡張される。ユーザーモードにおけるこのセ
グメント150までのすべての参照は、TLB83を介
してマツピングされ、キャシュ144と145の使用は
、TLBエントリにおける各ページエントリのためのビ
ットセツティングによって決定される。すなわち、ある
ページは、キャシュ可能で有り得るし、あるページはプ
ログラマによって特定されるのでキャシュ可能でない。
核モードにあるとき、仮想メモリ空間は、第19図の両
エリア150と151を含む。この空間は、4つの別々
のセグメントkusegエリア150、ksegOエリ
ア152、kSeglエリア153及びkseg2エリ
ア154を有する。
核モードのためのkusegエリア150のセグメント
は、ユーザーモードの” kuseg”エリアに対応し
て2Gバイトのサイズを有する。従って、核モードにお
いて、プロセッサはまさにユーザーモードの参照におけ
るようにこのセグメントに対して参照を行って、ユーザ
ーデータへの核アクセスを能率化する。kusegエリ
ア150は、ユーザーコードとユーザーデータを保持す
るために使用される。しかし、オペレーティングシステ
ムは、しばしばこの同じコード又はデータを参照するこ
とを必要とする。上記ksegOエリア152は、物理
的アドレス空間の初めの512Mバイトに直接にマツピ
ングされる512Mバイトの核物理的アドレス空間であ
り、キャシュされるが、TLB83を使用しない。この
セグメントは、核実行可能コードとある核データのため
に使用され、ローカルメモリ16内に第18図のエリア
143によって表される。上記kseglエリア153
は、ksegoエリアと同様に、物理的アドレス空間の
初めの512Mバイトに直接にマツピングされ、キャシ
ュされず、TLBエントリを用いない。kseglエリ
アは、キャシュされないことだけがl(segOエリア
と異なる。kseglエリアは、■10レジスタ、RO
Mコード及びディスクバッファのだめのオペレーティン
グシステムによって使用され、第18図の物理的マツプ
のエリア147と149に対応する。kseg2エリア
154は、1Gバイトの空間であり、kusegエリア
のように、キャシュを用い又は用いずに、任意の物理的
アドレスに仮想アドレスをマツピングするためのTLB
83エントリを使用する。このkseg2エリアは、ユ
ーザーモードにおいてアクセスできず、核モードにおい
てのみアクセスできるということだけが、kusegエ
リア150と異なる。オペレーティングシステムは、ユ
ーザーページテーブル(メモリマツプ)のためと動的に
割り当てられるデータエリアのために、コンテキストス
イッチに再びマツピングしなければならないスタックと
パープロセスデータ(per−process dat
a)のためにkSeg2エリアを使用する。kseg2
エリアは、全てか無かのアプローチを必要とするよりは
むしろ、パーページベーシス(per page ba
sis) ヘの選択的キャシングとマツピングを可能に
する。
マイクロプロセッサチップのレジスタ76又はPC80
とバス84での出力に発生される32ビツトの仮想アド
レスは、第20図に示される。ここで分かるように、ビ
ットo−iiは、第3図のバス42でのアドレスの下位
12ビツトとして無条件に使用されるオフセットであり
、ビット12−31は、ビット29−31がkuSeg
エリア、ksegQxリア、kseglエリア及びks
eg2エリアの間で選択する仮想ページ数(V P N
)である。現在実行中のプロセスのためのプロセスアイ
デンティファイア(P I D)は、TLBによっても
アクセス可能なレジスタ内に格納される。64ビツトの
TLBエントリは、同様に第20図に表され、ここで分
かるように、仮想アドレスからの29ビツトVPNは、
64ビツトエントリのビット44−63に位置される2
0ビツトVPNフイールドと比較され、一方、同時に、
PIDはビツ)38−43と比較される。もし対の一方
が64の64ビツトTLBエントリのいずれかに見いだ
されるならば、対となったエントリのビット12−31
でのページフレーム数PFNは、(他の基準が適合する
ことを仮定して)第3図のバス82と42を介した出力
として使用される。TLBエントリにおける他の1ビツ
トの値は、N、D、V及びGを含む。ここで、Nはキャ
ッシュできない指標であり、もしセットされれば、ペー
ジはキャシュできず、プロセッサは、キャシュ44又は
45をまずアクセスする代わりにローカルメモリ又はグ
ローバルメモリをアクセスする。Dは、ライトプロテク
トビットであり、もしセットされれば、ロケーションが
「よごれ」ていて、従って、ライト可能であるが、もし
0ならば、ライト動作はトラップを起こすことを意味す
る。Vビットは、セットされれば、正当であることを意
味し、単に正当なビットを再セットするだけでTLBエ
ントリをクリアできることを意味する。このVビットは
、このシステムのページのスワツピング配置において、
ページがローカルメモリにあるかグローバルメモリにあ
るかを示すために使用される。Gビットは、正当なTL
B翻訳のためのPIDマツチの要請を無視するグローバ
ルアクセスを許可するためにある。
装置コントローラ30は、ローカルメモリに対してDM
Aを直接に行うことができない。従って、グローバルメ
モリは、DMAタイプのブロック転送(典型的にはディ
スク148などから)のためのステージングエリアとし
て使用される。CPUは、コントローラ(すなわちプロ
グラムされたIloによって動作を開始しまた制御する
ために、コントローラ30において直接に動作を実行す
ることができる。しかしながら、コントローラ30は、
グローバルメモリに対するDMAを除いて、DMAを行
うことができない。コントローラ30は、VMEバス(
バス28)マスクになることができ、I10プロセッサ
26又は27を介してメモリモジュール14と15内の
グローバルメモリに直接にリード動作とライト動作を行
う。
グローバルメモリとローカルメモリ(及びディスク)と
の間のページのスワツピングは、ページフォールトとエ
ージングズロセスとの一方によって開始される。プロセ
スが実行中でありグローバルメモリ又はディスクにある
ページから実行すること又はそのページからアクセスを
することを試みるときに、ページ7オールトが生じる。
すなわち、TLB83は、ミスを示し、トラップが生じ
るであろう。従って、核のローレベルトラップコードが
ページのロケーションを示し、ページのスワツピングを
開始するためのルーチンがエンターされる。もし必要と
されるページがグローバルメモリ内にあるならば、一連
のコマンドがDMAコントローラに送られて、最も少な
く最近使用されたページをローカルメモリからグローバ
ルメモリに書き込み、その必要とされたページをグロー
バルメモリからローカルメモリに読む出す。もしそノヘ
ージがディスクにあるならば、コマンドとアドレス(セ
クタ)が、ディスクに行ってそのページを得るためにC
PUからコントローラ30に書き込まれる。そして、メ
モリ参照をするプロセスが一時停止される。ディスクコ
ントローラがデータを見付けそれを送信する用意ができ
たとき、メモリモジュールによって(cPUに到達せず
に)使用される割り込み信号が出力されて、グローバル
メモリにそのページを書き込むためにグローバルメモリ
へのDMAをディスクコントローラが始めることを許可
する。終了したときは、CPIJは割り込みされて、D
MAコントローラの制御の下にブロック転送を開始して
、最も少なく使用されたページをローカルメモリからグ
ローバルメモリへスワツピングし、必要なページをロー
カルメモリへ読み込む。次に、元のプロセスが再び実行
(ラン)可能にされ、その状態は元に戻され、元のメモ
リ参照が再び生じ、ローカルメモリ内にその必要なペー
ジを見付ける。ページのスワツピングを開始するもう1
つのメカニズムは、ニージングルーチンであり、これに
より、オペレーティングシステムは、各ページが最近使
用されたか否かについて又グローバルメモリへの押し出
しを被っていないページについてマークしながら周期的
にローカルメモリ内のページを通過していく。タスクス
イッチはそれ自身ページのスワツピングを開始しないが
、その代わり、新しいページがページフォールトをつく
り始めたとき、ページは必要なだけスワツピングされ、
スワツピングのための候補は、最近は使用されていない
ものである。
もしメモリ参照がなされTLBミスが示されるが、しか
しTLBミス例外から生じるページテーブルルックアッ
プがそのページがローカルメモリ内にあることを示すな
らば、このページがローカルメモリ内にあることを示す
ためにTLBエントリがなされる。すなわち、プロセス
は、TLBミスが起こったときに例外をとり、(核デー
タ区分内の)ページテーブルに行き、テーブルエントリ
を見付け、TLBに対して書き込み、次に進むことが許
される。しかし、もしメモリ参照がTLBミスを示し、
ページテープが、対応する物理アドレスが(8Mバイト
の物理アドレスを越えて)グローバルメモリ内にあるこ
とを示すならば、TLBエントリがこのページのために
実行され、そして、プロセスが再び続くとき、プロセス
は、前と同様にTLB内にページエントリを見いだす。
さらに1つの例外は、正当なビットが0であって、その
ページが物理的にローカルメモリ内にないことを示すた
めに採られる。そして、このときは、例外は、グローバ
ルメモリからローカルメモリにページをスワツピングす
るル−チンをロードし、そして実行が進むことができる
。第3の状況では、もしページテーブルが、メモリ参照
のためのアドレスがローカルメモリやグローバルメモリ
内に無くディスクにあることを示すならば、システムは
、上に示されたように動作し、すなわち、プロセスはラ
ンキュー(run quaua)を去り、スリーブキュ
ー (slsep queue)に入り、ディスク要求
がなされ、ディスクがそのページをグローバルメモリに
転送しコマンド完了割り込み信号を出力したとき、ペー
ジがグローバルメモリからローカルメモリへスワツピン
グされ、TLBは更新され、次にプロセスは再び実行で
きる。
くプライベートメモリ〉 メモリモジュール14と15は同じ位置に同じデータを
格納でき、全3個のCPUl1112及び13はこれら
のメモリモジュールに対して等しいアクセスを行うが、
各メモリモジュールにはプライベートメモリとしてソフ
トウェア制御のもとで割り当てられた小さなエリアがあ
る。例えば、第21図に図示されるように、メモリモジ
ュール位置のマツプのエリア155は、プライベートメ
モリエリアとして呼ばれ、全CPUが「プライベートメ
モリライト」コマンドをバス59に出力したときにのみ
ライト可能である。実施例では、プライベートメモリエ
リア155は、各CPUモジュールのバスインターフェ
ース56のレジスタ156に含まれるアドレスで出発す
る4にのページである。この出発アドレスは、CPUに
よってこのレジスタ156に書き込むことによってソフ
トウェア制御のもとで変更できる。プライベートメモリ
エリア155は、さらに3個のCPUの間で分割される
。CPU−Aだけがエリアl 55aに書き込むことが
でき、CPU−Bだけがエリア155bに書く込むこと
ができ、CPU−Cだけがエリア155cに書く込むこ
とができる。バス57の1つのコマンド信号は、動作が
プライベートライトであることをメモリモジュール14
と15に知らせるために、バスインターフェース56に
よってセットされる。そして、これは、ストア命令から
プロセッサ40によって発生されたアドレスに対応して
セットされる。アドレスのビット(およびライトコマン
ド)は、(バスアドレスをレジスタ156の内容に比較
する)バスインターフェース内のデコーダ157によっ
て検出され、バス57に対する[プライベートメモリラ
イト」コマンドを発生するために使用される。メモリモ
ジュールでは、ライトコマンドがレジスタ94.95及
び96で検出され、アドレスとコマンドが全てボート回
路100によって良好(すなわち一致している)とボー
トされたとき、制御回路100は、ただ1個のCPUか
らのデータをバス101へと通すことを許可し、これは
、全CPUからのアドレスの2ビツトによって決定され
る。このプライベートライトの間に、全3個のCPUは
、バス57に同じアドレスを示すが、バス58に異なっ
たデータを示す(この異なったデータは、例えばCPU
へのステートキューである)。メモリモジュールは、ア
ドレスとコマンドをポートし、アドレスバスに見られた
アドレスフィールドの部分によって基づいてただ1個の
CPUからデータを選択する。CPUがデータをポート
することを可能にするため、全3個のCPUは、両メモ
リモジュール14と15内へ、CPUに一義的なステー
ト情報の3個のプライベートライト動作(バス2112
2.23に3個のライト動作がある)を行う。各ライト
動作の間に、各CPUは、一義的データを送信するが、
ただ1個だけが各時間にアクセプトされる。それで、全
3個のCPUによって実行されるソフトウェアシーケン
スは、(1)ロケーション155aにストア、(2)ロ
ケーション155bにストア、(3)ロケーション15
5cにストアである。しかしながら、ただ1個のCPU
からのデータが実際には各時間に書き込まれ、そのデー
タはポートされない。なぜならば、異なっており又は異
る可能性があり、そしてポートされるならばフォールト
を示す可能性があるからである。
次に、全CPUは、全3個のロケーション155a、1
55b、155cを読んで、ソフトウェアによりこのデ
ータを比較することによってデータポートすることがで
きる。このタイプの動作は、例えば診断に又は原因レジ
スタ(cause register)データをポート
するための割り込みにおいて使用される。
プライベートライトのメカニズムは、フォールト検出と
回復において使用される。例えば、もし全CPUがメモ
リリード要求をするときにバスエラー(メモリモジュー
ル14又は15がパッドスティタス(lead 5ta
tus)をライン33−1または33−2に戻すような
とき)を検出するような場合である。この点で、CPU
は、他のCPUがメモリモジュールから同じスティタス
を受け取っているか否かを知らない。CPUが故障で有
り得るし、そのスティタス検出回路が故障で有り得るし
、あるいは、示されたように、メモリが故障で有り得る
。それで、故障を分離するために、上述のバス7オール
トルーチン 全3個のCPUは、前のリードの試みでメモリモジュー
ルからまさに受信したスティタス情報のプライベートラ
イト動作を行う。次に、全3個のCPUは、他のCPU
が書き込んだものを読み出し、自分自身のメモリスティ
タス情報と比較する。もしそれらが一致するならば、メ
モリモジュールは、オフラインでポートされる。もし一
致せず、1個のCPUがメモリモジュールに対して悪い
スティタスを示し他のCPUが良好なスティタスを示す
ならば、CPUはオフラインでポートされる。
くフォールトトレラント電源〉 第22図を参照して、好ましい実施例のシステムは、上
述のCPUモジュール、メモリモジュール呟 I10プ
ロセッサモジュール、I10コントローラ、及びディス
クモジュールのオンラインでの交換と同様に、故障した
電源モジュールをオンラインで交換できるフォールトト
レラントな電源を使用できる。第22図の回路で、交流
電力ライン160は、電力分配ユニット161に直接に
接続され、このユニット161は、電力ラインのる波器
、過渡電流の抑圧器、及び短絡に対して保護するための
サーキットブレーカを提供する。交流電力ラインの故障
に対して保護するために、冗長性のバッテリパック16
2と163が、順序圧しいシステムシャットダウンを完
了しうるような4−l/2分の全システム電力を与える
。2個のバッテリパックの1個162又は163だけが
、システムを安全にシャットダウンするために動作する
のに必要である。
電力サブシステムは、2つの同一の交流から直流へのバ
ルク電源164と165を備え、これらの電源は、高電
力ファクタを備え、1対の36ボルト直流分配バス16
6と167にエネルギーを供給する。このシステムは、
動作中である1個のバルク電源164又は165を用い
て、動作し続けるこ七が可能である。
4つの別々の電力分配バスがこれらのバス166と16
7に含まれる。バルク電源164は、電力バス166−
1と167−1を駆動し、バルク電源165は、電力バ
ス166−2と167−2を駆動する。バッテリパック
163は、バス166−3.167−3を駆動し、バス
166−1と167−2から再チャージされる。3個の
CPU11゜12.13は、これらの4個の分配バスの
異なった組み合わせから駆動される。
これらの36Vバス166と167に結合された多数の
DC−DCコンバータ168が、CPUモジュール11
,12及び13、メモリモジュール26と27、及びI
10コントローラ30を個々に電力を供給するために使
用される。バルク電源16と165は、また、3個のシ
ステムファン169と、バッテリパック162と163
のためのバッテリチャージャに電力を供給する。各シス
テム部品に対するこれらの別々のDC−DCコンバータ
を備えることにより、1個のコンバータの故障はシステ
ムシャットダウンを生じず、その代わり、システムは、
上述した故障回復モードの1つで動作を続け、故障した
電源部品をシステム動作中に交換できる。
この電源システムを、スタンドバイとオフの機能を備え
た手動スイッチか、もしくは保守・診断電源の故障の場
合に電源オン状態を自動的にオフ状態とする保守・診断
プロセッサ170からのソフトウェア制御の下のいずれ
かで、シャットダウンできる。
(以下余白) 第23図は、本発明の他の実施例によるデータ処理シス
テムのブロック図である。そこに示されるように、デー
タ処理システムは、CPU−A。
CP U−B及びCPU−Cを備え、これらのCPUは
、それぞれ、メモリA1メモリB及びメモリCとCPU
−メモリバスAA、CPU−メモリバスBB及びCPU
−メモリバスCCを介して通信する。
CPU−A、CPU−B及びCPU−Cは、それぞれ、
バスAO,BO及びCOを通して出力インターフェース
OIにデータを通信し、また、それぞれ、バスIA、I
B及びICを通して入力インターフェースIIからデー
タを受け取る。CPU−A、CPU−B及びCPU−C
は、相互に、そして、出力インターフェース28と入力
インターフェース40へ同期バスABCを介して、通信
する。出力インターフェースOIは、CPU−A、CP
U−B及びCPU−Cからポート回路Vヘインターフェ
ースーボートバスVBを介してデータを通信する。
ボート回路Vは、どのプロセッサからのデータがI10
コントローラIOCに通信されるべきかを決定する。デ
ータは、■10コントローラIOCと最後にI10装置
10Dにそれぞれポート−コントローラバスVCとコン
トローラー装置ハスCDを介して通信される。データは
、I10コントローラIOCから入力インター7エース
2ヘインター7エースーコントローラバスICBをiし
て通信される。
第24図に示されるように、CPU−A%CPU−B及
びCPU−Cは、多数の命令を実行し、いくつかの命令
は、これらのCPUに関連したプロセッサイベントを有
する。プロセッサイベントは、プロセッサにてランする
コードによって明白に表現してまたは内在的に定義され
る。例えば、各マイクロプロセッサライト動作は、プロ
セッサイベントと考えることができる。プロセッサイベ
ントの他の可能性は、データリード、データ転送、また
は、プロセッサにおいて明白に表したコードによって発
生される特定の信号であってもよい。(第1図から第2
2図までの実施例では、「イベント」は、ランサイクル
、すなわち、ストールが実行中でないのでバイズライン
が進むCPUのマシンサイクルすなわちクロックサイク
ルである。)どの場合でも、イベントは、各プロセッサ
で同じ順序で起こる。しかし、イベントは、各プロセッ
サでは同時には起こらないかもしれない。例えば、1個
のプロセッサは、他のプロセッサで実行中のコードの訂
正板を実行しているかもしれず、この訂正されたコード
は、イベントを異なった時間に起こさせる追加の命令を
含んでいるかもしれない。
CPU−AとCP U−Bにおけるイベント−4に注意
せよ。同一のコードを実行するプログラムにおいてさえ
もイベントが同時に起こらない他の理由は、予期しない
エラーの発生である。例えば、キャシュミスは、リード
のりトライまたはパリティエラーの検出を必要とし、こ
の場合、実行はエラールーチンに分岐するかもしれない
。CPU−AとCPU−Cによって見いだされるエラー
に注意せよ。
この実施例によるシステムが複数のプロセッサイベント
に同じ順序で出会うので、プロセッサは、所定のイベン
トに各プロセッサを同期することによって同期できる。
各プロセッサをそのように同期することを可能にする構
造が第25図においてCPU−Aに対して図示される。
CPU−BとCPU−Cは、同様に構成される。第25
図に示されるように、CPU−Aは、それ自身のクロッ
ク184からライン186を介して受け取られるクロッ
クパルスに基づいた命令を実行するプロセッサ180を
備える。プロセッサ180は、ライン190に内部同期
要求信号を、ライン191にクロック出力信号を、ライ
ン192に「追加の」クロツタ信号を、そして、ライン
194にプロセッサイベント信号を発生する。「追加の
」クロックサイクルは、エラーリトライ、キャシュヒツ
ト速度の変化、非同期論理、または他の理由のために起
こり得る。これらは、プログラムの実行中には通常起こ
らないクロックサイクルを表す。プロセッサ180は、
ライン196でウェイト信号を、そして、ライン198
で割り込み信号を受け取る。
CPU−Aは、さらに、クロックサイクルを計数するた
めのカウンタ200、プロセッサイベントを計数するた
めのイベントカウンタ202、イベントカウンタ202
の値をシステムの中の他のイベントカウンタと比較する
ための比較回路206及び、CPU−Aの同期を制御す
るための同期論理回路210を含む。サイクルカウンタ
200は、最後のプロセッサイベント以後に起こったク
ロックサイクルの数を計数するためにライン191に結
合される。サイクルカウンタ200は、追加のクロック
サイクルが起こったときにクロックサイクルの計数を禁
止するためにインバータ214を通してライン192に
結合される。この理由は、後で説明される。サイクルカ
ウンタ200は、また、各プロセッサイベントのときに
リセットされるためにライン194に結合される。サイ
クルカウンタ200は、オーバー70−するときはいつ
でも、次にORゲート222に結合されるライン218
に割り込み信号を発生する。ORゲート222の出力は
、ライン198に結合される。ORゲート222が概念
的なORゲートであることが分かる。実際の割り込み処
理は、周知の技法を用いて行われる。
イベントカウンタ202は、プロセッサ180によって
検出されるイベントの計数のためにライン194に結合
される。サイクルカウンタ200を用いているので、イ
ベントカウンタ202は、オーバー70−するときはい
つでも、ORゲート222への割り込み信号をライン2
26に発生する。イベントカウンタ202の値は、ライ
ン228を介して比較回路206へ、そして、ライン2
30を介して同期バスABCへ通信される。比較回路2
06は、イベントカウンタ202によって計数されたイ
ベントの数をライン230を介して、そして、システム
内の他のプロセッサのためのイベントカウンタによって
計数されたイベントの数を同期バスABCを介して受け
取る。比較回路206は、ライン234を介して同期論
理回路21Oに信号を発生して、イベントカウンタ20
2からの値とシステム内の他のイベントカウンタからの
値との間の関係を示す。
同期論理回路210は、ライン194に示されたイベン
トに応答してライン196でウェイト信号を主張するか
除くかによりプロセッサ180の作動を制御する。次に
、全プロセッサは同期され、同期論理回路210は、同
期された外部割り込み信号をライン238に発生する。
システムの作動は、第26A図−第26B図及び第27
図を参照して理解できる。
第26A図が図示する状況では、同期要求(すなわち外
部割り込み)がCPU−A、CPU−B及びcpu−c
によって受け取られたが、これらのCPUがコードの異
なった部分を実行している。
この場合、CPU−Aは、イベント−4が点250の時
間に示されるまでコードを実行する。イベント4が検出
されたとき、同期論理回路210は、CPU−Aをウェ
イトステートに入らせる。同様に、CPU−Bは、イベ
ント−5が点251で検出されるまでランを続行し、そ
のときにCPU−Bはウェイトステートに入る。CP 
U−Cは、イベント−6が点252で検出されるまでラ
ンを続行し、そのときにCPU−Cはウェイトステート
に入る。CPU−Aによって計数されるイベントの数が
CPU−Cによって計数されるイベントの数より少ない
ので、CPU−Aは、イベント−5が点254で検出さ
れてCPU−Aが再びウェイトステートに入るまでに、
点253で命令実行を再び続行する。CPU−Aがなお
CPU−Cの後にあることが確かめられるときは、イベ
ント−6が点256で検出されてCPU−Aが再びウェ
イトステートに入るまでに、命令実行が点255で再び
続行される。CP U−Bは、同様な処理シーケンスを
経験する。すなわち、CPU−Hによって計数されたイ
ベントの数が3個のプロセッサのいずれかによって計数
されたイベントの最大数より小さいことが確かめられた
とき、CP U−Bは、次のイベントが点258で検出
されてCPU−Bがウェイトステートに入るまでに、命
令実行を点257で再び続行する、などである。CPU
−Cは、同期要求が受け取られる前に最も多いイベント
を計数したので、CPU−A、CPU−B及びCPU−
Cの各々のためのイベントカウンタが等しくなるまでウ
ェイトステートに留まる。これが起こるとき、各プロセ
ッサに関連する同期論理回路210は、同期された外部
割り込み信号をライン238に出し、ライン196にウ
ェイト信号を送り、各プロセッサのための実行が共通の
点159で再び続けられる。
第26B図に示される処理シーケンスでは、CPU−A
、CPU−B及びCPU−Cがイベントカウンタのオー
バー70−の結果として同期される。
そこに示されるように、CPU−Aは、コードを実行し
、1つのイベントが点260で起こる。コード実行は、
CPU−Aのためのイベントカウンタが点261でオー
バー70−するまで再び続けられる。この点で、CPU
−A内のイベントカウンタ202は、ライン226に割
り込み信号を出し、CPU−Aはウェイトステートに入
る。イベントの同じシーケンスとイベントカウンタオー
バーフローは、CPU−BとCPU−Cにおいてそれぞ
れ点262.263と点264.265で起こる。CP
U−A、CPU−B及びCP U−Cの各々がウェイト
ステートにあることが確かめられたとき、各プロセッサ
に対する同期論理回路210は、ライン196から信号
を除き、コード実行が共通の点266で再び続行される
第26C図は、同期がサイクルカウンタオーバーフロー
の結果として起こる状況を示す。そこに示されるように
、CPU−Aはイベント−7を点267で検出し、コー
ド実行は、そのサイクルカウンタ200が点268でオ
ーバー70−をするまで2の(サイクルカウンタの値)
乗のクロックサイクルの間続く。サイクルカウンタ20
0は、割り込み信号をライン218に出し、CPLT−
Aはウェイトステートに入る。同様に、CPU−Bは、
イベント−7を点269で検出し、そのサイクルカウン
タが点270でオーバーフローをしてCPU−Bがウェ
イトステートに入るまでコード実行を続ける。最後に、
cpu−cは、イベント−7を点271で検出し、その
サイクルカウンタ200が点272でオーバー70−を
してCPU−Cがウェイトステートに入るまでコード実
行を続ける。
各プロセッサがウェイトステートにあることが確かめら
れたとき、同期論理回路210はライン196から信号
を除き、コード続行が共通の点273で再び続行される
第27図は、CPU−A、CPU−B及びCPU−Cの
各々のための処理シーケンスを図示する。
そこに示されるように、各プロセッサは、ステップ31
0にて命令を実行するためにクロックされる。もし現在
のクロックサイクルが追加のクロックサイクルであるこ
とがステップ304で確かめられるならば、サイクルカ
ウンタ200は、ステップ308で禁止され、処理がス
テップ308で再び続けられる。もし現在のクロックサ
イクルが追加のクロックサイクルでないことがステップ
304で確かめられるならば、サイクルカウンタ200
は、ステップ312でインクリメントされる。
次に、ステップ316で、サイクルカウンタ200がオ
ーバーフローしたか否かが確かめられる。
もしそうならば、サイクルカウンタ200は、ステップ
320でプロセッサを割り込みし、ステップ324で同
期要求を発生する。サイクルカウンタ200によって発
生される割り込みに対応して、プロセッサはステップ3
28でイベントを発生する。ここで、プロセッサは、(
ステップ324で発生された同期要求信号の結果として
)ステップ332でウェイトステートに入る。
サイクルカウンタオーバー70−の場合、全プロセッサ
は、最後のプロセッサイベントの後で正確に2の(サイ
クルカウンタの値)乗のクロックサイクル経って割り込
みコードでのプロセッサイベントに達する。プロセッサ
は、サイクルカウンタがオーバーフローする前に2の(
サイクルカウンタの値)乗のクロックサイクルの間に追
加のクロックサイクルが起こらない限り、同期状態にあ
る。もし追加のクロックが起こるならば、全プロセッサ
は異なった点で止まり、恐らくミスマツチを生じる。そ
して、プロセッサは、割り込みに対し異なって対応する
ことがあり得て、こうしてプロセッサエラーまたはシス
テムエラーを生じる。
これが、各サイクルカウンタがすべての追加のクロック
サイクルでディスエーブルにされる理由である。
もしステップ316でサイクルカウンタ200がオーバ
ーフローしないことが確かめられるならば、次に、ステ
ップ340で、イベントが起こったか否かが確かめられ
る。もし否であれば、処理はステップ300で再び続け
られる。もしイベントが起こっていたなら、イベントカ
ウンタ202はステップ344でインクリメントされる
。次に、ステップ348で、イベントカウンタ202が
オーバーフローしたか否かが確かめられる。もしそうな
らば、プロセッサはステップ320で割り込みされ、プ
ロセッサがステップ332で休止(halt)されるま
でサイ多ルカウンタオーバーフローを伴って処理が続け
られる。もしステップ348でイベントカウンタ202
がオーバー70−していないことが確かめられるならば
・次に・ステ7プ352で、同期要求がそのままである
か否かが確かめられる。もしそうならば、プロセッサは
、ステップ332で休止され、そうでなければ、コード
実行がステップ300で続けられる。
もしプロセッサがステップ332で停止された後で、次
にステップ360で、全プロセッサが停止したか否かが
確かめられる。もしそうでなければ、次にステップ36
4で、プロセッサ同期のために許された時間の最大値が
越えられたか否かが確かめられる。例えば、これはプロ
セッサの誤りの場合に起こる。もし最大値が越えられた
ならば、プロセッサがボートされ、すなわち、ステップ
372で、比較プロセスから無視される。いずれにして
も、ステップ360でプロセッサを適当に機能させる間
、比較が続く。全プロセッサが停止すると、カウンタは
ステップ372で比較される。
もしあるプロセッサのカウンタが他のプロセッサより大
きいことが確かめられるならば、より大きい計数をもつ
カウンタがウェイトステートに留まり、処理は、ステッ
プ360で続く。他方、もしあるプロセッサのカウンタ
の値が最大計数値より小さいならば、処理は、ステップ
300に戻り、そこで、次のイベントが検出されるまで
処理が再び続けられ、プロセッサは停止し、カウンタは
再び比較される。もしステップ372で全カウンタが等
しいことが確かめられるならば、ウェイト信号が各プロ
セッサから除かれ、全プロセッサは、同期要求を出すた
めにステップ376で再びスタートされる。
上に説明したことは第23図から第27図までの実施例
の完全な説明であるが、様々な変形が使用できる。例え
ば、同期論理回路210は、各チップに結合された単独
の回路に統合でき、システムは、任意の数のプロセッサ
を使用できる。
第23図から第27図までの実施例は、多数のプロセッ
サを同期するための方法と装置を示す。
各プロセッサは、それ自身のクロックを走らせ、1つの
ラインで所定のプロセスまたはイベントの発生を示し、
プロセスウェイトステートを開始するための他のライン
で信号を受ける。各プロセッサは、プロセッサが同期さ
れた最後の時間以後に示されたプロセッサイベントの数
を計数するカウンタを備える。同期を要求するイベント
がプロセッサに関連する同期論理回路によって検出され
たとき、同期論理回路は、次のプロセッサイベントの後
でウェイト信号を発生する。各プロセッサに関連する比
較回路は、システム内の他のイベントカウンタをテスト
し、その関連するプロセッサが他のプロセッサに遅れて
いるか否かを決定する。もしそうならば、同期論理回路
は、次のプロセッサイベントまでウェイト信号を除く。
プロセッサは、そのイベントカウンタが最速のプロセッ
サのイベントカウンタに一致するときに最終的に停止す
る。
そのとき、全プロセッサは、同期され、イベントを出す
ために再びスタートできる。もしイベントカウンタがそ
の最大値に達する前に同期イベントが起こらず、イベン
トカウンタのオーバーフローが再同期を強行するならば
、サイクルカウンタは、最後のプロセッサイベント以後
のクロックサイクルの数を計数するために備えられる。
このサイクルカウンタは、最大の割り込み潜在時間が越
えられる前の1点でオーバー70−をするようにセット
され、再同期を強行する。
本発明の追加の実施例は、第28図に示される。
ここで、フォールトトレラントなコンピュータシステム
は、2個以上の同一のCPUモジュール、CPU−Aと
CPU−B、を備えて示される。各CPUは、それ自身
のメモリ16を備え、それ自身のクロック発振器17に
接続される。これらのプロセッサは、プロセッサドリフ
トをある限界以下に保つ任意の同期メカニズムが使用で
きるけれども、カウンタ回路を用いて、本発明者の前の
米国出願第118,503号の特徴によりバスI8を介
して緩く同期される。
第28図で、各プロセッサCP U−AとCPU−Bは
、バス21または22を介してデータ入力・出力モジュ
ール14と15に結合される。プロセッサからの出力デ
ータは、これらのモジュール14と15においてポート
回路100によってポートされる。FIFOタイプの出
力バッファ50が、出て行< (outbound)デ
ータを順序づけるために各プロセッサにおいて使用でき
る。この説明では、メモリ16はCPUモジュール内に
あるので、この出ていくデータは、■10出力データで
ある。
こうして、出ていくデータは、CPU−A内のバッファ
50の出力からバス21aを介してモジュール14のポ
ート回路100へ、そしてバス21bを介してモジュー
ル15のポート回路100へ結合される。同様に、出て
いくデータは、CPU−Bからバス22aと22bによ
ってモジュール14と15内のポート回路100に結合
される。各CPUに入ってくるデータは、バス21内の
バス21cと21dに、または、バス22内のバス22
cと22dにある。入ってくるデータがポートされない
ことに注意せよ。
3個以上のCPUモジュールの場合、第28図のポート
回路28は、全CPUからの出力データの多数決をとる
。2個のプロセッサの場合、ポート回路は、2個の出力
の違いを検出し、もし同一ならば、ポート回路はI10
バス24と25を通して同一のデータの複製を通す。ポ
ート回路は、ポートが行われる前に全CPUがバス21
または22にデータ出力を出すまで、待つ。もし同じコ
ードを実行するならば、そして緩い同期メカニズムの限
界内で、全プロセッサは、同じデータを同じ順序で(す
べてのフォールトでないプロセッサから)送る。1組だ
けのポート回路100が必要であることに注意せよ。も
しプロセッサが誤動作してそのメモリ16の不正確なデ
ータを書き始めるならば、その誤動作は重要であり、そ
の悪いデータが外部(■10バスのデイスプレィ、キー
ボード、プリンタ、コグロセッサなど)に送られる場合
のみ、すなわち、もし誤動作がプロセッサに他のプロセ
ッサとの同期から外れさせるならば、誤動作は検出され
る。
第28図の実施例において、■10バスからの入ってく
るデータは、バス24と25からバッファ21eと21
fを通して入力バス21eと21に、また同様にバッフ
ァ22eと221を通して入力バス22と22dに結合
される。入ってくる■10において、データは、これら
の全バッファにロードされ、全CPUは、非同期にこれ
らのバッファをロードしない。これらのバッファは、1
つのバイト、ワードまたはパケットをバッファできる。
あるいは、これらのバッファは、多くのデータアイテム
を保持し、同時のロードと使用とを可能にするFIFO
または環状バッファであってもよい。
もっとも単純な場合、各バッファ21e、21f。
22e及び22fは、エンプティ/フルフラグを有する
1つのデータレジスタのみである。それで、新しいデー
タは、全プロセッサがエンプティを信号するまで(また
は時間ぎれが起こるまで)I10バス24と25からロ
ードされない。多重のI10バスは、1つのバッファを
共用しても良く、独立のバッファを備えてもよい。
さらに故障に対して安全にするために、第28図のI1
0バスは、好ましくは、データをメモリにロードする前
に各CPUが不正確なデータを検出できるためのパリテ
ィチエツクまたはコードチエツクを備える。さもなけれ
ば、悪いI10バスが全プロセッサの記憶を壊させるよ
うになる。
こうして、第28図の実施例は、フォールトトレラント
なコンピュータシステムが同じ命令ストリームを実行す
る多重の同一のCPU(それ自身の独立したメモリを備
える)を使用することを示す。この多重のCPUは、作
動サイクルのようなイベントを計数し他のCPUの前に
あるCPUをストールすることにより、緩く同期される
。別々のバスを介したデータ出力参照は、全CPUが同
じ参照をしたときを検出するポート回路によって各CP
Uの別々のポートでポートされ、そのときにのみ外部の
I10バスに同一の参照を通す。このポートは、全CP
Uが全FIFOを異なった時間にロードするように取り
扱いされる全非同期CPUから出力参照を可能にするF
IFOバッファを含んでいてもよい。全I10バスから
全CPUへの入力データはポートされないが、全CPU
がその固有のクロック速度で入力データを受け取ること
ができるようにバッファされる。
本発明は、特別な実施例を参照して説明されたが、この
説明は、制限的な意味でなされたのではない。開示され
た実施例の様々な変形が、本発明の他の実施例と同様に
、この説明を参照して当業者に明らかである。従って、
添付した特許請求の範囲は、本発明の範囲内で実施例の
任意のそのような変更を含む。
【図面の簡単な説明】
第1図は、本発明の1実施例によるコンピュータシステ
ムの電気回路のブロック図である。 第2図は、第1図のCPUの電気回路のブロック図であ
る。 第3図は、第2図のCPUに使用されるマイクロプロセ
ッサチップの電気回路のブロック図である。 第4図と第5図は、それぞれ、第2図と第3図のCPU
において生じるイベントを時間の関数として示すタイミ
ング図である。 第6図は、第1図のコンピュータシステムにおける1個
のメモリモジュールの電気回路のブロック図である。 第7図は、第1図のシステムにおけるメモリバスに対し
CPUにおこるイベントを示すタイミング図である。 第8図は、第1図のコンピュータシステムでの1個のI
10プロセッサの電気回路のブロック図である。 第9図は、第1図のシステムでのメモリモジュールとI
10プロセッサの間の転送プロトコルのためのイベント
を示すタイミング図である。 第1O図は、第1図から第3図までのCPUにおける命
令の実行のためのイベントを示すタイミング図である。 第10a図は、第10図の図の一部の詳細図である。 第11図と第12図は、それぞれ、第1図から第3図ま
でのCPUにおける命令の実行のためのイベントを示す
第1O図と同様なタイミング図である。 第13図は、第2図のCPUにおいて用いられる割り込
み同期回路の電気回路のブロック図である。 第14図、第15図、第16図及び第17図は、それぞ
れ、第1図から第3図までのCPUでの命令の実行のた
めのイベントを示す第1O図または第11図と同様なタ
イミング図であり、様々な場面を説明する。 第18図は、第1図、第2図、第3図及び第6図のシス
テムにおいて使用されるメモリの物理的メモリマツプ図
である。 第19図は、第1図、第2図、第3図及び第6図のシス
テムにおいて使用されるメモリの仮想的メモリマツプ図
である。 第20図は、第2図または第3図によるCPUにおける
マイクロプロセッサチップにおける仮想アドレスとTL
Bエントリのフォーマットの図である。 第21図は、第1図、第2図、第3図及び第6図のシス
テムにおいて使用されるグローバルメモリモジュールの
メモリマツプにおける専用メモリの位置の説明図である
。 第22図は、本発明の1実施例によるシステムで使用さ
れるフォールトトレラントな電源の回路図である。 第23図は、本発明の実施例の他の例によるデータ処理
システムの1実施例の概念的ブロック図である。 第24図は、第23図に図示されたデータ処理システム
の処理シーケンスの図である。 第25図は、第23図に図示されたCPUの1実施例の
概念的ブロック図である。 第26A図から第26C図は、第23図の実施例による
処理過程を同期するプロセッサを図示する図である。 第27図は、第23図の実施例によるプロセッサ同期を
図示するフローチャートである。 第28図は、本発明の他の実施例によるシステムの(第
1図のような)回路図である。 II、12.13・・・プロセッサ(cP U)、14
.15・・・メモリモジュール、 16・・・ローカルメモリ、 17・・・クロック発振器、 21.22.23・・・バス、 24.25・・・入出力バス、 26.27・・・入出カプロセッサ、 28・・・バス、 29・・・バスインター7エースモジユール、30・・
・I10コントローラ、 3I・・・ラジアルライン、 32・・・システムステータスバス、 33・・・肯定応答/ステータスバス、40・・・マイ
クロプロセッサチップ、41.42.43・・・ローカ
ルバス、44.45・・・キャッシュメモリ、 46・・・浮動小数点コプロセッサ、 50・・・ライトバッファ、 51・・・リードバッファ、 52・・・ライトバッファバイパス、 53・・・データバス、 54・・・アドレスバス、 55・・・制御バス、 56・・・バスインターフェース、 57・・・多重アドレス/データバス、58・・・コマ
ンドライン、 60・・・メモリコントローラ、 61・・・ローカルレジスタ、 62・・・不揮発性メモリ、 65・・・割り込み回路、 71・・・サイクルカウンタ、 72・・・リフレッシュカウンタ、 73・・・カウンタ、 74・・・DMA回路、 76・・・レジスタ、 77・・・ALU。 78・・・シック、 81・・・プロセッサバス構造、 82・・・命令デコーダ、 83・・・トランスレーションルックアサイドバッファ
(TLB)、 84・・・仮想アドレスバス、 87・・・パイプライン及びバス制御回路、91.92
.93・・・入力/出力ポート、94.95.96・・
・レジスタ、 100・・・ポート回路、 101・・・データバス、 102・・・アドレスバス、 103・・・コマンドバス、 104・・・DRAM。 105・・・メモリコントローラ、 106・・・制御・ステータスレジスタ、107・・・
不揮発性RAM、 108・・・ライトプロテクト、 109・・・バスインターフェース、 110・・・アービトレータ回路、 114・・・リードレジスタ、 117・・・コントローラ、 118・・・リフレッシュカウンタ、 119・・・割り込みポート回路、 121、 122・・・ポート、 123・・・双方向多重アドレス/データバス、124
・・・双方向コマンドバス、 126・・・ステートマシン、 127.128・・・ラッチ、 130・・・内部ステータス・制御レジスタ、131・
・・バスインターフェース、 132・・・マルチプレクサ、 133・・・制御・データ転送レジスタ、135・・・
割り込み分配器、 136・・・割り込みボータ、 138・・・保持レジスタ、 141・・・ローカルメモリエリア、 142・・・グローバルメモリエリア、143・・・カ
ーネルエリア、 144・・・カーネルデータエリア、 145・・・ユーザプログラムページエリア、146・
・・ユーザページエリア、 147・・・ディスクバッファエリア、149・・・I
10ステージングエリア、160・・・交流電力ライン
、 161・・・電力分配ユニット、 162.163・・・バッテリバック、164.165
・・・バルク電源、 166.167・・・DC分配バス、 168・・・DC−DCコンバータ、 169・・・システムファン、 170・・・保守・診断プロセッサ、 !1・・・入力インターフェース、 OI・・・出力インターフェース、 ■・・・ポート回路、 10G・・・I10コントローラ、 10D・・・I10装置、 21e、21f・・・バッファ。 特許出願人 タンデム・コンピューターズ・インコーホ
レイテッド 代理人 弁理士 青 山  葆 はか1名第9図 第18図 冨23図 第1911 予防舌

Claims (50)

    【特許請求の範囲】
  1. (1)(a)命令ストリームを実行する複数のCPUで
    あって、全CPUが相互に独立にクロックされて各CP
    Uのために別々のマシンサイクルを与えていて、このマ
    シンサイクルが、上記の命令ストリームが実行される実
    行サイクルと、上記の命令ストリームが実行されないス
    トールサイクルとを含み、各CPUがメモリ要求入力/
    出力ポートを備える複数のCPUと、 (b)上記の全CPUの全入力/出力ポートに結合され
    、上記の全CPUから同じ要求を受け取った後でのみメ
    モリ要求を実施し、メモリ要求を実施するときにのみ全
    CPUに肯定応答信号を送る共通メモリであって、上記
    の全CPUの各々は、上記の肯定応答信号によって信号
    されたときにこの共通メモリによってメモリ要求の実施
    を待つ間にストールサイクルを実行する、共通メモリと
    、(c)全CPUの各々に備えられ、実行サイクルを計
    数するがストールサイクルを計数しないカウンタと、 (d)上記の全CPUに結合され、外部の割り込み要求
    に応答する割り込み回路であって、上記の全CPUの上
    記の全カウンタに結合され、他のCPUが命令を実行し
    続ける間に同じ実行サイクルで各CPUに別々に割り込
    みをするために上記の全カウンタの各々において選択さ
    れた計数に応答する割り込み回路とを備えた多重CPU
    システム。
  2. (2)請求項1に記載されたシステムにおいて、上記の
    全CPUの各々が他のCPUによってアスセス可能でな
    いローカルメモリを備える多重CPUシステム。
  3. (3)請求項1に記載されたシステムにおいて、上記の
    CPUが全3個であって、上記のポートを介して上記の
    共通メモリへの上記の要求が上記の共通メモリによって
    ボートされる多重CPUシステム。
  4. (4)請求項1に記載されたシステムにおいて、上記の
    割り込み回路が上記のカウンタによって記憶された選択
    された値でのみ上記の全CPUに割り込みをする多重C
    PUシステム。
  5. (5)請求項1に記載されたシステムにおいて、上記の
    割り込み回路が、各CPUに対して、選択された値がそ
    の他の各CPUの上記のカウンタにおいて記憶されてい
    るときに割り込み要求の受信の信号に応答する手段を含
    む多重CPUシステム。
  6. (6)(a)命令ストリームを独立に実行する複数のC
    PUであって、全CPUが相互に独立にクロックされて
    各CPUのために別々のマシンサイクルを与えていて、
    このマシンサイクルが、上記の命令ストリームが実行さ
    れる実行サイクルと、上記の命令ストリームが実行され
    ないストールサイクルとを含む複数のCPUと、 (b)全CPUの各々に備えられ、実行サイクルを計数
    するがストールサイクルを計数しないカウンタと、 (c)上記の全CPUに結合され、外部の割り込み要求
    に応答する割り込み回路であって、上記の全CPUの上
    記の全カウンタに結合され、上記の命令ストールの同じ
    実行サイクルで各CPUに別々に割り込みをするために
    上記の全カウンタの各々において選択された計数に応答
    する割り込み回路とを備えた多重CPUシステム。
  7. (7)請求項6に記載されたシステムにおいて、上記の
    CPUが3個であって、全3個のCPUが共通メモリモ
    ジュールにアクセスし、上記の全CPUからの上記の共
    通メモリへの要求が上記のメモリモジュールによってボ
    ートされる多重CPUシステム。
  8. (8)請求項6に記載されたシステムにおいて、上記の
    全CPUの各々が他のCPUによってアクセス可能でな
    いローカルメモリを備える多重CPUシステム。
  9. (9)請求項7に記載されたシステムにおいて、上記の
    CPUが全3個であって、この3個のCPUによってア
    クセスされる共通メモリを備え、全CPUによるこの共
    通メモリへのアクセスがこの共通メモリによってボート
    される多重CPUシステム。
  10. (10)(a)命令ストリームを各々実行し、実行サイ
    クルを与えるために相互に独立にクロックされる複数の
    CPUと、 (b)上記の全CPUの各々に備えられ、実行サイクル
    を計数するカウンタと、 (c)上記の全CPUの各々に結合され、外部割り込み
    要求に応答する割り込み回路であって、上記の全CPU
    の上記の全カウンタに結合され、上記の命令ストリーム
    の同じ実行サイクルで各CPUに別々に割り込みをする
    ために上記の全カウンタの各々において選択された計数
    に応答する割り込み回路とを備えた多重CPUシステム
  11. (11)請求項10に記載されたシステムにおいて、 全3個のCPUが共通メモリモジュールをアクセスし、
    この全CPUから上記の共通メモリへのアクセスが上記
    のメモリモジュールによってボートされる多重CPUシ
    ステム。
  12. (12)請求項10に記載されたシステムにおいて、 上記のCPUの各々が他のCPUによってアクセス可能
    でないローカルメモリを備える多重CPUシステム。
  13. (13)請求項10に記載されたシステムにおいて、 上記のCPUの各々が、共通メモリにアクセス要求をし
    、このアクセス要求が上記の共通メモリによってボート
    される多重CPUシステム。
  14. (14)請求項10に記載されたシステムにおいて、 上記の割り込み回路が、各CPUに対して、選択された
    値がその他の各CPUの上記のカウンタにおいて記憶さ
    れているときに割り込み要求の受信の信号に応答する手
    段を含む多重CPUシステム。
  15. (15)(a)複数のCPUであって、このCPUの各
    々が同じ命令ストリームを独立に実行し、全CPUが実
    行サイクルを与えるために相互に独立にクロックされ、
    全CPUは各々入力/出力ポートを備え、少なくとも1
    個の共用される入力/出力装置が上記の複数のCPUの
    上記の入力/出力ボートに結合される複数のCPUと、 (b)上記の全CPUの各々に備えられ、実行サイクル
    を計数するモジューロNカウンタと、(c)上記の全C
    PUの各々に結合され、外部割り込み要求に応答し、上
    記の全カウンタの各々のあらかじめセットした値で各C
    PUに別々に割り込みをするために上記の全カウンタと
    関連づけられる割り込み回路とを備え、各CPUが上記
    の命令ストリームの同じ実行サイクルで割り込みをされ
    る多重CPUシステム。
  16. (16)請求項15に記載されたシステムにおいて、 全3個のCPUが共通メモリモジュールをアクセスし、
    上記の全CPUから上記の共通メモリへの要求が上記の
    メモリモジュールによってポートされる多重CPUシス
    テム。
  17. (17)請求項15に記載されたシステムにおいて、 上記の共有された入力/出力装置が共通メモリである多
    重CPUシステム。
  18. (18)請求項15に記載されたシステムにおいて、 上記の割り込み回路が、選択された値が上記の各CPU
    に対するカウンタによって記憶されるときに、上記の全
    CPUの中のより早いCPUによる命令の実行をストー
    ルすることなく、上記のCPUの各々に割り込みをする
    多重CPUシステム。
  19. (19)請求項15に記載されたシステムにおいて、 上記の割り込み回路が、各CPUに対して、選択された
    値がその他の各CPUの上記のカウンタにおいて記憶さ
    れているときに割り込み要求の受信の信号に応答する手
    段を含む多重CPUシステム。
  20. (20)請求項15に記載されたシステムにおいて、 上記のCPUの各々が他のCPUによってアクセス可能
    でないローカルメモリを備える多重CPUシステム。
  21. (21)(a)命令ストリームを各々実行し、実行サイ
    クルを定めるために相互に独立にクロックされる複数の
    CPUと、 (b)このCPUの各々に備えられ、実行サイクルに関
    連したイベントを計数するカウント手段と、 (c)各CPUに備えられ、上記の全CPUに外部から
    与えられた外部要求に応答する同期回路であって、この
    外部割り込みに応答して上記の命令ストリームの同じ点
    で全CPUの各々に別々に信号するために、上記の全C
    PUから入力を受け取り、選択された最大計数を示す上
    記のカウント手段に応答し、上記の命令ストリームの同
    じ実行ストリームでCPUに実行を開始させるために他
    のCPUからの情報に応答する同期回路とを備えたコン
    ピュータシステム。
  22. (22)請求項21に記載されたシステムにおいて、 上記の同期要求が外部割り込みであるコンピュータシス
    テム。
  23. (23)多数の別々にクロックされる複数のCPUを備
    えるコンピュータシステムにおいて、(a)上記の全C
    PUの各々で同じ命令ストリームを実行するステップと
    、 (b)上記の全CPUの各々で実行される命令を計数す
    るステップと、 (c)外部割り込み要求を検出し、選択された命令計数
    値で全CPUの各々に別々に、他のCPUが命令を実行
    し続ける間に、割り込み信号を与えるステップとを備え
    た、多数の別々にクロックされる複数のCPUを備える
    コンピュータシステムの作動法。
  24. (24)請求項23に記載された方法において、上記の
    全CPUによつて共通メモリにメモリアクセス要求をし
    、この要求の各々を上記の共通メモリによってボートす
    るステップを含むコンピュータシステムの作動法。
  25. (25)請求項24に記載された方法において、上記の
    全CPUの各々によって別々にローカルメモリ(この各
    CPUに対するローカルメモリは他のCPUによってア
    クセス可能でない)にアクセスするステップを含むコン
    ピュータシステムの作動法。
  26. (26)請求項23に記載された方法において、外部割
    り込み要求を検出する上記のステップが、上記の命令の
    計数の選択された値でだけ行われるコンピュータシステ
    ムの作動法。
  27. (27)多数のプロセッサの各々において、プロセッサ
    内で選択されたタイプのイベントの発生の指示を作る手
    段と、 上記のプロセッサの各々についてイベントの数を計数す
    るために上記の指示に応答するイベント計数手段と、 上記のイベント計数手段に応答して、全プロセッサの1
    個について計数されたイベントの数が他のプロセッサに
    ついて計数されたイベントの数より大きいならば、全プ
    ロセッサの各々の処理を変える手段とを備えた多数のプ
    ロセッサの同期装置。
  28. (28)請求項27に記載された装置において、上記の
    選択された回路のタイプが、プロセッサにおいてパイプ
    ラインが進むマシンサイクルである、多数のプロセッサ
    の同期装置。
  29. (29)請求項28に記載された装置において、上記の
    イベントカウンタがサイクルカウンタである、多数のプ
    ロセッサの同期装置。
  30. (30)請求項27に記載された装置において、同期要
    求信号を受け取る同期要求手段と、、1個のプロセッサ
    について計数されたイベントの数が他のプロセッサにつ
    いて計数されたイベントの数より少なくない時に、同期
    要求信号に応答して前者のプロセッサの処理の停止をす
    る停止手段とを含む、多数のプロセッサの同期装置。
  31. (31)請求項30に記載された装置において、上記の
    同期割り込み要求信号が割り込みである、多数のプロセ
    ッサの同期装置。
  32. (32)請求項28に記載された装置において各プロセ
    ッサについて計数されたイベントの数が等しいとき、停
    止されたプロセッサを再びスタートする手段を含む、多
    数のプロセッサの同期装置。
  33. (33)請求項29に記載された装置において、1個の
    プロセッサについて計数されたイベントの数が停止され
    たプロセッサについて計数されたイベントの数より少な
    くない時に、前者のプロセッサの処理の停止をする停止
    手段を備えた、多数のプロセッサの同期装置。
  34. (34)所定のイベントの発生の数を計数するためにプ
    ロセッサに結合されたイベント計数手段と、各プロセッ
    サに対するイベント計数手段のための信号を受け取るた
    めに結合された比較手段と、同期要求入力信号を受け取
    るためにイベントカウンタに結合され、各プロセッサに
    対して計数されたイベントの数が他のプロセッサについ
    て計数されたイベントの数に等しくなるまで同期要求信
    号に応答してプロセッサの処理を停止するための同期手
    段とを、各プロセッサに対して備えた、多数のプロセッ
    サの同期装置。
  35. (35)請求項34に記載された装置において、所定の
    イベントが、命令が実行されているプロセッサのクロッ
    クサイクルであり、上記のクロックサイクルが、そのプ
    ロセッサのパイプラインが進むクロックサイクルである
    、多数のプロセッサの同期装置。
  36. (36)請求項34に記載された装置において、同期要
    求信号が割り込みであり、イベント計数手段がサイクル
    カウンタである、多数のプロセッサの同期装置。
  37. (37)(a)それぞれ同じ命令ストリームを実行する
    多重プロセッサであって、各プロセッサが独立のクロッ
    クを備え、そして、各プロセッサが他のプロセッサに独
    立のメモリを備える多重プロセッサと、 (b)多数のボート回路であって、各ボート回路が、各
    プロセッサから出力データを別々に受け取り、多重プロ
    セッサが同じデータ出力を送ったときにのみ入力/出力
    手段にボート出力を作る多数のボート回路とを備えるフ
    ォールトトレラントなコンピュータシステム。
  38. (38)請求項37に記載されたシステムにおいて、 上記の全プロセッサが、全プロセッサの作動サイクルを
    計数し、他のプロセッサの前にあるプロセッサをストー
    ルすることにより緩く同期されるフォールトトレラント
    なコンピュータシステム。
  39. (39)請求項37に記載されたシステムにおいて、 上記の各入力/出力手段を上記の各プロセッサに結合す
    る入力バッファを含み、プロセッサがこの入力バッファ
    から非同期にデータを受け取るフォールトトレラントな
    コンピュータシステム。
  40. (40)請求項37に記載されたシステムにおいて、 各プロセッサからの上記の出力データが、上記の全プロ
    セッサが出力データをその出力バッファにロードするま
    で、出力バッファに保持され、この出力バッファがFI
    FOであるフォールトトレラントなコンピュータシステ
    ム。
  41. (41)(a)多重プロセッサの各々を相互に独立にク
    ロックするステップと、 (b)各プロセッサにおいて同じ命令ストリームを実行
    するステップと、 (c)各プロセッサについてのデータを他のプロセッサ
    によってアクセス可能でない別のメモリに格納するステ
    ップと、 (d)各プロセッサの出力ポートに出力データを出すス
    テップと、 (e)ボート回路における上記の全ポートにおける出力
    データを検出し、そして、多重プロセッサから入力/出
    力手段への同じデータである出力データを通すために上
    記の出力データをポートするステップとを備えた多重プ
    ロセッサシステム作動法。
  42. (42)請求項41に記載された方法において、上記の
    ボートの各々でバッファ内の上記の出力データを格納す
    るステップを含み、上記の各バッファがFIFOである
    多重プロセッサシステム作動法。
  43. (43)請求項42に記載された方法において、全プロ
    セッサの作動のサイクルを計数し他のプロセッサの前に
    あるプロセッサをストールすることにより上記の全プロ
    セッサを緩く同期するステップを含む多重プロセッサシ
    ステム作動法。
  44. (44)(a)少なくとも第1と第2のプロセッサにお
    いて同じ命令ストリームを実行するステップと、 (b)上記の第1と第2のプロセッサの各々においてリ
    モートアクセス(このリモートアクセスは、別々の第1
    と第2のアクセスポートに向けられる)を発生するステ
    ップと、 (c)上記の第1と第2のアクセスポートにおいて上記
    のリモートアクセスの各々を検出し、上記の第1と第2
    のアクセスポートの両方においてリモートアクセスが検
    出されるまで待って、次に上記のリモートアクセスをボ
    ートし、もし両者が同じであれば上記のリモートアクセ
    スを通すステップとを備えたコンピュータシステム作動
    法。
  45. (45)請求項44に記載された方法において、上記の
    実行するステップが、独立にクロックされるプロセッサ
    内にあり、上記の第1と第2のプロセッサでリモートア
    クセスを発生する上記のステップが、各プロセッサに対
    するバッファに上記のリモートアクセスを一時的に格納
    することをふくむコンピュータシステム作動法。
  46. (46)請求項44に記載された方法において、上記の
    第1と第2のアクセスボートが、上記の第1と第2のプ
    ロセッサに非同期に作動される第1と第2のモジュール
    内にあり、上記の第1と第2のプロセッサが、作動サイ
    クルを計数し他のプロセッサの前にあるプロセッサをス
    トールすることにより緩く同期され、1個ののプロセッ
    サのみによってアクセス可能な別々のメモリの上記の第
    1と第2のプロセッサについてのデータを格納するステ
    ップを含むコンピュータシステム作動法。
  47. (47)(a)同じ命令ストリームを実行する第1と第
    2のプロセッサと、 (b)上記の第1と第2のプロセッサの各々にリモート
    アクセス(このリモートアクセスは、別々の第1と第2
    のアクセスポートに向けられる)を発生する手段と、 (c)上記の第1と第2のアクセスポートで上記のリモ
    ートアクセスの各々を検出する別々のボート手段であっ
    て、上記のリモートアクセスをポートする前にリモート
    アクセスが第1と第2のアクセスポートの両方で検出さ
    れるまで待ち、もし両者が同じであるならば上記のリモ
    ートアクセスを通すポート手段とを備えるコンピュータ
    システム。
  48. (48)請求項47に記載されたシステムにおいて、 上記のプロセッサが独立にクロックされ、上記のリモー
    トアクセスを一時的に格納できる各プロセッサにおいて
    対するバッファを含むコンピュータシステム。
  49. (49)請求項47に記載されたシステムにおいて、 上記の第1と第2のアクセスポートが、上記の第1と第
    2のプロセッサに非同期に作動される第1と第2のモジ
    ュール内にあるコンピュータシステム。
  50. (50)請求項47に記載されたシステムにおいて、 上記の第1と第2のプロセッサの各1個のための別々の
    メモリ手段を含み、各メモリ手段は1個のプロセッサに
    よってのみアクセス可能なコンピュータシステム。
JP1322463A 1987-11-09 1989-12-11 多重プロセッサを備えたフォールトトレラントなコンピュータシステム Expired - Fee Related JPH079626B2 (ja)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US11850387A 1987-11-09 1987-11-09
US28313988A 1988-12-09 1988-12-09
US28314188A 1988-12-09 1988-12-09
US28253888A 1988-12-09 1988-12-09
US283139 1988-12-09
EP90105101A EP0447576A1 (en) 1987-11-09 1990-03-19 Synchronization of fault-tolerant computer system having multiple processors
US282538 1999-03-31
US283141 1999-03-31

Publications (2)

Publication Number Publication Date
JPH02202638A true JPH02202638A (ja) 1990-08-10
JPH079626B2 JPH079626B2 (ja) 1995-02-01

Family

ID=38829405

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1322463A Expired - Fee Related JPH079626B2 (ja) 1987-11-09 1989-12-11 多重プロセッサを備えたフォールトトレラントなコンピュータシステム

Country Status (4)

Country Link
US (1) US5317726A (ja)
EP (2) EP0372580A3 (ja)
JP (1) JPH079626B2 (ja)
CA (1) CA2003338A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5983359A (en) * 1996-03-18 1999-11-09 Hitachi, Ltd. Processor fault recovering method for information processing system
JP2010534888A (ja) * 2007-07-24 2010-11-11 ジーイー・アビエイション・システムズ・エルエルシー 高インテグリティと高可用性のコンピュータ処理モジュール
JP2012514257A (ja) * 2008-12-31 2012-06-21 インテル・コーポレーション 冗長プロセスを同期させるためのステート履歴ストレージ

Families Citing this family (132)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3144794B2 (ja) * 1990-11-09 2001-03-12 株式会社日立製作所 マルチプロセッサシステム
US5233615A (en) * 1991-06-06 1993-08-03 Honeywell Inc. Interrupt driven, separately clocked, fault tolerant processor synchronization
DE4219005A1 (de) * 1992-06-10 1993-12-16 Siemens Ag Rechnersystem
US5613127A (en) * 1992-08-17 1997-03-18 Honeywell Inc. Separately clocked processor synchronization improvement
EP0596410B1 (en) * 1992-11-04 1999-07-28 Digital Equipment Corporation Detection of command synchronisation error
US5551047A (en) * 1993-01-28 1996-08-27 The Regents Of The Univeristy Of California Method for distributed redundant execution of program modules
JPH0773059A (ja) * 1993-03-02 1995-03-17 Tandem Comput Inc フォールトトレラント型コンピュータシステム
DE59302826D1 (de) * 1993-03-16 1996-07-11 Siemens Ag Synchronisationsverfahren für Automatisierungssysteme
US5572620A (en) * 1993-07-29 1996-11-05 Honeywell Inc. Fault-tolerant voter system for output data from a plurality of non-synchronized redundant processors
US5600786A (en) * 1993-07-30 1997-02-04 Honeywell Inc. FIFO fail-safe bus
JPH07129426A (ja) * 1993-10-29 1995-05-19 Hitachi Ltd 障害処理方式
US5504859A (en) * 1993-11-09 1996-04-02 International Business Machines Corporation Data processor with enhanced error recovery
DE69435090T2 (de) * 1993-12-01 2009-06-10 Marathon Technologies Corp., Stow Rechnersystem mit Steuereinheiten und Rechnerelementen
US5452441A (en) * 1994-03-30 1995-09-19 At&T Corp. System and method for on-line state restoration of one or more processors in an N module redundant voting processor system
JPH0863365A (ja) * 1994-08-23 1996-03-08 Fujitsu Ltd データ処理装置
JP2908739B2 (ja) * 1994-12-16 1999-06-21 インターナショナル・ビジネス・マシーンズ・コーポレイション 多重プロセッサ・システムにおけるcpuのモニタリング・システム及び方法
US5539875A (en) * 1994-12-30 1996-07-23 International Business Machines Corporation Error windowing for storage subsystem recovery
US5694556A (en) * 1995-06-07 1997-12-02 International Business Machines Corporation Data processing system including buffering mechanism for inbound and outbound reads and posted writes
JP3595033B2 (ja) * 1995-07-18 2004-12-02 株式会社日立製作所 高信頼化コンピュータシステム
US5802265A (en) * 1995-12-01 1998-09-01 Stratus Computer, Inc. Transparent fault tolerant computer system
DE69703236T2 (de) * 1996-04-23 2001-03-01 Allied Signal Inc Integriertes gefahrenvermeidungssystem
US6141769A (en) 1996-05-16 2000-10-31 Resilience Corporation Triple modular redundant computer system and associated method
US6145115A (en) * 1996-06-24 2000-11-07 Rohm Co., Ltd. Device for duplicating functions and a method for duplicating functions
EP0825506B1 (en) 1996-08-20 2013-03-06 Invensys Systems, Inc. Methods and apparatus for remote process control
US5790397A (en) * 1996-09-17 1998-08-04 Marathon Technologies Corporation Fault resilient/fault tolerant computing
GB2317464A (en) * 1996-09-23 1998-03-25 Advanced Risc Mach Ltd Register addressing in a data processing apparatus
GB2317465B (en) * 1996-09-23 2000-11-15 Advanced Risc Mach Ltd Data processing apparatus registers.
GB2317468B (en) * 1996-09-23 2001-01-24 Advanced Risc Mach Ltd Digital signal processing integrated circuit architecture
GB2317469B (en) * 1996-09-23 2001-02-21 Advanced Risc Mach Ltd Data processing system register control
GB2317467B (en) * 1996-09-23 2000-11-01 Advanced Risc Mach Ltd Input operand control in data processing systems
US5784602A (en) * 1996-10-08 1998-07-21 Advanced Risc Machines Limited Method and apparatus for digital signal processing for integrated circuit architecture
US5842038A (en) * 1996-10-10 1998-11-24 Unisys Corporation Optimized input/output memory access request system and method
US6021261A (en) * 1996-12-05 2000-02-01 International Business Machines Corporation Method and system for testing a multiprocessor data processing system utilizing a plurality of event tracers
US5896523A (en) * 1997-06-04 1999-04-20 Marathon Technologies Corporation Loosely-coupled, synchronized execution
US6279119B1 (en) 1997-11-14 2001-08-21 Marathon Technologies Corporation Fault resilient/fault tolerant computing
US6374364B1 (en) * 1998-01-20 2002-04-16 Honeywell International, Inc. Fault tolerant computing system using instruction counting
US6691183B1 (en) 1998-05-20 2004-02-10 Invensys Systems, Inc. Second transfer logic causing a first transfer logic to check a data ready bit prior to each of multibit transfer of a continous transfer operation
US6513108B1 (en) 1998-06-29 2003-01-28 Cisco Technology, Inc. Programmable processing engine for efficiently processing transient data
US6195739B1 (en) 1998-06-29 2001-02-27 Cisco Technology, Inc. Method and apparatus for passing data among processor complex stages of a pipelined processing engine
US6119215A (en) 1998-06-29 2000-09-12 Cisco Technology, Inc. Synchronization and control system for an arrayed processing engine
US6836838B1 (en) 1998-06-29 2004-12-28 Cisco Technology, Inc. Architecture for a processor complex of an arrayed pipelined processing engine
US6101599A (en) * 1998-06-29 2000-08-08 Cisco Technology, Inc. System for context switching between processing elements in a pipeline of processing elements
US6247143B1 (en) 1998-06-30 2001-06-12 Sun Microsystems, Inc. I/O handling for a multiprocessor computer system
US6728839B1 (en) 1998-10-28 2004-04-27 Cisco Technology, Inc. Attribute based memory pre-fetching technique
US6385747B1 (en) 1998-12-14 2002-05-07 Cisco Technology, Inc. Testing of replicated components of electronic device
US6173386B1 (en) 1998-12-14 2001-01-09 Cisco Technology, Inc. Parallel processor with debug capability
US6920562B1 (en) 1998-12-18 2005-07-19 Cisco Technology, Inc. Tightly coupled software protocol decode with hardware data encryption
US7206877B1 (en) 1998-12-22 2007-04-17 Honeywell International Inc. Fault tolerant data communication network
US6853623B2 (en) 1999-03-05 2005-02-08 Cisco Technology, Inc. Remote monitoring of switch network
WO2000070531A2 (en) 1999-05-17 2000-11-23 The Foxboro Company Methods and apparatus for control configuration
US6754885B1 (en) 1999-05-17 2004-06-22 Invensys Systems, Inc. Methods and apparatus for controlling object appearance in a process control configuration system
US7089530B1 (en) * 1999-05-17 2006-08-08 Invensys Systems, Inc. Process control configuration system with connection validation and configuration
US6501995B1 (en) 1999-06-30 2002-12-31 The Foxboro Company Process control system and method with improved distribution, installation and validation of components
US6788980B1 (en) 1999-06-11 2004-09-07 Invensys Systems, Inc. Methods and apparatus for control using control devices that provide a virtual machine environment and that communicate via an IP network
AU6615600A (en) 1999-07-29 2001-02-19 Foxboro Company, The Methods and apparatus for object-based process control
DE19950131C1 (de) * 1999-10-18 2000-11-02 Siemens Ag Integrierter Schaltkreis mit gedoppelten synchronen und asynchronen Komponenten
US6681341B1 (en) 1999-11-03 2004-01-20 Cisco Technology, Inc. Processor isolation method for integrated multi-processor systems
US6529983B1 (en) 1999-11-03 2003-03-04 Cisco Technology, Inc. Group and virtual locking mechanism for inter processor synchronization
US6473660B1 (en) 1999-12-03 2002-10-29 The Foxboro Company Process control system and method with automatic fault avoidance
US6779128B1 (en) 2000-02-18 2004-08-17 Invensys Systems, Inc. Fault-tolerant data transfer
US6892237B1 (en) 2000-03-28 2005-05-10 Cisco Technology, Inc. Method and apparatus for high-speed parsing of network messages
US6708283B1 (en) 2000-04-13 2004-03-16 Stratus Technologies, Bermuda Ltd. System and method for operating a system with redundant peripheral bus controllers
US6633996B1 (en) 2000-04-13 2003-10-14 Stratus Technologies Bermuda Ltd. Fault-tolerant maintenance bus architecture
US6820213B1 (en) 2000-04-13 2004-11-16 Stratus Technologies Bermuda, Ltd. Fault-tolerant computer system with voter delay buffer
US6735715B1 (en) 2000-04-13 2004-05-11 Stratus Technologies Bermuda Ltd. System and method for operating a SCSI bus with redundant SCSI adaptors
US6687851B1 (en) 2000-04-13 2004-02-03 Stratus Technologies Bermuda Ltd. Method and system for upgrading fault-tolerant systems
US6691257B1 (en) 2000-04-13 2004-02-10 Stratus Technologies Bermuda Ltd. Fault-tolerant maintenance bus protocol and method for using the same
US6901481B2 (en) 2000-04-14 2005-05-31 Stratus Technologies Bermuda Ltd. Method and apparatus for storing transactional information in persistent memory
US6691225B1 (en) 2000-04-14 2004-02-10 Stratus Technologies Bermuda Ltd. Method and apparatus for deterministically booting a computer system having redundant components
US6802022B1 (en) 2000-04-14 2004-10-05 Stratus Technologies Bermuda Ltd. Maintenance of consistent, redundant mass storage images
US6862689B2 (en) 2001-04-12 2005-03-01 Stratus Technologies Bermuda Ltd. Method and apparatus for managing session information
US6505269B1 (en) 2000-05-16 2003-01-07 Cisco Technology, Inc. Dynamic addressing mapping to eliminate memory resource contention in a symmetric multiprocessor system
US6609216B1 (en) 2000-06-16 2003-08-19 International Business Machines Corporation Method for measuring performance of code sequences in a production system
US7172859B2 (en) * 2000-07-14 2007-02-06 Transform Pharmaceuticals, Inc. System and method for optimizing tissue barrier transfer of compounds
US6948010B2 (en) * 2000-12-20 2005-09-20 Stratus Technologies Bermuda Ltd. Method and apparatus for efficiently moving portions of a memory block
US6886171B2 (en) * 2001-02-20 2005-04-26 Stratus Technologies Bermuda Ltd. Caching for I/O virtual address translation and validation using device drivers
US6766479B2 (en) 2001-02-28 2004-07-20 Stratus Technologies Bermuda, Ltd. Apparatus and methods for identifying bus protocol violations
US6766413B2 (en) 2001-03-01 2004-07-20 Stratus Technologies Bermuda Ltd. Systems and methods for caching with file-level granularity
US6874102B2 (en) * 2001-03-05 2005-03-29 Stratus Technologies Bermuda Ltd. Coordinated recalibration of high bandwidth memories in a multiprocessor computer
US7065672B2 (en) * 2001-03-28 2006-06-20 Stratus Technologies Bermuda Ltd. Apparatus and methods for fault-tolerant computing using a switching fabric
US6928583B2 (en) * 2001-04-11 2005-08-09 Stratus Technologies Bermuda Ltd. Apparatus and method for two computing elements in a fault-tolerant server to execute instructions in lockstep
US6996750B2 (en) * 2001-05-31 2006-02-07 Stratus Technologies Bermuda Ltd. Methods and apparatus for computer bus error termination
US6925512B2 (en) * 2001-10-15 2005-08-02 Intel Corporation Communication between two embedded processors
US20030217053A1 (en) 2002-04-15 2003-11-20 Bachman George E. Context control mechanism for data executed in workflows of process, factory-floor, environmental, computer aided manufacturing-based or other control system
AU2003229438A1 (en) * 2002-05-10 2003-11-11 Portfolio Aid Inc. System and method for evaluating securities and portfolios thereof
JP3606281B2 (ja) * 2002-06-07 2005-01-05 オムロン株式会社 プログラマブルコントローラ及びcpuユニット並びに特殊機能モジュール及び二重化処理方法
JP3774826B2 (ja) * 2002-07-11 2006-05-17 日本電気株式会社 情報処理装置
EP1398701A1 (de) * 2002-09-12 2004-03-17 Siemens Aktiengesellschaft Verfahren zur Ereignissynchronisation, insbesondere für Prozessoren fehlertoleranter Systeme
EP1398699A1 (de) * 2002-09-12 2004-03-17 Siemens Aktiengesellschaft Verfahren zur Ereignissynchronisation, insbesondere für Prozessoren fehlertoleranter Systeme
US7467326B2 (en) * 2003-02-28 2008-12-16 Maxwell Technologies, Inc. Self-correcting computer
EP1629614A1 (en) * 2003-05-20 2006-03-01 Philips Intellectual Property & Standards GmbH Time-triggered communication system and method for the synchronization of a dual-channel network
EP1629636B1 (en) * 2003-05-20 2008-03-05 Nxp B.V. Time-triggered communication system and method for the synchronized start of a dual-channel network
US7146530B2 (en) * 2003-07-18 2006-12-05 Hewlett-Packard Development Company, L.P. Targeted fault tolerance by special CPU instructions
US7761923B2 (en) 2004-03-01 2010-07-20 Invensys Systems, Inc. Process control methods and apparatus for intrusion detection, protection and network hardening
US20060020852A1 (en) * 2004-03-30 2006-01-26 Bernick David L Method and system of servicing asynchronous interrupts in multiple processors executing a user program
US20050240806A1 (en) * 2004-03-30 2005-10-27 Hewlett-Packard Development Company, L.P. Diagnostic memory dump method in a redundant processor
US8799706B2 (en) * 2004-03-30 2014-08-05 Hewlett-Packard Development Company, L.P. Method and system of exchanging information between processors
US7426656B2 (en) * 2004-03-30 2008-09-16 Hewlett-Packard Development Company, L.P. Method and system executing user programs on non-deterministic processors
US7451384B2 (en) * 2004-07-15 2008-11-11 Honeywell International Inc. Error recovery in asynchronous combinational logic circuits
JP2008518307A (ja) * 2004-10-25 2008-05-29 ローベルト ボッシュ ゲゼルシャフト ミット ベシュレンクテル ハフツング 少なくとも2つの処理ユニットを有する計算機システムにおいて切替える方法及び装置
GB0425860D0 (en) * 2004-11-25 2004-12-29 Ibm A method for ensuring the quality of a service in a distributed computing environment
US7549082B2 (en) * 2005-04-28 2009-06-16 Hewlett-Packard Development Company, L.P. Method and system of bringing processors to the same computational point
US7782873B2 (en) * 2005-08-23 2010-08-24 Slt Logic, Llc Omni-protocol engine for reconfigurable bit-stream processing in high-speed networks
US8189599B2 (en) 2005-08-23 2012-05-29 Rpx Corporation Omni-protocol engine for reconfigurable bit-stream processing in high-speed networks
WO2007123753A2 (en) * 2006-03-30 2007-11-01 Invensys Systems, Inc. Digital data processing apparatus and methods for improving plant performance
US8074109B1 (en) * 2006-11-14 2011-12-06 Unisys Corporation Third-party voting to select a master processor within a multi-processor computer
FR2912526B1 (fr) * 2007-02-13 2009-04-17 Thales Sa Procede de maintien du synchronisme d'execution entre plusieurs processeurs asynchrones fonctionnant en parallele de maniere redondante.
US20090133022A1 (en) * 2007-11-15 2009-05-21 Karim Faraydon O Multiprocessing apparatus, system and method
US7809980B2 (en) * 2007-12-06 2010-10-05 Jehoda Refaeli Error detector in a cache memory using configurable way redundancy
US8793700B2 (en) 2008-05-14 2014-07-29 Freescale Semiconductor, Inc. Synchronization of stateful elements in a processing resource using a scan chain
RU2495476C2 (ru) 2008-06-20 2013-10-10 Инвенсис Системз, Инк. Системы и способы для иммерсивного взаимодействия с действительными и/или имитируемыми техническими средствами для управления технологическим процессом, контроля состояния окружающей среды и производственного контроля
US8271996B1 (en) * 2008-09-29 2012-09-18 Emc Corporation Event queues
WO2010043401A2 (en) * 2008-10-15 2010-04-22 Martin Vorbach Data processing device
US8127060B2 (en) 2009-05-29 2012-02-28 Invensys Systems, Inc Methods and apparatus for control configuration with control objects that are fieldbus protocol-aware
US8463964B2 (en) 2009-05-29 2013-06-11 Invensys Systems, Inc. Methods and apparatus for control configuration with enhanced change-tracking
US8473818B2 (en) * 2009-10-12 2013-06-25 Empire Technology Development Llc Reliable communications in on-chip networks
CN103703427B (zh) 2011-07-20 2016-05-11 飞思卡尔半导体公司 同步第一处理单元和第二处理单元的处理装置和方法
US9250944B2 (en) 2011-08-30 2016-02-02 International Business Machines Corporation Selection of virtual machines from pools of pre-provisioned virtual machines in a networked computing environment
AT511805B1 (de) * 2011-11-09 2013-03-15 Fts Computertechnik Gmbh Verfahren zur optimierung der wartezeit in replika-deterministischen systemen
WO2013078085A1 (en) * 2011-11-22 2013-05-30 Mips Technologies, Inc. Processor with kernel mode access to user space virtual addresses
US10353738B2 (en) 2012-03-21 2019-07-16 International Business Machines Corporation Resource allocation based on social networking trends in a networked computing environment
US11110648B2 (en) 2012-07-31 2021-09-07 Makerbot Industries, Llc Build material switching
US9153049B2 (en) 2012-08-24 2015-10-06 International Business Machines Corporation Resource provisioning using predictive modeling in a networked computing environment
US10042907B2 (en) * 2012-11-29 2018-08-07 Teradata Us, Inc. Providing metadata to database systems and environments with multiple processing units or modules
US9465746B2 (en) 2014-01-24 2016-10-11 International Business Machines Corporation Diagnostics for transactional execution errors in reliable transactions
US9304935B2 (en) * 2014-01-24 2016-04-05 International Business Machines Corporation Enhancing reliability of transaction execution by using transaction digests
DE102016208864A1 (de) * 2016-05-23 2017-11-23 Robert Bosch Gmbh Recheneinheit
US11609845B2 (en) * 2019-05-28 2023-03-21 Oracle International Corporation Configurable memory device connected to a microprocessor
CN112306948A (zh) * 2019-07-31 2021-02-02 北京君正集成电路股份有限公司 一种双核打印机节省处理器代码空间的方法
CN112181495B (zh) * 2020-09-28 2022-10-18 中国人民解放军国防科技大学 一种断言寄存器操作数指令的实现方法和装置
RU2768535C1 (ru) * 2021-07-09 2022-03-24 Российская Федерация, от имени которой выступает Государственная корпорация по атомной энергии "Росатом" (Госкорпорация "Росатом") Отказоустойчивый канал системы межпроцессорных обменов с программируемым и адаптивным выбором линий передачи данных
WO2024082174A1 (zh) * 2022-10-19 2024-04-25 宁德时代未来能源(上海)研究院有限公司 异常处理方法及三取二保护装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5224825A (en) * 1975-08-22 1977-02-24 Kubota Ltd Stalk conveying device for agricultral machinery
JPS5260540A (en) * 1975-11-14 1977-05-19 Hitachi Ltd Synchronization control of double-type system

Family Cites Families (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR1587572A (ja) * 1968-10-25 1970-03-20
GB1253309A (en) * 1969-11-21 1971-11-10 Marconi Co Ltd Improvements in or relating to data processing arrangements
GB1308497A (en) * 1970-09-25 1973-02-21 Marconi Co Ltd Data processing arrangements
JPS5633915B1 (ja) * 1970-11-06 1981-08-06
SE347826B (ja) * 1970-11-20 1972-08-14 Ericsson Telefon Ab L M
US3810119A (en) * 1971-05-04 1974-05-07 Us Navy Processor synchronization scheme
BE790654A (fr) * 1971-10-28 1973-04-27 Siemens Ag Systeme de traitement avec des unites de systeme
DE2202231A1 (de) * 1972-01-18 1973-07-26 Siemens Ag Verarbeitungssystem mit verdreifachten systemeinheiten
US3783250A (en) * 1972-02-25 1974-01-01 Nasa Adaptive voting computer system
CH556576A (de) * 1973-03-28 1974-11-29 Hasler Ag Einrichtung zur synchronisierung dreier rechner.
FR2253423A5 (ja) * 1973-11-30 1975-06-27 Honeywell Bull Soc Ind
FR2253432A5 (ja) * 1973-11-30 1975-06-27 Honeywell Bull Soc Ind
IT1014277B (it) * 1974-06-03 1977-04-20 Cselt Centro Studi Lab Telecom Sistema di controllo di elaboratori di processo operanti in parallelo
US4015246A (en) * 1975-04-14 1977-03-29 The Charles Stark Draper Laboratory, Inc. Synchronous fault tolerant multi-processor system
US4224664A (en) * 1976-05-07 1980-09-23 Honeywell Information Systems Inc. Apparatus for detecting when the activity of one process in relation to a common piece of information interferes with any other process in a multiprogramming/multiprocessing computer system
US4456952A (en) * 1977-03-17 1984-06-26 Honeywell Information Systems Inc. Data processing system having redundant control processors for fault detection
US4358823A (en) * 1977-03-25 1982-11-09 Trw, Inc. Double redundant processor
US4187538A (en) * 1977-06-13 1980-02-05 Honeywell Inc. Read request selection system for redundant storage
GB1545169A (en) * 1977-09-22 1979-05-02 Burroughs Corp Data processor system including data-save controller for protection against loss of volatile memory information during power failure
US4234920A (en) * 1978-11-24 1980-11-18 Engineered Systems, Inc. Power failure detection and restart system
US4257097A (en) * 1978-12-11 1981-03-17 Bell Telephone Laboratories, Incorporated Multiprocessor system with demand assignable program paging stores
US4253144A (en) * 1978-12-21 1981-02-24 Burroughs Corporation Multi-processor communication network
US4380046A (en) * 1979-05-21 1983-04-12 Nasa Massively parallel processor computer
US4428044A (en) * 1979-09-20 1984-01-24 Bell Telephone Laboratories, Incorporated Peripheral unit controller
US4315310A (en) * 1979-09-28 1982-02-09 Intel Corporation Input/output data processing system
DE2939487A1 (de) * 1979-09-28 1981-04-16 Siemens AG, 1000 Berlin und 8000 München Rechnerarchitektur auf der basis einer multi-mikrocomputerstruktur als fehlertolerantes system
FR2474201B1 (fr) * 1980-01-22 1986-05-16 Bull Sa Procede et dispositif pour gerer les conflits poses par des acces multiples a un meme cache d'un systeme de traitement numerique de l'information comprenant au moins deux processus possedant chacun un cache
US4321666A (en) * 1980-02-05 1982-03-23 The Bendix Corporation Fault handler for a multiple computer system
JPS56119596A (en) * 1980-02-26 1981-09-19 Nec Corp Control signal generator
US4493019A (en) * 1980-05-06 1985-01-08 Burroughs Corporation Pipelined microprogrammed digital data processor employing microinstruction tasking
US4412281A (en) * 1980-07-11 1983-10-25 Raytheon Company Distributed signal processing system
US4392196A (en) * 1980-08-11 1983-07-05 Harris Corporation Multi-processor time alignment control system
US4399504A (en) * 1980-10-06 1983-08-16 International Business Machines Corporation Method and means for the sharing of data resources in a multiprocessing, multiprogramming environment
US4375683A (en) * 1980-11-12 1983-03-01 August Systems Fault tolerant computational system and voter circuit
US4414624A (en) * 1980-11-19 1983-11-08 The United States Of America As Represented By The Secretary Of The Navy Multiple-microcomputer processing
US4430707A (en) * 1981-03-05 1984-02-07 Burroughs Corporation Microprogrammed digital data processing system employing multi-phase subroutine control for concurrently executing tasks
US4455605A (en) * 1981-07-23 1984-06-19 International Business Machines Corporation Method for establishing variable path group associations and affiliations between "non-static" MP systems and shared devices
US4438494A (en) * 1981-08-25 1984-03-20 Intel Corporation Apparatus of fault-handling in a multiprocessing system
IN160140B (ja) * 1981-10-10 1987-06-27 Westinghouse Brake & Signal
DE3208573C2 (de) * 1982-03-10 1985-06-27 Standard Elektrik Lorenz Ag, 7000 Stuttgart 2 aus 3-Auswahleinrichtung für ein 3-Rechnersystem
US4497059A (en) * 1982-04-28 1985-01-29 The Charles Stark Draper Laboratory, Inc. Multi-channel redundant processing systems
US4590554A (en) * 1982-11-23 1986-05-20 Parallel Computers Systems, Inc. Backup fault tolerant computer system
US4648035A (en) * 1982-12-06 1987-03-03 Digital Equipment Corporation Address conversion unit for multiprocessor system
US4541094A (en) * 1983-03-21 1985-09-10 Sequoia Systems, Inc. Self-checking computer circuitry
US4591977A (en) * 1983-03-23 1986-05-27 The United States Of America As Represented By The Secretary Of The Air Force Plurality of processors where access to the common memory requires only a single clock interval
US4644498A (en) 1983-04-04 1987-02-17 General Electric Company Fault-tolerant real time clock
US4661900A (en) * 1983-04-25 1987-04-28 Cray Research, Inc. Flexible chaining in vector processor with selective use of vector registers as operand and result registers
US4577272A (en) * 1983-06-27 1986-03-18 E-Systems, Inc. Fault tolerant and load sharing processing system
US4646231A (en) * 1983-07-21 1987-02-24 Burroughs Corporation Method of synchronizing the sequence by which a variety of randomly called unrelated activities are executed in a digital processor
JPS6054052A (ja) * 1983-09-02 1985-03-28 Nec Corp 処理継続方式
DE3334796A1 (de) * 1983-09-26 1984-11-08 Siemens AG, 1000 Berlin und 8000 München Verfahren zum betrieb eines multiprozessor-steuerrechners, insbesondere fuer die zentralsteuereinheit eines fernsprech-vermittlungssystems
US4912698A (en) * 1983-09-26 1990-03-27 Siemens Aktiengesellschaft Multi-processor central control unit of a telephone exchange system and its operation
US4564903A (en) * 1983-10-05 1986-01-14 International Business Machines Corporation Partitioned multiprocessor programming system
US4607365A (en) * 1983-11-14 1986-08-19 Tandem Computers Incorporated Fault-tolerant communications controller system
US4570261A (en) * 1983-12-09 1986-02-11 Motorola, Inc. Distributed fault isolation and recovery system and method
AU3746585A (en) * 1983-12-12 1985-06-26 Parallel Computers Inc. Computer processor controller
DE3509900A1 (de) * 1984-03-19 1985-10-17 Konishiroku Photo Industry Co., Ltd., Tokio/Tokyo Verfahren und vorrichtung zum erzeugen eines farbbilds
US4638427A (en) * 1984-04-16 1987-01-20 International Business Machines Corporation Performance evaluation for an asymmetric multiprocessor system
US4633394A (en) * 1984-04-24 1986-12-30 International Business Machines Corp. Distributed arbitration for multiple processors
US4589066A (en) * 1984-05-31 1986-05-13 General Electric Company Fault tolerant, frame synchronization for multiple processor systems
US4823256A (en) * 1984-06-22 1989-04-18 American Telephone And Telegraph Company, At&T Bell Laboratories Reconfigurable dual processor system
US4959774A (en) * 1984-07-06 1990-09-25 Ampex Corporation Shadow memory system for storing variable backup blocks in consecutive time periods
JPS6184740A (ja) * 1984-10-03 1986-04-30 Hitachi Ltd 汎用オブジエクトコ−ド生成方式
US4827401A (en) * 1984-10-24 1989-05-02 International Business Machines Corporation Method and apparatus for synchronizing clocks prior to the execution of a flush operation
US4757442A (en) * 1985-06-17 1988-07-12 Nec Corporation Re-synchronization system using common memory bus to transfer restart data from non-faulty processor to failed processor
US4751639A (en) * 1985-06-24 1988-06-14 Ncr Corporation Virtual command rollback in a fault tolerant data processing system
US4845419A (en) * 1985-11-12 1989-07-04 Norand Corporation Automatic control means providing a low-power responsive signal, particularly for initiating data preservation operation
US4733353A (en) * 1985-12-13 1988-03-22 General Electric Company Frame synchronization of multiply redundant computers
US4703452A (en) * 1986-01-03 1987-10-27 Gte Communication Systems Corporation Interrupt synchronizing circuit
US4799140A (en) * 1986-03-06 1989-01-17 Orbital Sciences Corporation Ii Majority vote sequencer
US4868832A (en) * 1986-04-30 1989-09-19 Marrington S Paul Computer power system
US4757505A (en) * 1986-04-30 1988-07-12 Elgar Electronics Corp. Computer power system
US4763333A (en) * 1986-08-08 1988-08-09 Universal Vectors Corporation Work-saving system for preventing loss in a computer due to power interruption
US4819159A (en) * 1986-08-29 1989-04-04 Tolerant Systems, Inc. Distributed multiprocess transaction processing system and method
IT1213344B (it) * 1986-09-17 1989-12-20 Honoywell Information Systems Architettura di calcolatore a tolleranza di guasto.
US4774709A (en) * 1986-10-02 1988-09-27 United Technologies Corporation Symmetrization for redundant channels
US4847837A (en) * 1986-11-07 1989-07-11 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Local area network with fault-checking, priorities and redundant backup
DE3638947C2 (de) * 1986-11-14 1995-08-31 Bosch Gmbh Robert Verfahren zur Synchronisation von Rechnern eines Mehrrechnersystems und Mehrrechnersystem
US4831520A (en) * 1987-02-24 1989-05-16 Digital Equipment Corporation Bus interface circuit for digital data processor
US4816989A (en) * 1987-04-15 1989-03-28 Allied-Signal Inc. Synchronizer for a fault tolerant multiple node processing system
CH675781A5 (ja) * 1987-04-16 1990-10-31 Bbc Brown Boveri & Cie
US4800462A (en) * 1987-04-17 1989-01-24 Tandem Computers Incorporated Electrical keying for replaceable modules
US4868826A (en) * 1987-08-31 1989-09-19 Triplex Fault-tolerant output circuits
US4868818A (en) * 1987-10-29 1989-09-19 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Fault tolerant hypercube computer system architecture
AU616213B2 (en) * 1987-11-09 1991-10-24 Tandem Computers Incorporated Method and apparatus for synchronizing a plurality of processors
US4879716A (en) * 1987-12-23 1989-11-07 Bull Hn Information Systems Inc. Resilient data communications system
US4937741A (en) * 1988-04-28 1990-06-26 The Charles Stark Draper Laboratory, Inc. Synchronization of fault-tolerant parallel processing systems
US4907232A (en) * 1988-04-28 1990-03-06 The Charles Stark Draper Laboratory, Inc. Fault-tolerant parallel processing system
US4873685A (en) * 1988-05-04 1989-10-10 Rockwell International Corporation Self-checking voting logic for fault tolerant computing applications
US4965717A (en) * 1988-12-09 1990-10-23 Tandem Computers Incorporated Multiple processor system having shared memory with private-write capability
US5018148A (en) * 1989-03-01 1991-05-21 Ncr Corporation Method and apparatus for power failure protection
US5020059A (en) * 1989-03-31 1991-05-28 At&T Bell Laboratories Reconfigurable signal processor

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5224825A (en) * 1975-08-22 1977-02-24 Kubota Ltd Stalk conveying device for agricultral machinery
JPS5260540A (en) * 1975-11-14 1977-05-19 Hitachi Ltd Synchronization control of double-type system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5983359A (en) * 1996-03-18 1999-11-09 Hitachi, Ltd. Processor fault recovering method for information processing system
JP2010534888A (ja) * 2007-07-24 2010-11-11 ジーイー・アビエイション・システムズ・エルエルシー 高インテグリティと高可用性のコンピュータ処理モジュール
JP2012514257A (ja) * 2008-12-31 2012-06-21 インテル・コーポレーション 冗長プロセスを同期させるためのステート履歴ストレージ

Also Published As

Publication number Publication date
EP0447576A1 (en) 1991-09-25
US5317726A (en) 1994-05-31
JPH079626B2 (ja) 1995-02-01
CA2003338A1 (en) 1990-06-09
EP0372580A3 (en) 1991-07-24
EP0372580A2 (en) 1990-06-13

Similar Documents

Publication Publication Date Title
JPH02202638A (ja) 多重プロセッサを備えたフォールトトレラントなコンピュータシステム
US5384906A (en) Method and apparatus for synchronizing a plurality of processors
US4965717A (en) Multiple processor system having shared memory with private-write capability
US5890003A (en) Interrupts between asynchronously operating CPUs in fault tolerant computer system
US5317752A (en) Fault-tolerant computer system with auto-restart after power-fall
US5327553A (en) Fault-tolerant computer system with /CONFIG filesystem
US6073251A (en) Fault-tolerant computer system with online recovery and reintegration of redundant components
EP0433979A2 (en) Fault-tolerant computer system with/config filesystem
US5226152A (en) Functional lockstep arrangement for redundant processors
JPH01152543A (ja) 欠陥分離及び修理機能を有する耐欠陥コンピュータシステム
JPH01154240A (ja) 単一レールインターフェイスにエラーチェック機能を有する二重レールプロセッサ
JPS638835A (ja) 障害回復方法
JPH01154242A (ja) 二重ゾーンの耐欠陥コンピュータシステム
JP3301992B2 (ja) 電源故障対策を備えたコンピュータシステム及びその動作方法
US5473770A (en) Fault-tolerant computer system with hidden local memory refresh
JPH0916535A (ja) マルチプロセッサ計算機
KR19990057809A (ko) 오류 방지 시스템
EP0476262B1 (en) Error handling in a VLSI central processor unit employing a pipelined address and execution module
JPH06161797A (ja) データ処理装置
JPS6146535A (ja) 擬似エラ−設定制御方式
JPH03228189A (ja) マイクロプロセッサ

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090201

Year of fee payment: 14

LAPS Cancellation because of no payment of annual fees