JPH09509270A

JPH09509270A - 故障から立直りが速い／故障に対する耐性がある計算処理

Info

Publication number: JPH09509270A
Application number: JP7515658A
Authority: JP
Inventors: トーマスディービセット; リチャードディーフィオレンティノ; ロバートエムグローリオソ; ダイアンティーマッコーリー; ジェームズディーマッコーラム; グレンエイトレンブレイ; マリオトロイアニ
Original assignee: マラソンテクノロジーズコーポレイション
Priority date: 1993-12-01
Filing date: 1994-11-15
Publication date: 1997-09-16
Also published as: US5600784A; EP0974912B1; EP0974912A3; AU1182095A; AU4286697A; EP0986008A3; DE69435090T2; CA2177850A1; DE69435090D1; EP0986008A2; AU711419B2; DE69424565T2; US5956474A; EP0731945A1; AU4286497A; US5615403A; EP0731945A4; EP0986008B1; EP0986007A3; EP0986007A2

Abstract

(57)【要約】他の計算素子のクロックに対して非同期的に作動するクロックを備えた計算素子少なくとも二つ（CE１、CE２）を同期させる方法は、計算素子（CE１、CE２）によって生成された信号組の中からメタ時刻信号として指定された信号を一つ以上選択することと、計算素子（CE１、CE２）を監視して計算素子の一方（CE１）による選択信号の生成を検出することと、等しい値の時間更新を計算素子各々へ送信することと、時間更新に基づいて計算素子（CE１、CE２）のクロックを更新することとから成る。本発明の第二の側面によれば、故障からの立直りが速いか故障に対する耐性があるコンピュータ（２００）は、第一プロセッサを計算素子（２０４）として指定し、第二プロセッサ（２０２）をコントローラとして指定し、モジュール対を作成するために計算素子（２０４）とコントローラ（２０２）とを接続して、故障からの立直りが速いか故障に対する耐性があるコンピュータ（２００）を作成するために少なくとも二つのモジュール対を接続することによって作成される。コンピュータ（２００）の各計算素子（２０２、２０４）は、他の計算素子（２０２、２０４）と同じ周期数単位で全部の命令を実行する。コンピュータシステムは一つ以上のコントローラ（２０２）と少なくとも二つの計算素子（２０４）とから成る。

Description

【発明の詳細な説明】故障から立直りが速い／故障に対する耐性がある計算処理発明の背景本発明は故障からの立直りが速くしかも故障に対する耐性がある計算方法と装置とに係わる。故障からの立直りの速いコンピュータシステムはハードウェア傷害が存在しても機能し続けられる。これらのシステムは、可用性モードと保全性モードのどちらかで作動するが両方ででは作動しない。システムは、ハードウェア傷害がユーザのアクセスに容認できない遅延を引起こさなければ、「使用可能」である。また、可用性モードで作動するシステムは、ハードウェア傷害に直面したときにも可能な限りオンラインのままであるように構成される。システムは、ハードウェア障害がデータの損失や変造を何も引起こさなければ、データ保全性を持っている。また、保全性モードで作動するシステムは、そのためにオフラインにならなければならないとしてもデータの損失や変造を回避するように構成される。故障に対する耐性があるシステムは可用性と保全性の両方に重点を置いている。耐故障システムは、単一のハードウェア障害に直面したときには使用可能のままでありデータ保全性を維持する。また、状況によっては、多重のハードウェア障害に直面したときにもそうである。災害に対する耐性があるシステムは耐故障システムの一歩先を行くものである。また、このシステムによれば、自然の災害あるいは人災による計算処理現場の損失によって、システムの可用性が中断されたりデータが変造されたり失われたりしないことになっている。故障に対する耐性の先行例の方法には、ソフトウェアチェックポイント／再始動、三重モジュール冗長およびペア／スペアなどがある。チェックポイント／再始動システムは、非同期的に作動し異なるアプリケーションを実行する二つ以上の計算素子を用いる。各アプリケーションは、自身が走行する計算素子の状態の画像を定期的に格納する（チェックポイント）。計算素子における故障が検出されると、チェックポイント用いて別の計算素子上（あるいは、故障が修正されてた後ならば同じ計算素子上）のアプリケーションを再始動させる。チェックポイント／再始動システムを実現するためには、そのシステム上で走行させるアプリケーションおよび／あるいはオペレーティングシステム各々を、システムの画像を定期的に格納するように変更しなければならない。加えて、システムは「後戻り」ができなければならない（すなわち、再始動させられたチェックポイントに続いて発生した動作の効果を取消すことができなければならない）。三重モジュール冗長の場合、三つの計算素子が同一のアプリケーションで走行し周期毎に作動される。計算素子全部が、三つの計算素子の出力（すなわち、メモリインターフェイス）を比較して、出力全部が同じものであれば、通常動作を継続するという票決ロジックブロックに接続されている。出力の一つが異なる場合、票決ロジックは、異なる出力を生成した計算素子をダウンさせる。票決ロジックは、計算素子とメモリとの間に配置されるがシステム速度に強い影響を及ぼす。ペア／スペアシステムは、同一のアプリケーションを走行させて周期毎に作動させられる二つ以上の計算素子対から成る。コントローラは対になった計算素子各々の出力（すなわち、メモリインターフェイス）を監視する。出力が異なる場合、対になった計算素子が両方ともダウンさせられる。発明の概要本発明によれば、故障からの立直りが速くしかも／あるいは故障に対する耐性があるシステムは、実時間で非同期的に作動し（すなわち、周期毎に）いわゆる「メタ時刻」に同期的に作動する少なくとも二つの計算素子（CE）を使用することによって達成される。これらのCEは、CE上で走行しているアプリケーションを分岐させることなくメタ時刻間に非同期的に走行させるのに充分頻繁に発生するメタ時刻に同期させられる。例えば、CEは、毎秒一回同期させられ、あとは非同期的に走行する。CEはメタ時刻毎に再度同期させられるので、CEはメタ時刻単位に作動すると言える。具体的な実施例においては、メタ時刻は、CEが入出力動作を要求する時刻と定義される。これらの実施例においては、CEは、入出力動作の終了の度に同期させられ入出力動作間に非同期的に走行する。この方法は、同一のアプリケーションを走行させる少なくとも二つの非同期計算素子が常に同一の順序で入出力要求を発生させるというシステムに適用可能である。この方法は、更に、処理環境（すなわち、書込み要求）を変更するための入出力要求の後のみの再同期に限定される。本発明に係わるメタ時刻同期は、アプリケーションとオペレーティングシステムソフトウェアとには見えない対モジュール冗長アーキテクチャを使用することによって達成される。このアーキテクチャによれば、各CEは、コントローラそうでなければ入出力プロセッサ(IOP)として知られるものと組合わされる。IOP は、CEによって要求されCEへ向けられる入出力動作を実行し、ハードウェア故障を検出し、入出力動作の終了の度にCE同士を同期させる。入出力要求が充分な頻度で発行されないシステムにおいては、IOP は、CEに接続されたプロセッサ間相互接続(IPI)モジュールによって発生させられるいわゆる「量子割込み」に応じて定期的にCE同士を同期させる。本発明の別の具体的な実施例においては、具体的な入出力動作に基づいてCEを同期させる代わりに、入出力動作ウィンドウに基づいてCEを同期させる。この方法では、入出力動作リストがCE毎に保持され、共通の入力がリスト全部に出現する度にCEが同期させられる。この方法は、入出力要求が発生させられる順序については柔軟性を与える。本発明の更に別の具体的実施例においては、CEは、オペレーティングシステムによって定期的に発生させられる信号かハードウェアで発生させられる割込みかに基づいて同期させられる。例えば、ハードウェア割込み法の場合、各CEのプロセッサを変更してＮ周期毎に割込みを発生させるようにし、その割込みに応じて CEを同期させる。対モジュール冗長システムの主な構成要素は、ソフトウェア、規格品のIOP、規格品のCEおよびIOP とCEの拡張スロットへ差込まれケーブルによって相互に接続された特注のIPI モジュール対から成る。冗長入出力装置は、一つ以上のCEか IOP かに接続されて冗長入出力を提供し、重要な大容量記憶装置のボリューム陰影処理機構などの機構を提供する。対モジュール冗長システムは、システムの IOP を実現する際に用いるプロセッサに対する互換性がある入出力装置ならどれでも収容可能である。対モジュール冗長アーキテクチャは、特注のソフトウェアとハードウェアを最長限使用して少なくとも二つの規格品の計算素子を、ウィンドウズNT、DOS、OS/ 2、UNIXなどの業界標準のオペレーティングシステムと未変更アプリケーションとを走行させる故障からの立直りが速いか故障に対する耐性があるシステムに組み込ませることができるようにする。このアーキテクチャは、コスト高および先行技術で用いられる登録商標のオペレーティングシステムやアプリケーションやプロセッサの設計の非柔軟性の両方を回避できる。本発明の対モジュール冗長アーキテクチャの別の優位性は、ある程度のソフトウェア故障に対する耐性を提供できる点である。ソフトウェアエラーの大半はアルゴリズムに関するものではない。そうではなく、エラーはたいてい入出力競争状態の原因となる計算素子と入出力装置との間の非同期性に起因する。入出力要求を計算素子から切離すことによって、対モジュール冗長アーキテクチャは、そのような非同期性に由来するいわゆる「Heisenbug」ソフトウェアエラーの個数を実質的に削減できる。一つの側面によれば、通常、本発明は、少なくとも一つのコントローラを使用して、他の計算素子のクロックに対して非同期的に作動するクロックを備えた計算素子少なくとも二つを同期させることによって、故障からの立直りが速いか故障に対する耐性があるコンピュータを形成することを特徴とする。メタ時刻信号として指定された一つ以上の信号が、計算素子によって生成された信号組の中から選択される。その後、計算素子を監視して一方の計算素子による選択信号の生成を検出する。選択信号が検出されると、システムは、他の計算素子による選択信号の生成を待合わせる。そして、選択信号を受信すると同時に、計算素子各々へ等時間更新を送信する。その後、計算素子のクロックが時間更新に基づいて更新される。本発明の優先的実施例は以下の特徴を有する。第一に、入出力要求は選択信号である。入出力要求を処理して、時間更新で送信される入出力応答を生成する。入出力要求の他にあるいは代わりに、量子割込みを選択信号にできる。計算素子は、実行命令か、システムクロック、バスクロックあるいは入出力クロックなどのクロックの周期かのどちらかを計数して、予め規定された個数の命令か周期かが発生する度に量子割込みを発生させる。入出力要求と量子割込みの両方を選択信号として用いる場合、計算素子は入出力要求なしに発生する命令か周期かの個数を計数する。例えば、入出力要求を発生させずに１００周期分の処理を行う度に量子割込みを発生させるように計算素子をプログラムしてもよい。一つの実施例では、予め決定された値を計数器にロードし、入出力要求でその計算器をイネーブルにし、計算器の値を減分させ、計算器の値がゼロに達したときに量子割込み信号を送ることによって、命令が計数される。別の方法では、プロセッサのデバッグ機構を用いて量子割込みを発生させる。故障検出のために、計算素子各々からの選択信号と付随のデータがあればそのデータとを比較する。それらが一致すれば、故障が発生したことを知らせるための信号が発生される。ある実施例においては、計算素子は、選択信号を生成した後休止して時間更新を待合わせる。計算素子は時間更新を受信すると同時に作用を再開する。他の実施例においては、計算素子は選択信号を生成した後も動作し続ける。計算素子の非同期アクティビティによって引起こされる問題点を回避するために、非同期アクティビティをディスエーブルにする。例えば、通常のメモリリフレッシュ機能をディスエーブルにして、その代わりに、バーストメモリリフレッシュを入出力要求や量子割込みなどの選択信号が生成される度に実行する。本発明は、また、計算素子として第一プロセッサを指定し、コントローラとして第二プロセッサを指定し、計算素子とコントローラとを接続してモジュール対を作成することによって、故障からの立直りが速いか故障に対する耐性があるコンピュータを作成する方法を特徴とする。その後、少なくとも二つのモジュール対を接続して故障からの立直りが速いか故障に対する耐性があるコンピュータを作成する。計算素子用のプロセッサは互いに全く同じである必要はないが、命令セット中の各命令を別のプロセッサと同じ周期数単位で実行することが好ましい。一般的には、業界標準プロセッサを用して計算素子とコントローラとを実現する。災害に対する耐性のために、少なくとも一つのモジュール対を他のモジュール対から遠く離して配置させる。コントローラと計算素子とは各々未変更の業界標準オペレーティングシステムとアプリケーションとを走行させることができる。更に、コントローラは、計算素子が同時に第二オペレーティングシステムを走行させるのに対し、第一オペレーティングシステムを走行させることができる。入出力故障からの立直りの速さは、冗長入出力装置を少なくとも二つのモジュール対に接続して少なくとも同一の入出力書込み要求とデータとを冗長入出力装置へ送信することによって達成される。入出力読取り要求は入出力装置のどれか一つに送信されるだけなのに、同一の入出力読取り要求はデータ保全性を検証するために入出力装置の内の一つ以上の装置へ送信される。冗長入出力装置を三つ以上のモジュール対に接続すると、同一の入出力要求の送信で故障した入出力装置の同定ができる。別の側面によれば、一般的に、本発明は、入出力リダイレクト処理を使用することによってコンピュータ内で計算処理動作から入出力要求を隔離することを特徴とする。通常、入出力装置は、低レベル入出力要求を用いるか入出力装置を直接アドレス指定することによってアクセスされる。低レベル入出力要求には、システムの基本入出力システム（BIOS）へ要求とブートファームウェア要求とブートソフトウェア要求とシステムの物理的な装置のドライバソフトウェアへの要求とが含まれる。計算素子が低レベル入出力要求を発行する場合、本発明は、入出力プロセッサへ入出力要求をリダイレクトするソフトウェアを使用することを特徴とする。直接にアドレス指定された入出力要求は中途妨害され仮想入出力装置へ供給される。定期的に、仮想入出力装置の内容が入出力要求として入出力プロセッサへ送信される。入出力プロセッサでは、送信された仮想入出力装置の内容が物理的入出力装置へ供給される。要求された入出力動作が実行された後に、動作の結果があればそれが入出力要求に対する応答として計算素子へ返送される。一般的に、仮想入出力装置は仮想キーボードと仮想表示器とから成る。本発明は、また、互いに接続され少なくとも二つの計算素子に接続された少なくとも二つのコントローラと、コントローラの少なくとも二つに接続された計算素子少なくとも二つとから成るコンピュータシステムにおける故障を検出し診断することを特徴とする。各計算素子は、データを生成しそのデータに関連するエラー検査コードなどの値を発生させる。その後、各計算素子は、その計算素子が接続された少なくとも二つのコントローラへデータを対応する値と供に送信する。データと付随の値とを受信すると、コントローラはその値を他のコントローラへ送信する。各コントローラは、各計算素子に対応する値と各コントローラに対応する値とに対して計算を実行する。各コントローラに対応する値に対する計算の結果が互いに等しく、各計算素子に対応する値に対する計算の結果が互いに等しいならば、故障は何も存在しない。その他の場合は故障が存在する。場合によっては、計算とは単純なビット毎の比較でもよい。故障が存在する場合、一つの計算素子に対応する値全部を計算素子毎に比較することによって故障診断を試みる。各計算素子に対応する値が計算素子毎に一致し計算素子間で不一致であれば、計算素子のどれか一つが故障している。計算素子のどれか一つだけに対応する値が互いに不一致ならば、その計算素子への経路が故障している。多数の計算素子に対応する値が互いに不一致ならば、その不一致の計算素子に接続されたコントローラが故障している。同定されると、故障素子はディスエーブルにされる。本発明に係わるシステムは、故障素子（すなわち、CE、IOP、記憶装置など）が修復された後完全機能状態へ復旧する。システムは、滑動素子の状態を修復された素子へ転送してから、修復された素子を再度イネーブルにすることによってそうなる。滑動プロセッサー個あるいは複数個の作動状態を非滑動プロセッサへコントローラを介して転送することによって、非滑動プロセッサあるいは修復されたプロセッサを起動する。非滑動プロセッサが計算素子である場合、滑動計算素子一個（あるいは複数個）の作動状態がコントローラを介して転送される。非滑動プロセッサがコントローラである場合、滑動コントローラの作動状態が直接転送される。この転送は、システム運用が休止したときあるいは背景プロセスとして発生する。この回復機能は、オフにするなどしてシステムのプロセッサが働かなくなるようにすることによって、ハードウェアかソフトウェアあるいはそれら両方のオンライン格上げを提供するためにも使用される。格上げは、ディスエーブルにされたプロセッサを交換あるいは変更することによって実行される。格上げされたプロセッサをオンにして先に考察したように再起動させる。本発明は、また、コントローラが二つの計算素子に接続された単一コントローラ二重計算素子システムを特徴とする。このコンピュータシステムでは、計算素子による入出力動作が中途妨害されコントローラへリダイレクトされる。一般的には、コントローラと二つの計算素子とは、各々、業界標準のマザーボードを備えており、未変更の業界標準オペレーティングシステムとアプリケーションとを走行させることができる。コントローラは、計算素子同士が同時に第二オペレーティングシステムを走行させるのに対し、第一オペレーティングシステムを走行させることができる。単一コントローラシステムは、第一コントローラと二つの計算素子の両方に接続された第二コントローラを有するように拡張させることができる。制限された災害からの立直りの速さのために、第一コントローラと計算素子の一方とを第二コントローラと他方の計算素子から遠く離れた位置に設置することができる。また、通信リンクによって第二コントローラと他方の計算素子とに接続することもできる。可用性と性能との向上のために、二重コントローラ二重計算素子システムを全く同じ第二システムに接続することができる。二つのシステムは、一方のシステムが第一アプリケーションの第一部分を走行させ他方のシステムが第二アプリケーションか第一アプリケーションの第二部分かを走行させるという分散型計算環境を走行させる。別の実施例においては、本発明は、互いに接続された三つのコントローラとそれら三つのコントローラの異なる一対に接続される計算素子三つとから成るコンピュータシステムを特徴とする。このシステムは、他のシステムと同様に、計算素子によって入出力動作を中途妨害してコントローラへリダイレクトして処理させる。災害からの立直りの速さのために、第一コントローラと計算素子の一方とを残りのコントローラと計算素子とから遠く離れた位置に設置する。あるいは、各コントローラ／計算素子対を異なる位置に設置する。耐災害システムは、上記の三つのコントローラシステムのうちの少なくとも二つを接続することによって作成される。三つのコントローラシステムは、遠く離れた位置に設置され通信リンクによって接続される。図面の簡単な説明図１は部分的に故障からの立直りの速いシステムのブロック図である。図２は図１のシステムのシステムソフトウェアのブロック図である。図３は図２のシステムソフトウェアのIOP モニタによって使用される手順の流れ図である。図４は図１のシステムのIPI モジュールのブロック図である。図５は図１のシステムの状態遷移表である。図６は故障からの立直りの速いシステムのブロック図である。図７は故障からの立直りの速い分散型システムのブロック図である。図８は耐故障システムのブロック図である。図９は図８のシステムのIOP によって使用てされる故障診断手順の流れ図である。図１０は耐災害システムのブロック図である。優先的実施例の説明図１に示すように、故障からの立直りの速いシステム１０は、入出力プロセッサ（IOP １２と二つの計算素子（CE）１４ａと１４ｂ（集合的にCE１４で示す）とから成る。システム１０は単一IOP １２のみを備えているのでIOP １２の障害から回復できないため、システム１０は全然故障に対する耐性がない。 IOP １２は、ケーブル２０ａと２０ｂによってCE１４の対応するIPI モジュール１８ａと１８ｂに接続された二つのプロセッサ間相互接続(IPI)モジュール１６ａと１６ｂを備えている。IOP １２は更に、プロセッサ２２とメモリシステム２４と二つのハードディスク駆動機構２６と２８と電源３０とを備えている。同様に、各CE１４は、プロセッサ３２とメモリシステム３４と電源３６とを備えている。別々の電源３６を使用することで電源障害という事態における故障からの立直りの速さを保証している。プロセッサ３２ａと３２ｂは、プロセッサ３２ａが一つの命令を実行するのに必要な周期数が、全ての命令に対して、プロセッサ３２ｂが同一の命令を実行するのに必要な周期数が、全ての命令に対して、プロセッサ３２ｂが同一の命令を実行するのに必要な周期数と同じであるという点で、互いに「全く同じ」である。図示の実施例においては、システム１０は、標準のインテル４８６基盤マザーボードがプロセッサ２２と３２およびメモリシステム２４と３５各々のメモリの４メガバイト分として用いることで実現されたものである。システム１０のIOP １２とCE１４とは、IOP 用のブートディスクとして用いられるハード駆動機構２６とCE１４用のブートディスクとして用いられるハード駆動機構２８とによって、未変更のオペレーティングシステムとアプリケーションソフトウェアとを走行させる。少なくとも二つのIOP を備えた眞に故障からの立直りが速いか故障に対する耐性があるシステムにおいては、各ハード駆動機構も二重化される。図示の実施例においては、IOP １２とCE１４とのオペレーティングシステムは DOS である。しかし、他のオペレーティングシステムを使用することもできる。また、IOP １２は、CE１４によって走行させられたものとは異なるオペレーティングシステムを走行させる。例えば、IOP １２は、CE１４がDOS を走行させているのに対し、UNIXを走行させられる。この方法は、周辺機器を支援していないオペレーティングシステムからCE１４が周辺機器にアクセスできるので好都合である。例えば、CE１４がCD-ROM駆動機構を支援していないオペレーティングシステムを走行させ、IOP １２がそれを支援しているものを走行させる場合、CE１４は、ハード駆動機構にアクセスするなどのために使用されるものと全く同じ入出力要求を発行することによってCD-ROM駆動機構にアクセスできる。その後、IOP １２は、その入出力要求のCD-ROM駆動機能をアクセスするのに適したものへの変換を実行する。図２を参照すると、システム１０は、CE１４のプート処理と初期化とを制御し、CE１４内の地域時間をディスエーブルにし、CE１４からの入出力要求全部をIO P １２へリヂレクトして実行させ、入出力要求の結果があればそれをIOP １２からCE１４へと返送するための専門化されたシステムソフトウェア４０を備えている。システムソフトウェア４０は、ROM 基盤のものであり各々がCE１４のIPI モジュール１８に位置する二組のIPI BIOS４２から成る。IPI BIOS４２は、ブートアップアクティビティと初期化アクティビティとに使用される。CE１４がブートされると、IPI BIOS４２は、システムBIOS割込み表内の入出力割込みアドレスをCE ドライバ４４によって制御されたアドレスに交換する。交換される割込みアドレスとは、ビデオサービスと固定ディスクサービスと直列通信サービスとキーボードサービスと日内時刻サービスなどに対応するものである。 IPI BIOS４２は、また、通常メモリリフレッシュ処理をディスエーブルにして、CE１４が実際に処理を行っている周期数に影響を与えるメモリリフレッシュ処理がシステムソフトウェア４０によって制御されることを保証する。メモリリフレッシュ処理はメモリ保全性を維持するために必要である。従来のリフレッシュ処理方法においては、メモリは、メモリ内の一つのブロックがリフレッシュ期間の終了の度にリフレッシュされるという具合いに定期的にリフレッシュてされる。リフレッシュ期間の継続時間は、メモリ全体がメモリのリフレッシュ限界内にリフレッシュされるように選択される。このように、例えば、メモリにブロックが２５６個ありリフレッシュ限界が８ミリ秒である場合、リフレッシュ期間は３１，２５マイクロ秒（８ms/256）となる。上記の実施例においては、IPI BIOS４２は、インテル４８６マザーボードに用いられてメモリリフレッシュ処理を制御するための計数器を、計数器へのゲート入力を増分させるために変化させるものとするモードに設定することによって、メモリリフレッシュ処理をディスエーブルにする。ゲート入力は普通電源に接続てされるので、ゲート入力は決して変化しない。従って、計数器は効果的にディスエーブルにされる。システムソフトウェア４０のCEドライバ４４は、入出力要求あるいは量子割込みが発生させられる度にメモリの多数のブロックをバーストリフレッシュすることによってメモリリフレッシュ処理を取行う。CEドライバ４４は、CEブートディスク２８に格納されCE１４によって走行させられる。バーストメモリリフレッシュを実行するばかりでなく、CEドライバ４４は、システムBIOSへの入出力要求を中途妨害してIPI モジュール１８経由でIOP １２へとリダイレクトし実行させる。CEドライバ４４は、また、IPI モジュール１８からの割込み要求に応答してシステムクロックをディスエーブルにしたり、IOP モニタ４８から供給される情報に基づいてCE１４の日内時刻を制御したりする。 IOP ブートディスク２６に配置されIOP １２によって走行させられるIOP ドライバ４６は、CE１４からの入出力要求をIOP モニタ４８へリダイレクトして処理させて、その結果をIOP モニタ４８からCE１４へと送信することによって、CE14 からの入出力要求を処理する。IOP ドライバ４６はパケット通信規約を用いてCE ドライバ４４と交信する。 IOP モニタ４８はIOP ブートディスク２６に配置されIOP １２によって走行させられる。IOP モニタ４８は、システム１０を制御し実際の入出力要求を実行してIOP ドライバ４６によってCE１４へ送信てされる結果を作成する。システムソフトウェア４０は、更に、IOP １２上で走行しシステム１０のユーザ制御を提供する操作ソフトウェア４９を備えている。操作卓ソフトウェア４９を使用すれば、ユーザはCE１４をリセットさせたりブートさせたり同期させたりできる。ユーザは、リセット後あるいは立ち上げ後すぐにCE１４の一方あるいは両方を自動的にブートさせたり（自動ブート）しかも／あるいは自動的に同期させたり（自動同期）するように設定することもできる。各CE１４を制御する機能は、通常動作時とテスト時の両方の時に有用である。操作卓ソフトウェア４９を使用すれば、ユーザは、IOP モニタ４８が比較間違いエラーに直面したときに両方のCE１４をダウンさせるという保全性モードか、IOP モニタ４８が比較間違いエラーに直面したときにCE１４ａをディスエーブルにするという第一可用性モードか、IOP モニタ４８が比較間違いエラーに直面したときにCE１４ｂをディスエーブルにするという第二可用性モードかにシステム１０を設定することもできる。最後に、操作卓ソフトウェア４９によってユーザはシステム１０の状態を要求できる。代替の実施例においては、操作卓ソフトウェア４９はIOP １２と交信する別のプロセッサで実現される。各CE１４は、他のCE１４によって走行させられるのと同じアプリケーションと同じオペレーティングシステムのコピーを走行させる。また、メモリシステム３４ａと３４ｂの内容は同じであり、CE１４の動作情況は各同期時刻において同じである。このように、IOP モニタ４８はCE１４から全く同じ順序の入出力要求を受け取る。図３に示すように、IOP モニタ４８は手順１００に従って入出力要求を処理し監視する。初めに、IOP モニタ４８はCE１４の一方からの入出力要求を待合わせる（ステップ１０２）。例えばCE１４ｂｗｙ入出力要求バケットを受取ると、IO P モニタ４８はCE１４ａからの入出力要求かタイムアウト期間の満了かを待合わせる（ステップ１０４）。システム１０は、入出力要求が処理されている間にアプリケーションの実行を停止させるDOS オペレーティングシステムを使用するので、IOP モニタ４８がCE１４ａからの入出力要求を待合わせている（ステップ１０４）間にCE１４ｂから入出力要求を受取ることはないことが保証される。次に、IOP モニタ４８はタイムアウト期間が満了したかどうかを確認し判定する（ステップ１０６）。満了していなければ（すなわち、CE１４ａからの入出力要求が到着した）、IOP モニタ４８はパケットの検査合計を比較する（ステップ１０８）。検査合計が互いに等しければ、その入出力要求を処理する（ステップ１１０）。入出力要求を処理し終えたと、IOP モニタ４８は現在の日内時刻を求める要求をIOP １２のシステムBIOSへ発行する（ステップ１１２）。日内時刻を受け取ると、IOP モニタ４８は、日内時刻と入出力要求の結果があればその結果とから成るIPI パケットを組立てて（ステップ１１４）、そのIPI パケットをIOP ドライバ送り（ステップ１１６）CE１４へ送信させる。IPI パケットを受取ると、CE１４は、送信された日内時刻を使って前述のように他の場合にはディスエーブルにされる地域クロックを更新する。 DOS からの要求通りに、CE１４での実行は、IOP モニタ４８が入出力要求の結果をIOP ドライバ４６を介して返送するまで中断される。なぜなら、実行が再開される前に、両方のCE１４の日内時刻が共通の値（IPI パケットから送信てされた日内時刻）に更新されて、CE１４はメタ時間が指定される送信日内時刻と時間的に同期し続けるからである。多量タスクオペレーティングシステムが用いられる場合、CE１４での実行は、IOP モニタ４８が入出力要求が実行している間も中断されない。その代わりに、CE１４での処理が、IOP モニタ４８が入出力要求を処理し始めたことを示す肯定応答を受信するまで中断される（ステップ１１０）。この肯定応答は、日内時刻を含んでおりCE１４によって地域クロックの更新に使用される。 IPI パケットをIOP ドライバ４６へ送ってしまうと、IOP モニタ４８は、CE14 が両方ともオンラインであることを検証する（ステップ１１８）。そうならば、 CE１４の一方からの別の入出力要求を待合わせる（ステップ１０２）。タイムアウト期間が満了した場合（ステップ１０６）、IOP モニタ４８は、応答できなかったCE１４をディスエーブルにし（ステップ１１９）入出力要求を処理する（ステップ１１０）。 CE１４からパケットの検査合計間に比較間違いがあれば（ステップ１０８）、 IOP モニタ４８は、システム１０が可用性モードで作動しているか保全性モードで作動しているかを確認する（ステップ１２０）。システム１０が可用性モードで作用している場合、IOP モニタ４８は、選択された可用性モードに基づいて適宜のCE１４をディスエーブルにし（ステップ１２２）、入出力要求を処理する（ステップ１１０）。その後、IOP モニタ４８がCE １４が両方ともオンラインかどうかを確認する（ステップ１１８）。ディスエーブルにされたCE１４が修復も再起動もされていない場合、IOP モニタ４８はオンラインCE１４からの入出力要求を待合わせる（ステップ１２４）。システム１０はもはや故障からの立直りが速いとは言えないので、入出力要求が受信されると、IOP モニタ４８は即座にその入出力要求を処理する（ステップ１１０）。システム１０が、比較間違いが検出されたときに保全性モードで作動していれば、IOP モニタ４８は、両方のCE１４をディスエーブルにし（ステップ１２６）処理を停止する（ステップ１２８）。図１と２を再度参照すると、例えばCE１４ａのアプリケーションかオペレーティングシステムがシステムBIOSへ非入出力呼出しを行った場合、システムBIOSは、要求を実行しその結果をシステムソフトウェア４０を呼出さすことなくアプリケーションへ返送する。しかし、アプリケーションかオペレーティングシステムかが入出力BIOS呼出しを行う場合、CEドライバ４４ａはその入出力要求を中途妨害する。入出力要求を中途妨害した後、CEドライバ４４ａは、その入出力要求を IPI パケットへ入れそのIPI パケットをIOP １２へ送信する。 IPI パケットのCE１４ａからの送信を検出すると、IOP １２のIPI モジュール１６ａはIOP ドライバ１６への割込みを発生させる。IOP ドライバ４６はIPI パケットを読取る。以上考察したように、IOP モニタ４８は、手順１００に従ってCE１４ａからの IPI パケットに応答する。やはり考察したように、ハードウェア故障がない場合、IOP ドライバ４６は、最終的に、CE１４への入出力要求の結果と日内時刻とを含んだIPI パケットを送信する。 CE１４のIPI モジュール１８はIOP １２からIPI パケットを受信する。CEドライバ４４は、IPI パケットを元の形に復元しCE１４の日内時刻を更新して、CE１４の制御をCE１４上で走行しているアプリケーションかオペレーティングシステムかへ戻す。所定時間内に入出力要求が何も発行されなかった場合、CE１４のIPI モジュール１８は、CE１４のCEドライバ４４を呼出すためのいわゆる量子割込みを発生させる。これに応じて、CEドライバ４４は、量子割込みIPI パケットを作成してそれをIOP １２へ送信する。IOP モニタ４８は、量子割込みIPI パケットを入出力要求を持たないIPI パケットとして処理する。このように、IOP モニタ４８は、着信量子割込みIPI パケットを検出し（図３のステップ１０２）、一致する量子割込みIPI パケットが別のCE１４から受信されれば（図３のステップ１０４、１０６および１０８）、現在の日内時刻をもとめる要求をIOP １２のシステムBIOS へ発行する（図３のステップ１１２）。その後、IOP モニタ４８は、IOP ドライバ４６がCE１４へ送った（図３のステップ１１６）量子応答IPI パケットへ現在の日内時刻を入れる（図３のステップ１１４）。CEドライバ４４は、日内時刻を更新してCE１４の制御をCE１４上で走行しているアプリケーションかオペレーティングシステムへ戻すことによって、量子応答IPI パケットに応答する。 IOP モニタ４８は、予め規定されたタイムアウト期間内に別のCE１４から量子割込みIPI パッケージを受信しない場合（図３のステップ１０６）、応答しない CE１４をディスエーブルにすることによって応答する。。図１に示すように、IPI モジュール１６と１８およびケーブル２０で、プロセッサ２２と２３を実現するために用いられる標準インテル４８６基盤マザーボードから故障からの立直りの速いシステムを作成するのに必要なハードウェア全部が提供される。IPI モジュール１６とIPI モジュール１８とは、全く基板を使って実現され互いに同様の機能を果たす。図４に示すように、IPI モジュール１８は、入出力要求と応答とをCE１４のプロセッサ３２のシステムバスとIPI モジュール１８の並列インターフェイスとの間で通信させるための制御ロジック５０を備えている。並列インターフェイス５２の方は、ケーブル２０を介してIPI モジュール１６の並列インターフェイスと交信する。並列インターフェイス５２は、１６ビットデータ出力ポート５４と１６ビットデータ入力ポート５６と制御ポート５８とから成る。ケーブル２０は、データ出力ポート５４がIPI モジュール１６のデータ入力ポートに接続され、データ入力ポート５６がIPI モジュールのデータ出力ポートに接続され、制御ポート５８がIPI モジュール１６の制御ポートに接続されるように構成される。制御ポート５８は、IPI モジュール１８とIPI モジュール１６との間にハンドシェイク方式の通信規約を実現する。制御ロジック５０はIPI BIOS ROM６０にも接続されている。立上がり時、制御ロジック５０は、IPI BIOS ROM６０の内容であるIPI BIOS４２（図２）をプロセッサ３２のシステムバスを介してプロセッサ３２へ転送する。やはりIPI モジュール１８に配置されるQI計数器６２は先に考察したように量子割込みを発生させる。QI計数器６２は、プロセッサ３２のシステムクロックに接続されたクロック入力端子６４と制御ロジック５０に接続されたゲート入力端子６６とを備えている。ゲート入力端子６６は、QI計数器６２を起動し計数値をリセットするために用いられる。起動されると、QI計数器６２は、プロセッサ３２のシステムクロックの各周期中に計数値を１だけ減分させる。計数値がゼロに達すると、QI計数器６２は、先に考察したようにCEドライバ４４（図２）を起動させるための量子割込みを発生させる。 CEドライバ４４は入出力取引の開始の度にQI計数器６２を非活動にする。CEドライバ４４は、QI非活動アドレスとして知られる第一アドレスでの入出力書込みを要求することによってQI計数器６２を非活動にする。制御ロジック５０は、入出力書込み要求を検出してゲート入力端子６６を介してQI計数器６２を非活動にする。特にこの入出力書込みは制御目的のものなので、制御ロジック５０は並列インターフェイス５２へ入出力書込みを渡すことはしない。入出力取引の終結度に、CEドライバ４４は、QI起動アドレスとして知られる第二アドレスへの入出力書込みを要求することによってQI計数器６２を起動する。制御ロジック５０は、 QI計数器６２をリセットし起動することによって応答する。代替の方法においては、量子割込みは、プロセッサ３２において実現可能なデバック処理機構などの機構を使用することによって発生させられる。一般に入手可能なプロセッサの中には、デバッグ命令や、トラップ命令に続く選択された個数の命令の完了後に指定されたプログラムへプロセッサの制御を転送することによってエラーを捕らえるためのトラップ命令に対応しているものもある。この方法では、CEドライバ４４は、プロセッサ３２の制御をアプリケーションかオペレーティングシステムかへ戻す度に、トラップ命令を発行してプロセッサ３２の制御が例えば３００個の命令の完了と同時にCEドライバ４４へ与えられることを示す。プロセッサ３２が示された３００個の命令を完了すると、トラップ命令によってプロセッサ３２の制御がCEドライバ４４へ戻される。入出力要求が指定された個数の命令の完了の前にCEドライバ４４を起動させるという事態に際して、CE ドライバ４４はトラップ命令を取消すための命令を発行する。 IPI モジュール１８はオフラインCE１４を起動する際にも使用される。次に考察するように、オフラインCE１４が起動される前に、活動CE１４のメモリシステム３４の内容が、オフラインCE１４のメモリシステム３４へコピーされる。この活動CE１４へのコピーの効果を低減させるために、活動CE１４のプロセッサ３２に処理を継続させ、活動CE１４のプロセッサ３２のシステムバスが使用されてない周期の間中のみメモリをコピーする。メモリがコピーされている間プロセッサ３２が処理を継続できるように、IPI モジュール１８は、既にオフラインCE１４にコピーされたアドレスに対するプロセッサ３２によるメモリ書込みを不具にする。そうするために、制御ロッジ５０はシステムバスを監視する。プロセッサ３２が既にコピーされたメモリアドレスに書込みを行うと、制御ロジック５０はそのアドレスをFIFO６８に格納する。メモリ転送が終了すると、あるいは、FIFO６８が満杯になると、FIFO６８に格納されたメモリアドレスに対応するメモリ位置の内容がオフラインCE１４にコピーされ、FIFO６８は空になる。別の方法では、FIFO６８は、メモリアドレスとそのアドレスに対応するメモリ位置の内容の両方を格納するかあるいはメモリアドレスの書込みが行われているメモリブロックのブロックアドレスを格納するように変更される。 IPI モジュール１８は非BIOS入出力要求も処理する。コンピュータシステムによっては、BIOSはとてものろいので映像表示などの入出力演算を効果的に実行できない。その結果、DOS やUNIXなど組織化や統制があまり進んでいないオペレーティングシステムは、アプリケーションが入出力装置に対応するアドレスから直接に読取ったりそのアドレスに直接書込んだりすることによってBIOSを迂回したり非BIOS入出力要求を行ったりすることを許してしまう。非BIOS入出力要求は、例えば入出力ディスク読取りと書込みで中途妨害されるようにシステム割込み表を変更することによって中途妨害されうるものではないが、同期が入出力インターフェイスの強い制御を必要とするシステムにおいては問題のある要求である。この問題を軽減するために、しかも、非BIOS入出力要求でさえもIOP １２によって隔離され管理されることを保証するために、IPI モジュール１８は、物理的入出力装置のハードウェアインターフェイスのまねをする仮想入出力装置を備えている。仮想入出力装置は仮想表示器７０と仮想キーボード７２とから成る。必要に応じて、仮想マウスあるいは仮想直列ポートと仮想並列ポートなどの別の仮想入出力装置を使用することもできる。実際には、制御ロジック５０が、システム入出力装置への非BIOS入出力要求に対応するアドレスに向けられた読取り動作か書込み動作かを調べるためにシステムバスを監視する。制御ロジック５０は、その様な動作を検出すると、適宜の仮想装置において動作を再構築するために必要な情報を格納する。このように、例えば、制御ロジック５０は、表示器に対応するアドレスに向けられた書込みを検出すると、その動作を仮想表示器７０にて再構築するために必要な情報を格納する。BIOS入出力要求あるいは量子割込みが発生する度に、CEドライバ４４は、仮想入出力装置を走査して、仮想装置が空でなければ、仮想装置内に格納てされた情報を組立ててIPI パケットを作りIOP １２へ送信する。IOP １２は、先に考察した手順１００を用いて当該パケットをBIOS入出力要求と同様に処理する。制御ロジック５０が仮想入出力装置へ向けられた読取りを検出すると、制御ロジック５０は、その読取り要求を組立ててIPI パケットを作りIOP １２によって処理させる。IOP １２はIPI パケットを標準BIOS入出力要求と同様に処理する。図５を参照すると、各CE１４は常に八つの状態のどれか一つで作動する。また、許容状態の組合せの個数は限られているので、システム１０は常に１４つの状態のどれか一つで作動する。主なCE作動状態は、オフライン、RTB(ブート準備完了)、ブート処理、活動中、RTS(同期準備完了)、待合わせ、M SYNC（マスタとしての同期）およびS SYNC（スレーブとしての同期）である。IOP モニタ４８は、システム１０の状態と操作卓ソフトウェア４９からのユーザ指令とに基づいてCE １４の作動状態を変化させる。操作卓ソフトウェア４９によって、ユーザはいつでもCE１４をリセットできる。ユーザがCE１４をリセットする度、あるいは、故障がCE１４に発生する度に、IOP モニタ４８はCE１４の状態をオフラインへ変化させる。立上がり時、システム１０は両方のCE１４をオフライン（１５０状態）にさせて作動する。システム１０は、CE１４ａがCE１４ｂの前に作動状態になったときは図５の上側の状態（１５２〜１６２状態）で作動し、CE１４ｂが先に作動状態になったときは下側の状態（１６６〜１７６状態）で作動する。CE１４が同時に作動状態になった場合、IOP モニタ４８によって最初に作動状態になったと認識されたCE１４が、最初に作動状態になったものとして取扱われる。 CE１４が、ブート要求を発行することによってブートの準備が完了していることを示すとき、CE１４の状態は、CE１４が自動ブートに設定されていなければRT B へ変わり、CE１４が自動ブートに設定されていればブート処理へ変わる。例えば、両方のCE１４がオフライン状態のときにCE１４ａがブート要求を発行し、しかも、CE１４ａが自動ブートに設定されていなければ、CE１４ａの状態はRTB（１５２状態）へ変わる。その後、IOP モニタ４８は、ユーザが操作卓ソフトウェア49を介してCE１４ａをブートするのを待合わせる。ユーザがCE１４ａの状態はブート処理（１５４状態）へ変わる。ユーザがCE１４ａをリセットすれば、CE１４ａの状態はオフライン（１５０状態）へ変わる。 CE１４ａがブート要求を発行ししかもCE１４ａが自動ブートに設定されている時に、両方のCE１４がオフラインならば、CE１４ａの状態はブート処理（１５４状態）へ変わる。CE１４ａのブートが成功すれば、CE１４ａの状態は活動中（１５６状態）へ変わる。 CE１４ａが活動中でCE１４ｂがブート要求を発行したか、あるいは、CE１４ｂが、CE１４ａの状態がオフラインから活動中（１５２〜１５６状態）へ遷移しつつあるときに、ブート要求を発行したならば、CE１４ｂの状態は、CE１４ｂが自動同期に設定されているか、さもなければ、待合わせ（１６０状態）に設定されていれば、RTS(１５８状態)へ変わる。CE１４ｂの状態がRTS（１５８状態）へ変われば、IOP モニタは、ユーザがCE１４ｂへ同期指令を発行するのを待合わせる。ユーザがそのような指令を発行すると、CE１４ｂの状態は待合わせ（１６０状態）へ変わる。 CE１４ｂが待合わせ状態になると、IOP モニタ４８は、CE１４ａのメモリシステム３４ａの内容をCE１４ｂのメモリシステム３４ｂへコピーする。メモリ転送が終了すると、IOP モニタ４８は、CE１４ａが量子割込みか入出力要求IPI パケットを送信するのを待合わせる。そのようなパケットを受取ると、IOP モニタ４８は、CE１４ａの状態をM SYNCへ変えCE１４ｂの状態をS SYNC（１６２状態）へ変えて、CE１４同士を同期させる。この同期化には、IOP モニタ４８がCE１４ａが量子割込みが入出力要求IPI パケットかを送信するのを待合わせている間に発生したメモリ変化に対する応答処理が含まれる。同期化が終了し次第、CE１４の状態は両方とも活動中（１６４状態）へ変わり、システム１０は完全に使用可能状態であると考えられる。代替の実現形態においては、IOP モニタ４８は、CE１４ａの状態をM SYNCへ変えCE１４ｂの状態をS SYNC（１６２状態）へ変える前にメモリ転送が終了するのを待合わせることはしない。その代わりに、IOP モニタ４８は、IPI パケットの CE１４ａからの受信と同時にこの状態変化を行って、同期化プロセスの一部としてメモリ転送を実行する。 CE１４ｂが最初にブート要求を発行したCE１４であることにも同様の状態遷移が起こる。このように、CE１４ｂが自動ブートに設定されていない場合、CE１４ｂは、オフライン（１５０状態）からRTC(１６６状態)、ブート処理（１６８状態）そして活動中（１７０状態）へと遷移する。同様に、CE１４ｂが活動中に入り、CE１４ａが自動同期に設定されていない場合、CE１４ａは、オフライン（１７０状態）からRTS（１７２状態）、待合わせ（１７４状態）、S SYNC（１７６状態）そして活動中（１６４状態）へと遷移する。本発明の他の実施例においては、例えば、図６を参照すると、故障からの立直りの速いシステム２００は二つのIOP ２０２と二つのCE２０４とから成る。各CE ２０４は、IPI カード２０６とケーブル２０８とを介して各IOP ２０２るIPI カード２１０に接続される。IPO ２０２は、IPI カード２１０とケーブル２１２とを介して冗長的に接続される。システム２００の構成要素は全て冗長バックアップ構成要素を備えているので、システム２００は全体的に故障からの立ち直りが速い。代替の方法では、ケーブル２０８と２１０が、IOP ２０２とCE２０４とが接続される一対の構内通信網によって置換えられる。実際、構内通信網がいつもケーブル配線の代わりに用いられる。システム２００は、オペレーティングシステムやアプリケーションソフトウェアの改良品が作動しなければならないとはしていないから、オペレーティングシステムとアプリケーションソフトウェアとには依存していない。たった１個のハードウェアを、サービスを中断させることなくシステム２００内で格上げしたり修復したりできる。従って、ハードウェア一つ一つを順次交換してシステム２００を交換の終了の度に再同期させることによって、システム２００のハードウェアをそっくりそのままサービスを中断させることなく交換できる。同様に、システム２００上のソフトウェアをサービスの中断を最長限に抑えて格上げできる（すなわち、ソフトウェア格上げの最中、アプリケーションは２秒くらいの許容できる時間の間使用不能になる）。また、可用性を目的とした災害に対する耐性は、別の位置に各IOP/CE対を設置し全部のIOP/CE対を通信リングを介して接続することによって達成される。図７を参照すると、分散型で高性能の故障からの立直りの速いシステム２２０は、二つのシステム２００から成る。システム２００のIOP ２０２は、ケーブル２２２によってIPI モジュールを介して互いに接続される。システム２２０は、分散型計算環境ソフトウェアを使用して各システム２００上のアプリケーションの別々の部分を走行させることによって高性能を達成している。システム２２０は、故障に対する耐性がありサービスを中断させることなくハードウェア格上げとソフトウェア格上げの両方を実行する機能を提供する。図８を参照すると、耐故障システム２３０は、三つのIOP(２３２、２３４および２３６)と三つのCE２３８、２４０および２４２）とから成る。IPI モジュール２４４とケーブル２４５とを介して、各IOP は他のIOP の各々のIPI モジュール２４４に接続される。IPI モジュール２４８とケーブル２５０とを介して、各 CEは、CE２３８がIOP ２３２と２３４に接続されCE２４０がIOP ２３２と２３６に接続されCE２４２がIOP ２３４と２３６に接続された状態で、IOP のうちの二つのIPI モジュール２４４に接続される。システム２００と同様に、システム２３０は、サービスを中断させることのないハードウェア格上げとサービスの中断を最小限に抑えたソフトウェア格上げとを考慮に入れる。図７と８との比較から分かるように、システム２００と２３０のCEとIOP とは全く同じ構成をしている。その結果、故障からの立直りの速いシステム２００から耐故障システム２３０への格上げは、現存のハードウェアの交換を何も必要としないが、別のCE／IOP 対を追加しケーブルを接続しシステムソフトウェアに適宜の変更を加えるという簡単な手順を必要とする。このモジュール方式は、本発明の対モジュール方式冗長アーキテクチャの重要な特徴である。システム２３０の構成要素は三重に冗長であるので、システム２３０は、システム１０よりもハードウェア故障を同定する能力に優れている。このように、システム１０がただ単にエラーが検出されたときにCE１４の一方あるいは両方をディスエーブルにするのに対して、システム２３０はより高度な故障診断を提供する。図９を参照すると、システム２３０の各IOP（２３２、２３４、２３６）は手順３００に従って故障診断を行う。初めに、各IOP（２３２、２３４、２３６）は、電力検知やケーブル検知や通信規約タイムアウトなどの周知の方法を用いて電力損失やケーブル破壊やCE機能不全やIOP 機能不全などの重大な故障について検査する（ステップ３０２）。このような故障が検出されると、各IOP は、故障の装置をディスエーブルにし、必要に応じて、システム全体をディスエーブルにする。重大な故障について検査した後、各IOP は、IOP が接続された二つのCEから IPI パケット（すなわち、量子割込みか入出力要求）を受信するために待合わせる（ステップ３０４）。このように、例えば、IOP ２３２は、CE２３８と２４０からIPI パケットを受信するために待合わせる。接続されたCEからIPI パケットを受信した後、各IOP は、IPI パケットの検査合計(CRC)を他の二つのIOP へ送信して、その他の二つのIOP からのCRC の受信のために待合わせる（ステップ３０６）。他の二つのIOP からCRC を受信した後、各IOP は、各縦列がCEに対応し各横列がIOP に対応し各入力が横列のIOP によって縦列のCEから受信されたCRC でありとした３×３行列を発生させる。このように、例えば、IOP ２３２は次の行列を発生させる。この行列を発生させた後、IOP ２３２は、行列の横列毎および縦列毎に入力を合計する。三つの横列合計が等しく三つの縦列合計が等しければ（ステップ３１０）、故障はないので、IOP ２３２は再度重大な故障について検査する（ステップ３０２）。三つの横列合計か三つの縦列合計かが等しくなければ（ステップ３１０）、IO P ２３２は、行列の縦列毎にCRC 入力を比較する。各縦列の二つのCRC 入力が一致すれば（ステップ３１２）、IOP ２３２は、CE障害が発生したと診断し、合計が他の縦列の合計と等しくなかった縦列に対応するCEをディスエーブルにする（ステップ３１４）。一つ以上の行列の縦列のCRC 入力が一致しなければ（ステップ３１２）、IOP ２３２は、縦列のうちいくつが不一致入力を持っているかを判定する。行列の中に不一致入力を持つ縦列が一つしかない場合（ステップ３１５）、IOP ２３２は、他の行列の横列合計に等しくない行列の横列合計に対応するIOP と不一致入力を持つ縦列に対応するCEとの間の経路が働かなくなったと診断してその経路をディスエーブルにする（ステップ３１６）。この診断のために、経路に、IOP のIPI モジュール２４４とCEのIPI モジュール２４８とケーブル２５０とを含める。行列には不一致入力をもつ縦列が一つ以上あるので（ステップ３１４）、IOP ２３２は、一つの行列横列合計が他の行列横列合計に等しくないことを確認して、他の行列横列合計に等しくない行列横列合計に対応するIOP をディスエーブルにする（ステップ３１８）。 CE障害（ステップ３１４）、経路障害（ステップ３１６）あるいはIOP 障害（ステップ３１８）を診断し不具にした後、IOP ２３２が、システム３００はいつでも作動可能になっている非故障ハードウェアを依然充分に備えていると判定すると、IOP ２３２は再度重大な故障について検査する（ステップ３０２）。システム２３０は三重に冗長なので、システム２３０は、構成要素が数個働かなくなったとしても作動し続けられる。例えば、可用性モードで作動したままでいるには、システム２３０は、単一の機能しうるCEと単一の機能しうるIOP とこれらの間の経路とを備えてさえいればいい。手順３００を用いると、各IOP（２３２、２３４、２３６）は、完璧にいつでも作動可能なシステム２３０あるいは一つの要素（すなわち、CE、IOP あるいは経路）が以前にディスエーブルにされたことのあるシステム２３０におけるどの様な障害一つも正しく診断できる。要素がディスエーブルにされたことのあるシステム２０３においては、各IOP は、実際に受信したCRC との比較から正しく見える値を使うことによって、その要素がディスエーブルにされたために受信されていないCRC を不具にする。手順３００は、CEはIOP との間の特定な相互接続構成に依存するものではない。適切に作動させるために、手順３００によれば、各CEの出力が少なくとも二つのIOP によって直接に監視されるべきであるとするだけである。この様に、手順３００は、どの様な相互接続機序を翔いたシステムにおいても実現でき、CEとIO P との間に対して二地点間接続を必要とするものではない。例えば、CEとIOP とを少なくとも二つの構内通信網に接続させることもできる。代替の方法においては、行列の横列と縦列とのCRC 値を合計する代わりに、これらの値を比較して、入力が一致しない横列か縦列かに一致／不一致標識で印をつけることもできる。手順３００の単純化バージョンについては、システム２００での使用に合わせて実現できる。この手順では、システム２００の各IOP ２０２は、各縦列がCE２０４に対応し各横列がIOP ２０２に対応する２×２行列を発生させる。この行列を発生させた後、各IOP ２０２は、二つの入力が不一致となった横列あるいは縦列毎に不一致標識を添付する。不一致標識が何もなければ、システム２００は正しく作動する。どちらの横列にも不一致標識がなく両方の縦列に不一致標識がある場合、CE２０４は故障している。システム２００の作動モード次第で、IOP ２０２は、別の IOP ２０２をディスエーブルにするかシステム２００をダウンさせるかする。ディスエーブル対象のIOP ２０２は、システム１０で使用された二つの可用性モードに類似したユーザ供給パラメータに基づいて選択される。両方の横列に不一致標識がありどちらの縦列にも不一致標識がない場合、CE２０４は故障している。この場合、IOP ２０２は、システム２００が可用性モードで作動しているならばCE２０４をディスエーブルにすることによって、あるいは、システム２００が保全性モードで作動しているならばシステム２００をダウンすることによって応答する。両方の横列に不一致標識があり一方の縦列に不一致標識がある場合、IOP ２０２と不一致縦列に対応するCE２０４との間の経路の一つが働かなくなっている。システム２００の作動モード次第で、IOP ２０２は、働かなくなった経路を持つCE２０４をディスエーブルにするかシステム２００をダウンさせるかする。両方の横列に不一致標識があり両方の縦列に不一致標識がある場合、多数の故障が存在する。IOP ２０２はシステム２００をダウンさせる。一方の横列に不一致標識があり両方の縦列に不一致標識がある場合、不一致横列に対応するIOP ２０２は故障している。システム２００の作動モード次第で、別のIOP ２０２が、その故障のIOP ２０２をディスエーブルにするかシステム２００をダウンさせるかする。一方の横列に不一致標識があり一方の縦列に不一致標識がある場合、不一致横列に対応するIOP ２０２と不一致縦列に対応するCE２０４との間の経路が働かなくなっている。システム２００の作動モード次第で、 IOP ２０２は、働かなくなった経路を将来の処理において不具にしシステム２００をダウンさせる。図１０を参照すると、耐災害システム２６０の一つの実施例は、遠く離れた位置に配置され、イーサネットやファイバなどの通信リンク２６２で接続され、互いにメタ時刻方式で作動する二つの耐故障システム２３０から成る。メタ時刻方式を達成するために、IPI パケット全部を耐故障システム２３０間で送信させる。システム２２０と同様、システム２６０はサービスを中断させることのないハードウェア格上げとソフトウェア格上げとを考慮に入れる。図示のように、本発明の対モジュール方式冗長アーキテクチャによれば、実時間で非同期的に作動しIOP によってメタ時刻に同期的に作動するように制御されるCEを使用することによって故障からの立直りの速さのレベルと故障に対する耐性のレベルとを変化させることができる。このアーキテクチャは簡単で費用効率がよい。また、拡張も格上げも容易である。

───────────────────────────────────────────────────── フロントページの続き (72)発明者フィオレンティノリチャードディーアメリカ合衆国マサチューセッツ州 01741 カーライルアーロンウェイ 43 (72)発明者グローリオソロバートエムアメリカ合衆国マサチューセッツ州 01775 ストウバーチヒルロード 70 (72)発明者マッコーリーダイアンティーアメリカ合衆国マサチューセッツ州 01748 ホプキントンエルムストリート 190 (72)発明者マッコーラムジェームズディーアメリカ合衆国マサチューセッツ州 01588 ホワイティンズヴィルスウィフトロード 275 (72)発明者トレンブレイグレンエイアメリカ合衆国マサチューセッツ州 01568 アプトンサウスストリート 139 (72)発明者トロイアニマリオアメリカ合衆国マサチューセッツ州 02160 ニュートンウォルナットストリート 57 【要約の続き】（２０２、２０４）と同じ周期数単位で全部の命令を実行する。コンピュータシステムは一つ以上のコントローラ（２０２）と少なくとも二つの計算素子（２０４）とから成る。

Claims

【特許請求の範囲】１．少なくとも二つの計算素子と少なくとも一つのコントローラとから成るコンピュータシステムであって、計算素子各々は他の計算素子のクロックに対して非同期的に作動するクロックを備えているコンピュータシステムにおける少なくとも二つの計算素子を同期させる方法であって、計算素子によって生成された信号組から一つ以上の信号を選択する段階と、計算素子を監視して計算素子の一方による選択信号の生成を検出する段階と、計算素子の一方による選択信号の検出の後他方の計算素子による選択信号の生成を待合わせる段階と、計算素子全部からの選択信号の受信後少なくとも一つのコントローラからの等時間更新を計算素子各々へ送信する段階と、時間更新に基づいて計算素子のクロックを更新する段階と、で構成される方法。２．更に、少なくとも二つの計算素子と少なくとも一つのコントローラとから故障からの立直りの速いコンピュータを形成する段階で構成されることを特徴とする請求の範囲第１項に記載の方法。３．前記選択段階は、入出力要求を選択信号として選択する段階で構成されることを特徴とする請求の範囲第１項に記載の方法。４．更に、少なくとも一つのコントローラで入出力要求を処理して入出力応答を生成する段階と、少なくとも一つのコントローラからの入出力応答をもつ時間更新を少なくとも二つの計算素子へ送信する段階と、で構成されることを特徴とする請求の範囲第３項に記載の方法。５．前記選択段階は、量子割込みと入出力要求とを選択信号として選択する段階で構成されることを特徴とする請求の範囲第１項に記載の方法。６．前記選択段階は、量子割込みを選択信号として選択する段階で構成されることを特徴とするひ請求の範囲第１項に記載の方法。７．更に、計算素子におけるクロック周期を計数することによって各計算素子において量子割込みを発生させる段階で構成されることを特徴とする請求の範囲第６項に記載の方法。８．クロック周期を計数する段階は、システムクロックと入出力クロックとバスクロックとの中の選択された一つのクロックの周期を計数することを含むことを特徴とする請求の範囲第７項に記載の方法。９．更に、予め決定された値を計算素子各々の計数器にロードする段階と、入出力要求で計算素子各々の計数器をイネーブルにする段階と、計算素子各々のクロック周期の間中計数器の値を減分する段階と、計算素子の計数器の値がゼロに達したときに計算素子からの量子割込み信号を送る段階と、で構成されることを特徴とする請求の範囲第７項に記載の方法。 10．更に、各計算素子における実行された命令を計数することによって量子割込みを発生させる段階で構成されることを特徴とする請求の範囲第６項に記載の方法。 11．更に、各計算素子のデバッグ機構を使用して量子割込みを発生させる段階で構成されることを特徴とする請求の範囲第６項に記載の方法。 12．更に、計算素子によって生成された選択信号のリストを計算素子毎に維持する段階で構成され、等時間更新は、各計算素子のリストに共通の入力があるときに送信されることを特徴とする請求の範囲第１項に記載の方法。 13．更に、計算素子によって発生させられた選択信号同士およびその選択信号に付随するデータがあればそのデータ同士を比較する段階と、選択信号同士か付随のデータ同士かが不一致の場合故障が発生したことを示す信号を送る段階と、で構成されることを特徴とする請求の範囲第１項に記載の方法。 14．更に、計算素子が選択信号を生成した後に各計算素子の動作を停止させる段階と、時間更新の計算素子による受信と同時に計算素子の動作を再開させる段階と、で構成されることを特徴とする請求の範囲第１項に記載の方法。 15．更に、選択信号を生成した後に計算素子の動作を継続させる段階で構成されることを特徴とする請求の範囲第１項に記載の方法。 16．更に、計算素子の非同期的アクティビティをディスエーブルにする段階と、計算素子が選択信号を生成したときに計算素子における非同期的アクティビティの機能を実行する段階と、で構成されることを特徴とする請求の範囲第１項に記載の方法。 17．前記ディスエーブルにする段階は通常のメモリリフレッシュ機能をディスエーブルにする段階で構成され、前記実行する段階は、前記選択信号が生成されたときにバーストメモリリフレッシュを実行する段階で構成されることを特徴とする請求の範囲第16項に記載の方法。 18．前記ディスエーブルにする段階は、更に、ゲートの入力値が変化するものとするモードへ通常のメモリリフレッシュ機能に用いられる計数機を設定する段階と、固定電圧にゲートを接続する段階と、で構成されることを特徴とする請求の範囲第17項に記載の方法。 19．故障からの立直りが速いか故障に対する耐性があるコンピュータを作成する方法であって、第一プロセッサを計算素子として指定する段階と、第二プロセッサをコントローラとして指定する段階と、計算素子とコントローラとを接続してモジュール対を作成する段階と、少なくとも二つのモジュール対同士を接続して故障からの立直りが速いか故障に対する耐性があるコンピュータを作成する段階と、で構成され、各計算素子は、他の計算素子と同じ周期数単位で全部の命令を実行する、ことを特徴とする方法。 20．第一と第二のプロセッサは業界標準のプロセッサであることを特徴とする請求の範囲第19項に記載の方法。 21．更に、少なくとも二つのコントローラと少なくとも二つの計算素子との上で業界標準のオペレーティングシステムとアプリケーションとを走行させる段階で構成されることを特徴とする請求の範囲第19項に記載の方法。 22．更に、少なくとも二つのコントローラの上で第一オペレーティングシステムを走行させる段階と、少なくとも二つの計算素子の上で第二オペレーティングシステムを走行させる段階と、で構成されることを特徴とする請求の範囲第19項に記載の方法。 23．更に、一つ以上のモジュール対から遠く離してモジュール対を配置して災害に対する耐性を提供する段階で構成されることを特徴とする請求の範囲第19項に記載の方法。 24．更に、第一入出力装置を第一モジュール対に接続する段階と、第二入出力装置を第二モジュール対に接続する段階であって、前記第二入出力装置は第一入出力装置の冗長分である段階と、少なくとも同じ入出力書込み要求とデータとを第一と第二の入出力装置へ送信する段階と、で構成されることを特徴とする請求の範囲第19項に記載の方法。 25．更に、第三入出力装置を第三モジュール対に接続する段階であって、前記第三入出力装置は第一と第二の入出力装置の冗長分である段階と、少なくとも同じ入出力書込み要求とデータとを第一、第二および第三の入出力装置へ送信する段階と、で構成されることを特徴とする請求の範囲第24項に記載の方法。 26．更に、コントローラを介して活動プロセッサの作動状態を非活動プロセッサへ転送することによって非活動プロセッサを起動させる段階で構成されることを特徴とする請求の範囲第19項に記載の方法。 27．更に、前記転送段階の最中に前記計算素子による処理を休止させる段階で構成されること特徴とする請求の範囲第26項に記載の方法。 28．更に、前記計算素子による処理を休止させることなく前記転送段階を背景プロセスとして実行する段階で構成されること特徴とする請求の範囲第26項に記載の方法。 29．更に、格上げ対象のプロセッサをディスエーブルにし、ディスエーブルにされたプロセッサを格上げし、コントローラを介して格上げされたプロセッサへ活動プロセッサの作動状態を転送することによって格上げされたプロセッサを再起動することによって、前記計算素子が処理を行っている間にプロセッサを格上げする段階で構成されることを特徴とする請求の範囲第19項に記載の方法。 30．更に、修復対象のプロセッサをディスエーブルにし、ディスエーブルにされたプロセッサを修復し、コントローラを介して修復されたプロセッサへ活動プロセッサの作動状態を転送することによって修復されたプロセッサを再起動することによって、前記計算素子が処理を行っている間にプロセッサを修復する段階で構成されることを特徴とする請求の範囲第19項に記載の方法。 31．コンピュータにおける計算動作から入出力要求を隔離する方法であって、物理的入出力装置のインターフェイスをシミュサートするための仮想入出力装置を提供する段階と、物理的入出力装置へ向けられた計算素子からの入出力要求を中途妨害する段階と、中途妨害された入出力要求を仮想入出力装置へ供給する段階と、仮想入出力装置の内容を入出力プロセッサへ送信する段階と、入出力プロセッサで、送信された仮想入出力装置の内容を物理的入出力装置へ供給する段階と、で構成される方法。 32．前記供給する段階は仮想キーボードを供給すること含むことを特徴とする請求の範囲第31項に記載の方法。 33．前記供給する段階は仮想表示器を供給すること含むことを特徴とする請求の範囲第31項に記載の方法。 34．更に、仮想入出力装置を使用して、入出力競争状態の原因となるソフトウェア非同期によって引起こされたソフトウェアエラーをあらわにする段階で構成されること特徴とする請求の範囲第31項に記載の方法。 35．更に、計算素子からの低レベル入出力要求を中途妨害する段階と、中途妨害された低レベル入出力要求を入出力プロセッサへリダイレクトする段階と、入出力プロセッサで、要求された入出力動作を実行して入出力結果を生成する段階と、入出力結果を計算素子へ返送する段階と、で構成されること特徴とする請求の範囲第31項に記載の方法。 36．少なくとも二つの計算素子と少なくとも二つのコントローラとから成るコンピュータシステムであって、計算素子各々はコントローラのうちの少なくとも二つに接続され、各コントローラは少なくとも二つの計算素子と他のコントローラとに接続されているコンピュータシステムにおける故障を検出し診断する方法であって、計算素子各々でデータを生成する段階と、生成されたデータに係わる計算素子各々で値を発生させる段階と、各計算素子から少なくとも二つの接続されたコントローラへデータを対応する値と供に返送する段階と、各コントローラによって受信された値を他のコントローラへ送信する段階と、各計算素子に対応する値と各コントローラに対応する値とに対して計算を実行する段階と、で構成され、各コントローラに対応する値に対して実行された計算の結果が等しく、各計算素子に対応する値に対して実行された計算の結果が等しければ、故障は何も存在しないとする、ことを特徴とする方法。 37．更に、各計算素子に対応する値に対して実行された計算の結果と各コントローラに対応する値に対して実行された計算の結果とが等しくないとき、一方の計算素子に対応する値全部を計算素子毎に比較する段階と、各計算素子に対応する値が計算素子毎に一致するが異なる計算素子間で不一致標識であるならば計算素子の一方を故障しているものとして指定する段階と、で構成されることを特徴とする請求の範囲第36項に記載の方法。 38．更に、各計算素子に対応する値に対して実行された計算の結果と各コントローラに対応する値に対して実行された計算の結果とが等しくないとき、一方の計算素子に対応する値全部を計算素子毎に比較する段階と、一方の計算素子のみに対応する値が不一致であるならば計算素子の一方の接続線を故障したものとして指定する段階と、で構成されることを特徴とする請求の範囲第36項に記載の方法。 39．更に、各計算素子に対応する値に対して実行された計算の結果と各コントローラに対応する値に対して実行された計算の結果とが等しくないとき、一方の計算素子に対応する値全部を計算素子毎に比較する段階と、二つ以上の計算素子に対応する値が不一致であれば、二つ以上の計算素子に接続されたコントローラを故障したものとして指定する段階と、で構成されることを特徴とする請求の範囲第36項に記載の方法。 40．コントローラと、コントローラに接続された第一計算素子と、コントローラに接続された第二計算素子と、第一と第二の計算素子による入出力動作を中途妨害するための手段と、中途妨害された入出力動作をコントローラへ送信するための手段と、で構成され、第一計算素子は、第二計算素子が実行するときと同じ周期数単位で命令セットの各命令を実行する、ことを特徴とするコンピュータシステム。 41．コントローラと第一と第二の計算素子とは各々業界標準のマザーボードを備えていることを特徴とする請求の範囲第40項に記載のコンピュータシステム。 42．更に、第一コントローラと第一と第二の計算素子とに接続された第二コントローラで構成されることを特徴とする請求の範囲第項に記載のコンピュータシステム。 43．第一コントローラと第一計算素子とは第一位置に配置され、第二コントローラと第二計算素子とは第二位置に配置され、更に、第一コントローラを第二コントローラに、第一コントローラを第二計算素子に、および第二コントローラを第一計算素子に接続する通信リンクで構成されることを特徴とする請求の範囲第 42項に記載のコンピュータシステム。 44．更に、第三コントローラと、第三コントローラに接続された第四コントローラと、第三コントローラと第四コントローラとに接続された第四計算素子と、第三と第四のコントローラを第一と第二のコントローラに接続するための手段と、計算素子間に計算タスクを分散するための手段と、で構成され、第一と第二の計算素子は第一の計算タスク組を実行し、第三と第四の計算素子は第二の計算タスク組を実行し、第三と第四の計算素子は、第一と第二の計算素子が命令を実行する場合と同じ周期数単位で命令セット中の各命令を実行する、ことを特徴とする請求の範囲第42項に記載のコンピュータシステム。 45．第一コントローラと第一計算素子とを第二コントローラと第二計算素子とから遠く離して配置して災害に対する耐性を提供することを特徴とする請求の範囲第42項に記載のコンピュータシステム。 46．前記第一と第二の計算素子各々は更に量子割込みを発生させるための手段で構成されることを特徴とする請求の範囲第40項に記載のコンピュータシステム。 47．第一コントローラと、第一コントローラに接続された第二コントローラと、第一と第二コントローラに接続された第三コントローラと、第一と第二コントローラに接続された第一計算素子と、第二と第三コントローラに接続された第二計算素子と、第一と第三コントローラに接続された第三計算素子と、で構成されるコンピュータシステム。 48．第一コントローラと第一計算素子とを他のコントローラと計算素子とから遠く離して配置して災害に対する耐性を提供することを特徴とする請求の範囲第 47項に記載のコンピュータシステム。 49．更に、第一計算素子による入出力動作を中途妨害するための手段と、中途妨害された入出力を第一計算素子から第一と第二のコントローラへ送信するための手段と、第二計算素子による入出力動作を中途妨害するための手段と、中途妨害された入出力を第二計算素子から第二と第三のコントローラへ送信するための手段と、第三計算素子による入出力動作を中途妨害するための手段と、中途妨害された入出力を第三計算素子から第一と第三のコントローラへ送信するための手段と、で構成されることを特徴とする請求の範囲第47項に記載のコンピュータシステム。 50．更に、第四コントローラと、第四コントローラに接続された第五コントローラと、第四と第五のコントローラに接続された第六コントローラと、第四と第五のコントローラに接続された第四計算素子と、第五と第六のコントローラに接続された第五計算素子と、第四と第六のコントローラに接続された第六計算素子と、第一と第二と第三のコントローラを第四と第五と第六のコントローラに接続するための通信リンクと、で構成され、第一と第二と第三のコントローラおよび第一と第二と第三の計算素子は第一位置にあり、第四と第五と第六のコントローラ及び第四と第五と第六の計算素子は第二位置にある、ことを特徴とする請求の範囲第47項に記載のコンピュータシステム。