JPH11510934A - 高稼働率コンピュータおよびこれに関連する方法 - Google Patents

高稼働率コンピュータおよびこれに関連する方法

Info

Publication number
JPH11510934A
JPH11510934A JP9509578A JP50957897A JPH11510934A JP H11510934 A JPH11510934 A JP H11510934A JP 9509578 A JP9509578 A JP 9509578A JP 50957897 A JP50957897 A JP 50957897A JP H11510934 A JPH11510934 A JP H11510934A
Authority
JP
Japan
Prior art keywords
clock
computer system
circuit
test
motherboard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9509578A
Other languages
English (en)
Inventor
バクスター,ウイリアム・エフ
ウエイラー,パツト・ジエイ
コツクス,ジヨージフ
ジエリナス,ロバート・ジー
ジロツト,バリー・イー
ガイヤー,ジエイムズ・エム
ヘイダ,アンドレア
ホツク,ダン・アール
ハント,マイケル・エフ
キーテイング,デイビツド・エル
キメル,ジエフ・エス
パイク,ロブ・ジエイ
ラドグナ,トム・ブイ
ルークス,フイル・ジエイ
シヤーマン,アート・エイ
スポーター,マイクル
トウルーベンバツク,リズ・エム
タツカー,ダグ・ジエイ
バレンタイン,ロブ・ピー
ユン,サイモン・エヌ
Original Assignee
データ・ジエネラル・コーポレイシヨン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=21700234&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JPH11510934(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by データ・ジエネラル・コーポレイシヨン filed Critical データ・ジエネラル・コーポレイシヨン
Publication of JPH11510934A publication Critical patent/JPH11510934A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2289Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by configuration test
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • G06F11/267Reconfiguring circuits for testing, e.g. LSSD, partitioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0806Multiuser, multiprocessor or multiprocessing cache systems
    • G06F12/0813Multiuser, multiprocessor or multiprocessing cache systems with a network or matrix configuration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/36Handling requests for interconnection or transfer for access to common bus or bus system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/25Using a specific main memory architecture
    • G06F2212/254Distributed memory
    • G06F2212/2542Non-uniform memory access [NUMA] architecture

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Multi Processors (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Hardware Redundancy (AREA)

Abstract

(57)【要約】 高稼働率コンピュータシステムおよび方法は少なくとも一本のバックプレーン通信バス(208a−d)と診断バス(206)を有しているバックプレーンと、各々が診断バス(206)にインタフェースしている複数枚のマザーボード(202a−h)を含んでいる。各マザーボード(202a−h)は複数枚のマザーボード(202a−h)の間に分散されたメインメモリを含んでいるメモリシステム(252)と、少なくとも一枚のドータボード(250a−b)と、各マザーボード(202a−h)およびドータボード(250a−b)に実装された機能性構成要素を電気的に相互接続する走査チェーンをも含んでいる。システムは走査チェーンを使用して機能性構成要素ならびに電気接続を自動的にテストし、障害構成要素の存在を判定し、障害構成要素をコンピュータシステムから機能的に除去する命令および基準を含んでいる。

Description

【発明の詳細な説明】 高稼働率コンピュータおよびこれに関連する方法 本出願は1995年8月14日出願の米国仮出願番号第60/002320号 の利益を主張するものであり、該出願の教示は参照することにより本明細書の一 部となるものである(付録Aも参照)。 発明の分野 本発明はコンピュータシステムに関し、詳細にいえば、障害が生じたコンピュ ータシステムを自動的に感知し、診断し、構成解除(デコンフィギュア)/再構 成(リコンフィギュア)して、稼働率を改善する高稼働率コンピュータシステム 、ならびに高い稼働率を提供するための関連した方法に関する。 発明の背景 ビジネス環境においてコンピュータシステムを調達する場合、考慮する重要な 要因はコンピュータが実行/動作する稼働率である。これは収益性、ならびに作 業/ジョブの実績に影響を及ぼす。稼働率を改善するために単独で、あるいは組 み合せて使用される四つの基本的な設計概念がある。 設計技法の一つは一般に「フォールトトレラント」と呼ばれ ているものである。この技法を用いているコンピュータシステムは他のタイプの コンピュータであればシャットダウンさせてしまうであろう重障害にも耐え得る ように設計される。このような設計は通常、ハードウェアおよびソフトウェアを 重複させて、アプリケーションプログラムが複数のプロセッサで同時に動作する ようにすることを含んでいる。このようにすれば、重障害がプロセッサまたはサ ブシステムの一つで生じた場合に、他のプロセッサ/サブシステムで動作してい るアプリケーションプログラムが依然として出力を行う。それ故、ユーザに関し て、コンピュータシステムはその指定されたタスクを実行していることとなる。 複数のプロセッサに加えて、ボーティング手法を実施し、これにより複数のプロ セッサからの出力を比較して、適正な出力を決定することができる。 フォールトトレラントシステムは複雑なものであり、複数の独立した処理シス テムを本質的に必要とするものであり、それ故、きわめて高価なものである。さ らに、システムがフォールトトレラントであったとしても、いったん障害が発生 したら、サービス担当員が現場へ赴き、障害が生じたパス/サブシステムを診断 し、修理する必要がある。これにより保守の費用がか さむ。 他の技法は構成要素が信頼性がきわめて高く、したがって、動作サイクル中に 障害を生じる可能性がないように、構成要素を設計することを含んでいる。この 技法は意図している用途(たとえば、人工衛星)の大きさおよび重量の制限が通 常利用可能な設計技法を限定する宇宙用、軍事用および航空用に一般的なもので ある。高信頼性の構成要素は通常高価であり、またこれらの設計特性を維持する ためには、保守活動も費用のかさむものとなる。 このような経費はコンピュータシステムを所与の用途に関して商業的に受け入 れられないものとしてしまう。いずれにせよ、システムがいったん障害を起こす と、サービス担当員を派遣して、障害を起こしたシステムの診断および修理を行 わなければならない。軍事用/航空用のものを取り扱う場合、障害を起こした構 成要素を収納している車両/品目を修理施設に持ち込まなければならない。しか しながら、システムは修理されるまで、利用できなくなる。それ故、これは保守 コストを高くし、このような修理/交換活動をクリティカルパスの問題としてし まう。 第三の技法は複数の独立したコンピュータシステムをクラス タ化して、コンピュータシステムの一つが故障した場合に、その作業をクラスタ 内の他のシステムの一つで行うようにすることを含んでいる。この技法はいくつ かの独立したシステムが存在するか、必要とされる用途に限定される。独立型の システムには使用できない。また、この種のシステムが動作するには、独立した 各システムがクラスタ内のいずれのシステムのデータおよびアプリケーションプ ログラムにもアクセスできなければならない。たとえば、いずれのコンピュータ システムもアクセスできる中央データ記憶装置(たとえば、ハードディスク)を 設ける。適用性が限定されていることに加えて、これは複雑であり、高価であり 、しかもデータセキュリティの問題を生じる。 第四の技法は冗長電源およびブロワを設けることを含んでいる。それ故、ブロ ワや電源の故障がコンピュータシステムのシャットダウンにつながることはない 。しかしながら、サービス担当員をつれてきて、機械を修理し、動作可能な状態 に復帰させられるように故障の原因を診断させなければならないため、他のコン ピュータシステム構成要素に冗長性を与えることは実行できない。 第四の技法はコンピュータシステムに、システムのクラッシ ュまたはハング後にシステムを自動的にリブートする機構を設けることも含んで いる。この技法は一時的な問題からの回復を可能とするものではあるが、動作可 能状態へのシステムの復元に関連した診断は行われない。それ故、システムが故 障した場合には、サービス担当損をつれてきて、機械を修理し、動作可能な状態 に復帰させられるように故障の原因を診断させなければならない。 それ故、大きな割合の潜在的な障害モードから自動的に回復できる(すなわち 、操作員/サービス担当員の活動を必要とすることなく回復できる)コンピュー タシステムが必要とされている。特に、コンピュータおよびその構成要素の機能 に関するコンピュータによる自動診断を含んでいる方法、ならびに障害を起こし た構成要素を分離するためにシステムを構成解除/再構成でき、それ故、おそら くはデグレード状態であってもコンピュータがシステム動作を自動的に継続でき るコンピュータが必要とされている。また、このような高稼働率設計特性を有す るコンピュータシステムも必要とされている。 発明の概要 本発明の方法およびマルチプロセッサコンピュータシステム は、複数プロセッサコンピュータシステムの稼働率を、システムの動作を中断さ せるいくつかの障害のいずれをも自動的に感知し、診断するようにシステムを設 計して改善することを実現することによってもたらされる。さらに、継続したシ ステム動作を阻害する障害を診断し、分離するにあたり、コンピュータシステム はシステムを自動的に構成解除して、分離された障害を生じた構成要素/サブシ ステムがシステムから機能的に除去されるようにする。コンピュータシステムは 次いでそれ自体、オペレーティングシステムおよびアプリケーションプログラム を自動的にリブートする。 障害を生じた構成要素がサービス担当員によって交換/修理されるまで、コン ピュータシステムはデクレード状態ではあるが、動作を継続する。しかしながら 、他のコンピュータシステムと異なり、この交換については正規のシステム運用 を回避してスケジュールを組むことができる(たとえば、非生産時間中の交換) 。このようにして、修理および/または交換活動はシステムを動作可能状態に回 復するのにクリティカルパスの問題ではなくなる。一般に、ほとんどのシステム 、特にマルチプロセッサタイプのコンピュータシステムは、実際のパフォーマン スをほとんどあるいはまったく損なうことなく、デグレード状態で動作させるこ とができる。 コンピュータシステムはシステム(すなわち、チップおよび回路基板)を走査 して、構成要素/サブシステムの障害を特定することによって、完全なシステム 診断を電源投入時に並列に行うようにも設計される。このようにして、コードの ロード前に動作状態になっているものとしてシステムを検査する。これはシステ ムが動作するようになってから、障害状態を見つけ出すよりも好ましい。走査は 統合されたJTAGテスト論理を使用して、チップにおいて、また回路基板レベ ルにおいて開回路および短絡回路を突き止め、またシステムを構成する特定用途 向け集積回路、プロセッサおよび回路基板の機能を判定することを含んでいる。 電源投入時に行われる走査動作はいくつかのASICのうちのいずれかのものを 初期化することも含んでいる。 このことはコンピュータシステムのコストおよび使い方に比例したさまざまな 段階またはレベルで実施できる簡単で、迅速で、しかも低コストな診断修理方針 をもたらす。その広範囲にわたる用途において、システム障害につながるほとん どすべて の障害についてシステムは自動的にシステムを構成解除および再構成するととも に、正確で完全な障害分離および検出をもたらす。ただし、意図している用途に 基づいて継続したシステム動作を可能とするとともにユーザのコストを最小限と するのに必要なシステム冗長性の量を調整することも、本発明の範囲に含まれる 。 さらに、コンピュータシステムの処理動作に関する構成要素に対しては、N+ 1個の冗長ブロワと電源を含めるようにシステムを構成する。電源をグルーブ化 して、各電源グループがシステムの個別の部分に電源を供給するようにすること が好ましい。各グループにN+1個の電源を設けることが好ましい。ブロワおよ び電源がホット修理可能であって、現場でシステムを遮断せずにこれらを交換す ることができる。 高稼働率コンピュータシステムはさらに、アプリケーションプログラムおよび 基板実装構成要素(たとえば、走査チェーン、テストバスコントローラ)ととも に、診断テストを行って、いずれかのアプリケーションプログラムのローディン グに先立って、システムの完全性を判定する、各マザーボードに実装されたマイ クロコントローラおよび診断バスを含んでいる。 各マザーホードおよびドータボード上の特定用途向け集積回路は論理フリップ /フロップ(F/F)へクロックを供給するゲート式バランスクロックツリーを 含んでいる。クロックツリーはクロックトランクと、これから延びている複数の ブランチとを含んでいる。ANDゲートを少なくとも一つのブランチに配置し、 いくつかのクロックパルスだけが論理F/Fへ通るように制御回路の制御の下に おく。 制御回路はANDゲートによって、自動的にパルスがコンピュータシステムの 第一の動作状態、すなわち正規のシステム動作中にブランチを通過でき、システ ムが第二の動作状態、すなわちシステムに致命的なエラーが生じているときにA NDゲートがパルスをブロックするように構成される。また、制御回路はコンピ ュータシステムが診断テストを受けているときにパルスが通過するようにも構成 される。 システムは一方の回路がシステムクロック源と指定されている二つの冗長クロ ック生成分配回路も含んでいる。クロックパルスの生成障害が特定された場合に は、クロック生成分配回路は自動的にシステムが冗長クロック回路にフェイルオ ーバし、システムをサービス状態に戻す。回路をシステムの各マザーボ ードに実装するのが好ましい。特定の実施の形態において、バックプレートのス ロット0にあるマザーボード上のクロック生成分配回路は正規のシステムクロッ ク源であり、バックアップ源はスロット1のマザーボード上に実装された回路と なる。 要約すると、本発明の上記の方法は、システムの意図している用途およびコス トに基づいて構成することのできる高稼働率コンピュータシステムをもたらす。 それ故、連続したシステム運用を可能とするのに必要とされるシステムの冗長性 の量は用途に合わせて、またユーザのコストを最小限とするように調整できる。 このようなシステムによって、障害を起こした構成要素の修理または交換のスケ ジュールをユーザに与える影響が最も少ない時間に組むことが可能となる。 定義 本発明は以下の定義を参照することにより、もっともよく理解されよう。 「ASIC」は特定用途向け集積回路を意味する。 「ボードマスタJP」は各マザーボード上の最下位の機能的ジョブプロセッサ /中央演算処理装置を意味する。ボードマスタボードレベルテストで分離した動 作により決定される。 「デグレード」および関連する用語は、構成要素の、たとえばFRU、コンピ ュータシステムからの喪失または除去を意味する。コンピュータシステムの動作 またはパフォーマンスの実際の低下は、構成要素の喪失または除去によって生じ ることもあれば、生じないこともある。 「診断マスタJP(DM)」はシステムが初めてメインユーザインタフェース で停止したときに、すべての基板内テストと制御を調整する、システム内のジョ ブプロセッサ/中央演算処理装置を意味する。 「障害検出」は障害が発生し、現行のシステムデータがだめになったことを認 識できることを意味する。 「障害分離/障害の分離」および関連する用語は定義のあるレベルまで障害の 位置を特定できることを意味する。分離はシステム、サブシステム、基板、構成 要素、FRU、またはサブFRUレベルで定義できる。 「FRU」は現場交換可能ユニットを意味する。現場交換可能ユニットはコン ピュータシステムの構成要素(たとえば、基板、ドータボード、バス、電源、ブ ロワ)であって、フィールドサービス担当員によって現場でユニットとして取り 外され、 交換されるように(すなわち、現場で修理されない)設計されたものである。 「マスタマイクロコントローラ」はどの基板がシステム内にあるかの基本的な サイジングを行い、ミッドプレーンSEEPROMを含めオフボード走査をテス トする、システム内のマイクロコントローラを意味する。 「走査可能メールボックス」は通信手段としてマイクロコントローラによりD BUSを介してアクセスされるレジスタを意味する。 「SEEPROM」は電気的に消去可能なシリアルプログラマブルリードオン リーメモリを意味する。これらのうちの一つがSIMM以外の各FRU上に存在 している。 「TCK」はテストクロック、すなわちIEEE1149.1テストクロック 信号を意味する。 「TMS」はIEEE1149.1テストモード選択信号を意味する。 「TDI」はIEEE1149.1テストデータイン信号を意味する。 「TDO」はIEEE1149.1テストデータアウト信号 を意味する。 「TRST」はIEEE1149.1テストリセット信号を意味する。 図面の簡単な説明 本発明の性質および望ましい目的を完全に理解するためには、類似した参照記 号が数枚の図面にわたり対応する部品をさしている添付図面に関して行われる以 下の詳細な説明を参照されたい。 第1A図から第1C図は複数並列プロセッサ用の高稼働率方法のハイレベルの 流れ図である。 第2図は本発明の高稼働率コンピュータシステムのハイレベルのブロック図で ある。 第3図は第2図のコンピュータ用のマザーボードのブロック図である。 第4図は第3図のマザーボード用のドータボードのブロック図である。 第5図は本発明のASIC用PLLゲート式バランスクロックツリーのブロッ ク図である。 第6図はBCTの階層図である。 第7図は本発明によるASICのPLLモジュールのブロック図である。 第8図はASIC内部リセットおよびクロック生成用の回路/論理のブロック 図である。 第9図は本発明のクロック生成および検出回路/論理のブロック図である。 第10図はクロック障害検出回路のブロック図である。 第11図はマザーボードおよびドータボードへのクロックの配布に関する例示 的ブロック図である。 第12図はバックプレートの位置「0」に配置されたマザーボード用の走査チ ェーン/走査論理の図である。 第13A図および第13B図はマイクロプロセッサが行う電源投入時テストの 表である。 第14図はジョブプロセッサ(JP)が行う電源投入時テストの表である。 第15A図および第15B図は診断マスタJPが行う電源投入時テストの表で ある。 第16図は診断マスタJPが行う電源テストの表である。 好ましい実施の形態の説明 類似した参照符号が類似した部品を指している各種の図面を参照すると、第1 A図から第1C図には本発明の複数プロセッサコンピュータシステム用の高稼働 率方法の流れ図が示されている。本発明のコンピュータシステムおよび関連する 方法は、ユーザアプリケーションコードの実行中に生じる障害事象を正常に検出 し、事象を少なくとも一つのFRUに分離し、FRU/障害構成要素を構成解除 し、オペレーティングシステムをリブートし、ユーザアプリケーションコードを リブートするシステムをもたらす。検出、分離、構成解除およびリブートという このプロセスは、コンピュータシステムによって自動的に行われ、ユーザ/サー ビス担当員の対話/入力を必要としない。 コンピュータシステムの電源投入すなわち起動を行っているときに(ステップ 100)、電源システムコントローラがいくつかの機能を実行する。これには動 作電圧を正規の値にし、ブロワファンを正規の速度まで上げ、診断割込みまたは その制御下にある他の状況をクリアすることが含まれている。このモードの間、 コンピュータシステムの他の機能は禁止されている。システムの動作が図示の動 作順序に限定されるものではなく、 動作を並列におよび/または異なる順序で行ってもよいことに留意すべきである 。 システムが起動すると、システムクロックが適切なシステム動作に必要なクロ ック信号(すなわち、クロック)を与える。以下で説明するように、クロック回 路/論理256(第3図)が正規のシステムクロック源の動作を監視し、正規の システムクロック源が障害を起こすと、クロック障害出力をもたらす(ステップ 102)。システムクロック監視機能は起動時に開始され、システムの電源を切 断するまで、システム動作のすべてのモードの間継続する。 好ましい実施の形態において、コンピュータシステムは冗長ないしバックアッ プクロック回路/論理を含んでいるので、システムは単一のシステムクロック障 害に耐えることができる。それ故、正規のシステムクロック源の障害が特定され た場合、コンピュータシステムは冗長クロック回路をシステムクロックの指定さ れたクロック源であると自動的に再指定する(ステップ104)。スロット0の マザーボード上のクロック回路/論理256の障害が、スロット0のマザーボー ドをシステムから機能的に構成解除することを自動的に必要とするものではない ことに留意すべきである。システムクロックの喪失が検索不能な障害であるから 、コンピュータシステムは診断テストプロセスの始まりへ自動的に復帰する。本 発明の目的では、システムのこのような再起動をシステムのコールドリセットと 呼ぶ。しかしながら、このコールドリセットはシステムへの電力の除去および再 確立を含むものではない。 コールドリセット電源投入プロセス時に、他のシステム障害が発見されなかっ たものと想定すると、以下で説明するように、オペレーティングシステムが自動 的にブートされ、再呼出しされる。また、システム起動プロセスの一部として、 クロック障害に関するメッセージがユーザおよび当地のサービスセンタへ送られ る。要約すると、上述のクロックフェイルオーバプロセスはシステムによって自 動的に行われ、ユーザが介入して、クロックを切り替えることを必要としない。 上記の初期電源投入プロセスが完了すると、コンピュータシステムはいくつか の診断テストおよび評価動作を行うように解除される。これらの動作は各種の構 成要素(たとえば、チップ、基板、バス)を調べ、アプリケーション(たとえば 、オペレーティングシステム)のロード前に、コンピュータシステムの完 全性および動作可能性を確認する。好ましい実施の形態において、コンピュータ システムは統合JTAGテスト回路/論理および走査チェーンを含むように設計 されているので、診断テストおよび評価はシステムによって自動的に行われる。 詳細にいえば、コンピュータシステムは基板およびチップレベルで電気的連続 性を調べる(すなわち、短絡および開回路を調べる)(ステップ110)。連続 性チェックに加えて、コンピュータは機能性チェックを行って、たとえば、ハー ドスタックを特定する(ステップ112)。障害があると特定されたすべての構 成要素には、その旨のタグがつけられる。 障害構成要素がある場合には(ステップ114のYES)、コンピュータシス テムは障害構成要素を構成解除して、これらがコンピュータシステムの論理的ま たは動作上機能的な構成要素ではなくなるようにしようと試みる(ステップ11 6)。実際問題としてコンピュータシステムはシステム動作に必要な構成要素の 最低限の数未満にシステム自体を構成解除するべきではない。たとえば、システ ムは最後のシステムボードを機能的に除去することはできない。コンピュータシ ステムの構成解除が可能でない場合(NO)、システムはそれ自体をシャットダ ウンする(ステップ118)。 コンピュータシステムを構成解除できる場合には(ステップ116のYES) 、コンピュータシステムは障害構成要素をシステムから機能的および動作上除去 するのに必要な活動を行う(ステップ120)。コンピュータシステムは動作し て、障害分離が障害を起こしたFRUに対するものとするか、あるいは障害を起 こしたと考えられる構成要素が位置するFRUに対するものとすることが好まし い。FRUまでの分離は診断および障害分離プロセスを正確で、迅速で、完全な ものとする。システムはシステムメモリチップ(たとえば、EEPROM)の更 新を行って、障害システムクロックを含む活動しており、構成解除された構成要 素の特定も行う。 構成解除が完了した後、プロセスおよびコンピュータシステムは復帰して、診 断テストを再度行う(ステップ110〜114)。それ故、構成解除されたシス テムの動作可能性および完全性がアプリケーションのローディング前に確認され る。診断テストおよび評価プロセスは障害が特定されなくなるか、システムシャ ットダウンが必要となるまで繰り返される。 他の障害が検出されなくなった場合、あるいは初期診断テス トで障害が検出されなかった場合(ステップ114のNO)、システムはオペレ ーティングシステムのロードへ進む(ステップ122)。オペレーティングシス テムが正常にロードされた場合には(ステップ124のYES)、コンピュータ システムは使用可能である。すなわち、ユーザのアプリケーションプログラムを ロードし、実行することができる(ステップ126)。 以下で説明するように、システムは構成解除またはシャットダウンに関するメ ッセージをユーザに、また、好ましくは、該当するサービスセンターへ出力する 。これには障害を起こしたシステムクロック(すなわち、冗長性の喪失)に関す る勧告も含まれている。このようにして、サービスセンタおよびユーザには障害 が通知される。また、これによって、ユーザおよびサービスセンタはユーザに都 合のよいときに構成要素を交換するスケジュールを組むことも可能となる。 アプリケーションプログラムが実行されている間中、コンピュータシステムは 障害構成要素が存在していることを表すことがあるエラーを監視している。エラ ーが検出されない場合には(ステップ128のNO)、ユーザはアプリケーショ ンプログラムの実行を継続する。エラーが検出された場合には(ステッ プ128のYES)、オペレーティングシステムおよび/またはコンピュータシ ステムはエラーが致命的なものであるか、非致命的なものであるかを判定する( ステップ130)。 非致命エラーはコンピュータシステムの瞬時シャットダウンおよび/または情 報、データまたは状態の検索不能な変造を結果として生じないエラーをいう。非 致命エラーの例としてはシングルビットエラーがある。一方、致命エラーはシス テムシャットダウンを引き起こす構成要素の潜在的な障害を示すエラー、動作し ているプログラムがクラッシュまたはハングしたもの、情報、データまたは状態 のコラプションがある障害である。致命エラーの例としては、所与の動作/構成 要素に対するウォッチドッグタイマがタイムアウトして、ハング状態を示してい る場合である。 エラーが致命であると判断された場合(YES)、コンピュータシステムはシ ステムのメモリおよび構成要素バッファ/レジスタで見出されるもののようなコ ンピュータシステム情報をセーブする状態にされる(ステップ150)。以下で 検討するように、ボード実装ASICは状態またはバストランザクション情報を 格納するレジスタを含んでいる。また、ASICは一 般に、致命エラーが検出された場合に、その状態を維持するように構成されてい る。しかしながら、この情報のセーブにはいくつかの従来技術で示唆されている 技法で必要とされるようなシステムクロックをフリーズさせることを必要としな い。このように、システムは情報を自動的にセーブして、情報はたとえば、製造 /修理施設で障害を起こした構成要素/障害の原因を特定するために後で使用す ることができる。 システムをその情報セーブ状態とした後、コンピュータシステムはシステムの 状態に関する情報を検索する(ステップ152)。好ましくは、統合JTAGテ スト論理/回路および走査チェーンを使用してこれを達成し、システム内の各種 のレジスタ/バッファおよびASICフリップ/フロップ(F/F)から情報を 走査する。情報を検索した後、ウォームリセットがアサートされる(ステップ1 54)。 コンピュータシステム/オペレーティングシステムは可能な場合に、特定され たエラーを解決できる処置を行って、メモリの内容を検索することを目的として 、コンピュータシステムをウォームリセットによって再起動できるようにする。 それ故、ウォームリセットが成功した場合(ステップ156のYES)、 コンピュータシステムはメモリをダンプさせて、たとえば、システムのハードデ ィスクにセーブする。メモリダンプの完了後、あるいはシステムが再度障害を起 こした場合には、ウォームリセットのアサート後に(ステップ156のYES) 、プロセスは復帰して、システム診断評価プロセスを行う(ステップ102)( すなわち、コールドリセットをアサートする)。それ故、システムの動作を継続 する前に、コンピュータシステムの完全性および動作可能性が再度確認される。 エラーが致命的なものでない場合(ステップ130のNO)、コンピュータシ ステム/オペレーティングシステムは必要な処置を行って、当初特定されたエラ ーを修正ないし解決する(ステップ132)。たとえば、シングルビットエラー に関与するデータの再取得/再書込みを行う。非致命エラーのある種のものに対 しては、コンピュータシステム/オペレーティングシステムはこのプロセスの一 部として、非致命エラーのオカレンスが閾値基準を超えたかどうかも判定する。 超えている場合、表記を行って、構成要素または関係するFRUをシステムの次 の電源投入またはコールドリセット時に構成解除するようにする。たとえば、所 与のSIMMに対するシングルビットエラーが閾 値限度を超えた場合には、後で構成解除するためにSIMMにタグをつける。コ ンピュータシステムの動作およびアプリケーションシステムの作動は継続される (すなわち、コンピュータシステムは遮断されない)。 第2図には、本発明の高稼働率マルチプロセッサコンピュータシステム200 のハイレベルブロック図を示す。本発明のマルチプロセッサコンピュータシステ ム200は「SYMMETRIC MULTIPROCESSING COMP UTERWITH NON−UNIFORM MEMORY ACCESS A RCHITECTURE」なる名称の同一出願人に譲渡された係属米国出願第0 8/ 号(代理人整理番号46.585、1996年8月 日出願 )に記載されているCC−NUMAアーキテクチャを用いていることが好ましい 。この教示は参照することによって、本明細書の一部となる。マルチプロセッサ コンピュータシステム200は複数の基板複合体すなわちマザーボード202a −hを含んでおり、これらの各々はPIBUS208を構成する4本のバス20 8a−dに相互接続されている。PIBUS208はバックプレートを横切り、 システムのすべてのマザーボードを相互接続するバスで ある。4本のバス208a−dは情報、データおよび命令をマザーボード間で通 信することを可能とする。各マザーボード202は各マザーボードを診断バス( DBUS)206に相互接続する診断バスインタフェース(DBI)204も含 んでいる。図示のコンピュータシステムは8枚のマザーボード202a−hを含 んでいるが、システムを最低限2枚のマザーボードで構成できるため、これは限 定条件ではない。 マザーボードのブロック図である第3図も参照すると、各マザーボード202 はマザーボードに差し込まれる2枚のジョブプロセッサ(JP)ドータボード2 50a、b、メモリサブシステム252、I/Oサブシステム254、クロック 回路/論理256、バス/PIBUSインタフェースサブシステム258、およ びローカルリソース260を含んでいる。スロット0でマザーボードに組み込ま れたクロック回路256は通常システムクロックおよびテストクロックを生成し 、これをすべてのバックプレート一/スロットにあるマザーボードに与える。ク ロック回路/論理256についてはその分配を含めて、第9図から第11図に関 して以下で説明する。同様に、ジョブプロセッサドータボード250a、bにつ いても第4図に関連して以下で 説明する。 各マザーボード202上のメモリサブシステム252は複数のSIMM270 、二つのエラー検出および修正ユニットASIC(EDiiAC)272、ディ レクトリ274およびメモリコントローラASIC(MC)276を含んでいる 。メモリサブシステム252は各マザーボード202上の最大512MBのメモ リをコンピュータシステム200に与えることができる。実際のランダムアクセ スメモリ記憶装置はマザーボード202上に設けられた最大8個の16M×36 のSIMM270によって提供される。マザーボード202にはしかしながら、 4ないし8個のSIMMを搭載することができる。二つのEDiiAC ASI C272を使用して生成/修正されるECCを使用して、メモリデータを保護す る。各EDiiACは64ビットのデータパスを備えており、そのうち二個はキ ャッシュブロックとインタリーブするために使用される。 メモリサブシステム252はキャッシュコヒーレンシィを維持するために使用 されるディレクトリ274用の記憶域も含んでいる。ディレクトリ274は4M ×4のダイナミックランダムアクセスメモリを含んでおり、これらはマザーボー ド202 に実装されている。ディレクトリおよびメインデータ記憶装置(すなわち、SI MM)両方に対するECCコードはすべてのシングルビットエラーを修正し、す べてのダブルビットエラーを検出することができる。 MC ASIC276は物理メモリ操作の実行を管理する。これはシステムコ ヒーレンシィを維持するディレクトリ274およびメモリデータ記憶SIMM2 70の両方を管理することを含んでいる。MC ASIC276はBAXBAR 292によってMCBUS上へ駆動されるメモリトランザクションパケットを処 理する。 各マザーボード202上のI/Oサブシステム254は二つのI/Oサブシス テムインタフェースASIC(GG)280、二枚の周辺構成要素インタフェー ス(PCI)拡張カード282、二つのスモールコンピュータシステムインタフ ェース(SCSI)284、および一つのローカルエリアネットワーク(LAN )インタフェース286を含んでいる。これらの各々はマザーボード202に実 装されている。 各マザーボードのI/Oサブシステム254は25MHzで動作する二つのP CIチャネルを備えている。各PCIチャネ ルはGG ASIC280によってバス/バスインタフェースサブシステムのG Gバスとインタフェースしている。各GG280はI/Oトランザクション用の 統合キャッシュを含んでおり、またGGバスとPCIバスの間にインタフェース をもたらすのに必要な、PCIアービトレーションを含むすべての論理も含んで いる。GG280はマザーボード及び接続されたペリフェラルからの割込みの集 束器としても働き、これらの割込みを組み合わせ、バスパケットによってJPド ータボード250a、b上の該当するジョブプロセッサ(JP)へ送る。 二本のPCIバスの各々は統合SCSIインタフェース284に接続され、ま た単一のPCI拡張ボード282にも接続されている。二本のPCIバスの一本 も統合10Mb LANインタフェース286に接続されている。二つのSCS IインタフェースはNCR825統合PCI−SCSIコントローラを使用して 、一対の広帯域差動SCSI−2インタフェースとして実現される。各コントロ ーラは一組の差動トランシーバによって、エアダム上の68ピン高密度SCSI コネクタに接続されている。SCSIバスのオンボード終端は設けられておらず 、マザーボード202のマルチイニシエータまたは他のSCSI クラスタ構成への接続が可能である。単一LAN接続がDECchip2104 0PCI−イーサネットコントローラを使用して行われる。これはエアダム上の RJ−45に接続される単一チップ統合LANを提供する。 各マザーボード202上のバス/PIBUSインタフェースサブシステム25 8は四つのPIBUSインタフェースASIC(PI)290、マザーボードレ ベルバス用の相互接続パスとして働くクロスバー交換機(BAXBAR)292 、アービトレーションASIC(ORB)294および複数のボードレベルバス を含んでいる。ORB ASIC254はマザーボードレベルバス用のアービト レーションとBAXBARバストランシーバを管理する。BAXBAR(BB) 292は四つのASICとして実施され、ORB ASIC機能とBAXBAR ASIC機能を選択するためのモードスイッチを含んでいる。 バックプレートを横切るジョブプロセッサ間の一次通信はバス/PIBUSイ ンタフェースサブシステム258のPIBUSインタフェース部分を使用して達 成される。単一PIBUS208aは多重化72ビットアドレス制御/データバ ス、ならびに関連するアービトレーションおよび制御信号からなってい る。各マザーボード202は四つの同一のPI280を含んでおり、各PIはP IBUS208を構成するバス208aの一つに相互接続されている。トラフィ ックは四本のバス208a−dを横切って区分されているので、各バスはほぼ均 等に利用される。 上述したように、サブシステム258は複数のボードレベルのバスを含んでい る。以下はここのリストの各々を列挙したものであり、各々の簡単な説明を含ん でいる。 RIバス。BAXBAR292をリソースインタフェースASIC(RI)3 06およびデバッグバッファ/デバッグコネクタへ相互接続するバスである。 GGバス。BAXBAR292を二つのGG ASIC280へ相互接続する バスである。 MCバス。BAXBAR292をMC ASIC276へ相互接続するバスで ある。 CI0バス。BAXBAR292をJP0ドータボード250aに実装されたキ ャッシュインタフェースASIC(CI)414へ相互接続するバスである。 CI1バス。BAXBAR292をJP1ドータボード250 bに実装されたキャッシュインタフェースASIC(CI)414へ相互接続す るバスである。 PIXバス。BAXBAR292を四つのPI ASIC290へ相互接続す るバスである。 MUD L、MUD Hバス。BAXBAR292をメモリサブシステムのE DiiAC ASIC272へ相互接続する二本のバスである。 各マザーボード202はバックパネルに含まれているシステムID PROM 204を除き、システムで必要とされるすべてのローカルリソースを含んでいる 。ローカルリソース260はマイクロコントローラ(μC)300、EEPRO M302、SRAM、NOVRAM、DUART、SCANインタフェース論理 304、MACH論理、およびリソースインタフェース(RI)ASIC306 を含んでいる。ローカルリソース260は各マザーボード202上で重複してい るが、コンピュータシステム200はバックプレート上のスロット0またはスロ ット1のいずれかの基板のローカルリソース部分だけを、システム全体にわたる グローバルリソースとして使用する。RI ASIC306はRIバス/BAX BAR292とローカルリソー ス260内の装置との間のインタフェースを提供する。 マイクロコントローラ300はシステムのローレベル早期電源投入診断を行っ てから、JPドータボード250a、bJPに対するRESETのアサート解除 を行う。これはすべての走査動作に使用されるコントローラ/エンジンでもある 。ドータボード250a上のJP400a、bが走査動作を行う必要がある場合 、マイクロコントローラ300に対して要求を行い、該マイクロコントローラは 必要な動作を行う。走査は電源投入時にASICを構成し、電源およびブロワと 通信を行い、システム内の各種のID PROMとの通信を行い、ハードウェア 致命エラー後に障害情報のダンプを行うために使用される。 すべてのJP400a、bおよびマイクロコントローラ300のファームウェ アを格納する四つの512K×8のEEPROM302がある。EEPROM3 02は電源投入時にJTAG走査テストを行うための適切なテストベクトルも含 んでいる。512K×8のSRAMがローカルリソース260に含まれていて、 早期電源投入用およびマイクロプロセッサスタックスペース用のスクラッチパッ ドRAMとして使用される。128K×8のNOVRAM/RTCも設けられて おり、重要な情報を 不揮発性記憶装置に格納するための特別な領域を与え、システムにリアルタイム のクロックを与える。 ローカルリソース260は三つの必要なUARTポートを実施するためのDU ARTをシステムに与える。四番目のUARTポートはループバック回路の一部 としても使用されて、JPが主システムコンソールで何が駆動されているかを監 視することを可能とする。 さらに、ローカルリソース部分260はすべての基板実装ASIC、電源、ブ ロワ、SEEPROMおよびSYSID PROMのJTAGベースの走査を行 うための論理304も備えている。この論理は外部テスタを使用した製造テスト 中、あるいはマザーボード202上のマイクロコントローラ300を使用した正 規の動作/電源投入中のいずれかにおいてシステムを走査できるようにするため におかれている。この論理により、故障している可能性のある構成要素(たとえ ば、FRU)を検出し、分離するための電源投入時システムテストの一部として 簡単な境界走査テストを使用することが可能となる。 さらに、リソースバス上のMACHを外部コネクタからのそのJTAGインタ フェースを使用してプログラムすることがで きる。また、マイクロコントローラを外部コネクタとともに使用して、リソース バス上のEEPROMをプログラムすることができる。これにより、組立て中に 実装される部品の「バーン済み」のものを在庫しておくのではなく、製造時に基 板にブランクのMACHとEEPROMを組み付けてから、テスト手順の一部と してこれらを「バーン」することが可能となる。この「回路内プログラム可能性 」機能もECO活動に関する更新を、古い部品を取り外してから、新しい部品を 代りに実装するのではなく、プログラミングコネクタを差し込み、部品を再プロ グラムするという簡単なものとする。 再度第2図を参照すると、コンピュータシステム200はマザーボード202 の各対に対する三つの電源210a−cのグループ、システムを冷却する三個の ブロワ212、およびシステムID SEEPROM204も含んでいる。八枚 のマザーボード202がある場合には、合計十二の電源がある。各グループ内の 三つの電源210a−cはマザーボードの対に対するN+1の冗長電源を表して いる。また、三個のブロワ212はシステム200に対するN+1個のブロワを 表している。 各グループに対する電源210a−cもマザーボードの対応 する対の各マザーボード202に相互接続されている。このようにして、また以 下で説明するように、各マザーボード202はマザーボードのこの対に対する電 源の動作可能性状態を確認する(たとえば、走査、診断する)機能を有している 。ブロワ212もバックプレートのスロット0および1のマザーボード202に 相互接続されている。このようにして、また以下で説明するように、これらのス ロットのマザーボード202はブロワ212の動作可能性状態を確認する(たと えば、走査、診断する)機能を有している。 システムID SEEPROM204は製造番号やバックパネル構成などの重 要なシステム情報を格納するための不揮発性部分を備えている。システムID SEEPROM204が本当の意味のJTAGインタフェースを持っていないた め、IEEE1149.1走査チェーンへ直接接続することができない(以下の 検討参照)。それ故、バッファを使用して、二つのシリアルプロトコルの間にイ ンタフェースを提供する。 第4図を参照すると、JPプロセッサドータボード250の例示的なブロック 図が示されている。各JPドータボードは二つの50MHzのモトローラ881 10中央演算処理装置ない しJPプロセッサ(JP)400a、bを含んでおり、各JPはこれに関連付け られたレベル2キャッシュとしての1MBのスタティックランダムアクセスメモ リ(SRAM)402a、bと88410キャッシュコントローラ(SLCC) 404a、bを有している。各ドータボード250には、16MBのダイナミッ クランダムアクセスメモリ(DRAM)、第三レベルのキャッシュ(TLC)4 06およびTLCを制御する第三レベルのキャッシュコントローラ(TLCC) ASIC408も実装されている。第三レベルキャッシュ408は両方のJP4 00a、bによって共用されている。DRAMはECCによって保護されており 、このECCはTLCC ASIC408の制御下にある二つのEDiiAC ASIC410によって生成され、チェックされる。第三レベルキャッシュ40 6のキャッシュタグはSRAM412に格納されている。 各JPドータボード250はキャッシュインタフェース(CI)ASIC41 4も含んでいる。CI ASIC414の主な機能はマザーボード202上のパ ケット交換ローカルバスプロトコルとJPドータボード250上の88410キ ャッシュコントローラバスプロトコルとの間の変換/シーケンサとして 働くことである。クロックとリセットを除く、すべてのオフJPドータホード通 信はマザーボードレベルのバスの一部であり、CIはCIBUSに直結される。 二つのEDiiAC ASIC410は六つのABT16260ラッチング2: 1マルチプレクサ416を介してドータボードレベルのバスに相互接続されてい る。多重化のために、32ビットのS Aバスおよび32ビットのS Dバスが 四つのLVT162245バスクロスオーバ418によってS ADバスへ多重 化されている。 各ドータボード250は基板番号、製造番号および改訂履歴などの重要なドー タボード情報を格納するための不揮発性部分を備えているSEEPROM420 を含んでいる。SEEPROM420が本当の意味でのJTAGインタフェース を持っていないため、バッファ422を使用して、二つのシリアルプロトコール の間のインタフェースを提供する。 上述のASICの各々は、第5図に示すように位相ロックループ(PLL)ベ ースの「ゲート式」バランスクロックツリー(BCT)設計を使用している。A SICのクロック制御は各基板実装ASICのテストアクセスポート(TAP) モジュー ルとASICクロック/リセット(CLK RST)モジュール602によって 処理される。BCT回路/論理600はクロックトランク604を含んでおり、 これは複数のブランチを有している。これらのうち一つを除くすべてがゲート式 ブランチ606であり、これはCLK RSTモジュールからのイネーブル機能 ASIC CLK ENによって制御されるANDゲート608を含む。第6図 はASIC階層(G1000レベル)でのBCTの接続方法を示す。 無制御ブランチ610はクロックツリーの「自由動作」脚であり、クロックデ スキュー用のPLL612に対する遅延クロック入力をもたらす。PLL612 へ入力されるクロックは遅延セル614を介して渡されるものであり、この遅延 セルはフィードバッククロックを調節して、これらが設定ブランチ長さでの移動 時間遅延を表すようにする。遅延セル614は最長のブランチおよび最短のブラ ンチに対して期待される移動時間ないしブランチ線長が設定ブランチ長さ/時間 に対する許容範囲内にあるように構成/設定されるのが好ましい。それ故、PL Lフィードバックパスは常に活動状態であるから、PLL612はASICの基 準クロック入力CLKとの同期を維持すること ができる。無制御ブランチはLOOPBACK CLK616を、テストクロッ ク(TCK)の同期に使用されるクロックリセット(CLK RST)モジュー ル602へ給送することも行う。 第7図に示すようなPLLモジュールは、上述のBCT ASIC設計を使用 しているすべてのシステムASICに対する共通モジュールである。ATE T EST入力を使用して、VCO論理に対するテストモジュールを制御する。EN 、TSTNおよびIDDTN信号をパッケージ製造テスト中にASICピンレベ ルで制御して、すべてのPLLベースASICがこれらのピンを個別に備えてい るか、あるいはこのピンを他の入力ピンと強要するかするようにする必要がある 。これはピン数を節減する。ATE TEST入力ピンはこれらの信号の共用ピ ンのピンレベルでの制御を可能とするために使用される。たとえば、P1はEN 機能をPI ORDERED OP入力と共用し、IDDTN機能をPI ME D CUSTOMER入力と共用している。 ASICクロック/リセット(CLK RST)モジュール602はASIC 内部リセットおよびクロック信号、ならびに ASIC設計内のF/Fにある種のクロックパルスだけを見せるようにするイネ ーブル機能(ASIC CLK EN)を生成する。第8図に、ASIC内部リ セットおよびクロック生成用の回路/論理のブロック図を示す。各ASIC用の CLKRSTモジュール602は三つのモード、すなわち正規モード、走査モー ドおよびリセットモードのうちの一つで動作する。これら三つのモードの一つに なっていない場合、CLK RSTモジュールは一般に、ゲート式ブランチ60 6内のF/Fにクロックが到達するのをマスクすなわちブロックするように作用 する。 正規モードにおいて、CLK RSTモジュール602はASIC CLK ENイネーブル機能を継続的に生成する。それ故、BCTのゲート式ブランチ6 06におけるANDゲート608はクロックがこれを通過するように構成される 。FATAL IN Nがコンピュータシステム200によってアサートされた 場合には、MC ASIC276(第3図)を除くすべての基板実装ASICに 対するゲート608は、クロックをブロックないしマスクするように再構成され る。本質的に、ASICがFATAL IN Nのアサートを受けるまでは、 ASIC CLKは自由動作をする。走査モードまたはリセットモードになるま で、クロックはブロック/マスクされたままである。 走査モードにおいて、JTAG TAPはASICクロックを制御する。AS IC CLKは80ナノ秒(nsec)ごとに、TCK ENイネーブル信号が TAPによってアサートされた場合にだけ、パルスを発生することができる。走 査モードはリセットモードまたは正規モードをオーバライドする。リセットモー ド時にも、ASIC CLKは80nsecごとにパルスを発生することができ る。これにより基板実装ASICを同期させ、同時にリセットすることが可能と なる。リセットモードは正規モードをオーバライドする。 CLK RSTモジュール602に対するリセットまたは走査入力のいずれか がアサートされた場合、クロックは一般に正規システムクロック(SYS CL K)、たとえば50MHzのクロックからテストクロック(TCK)、たとえば 12.5MHzのクロックへ切り替えられる。しかしながら、MC ASIC2 76に対しては、COLD RESET Nだけがクロックを切り替え、WAR M RESET NがTCKモード に登録され、一回の20nsecのサイクルですべてのフロップに対して設定が 行われることが期待される。 外部リセットがアサートされるTCKサイクルの終了時に、ASIC CLK がSYS CLKからTCKに切り替わるように、クロックイネーブルが生成さ れる。内部リセット信号は外部リセットのアサート後二つのTCKサイクルが行 われるまで、アサートを行わない。外部リセットがアサート解除されると、その 後内部リセットは二つのTCKサイクルをアサート解除する。 TCK ENは走査機能に使用される。これをアサートして、TCKをクロッ クゲート論理へ渡さなければならない。TCK ENはTAPコントローラで生 成される。 それ故、内部フリップ/フロップ(F/F)クロックに影響を及ぼす、クロッ ク動作の三つの基本モードがある。最初のモードは論理F/Fクロックのすべて がCM PLLモジュール内のオンチップ電圧制御発振器(VCO)を使用して 、CLK/CLK N入力クロックと同期させられた場合である。第二のモード はX FATAL IN N入力ピンによって検出されたエラーの検出時に内部 F/Fクロックが停止した場合であ る。これはMC ASIC275(第3図)以外のすべての基板実装ASICに 対して行われる。最後のモードは特定のTAP命令がTAP命令レジスタにロー ドされ、TAPコントローラが「DR取得」および「DRシフト」TAP状態の ときに、内部F/FクロックがTCK入力ピンと同位相でクロックされることと なる場合である。この最後の動作モードはASIC状態を走査初期化または走査 ダンプするのに使用される。 要約すると、クロックツリーの「自由動作」脚によって、システムクロックを 動作させたまま、致命エラーの検出時に内部F/Fクロックを停止でき、かつP LLをASICの基準クロック入力CLKとの同期状態に維持しておくことがで きる。それ故、ASICがその状態に関して走査ダンプされている場合、ASI Cのクロックはコンピュータシステムのクロックと同期していることになる。こ れはこのようなクロック停止/再起動がPLLの再同期を取り、したがってAS IC状態の走査ダンプを防止することを必要とする知られているBCTの設計と は対照的なものである。このような設計はシステムクロックがコンピュータシス テムの他の構成要素(たとえば、マイクロコントローラ300(第3図))、特 に以下で説明するように致命 エラーの受信後にコンピュータシステムを走査診断するために使用される構成要 素へクロック信号を与えつづけることを可能とする。 上述したように、MC ASIC276(第3図)の内部F/FはX FAT AL IN N入力によって停止されない。これは内部F/Fクロックを停止す ることによってマザーボード202に格納されるメモリイメージ(すなわち、メ モリリフレッシュとのインタフェース)が破壊されるからである。メモリイメー ジはオペレーティングシステム(すなわち、DG/UX)のデバッグに必要とさ れるコアをダンプできるように維持される。MC ASIC276は内部F/F クロックを実験室でのデバッグのために停止できるモードをサポートしている。 システム内部での致命エラーの検出を表すX FATAL IN Nの受信時 に、MC ASIC276は現行の動作を打ち切り、メモリ(すなわち、DRA M/SIMM)のリフレッシュを除いてアイドル状態を維持する。MC ASI Cの入力および出力待ち行列はクリアされ、若干の内部状態機械がアイドル状態 にリセットされる。MC ASICはウォームリセットを受け取るまでバス活動 に対して応答しない。ウォームリセ ット後、MC ASICの制御スペースレジスタを読み取って、致命エラーが検 出されたときにセーブされたエラー情報を取得することができる。 MC ASIC276を走査して、致命エラーに関する情報を収集することが できないため、致命エラーが生じたときに現行状態のあるもののコピーをシャド ウレジスタにフリーズする。シャドウレジスタはコピーに過ぎず、これらをフリ ーズすることが正規のASICの挙動に影響を及ぼすものではない。これらのシ ャドウレジスタの多くは制御スペースにアクセス可能である。シャドウレジスタ 内の情報はウォームリセットの間中有効であり、エラーレジスタが特定の制御ス ペースの書込みによってクリアされるまで、変化することがない。マザーボード 202およびドータボード250a、b上の他のASICも内部の若干の状態情 報をフリーズコピーするためシャドウレジスタを含んでいる。 致命エラーがMC ASIC276で発生した場合、MCASICは現在実行 中の動作に関係する内部状態のシャドウコピーをただちにフリーズする。これに より、状態を取得してから、シャドウレジスタのいくつかのレベルを使用せずに 先へ進 むことが可能となる。含んでいる揮発性状態が少ないシャドウレジスタは、MC ASICが生成した致命エラーがシステム致命エラーとしてMC ASICへ 送り返されるまでフリーズされない。 上述したように、また高いレベルの稼働率を維持するために、本発明のコンピ ュータシステム200は冗長システムクロック回路/論理を含んでいる。クロッ ク回路/論理256はシステムクロックとテストクロックを生成し、生成される クロックを監視して、クロック生成および分配回路の障害を特定し、かつ各マザ ーボード202に設けることが好ましい。このような回路と論理が、スペアの製 造および在庫を簡素化するために少なくとも各マザーボード202に設けられる 。特定の実施の形態において、コンピュータシステムクロックとテストクロック はバックプレーンスロット0および1のマザーボードの一方にあるクロック回路 /論理256に供給される。この構成において、スロット0のマザーボード上の 回路/論理は通常、システムクロックとテストクロックを供給し、スロット1の マザーボード上の回路/論理はバックアップクロック源となる。 第9図から第10図には、システムクロックとテストクロッ クを生成し、しかも生成されるクロックを監視して、障害を検出するクロック回 路/論理が示されている。これらのクロックをマザーボード202およびそのJ Pドータボード250a、bに分配する態様を第11図に示す。 クロック回路/論理256は二つの発振器を含んでいる。一次発振器500は 正規のクロックであり、特定の実施の形態においては、100MHzの水晶であ る。他方の発振器、すなわちマージン発振器502は5%早いマージン機構を備 えており、特定の実施の形態においては、105MHzの水晶である。発振器5 00、502の各々は二分割回路504を駆動して、50%のデューティサイク ルのクロック(たとえば、50MHzおよび55MHzのクロック)を生成する 。二分割回路504の出力は、その出力が正規クロック(たとえば、50MHz のクロック)になるように構成されていることが好ましい2:1マルチプレクサ 506に入力される。ただし、2:1マルチプレクサ506はクロックをマージ ン水晶502によって供給することを可能とするものである。 2:1マルチプレクサ506からのクロック、すなわちシステムクロックはE 111 1:9クロックファンアウト回路 508へ供給される。1:9ファンアウト回路508からの出力の一つはE43 1四分割回路510へ給送され、該四分割回路はテストクロック同期信号を形成 するように駆動され、該信号は次いでE111 1:9クロックファンアウト回 路512へ供給される。システムクロック信号およびテストクロック同期信号は 両方ともそれぞれのE111ファンアウト回路508、512を駆動して、シス テムクロック信号およびテストクロック同期信号(バックパネルを横切る)をフ ァンアウトし、すべてのマザーボード202へ分配する。 すべてのシステムクロックは等しい線長ですべてのマザーボード202にファ ンアウトされ、マザーボードにおいて、他のE111 1:9ファンアウト回路 514へ送られる。これらのファンアウト回路は次いで基板実装ASICと、J P、SLCC、EDAC、FPGAおよびその他のTLLクロックを必要とする 要素を駆動するTTLクロックバッファを駆動する。各ASICにおいて、シス テムクロックおよびテストクロックはPLLによって自動的にスキュー解除され るので、すべてのASICにおけるクロック遅延が補償される。TTLクロック バッファはASICと同様、バッファによる遅延ならびにバッ ファ上のエッチおよび負荷の両方を補償するPLLも有している。 同様に、テストクロック同期信号はすべてのマザーボード202へファンアウ トされる。マザーボード上で生成されたテストクロックはテストクロックを必要 とするすべての構成要素へE111 1:9ファンアウト回路512およびH6 41PECL−TTLレベル変換器516を介してファンアウトされる。テスト クロックは走査およびリセット両方の制御に使用され、また基板のリソース部分 を制御するために使用される。 システムクロックは各マザーボード202上でPCIクロックを生成するため にも使用される。これはシステムクロックを二分割回路518へ入力することに よって達成される。PCIクロックは25MHzで動作し、GG ASIC28 0を含むすべてのPCIバス回路へファンアウトするのが好ましい。GG AS IC280は25MHzのクロックをASICCLK(システムクロックのAS ICの内部バージョン)と同期させて、D入力を内部F/Fへゲートする際に使 用する。これはまずASIC CLKの後縁でクロックし、次いでASIC C LKの前縁でクロックすることによって達成される。 クロック回路/論理256はクロック障害検出回路210も含んでおり、これ は一次発振器500または分配論理からの信号パルスの停止を感知する。検出回 路はスタックハイまたはスタックロー状態などの他の障害を感知することもでき る。クロック障害検出回路520は四つのE431 F/F522a−d、二つ のORゲート524およびE431二分割F/Fを含んでいる。 マージンクロック(たとえば、55MHz)用のE131二分割404からの 出力はE431二分割F/F526にクロック入力を与える。E431二分割F /F526からの出力はE431F/F522a−bのうち二つに対してクロッ ク入力を与える(すなわち、F/Fを設定する)。マザーボードレベルのクロッ クもこれら二つのE431F/F522のリセットに給送される。このようにし て、一次発振器500の障害(たとえば、出力なし)により、F/Fリセットの 障害がアサートされる。 ORゲート524および残っているE431F/F522c−dはE431二 分割526および最初の二つのE431F/F522a−bからの出力に相互接 続されて、一次水晶400 からのシステムクロックの生成に障害があった場合に、第三のE431F/F5 22cが障害を表す出力をもたらすようになる。第四のE43IF/F522d はバックアップマザーボードのクロック回路/論理256、すなわちスロット1 マザーボードの強制選択を行うバックパネルへの出力を生成する。 バックプレーンのスロット0または1いずれかにあるマザーボードはクロック 源を正規クロック源(すなわち、スロット0のマザーボード上の回路)からバッ クアップクロック源への切替えないし再指定を行うことができる。これはバック パネル上のワイヤすなわちPECL MUX SEL OUTワイヤのアサート によって達成される。クロック源はバックアップクロックへ切り替えられ、診断 マスタとして指定されたマザーボード上のリソース部分がシステムがCOLD RESET Nを通るようにする。 バックアップクロックが選択されると、クロック障害検出回路520はバック アップクロック回路/論理によってクロック源の監視を継続する。PECL M UX SEL OUTがアサートされている際に障害が特定された場合には、エ ラーを検出した各マザーボード202上のマイクロコントローラ300 は基板ASICのすべてにあるTNピンを活動化する。これはASICの出力を 三状態化し、長時間のバス競合による部品の損傷をなくする。コンピュータシス テム200にあるマザーボード202が一枚だけであり、クロックが故障した場 合には、クロック障害検出回路520がTNピンを活動化させ、これによって基 板の構成要素を保護する。マイクロコントローラ300がクロック源を正規クロ ックからマージンクロックへ切り替える機能を有しているため、マザーボード2 02をマージン速度でオンラインに戻すことができる。 本発明のコンピュータシステム200はシステムを構成している基板、基板実 装チップ、バス、ブロワおよび電源を走査して、アプリケーションのロード前に 、システムの完全性および動作可能性を確認することができる。このような走査 はシステムに電源が投入された場合、およびシステムが致命エラーを検出した後 で行われる。走査動作は障害を自動的に検出し、障害を少なくともFRUに自動 的に分離し、システムを自動的に構成解除して、分離された構成要素/FRUを 論理的および機能的に除去することを含んでいる。システムが構成解除された後 、システムは自動的にリブートされ、アプリケーションプログラ ムを再ロードする。このようにして、システムはシステムが障害事象を被った後 で、ユーザまたはサービス担当員の介入を必要とすることなく、システムを自動 的に回復することができる。 基板実装ASICおよび基板は統合JTAG IEEE1149.1テスト論 理によって設計されているので、テストパターンを一つの装置へシフトし、論理 基板へ駆動し、他の装置で取得することができる。このようにして、基板の相互 接続を確認できる。適正な構成要素の選択および適正な装置の挿入を検証する規 格も設けられている。コンピュータシステムはIEEE規格の境界走査および全 走査両方のインプリメンテーションを実施する。 第12図には、コンピュータシステムの一部に対する走査チェーンおよび関連 する論理、特にバックプレーンのスロット「0」に配置されているマザーボード 202に対するものが示されている。他のバックプレーンスロットにあるマザー ボードに対する走査チェーンは、そのマザーボードによって走査されるべき構成 要素(たとえば、基板/基板レベルの構成要素および電源)に基づいて確立され る。走査チェーンは基板および基板実装ASICのテストの基礎として使用され る。基板レベル の開口、隣接するピンのブリッジ、適切な構成要素の選択および挿入は1149 .1境界走査によってテストされる。 各マザーボード202はリセットの生成、走査ベースの電源投入時相互接続テ ストおよびASICテストを担うマイクロコントローラ300を含んでいる。マ イクロコントローラ300はリソースバスをRI ASIC306と共用してい る。リセットが初めて適用された場合、マイクロコントローラ300はRI A SICにリソースバスをオフにさせるRI ASIC306に対して信号をアサ ートする。マイクロコントローラ300はバスをテストし、走査ベースのテスト にテストバスコントローラ(TBC)700を使用することができる。電源投入 時相互接続テストおよびASICの走査ベーステストに引き続き、マイクロコン トローラ300はRI ASIC306に対して制御信号をアサート解除して、 RI ASICがリソースバスおよびこれに関連する装置に対する正規のシステ ムアクセスを行うことを可能とする。 走査チェーンはコンピュータシステム内のすべての基板および基板実装ASI Cを特定するために使用される。具体的にいうと、各マザーボード202および 関連するJPドータボード 250の存在が検出され、基板の製造番号およびシステムIDが走査によって読 み取られる。また、ASICの部品番号と改訂番号が走査により電源投入時に読 み取られる。EEPROMおよびSEEPROMに対して、バッファが含まれて いるので、走査プロセス中に情報を抽出することができる。 走査チェーンは電源210a−cおよび冷却ブロワ212との通信にも使用さ れる。電源状態機能、たとえば電源オン、過剰温度、過剰/不足電圧、および使 用不能、ならびに制御機能、たとえば障害マスクおよび使用不能も走査によって 実行される。ブロワ状態、たとえば高速、低速、周囲過剰温度、電源オフならび に制御、たとえば障害マスク、スピードアップ、使用不能が走査によって伝えら れる。 走査インタフェース部分はテストバスコントローラ(TBC)700、すなわ ちTIが市販している在庫品部品番号74ACT8990である(Texas Instrumentsの「Advanced Logic and Bus Interface Logic Databook 」、1991年も参照され たい)。TBC700は1149.1コントローラとして機能し、パラレルデー タがTBCに対して読み書きされ、 シリアル1149.1データが生成され、受信される。TBCは各マザーボード のローカルリソース260に常駐している。マイクロコントローラ300はTB C内部のレジスタを使用して、システム走査動作を実行する。 走査動作を実行するために、マイクロコントローラにロードされたPROMコ ードはTBC700内部のレジスタにアクセスする。目標基板、目標装置、およ び実行すべき動作を指定するために、データが伝送される。動作は走査チェーン シフト動作、ループバック動作、および判明した場合の他のものからなる。 TBC700はアドレス可能シャドウポート(ASP)を使用して、システム 内の基板走査チェーンの一つまたは全部を選択し、これと通信する。各ASPは ハードワイヤされたノードアドレス入力信号を有しており、この信号はASPが そのローカルチェーンに送られたメッセージを区別するのを可能とする。ノード アドレス入力は、マザーボードのバックパネルコネクタにハードワイヤされた「 ノードID」に基づいている。希望する場合には、マスタTBCがシステム内の すべての基板走査チェーンと通信できるようにする「ブロードキャスト」アドレ ス を使用することができる。ASPプロトコルの詳細は「A Proposed Method of Accessinthe 1149.1 in a Ba ckplane Environment 」、Lee Whetsel、Int ernational Test Conference、 1992年に記載 されており、その教示は参照することにより本明細書の一部となる。 PALである診断バスインタフェース(DBI)はTBCをバックパネルDバ ス208およびASPとインタフェースさせる。DBIのジョブは三つの動作モ ード、すなわちローカルモード、リモートモード、および製造テストモードを可 能とすることである。 ローカルモードにおいて、TBC700からのデータはローカル走査チェーン へ直接送られ、ローカル走査チェーンからのデータはTBCへ直接送られる。D バス206がローカル走査動作によって妨害されることはない。それ故、マザー ボードはローカル走査モードにおいて、並列にかつ同時に動作できる。これらの 同時走査動作は電源投入時テスト中に行われる。 リモートモードにおいて、TBC700からのデータはDバ ス206へ送出され、Dバス上のデータはTBCへ戻される。ローカル走査チェ ーンはASP部分を介してDバス206にも接続されている。これにより、TB C700がそれ自体だけではなく、システム内の任意のマザーボードもアドレス 可能となる。TBC700によるDバス206上へのアドレスのブロードキャス トが基板のハードワイヤアドレスまたはブロードキャストアドレスと一致した場 合、ASPはローカル走査チェーンをDバスへ接続する。 製造テストモードにおいて、Dバス206はローカル走査チェーンに直結され 、TBC700およびASPは使用されない。このモードにより、製造部門がテ ストベクトルをバックパネルDバス信号を介してローカル走査チェーンへ直接適 用することが可能となる。現在の走査動作に関係ないものはバイパスモードとし てもかまわない。 マスタマイクロコントローラはTBC700およびDBIを使用して、バック パネル診断バスDバス206で通信を行い、また他のマザーボード上のDBI/ ASPと通信を行う。マスタTBCは「選択」プロトコルを伝送して、選択した 基板のスレーブDBIに接続されたASPをアドレスし、使用可能とす る。選択されると、マスタおよびスレーブは「接続」され、マスタTBCは標準 IEEE1149.1プロトコルを使用して、リモート基板上で走査動作を透過 的に実行することができる。 Dバス206は四つの標準IEEE1149.1信号(TCK、TDI、TD OおよびTMS)および「診断割込み要求」信号DIRQ Nからなっている。 システム電源投入時に、診断マスタ権を決定するのにDIRQ Nが使用される 。正規のシステム動作中に、DIRQ Nはマスタマイクロコントローラに割込 みをかけるために電力システム構成要素によって使用される。 いくつかのIEEE1149.1機構は信号がスタックした場合に、テスト回 路が正規のシステム動作を妨害しないようにするのを助ける。論理レベルを選択 して、ドライバが破壊された場合に、信号がテストインタフェースを「テスト論 理リセット」モードにするレベルへ浮動するようにする。テストインタフェース がリセットされると、テスト論理が開始状態にされる。「Dバス駆動」LEDも 各マザーボードに含まれており、ある種のDバス障害を分離するのを援助する。 このLEDは基板のDBIがいずれかのDバス出力を駆動しているときに点灯す る。 DIRQ N Dバス信号はいくつかの機能を果たす。上述したように、これ は電源投入時に診断マスタ権を判定するために使用される。 正規のシステム動作中に、DIRQ N信号を電源210またはブロワ212 が使用して、マスタマイクロコントローラの注意を引く。装置は障害状態を検出 すると、DIRQレジスタビットをセットし、割込みがバックパネルDバス20 6上のDIRQ Nを駆動することによってマスタマイクロコントローラへ送ら れる。マスタマイクロコントローラは次いでDMのマザーボードおよびRI A SIC306上の正規のマザーボードレベルのバスを介して、TBC700にア クセスしようと試みる。 マザーボードレベルのバスが正常に機能している場合には、マスタマイクロコ ントローラはそのマスタTBC700に正常にアクセスすることができる。マス タマイクロコントローラはコンピュータシステム200内のスレーブDBIの走 査を開始して、どの装置がDIRQ Nをアサートしたかを判定する。装置のD IRQレジスタビットがアサートされたと判明した場合には、これはクリアされ 、装置に対するサービスが行われる。 ハード障害がマザーボードレベルのバスで生じた場合には、DMはマスタTB Cまたはこれもローカルリソース260にあるウォッチドッグタイマ(WDT) にアクセスできない。この場合、DIRQ Nは受け入れられないほど長時間D バス206上でアサートされたままとなり、コンピュータシステムはハングする 。ハードウェアWDTタイマがタイムアウトすると、NMI、ウォームリセット 、および最後にコールドリセットが正常に呼び出され、ハングが解除される。コ ールドリセットに関連する電源投入確認テスト中に、ハード障害は分離され、新 しい診断マスタを選択することができる。 上述したように、高い稼働率を与えるために、コンピュータシステムの電源シ ステムは(N+1)冗長構成として設計されている。マザーボードの対が三つの 電源210a−cを共用している場合、必要なものは二つだけである。単一のマ ザーホードは二つの電源を使用しているが、必要なものは一つだけである。各電 源は74BCT8373走査可能ラッチ部分を特徴としており、これは二枚の関 連するマザーボードのうち一枚にあるローカル走査チェーン702によってアク セスされる。障害状態をスキャンアウトすることができ、制御コマンドをスキャ ンインすることができる。電源210a−cを遅延後に使用不能とすることがで き、DIRQをマスクすることができる。 PIバスの電気特性がマザーボードを左から右へ差すことを指示しているため 、偶数のスロット番号のマザーボードが、(最大)三つの電源210a−cによ って電力が供給される偶数/奇数マザーボード対の、たとえばスロット0に常に 存在している。したがって、偶数のスロット番号のマザーボードのローカル走査 チェーンが、マザーボード対用の電源との通信に常に使用される。 電源との通信に加えて、マスタマイクロコントローラのマザーボード上のロー カル走査チェーンが、三つのブロワ212およびシステムIDバッファとの通信 に使用される。システムIDはバックパネルのソケットに差し込まれているSE EPROM部分204に格納されている。SEEPROMはシステム履歴情報を 格納するのにも使用される。 コンピュータシステム200のブロワ212も(N+1)冗長として構成され ている。三つのブロワが設けられているが、必要なものは二つだけである。マス タマイクロコントローラのマザーボードのローカル走査チェーン704はコンピ ュータシ ステム200の三つのブロワと通信する。ブロワに設けられている二つの主機能 は、ブロワの障害の通知とブロワ速度の調節である。 ブロワの障害が発生すると、ブロワインタフェースの回路が障害を検出し、I EEE1149.1走査可能レジスタにビットをセットする。回路はブロワの個 別のDIRQレジスタビットもセットし、このビットはバックパネルDIRQ N信号をアサートさせる。この場合、これは電源について上述したように、マス タマイクロコントローラによって処理される。ブロワの速度はブロワインタフェ ース基板上の走査可能レジスタ部分によって調節することができる。 特定の実施の形態において、基板実装ASICの設計に関する本発明の走査テ ストスーツはシナプシステストコンパイラを使用することを含んでいる。コンパ イラは六種類の走査方式、すなわち多重化フリップフロップ、クロック式走査、 シングルラッチLSSD(レベル感応走査設計)、ダブルラッチLSSD、クロ ック式LSSD、および補助クロックLSSDをサポートしている(その教示が 参照することによって、本明細書の一部となる「Scan Methodolo gies 」、 Marshall Wordも参照)。好ましい実施の形態においては、多重化 フリップフロップ方式が使用される。多重化フリップフロップが正規のシステム クロックを使用しているため、テストアクセスポート(「TAP」)は各ASI C内のシステムクロックイネーブルを制御する。 本発明のすべての基板実装ASICはIEEE1149.1に準拠しており、 TAPならびに関連するピンTCK、TMS、TDI、およびTDOを含んでい る。各マザーボード上のすべてのASICおよびその他の1149.1構成要素 は単一の論理1149.1チェーンに組み込まれている。TDIおよびTDO信 号はある装置から他の装置へカスケードされ、必要な信号TCKおよびTMSが 適宜バッファされる。 コンピュータシステムのすべての1149.1準拠装置は境界走査レジスタを 含んでいる。これは正しい部品が基板に適正に挿入されていることを確認するハ ードウェア支援手段を提供する。さらに、これはI/Oドライバ、境界走査セル および部品内のボンディングワイヤが適正に機能していること、ならびに部品間 の基板のエッチが完全であることを確認する。 各基板実装ASICは装置識別レジスタ、たとえばIEEE 1149.1規格の32ビット「装置識別レジスタ」を含んでいる。各基板実装 ASIC用の装置IDレジスタは部品を識別する(たとえば、DG部品、DG部 品番号の何らかの派生物として)一意のコードおよびASICの改訂番号を含ん でいる。基板実装ASICのうち少なくともあるものはTAPによってアクセス される設計固有のテストデータレジスタ(TDR)を含んでいる。 基板実装ASICは全走査を行って、ASIC内のすべての論理フリップフロ ップが走査できるようにするようにも設計されている。この特徴は致命エラー後 の機械状態を走査アクセスできること、およびチップテスト時の対象範囲の改善 をはじめとするいくつかの利点を提供する。全走査TDRはASICに埋め込ま れている全走査回路にアクセスする。 専用TDRがASICならびにこれが制御している回路(もしあれば)内のハ ードウェア検出エラーの制御および状況を与える。各ASICのエラー状況TD Rは論理1にアサートされた場合に、ASICが現在そのFATAL OUT N信号を駆動していることを示す読み書きビットも有している。外部信号はアク ティブロー(論理0)であり、ORB ASICに対 して駆動されており、そこで他のASICの致命信号を組み合わされ、システム 全体に分配される。 エラーマスクTDRはASICが検出した各エラーに対して1ビット、FAT AL OUT Nに対して1ビットを含んでおり、「1」はエラーアウトをマス クする(通常、レジスタにはすべて「0」が書き込まれている)。各ASICの エラーマスクレジスタは各エラーのマスクに対するビット位置がエラー状況レジ スタ内のビット位置に対応するように設計されている。エラー強制TDRはAS ICが検出した各エラーに対して1ビットを含んでいる。このレジスタの論理「 1」はASICにそのタイプのエラーを生成させる(通常、レジスタはすべて「 0」を含んでいる)。 各エラーに対する状況ビットは読み書き、アクティブハイであり、アサートさ れた場合に、エラーが検出されていることを示す。したがって、このビットの「 0」はエラーが検出されていないことを示し、エラー状況TDRから「すべてゼ ロ」を読み出すことはエラーが検出されていないことを示す。 以下で、走査チェーンをコンピュータシステム200のテストに関連して使用 する方法を説明する。停電リセットのアサー ト解除に引き続き、各マザーボード202上のマイクロコントローラ300はリ ソースバスおよび関連するDBIの制御を引き取り、その後、そのマザーボード に対する走査環境を制御する。まず、マイクロコントローラ300はリソース部 分をテストして、その完全性を確認する。次いで、マイクロコントローラ300 はTBCを使用して走査環境を初期化して、1149.1装置内のすべてのTA Pコントローラをテスト−論理−リセット状態にする。TMSを少なくとも5T CKサイクルの間論理1にする。 次に、マイクロコントローラ300はマザーボード上の相互接続テストを実行 し始める。これはオンボードEEPROM302に格納されているテストベクト ルを取り出し、ベクトルをDBIを介して適用することによって行われる。これ らのテストの失敗をコンソールメッセージにより、また基板上の障害LEDを点 灯することによって報告することができる。 最後に、マイクロコントローラ300はTBC700を介して基板実装ASI Cにテストベクトルを適用することによってASICテストを実行する。これら のテストベクトルはEEPROM302にも格納されている。テストのこの段階 が完了す ると、マイクロコントローラ300はリソースバスの制御を放棄し、正規のプロ セッサ要求がRIから入れるようにする。 各マザーボード用のマイクロコントローラはTAPコントローラを再度テスト −論理−リセット状態にすることによって、コンピュータシステムのサイジング を開始する。この状態において、TAPコントローラはIDCODE命令(ID CODEがサポートされていない場合には、BYPASS)を1149.1命令 レジスタにロードする。IDCODE命令により、装置IDレジスタが各装置の TDIピンとTDOピンの間に接続される。BYPASSは単一ビット(「0」 )の「バイパス」レジスタを選択する。装置IDレジスタは長さが32ビットで 、「1」から始まる。これらのビットの定義により、複数の装置からのビットス トリームが装置IDに関して分析される。 TBC700は走査パスリンカ(SPL)装置または走査ブリッジを使用して 、対応する任意選択のTDI/TDOチェーンをマザーボード202用の主TD I/TDOチェーンに多重化する。SPL装置は「基板存在」信号に接続できる パラレル入力信号を特徴としている。マイクロコントローラはこれらの信号を読 み取り、該当するJPドータボード走査チェーンを接 続することができる。JPドータボードチェーンが接続されていることを確認す るのには、さまざまな方法がある。マイクロコントローラがチェーン上のすべて の装置から装置IDレジスタを読み取った場合、JPドータボード上だけに存在 していることが分かっている装置が存在しているかどうかを判定したり、あるい は単に走査された装置の数をカウントすることができる。いずれの方法も任意選 択の装置が存在していることを判定できる。ハードワイヤ構成要素および任意選 択のカード構成要素の配列は任意選択のカードの位置が確実に判定できるように 選択される。 I/Oドータボード(たとえば、PCI拡張カード282)をPCIチャネル を装置に対してポーリングすることによって検出できる。マイクロコントローラ は次いで、I/OドータボードをTDI/TDOチェーンに多重化するべきかど うかを決定できる。 各マザーボード202はドータボードのオプションを調べ、すべてのASIC の改訂を調べることによってそれ自体のサイジングを行う。マイクロコントロー ラはサイジング情報を簡潔なフォーマットでアクセスが容易なオンボード位置、 たとえば ローカルリソース260のRAMに一時的に格納することができる。DMはこの RAMを後で読み取って、全体的なシステム構成テーブルを構築することができ る。 マスタマイクロコントローラから離隔したマザーボードが存在しているかどう かを判定するために、マスタマイクロコントローラはASP「選択」プロトコル をマザーボードのアドレスに対して伝送する。ASP「確認」応答を受信した場 合には、遠隔マザーボードが存在しており、マイクロコントローラはそれとの通 信を開始することができる。確認応答を受信しなかった場合には、アドレス指定 されたマザーボードがシステムに存在しないと考えられる。このアドレスとの以 降の通信は試みられない。 スロット0/スロット1のDBIを通じてだけ利用できる装置も、マザーボー ドを任意選択のドータボードに対してサイジングするのと同じ態様でサイジング できる。バックパネルのSEEPROMは常に存在していると判断されなければ ならない。存在していない場合には、切れ目がSEEPROM構成要素の位置に あるチェーンで検出され、SEEPROMには見つからない旨が報告される。各 ブロワまたはすべてのブロワはスロッ ト0/スロット1のDBIの任意選択のTDI/TDOチェーンの一つに接続さ れる。この時点でのサイジングプロセスは専用診断ハードウェアだけを使用する ことに留意するのが重要である。PIアレイなどの「正規」のシステム論理はこ の段階のサイジングには関与しない。 上述したように、コンピュータシステム200は障害を少なくともFRUに分 離してから、FRUをシステムから構成解除、すなわち機能的論理的に除去する ように設計されている。論理の一部を構成解除するには、1149.1任意選択 HIGHZ命令を呼び出し、また、使用されている場合には、この命令はすべて の出力を高インピーダンス状態にする。あらゆる基板実装ASICがこの命令を 実施しているため、動的に再構成可能なユニット(「DRU」)の細分性が達成 される。 JPドータボード250を構成解除するには、CI ASIC414およびこ れに実装されているTLCC ASIC408をHIGHZモードにする。ある いは、JP250をCI414内の制御レジスタによってリセットしてもよい。 マザーボード202を構成解除するには、すべてのPI ASICをHIGHZ モードにする。マザーボードがその上にI/O装置も有し ているため、I/OバスをGG ASIC280内の制御レジスタによって使用 不能とする必要がある。 電源投入プロセス中に、基板実装ASIC(たとえば、PIASIC290) を走査プロセスによって初期化する。電源投入時テストプロセスの後の段階にお いて、IDおよびメモリ範囲が制御スペース書込みによってASICにロードさ れる。 上述したように、EEPROM302はマイクロコントローラ300およびJ P250、特に診断マスタとして指定されたJPおよびマスタマイクロコントロ ーラとして指定されたマイクロコントローラに対するファームウェアを含んでい る。マイクロコントローラ用のファームウェアは電源投入時テスト、走査テスト 、エラー処理、実行時のシステムスニッフィング、システム致命エラーが生じた ときのエラー状態走査を含んでいる。JPファームウェアは電源投入時テスト、 XDIAGテスト、製造モードテスト、およびエラー処理を含んでいる。 マイクロコントローラ300はファームウェア診断に使用されるコンピュータ システム200のハードウェアの最初の部分である。これはコールドリセットか ら始まり、それ自体およびリソースをテストすることができるのに対し、システ ムの他の 部分はウォームリセットに維持されている。システム内のすべての走査可能構成 要素についてJTAG境界走査を開始し、内部走査状態も初期化する。分離可能 性を高い水準に維持するため、システムのすべての他の部分を個別の態様でリセ ットさせることを担う。基板ごとの電源投入時テストを監視し、ウォッチドッグ タイマ(WDT)機構を制御し、EEPROMのフラッシングを処理する。実行 時に、オペレーティングシステムが起動すると、マイクロコントローラ300は スニッフィングタスクを行って、システムの動作が依然適正に機能していること を確認する。 マイクロコントローラ300によって行われる電源投入時テストの一覧表を、 第13A図および第13B図に示す。電源投入時に各マザーボード200上の各 マイクロコントローラ300によって実行される事象の順序は次のとおりである 。 各マイクロコントローラ300はほぼ同時にリセットされている。各マイクロ コントローラは次いで、そのオンチップEEPROMのチェックサムを取り、オ ンチップSRAMに対するそのアクセスをテストする。エラーとしてのIPが検 出され、マイクロコントローラは一般エラー処理機能を実行する。リソ ースバスLEDを設定して、障害の指示を行わせる試みも行われる。マイクロコ ントローラは次いで、STOP命令を実行する。 各マイクロコントローラはそのオンチップハードワイヤモジュールを初期化す る。そのオンチップUARTが初期化されると、コード改訂情報とマイクロコン トローラのリセットの原因が、個々の補助コンソールへ出力される。 各マイクロコントローラはリソースバスハードウェアの次の部分に対してオン ボード診断を実行する。TBC700、SRAM、EEPROM302、NOV RAM/RTC、DUART、LSM、RSM、P555、GMおよびクロック 。基板0のDUARTテストが実行されると、基板0のマイクロコンピュータ3 00はメッセージをシステムコンソールへ出力する。スロット1のマイクロコン トローラ以外のすべてのマイクロコントローラはそのリソースバステストスィー トの初期にDUARTをテストする。スロット1のマイクロコントローラはその テストスィートの後の段階でDUARTをテストする。このことはスロット0と スロット1がシステムコンソールへの書込みを行い、DUARTをフィードバッ クするときの外部ループバ ック衝突を防止する。 これらの構成要素のエラーないし障害はマザーボードにとって致命的であると みなされ、基板の構成解除を生じる。以下で、障害が検出されたときに基板上で 生じる構成解除プロセスを説明する。 エラーが検出されると同時に、一般エラー処理機能が実行される。エラーコー ドが補助コンソールへ出力され、障害を示すためにリソースバスLEDを設定す る試みがなされる。 障害情報(エラーコード、テスト/サブテスト、スロット、およびFRU/サ ブFRU)をNOVRAMエラーログに書き込む試みがなされる。システムがコ ールドリセットに保持されており、かつ走査テスト/初期化が実行されていない ため、この情報にシステムJPがアクセスすることはできない。 メッセージがオンボードの走査可能なメールボックスにおかれて、エラーを受 け取ったマスタマイクロコントローラを通知する。このメッセージの内容は致命 マザーボード構成解除エラーが生じたことを述べているだけのものである。メー ルボックスへの書込みの試みが失敗した場合には、デフォルトのマスタマイクロ コントローラ、すなわちスロット0のマイクロコント ローラがすべての人のスキャンボックスを結局ポーリングするのであるから、こ のことも有効な情報である。マザーボードに壊滅的な障害が生じたことを示すの に十分なRESET状況を、違反したマザーボードのメールボックスで見つけ出 す。現行のデフォルトマスタマイクロコントローラでエラーが生じた場合には、 同じステップが行われる。結局、走査メッセージもDUARTループバックトラ フィックも受信せずに二次マスタマイクロコントローラがタイムアウトし、シス テムに関するマスタ権を引き継ぐ。 最後に、マイクロコントローラはSTOP命令を実行し、この状態の間、マザ ーボードはコールドリセットに保持される。STOP命令を実行させるのではな く、マイクロコントローラをアイドルループに保持する試みがなされる。このよ うにして、NOVRAMエラーログを電源投入プロセスの後の段階で、診断マス タJPによって潜在的に読み取ることができる。 コールドリセットはシステムおよび各スロットについてアサート解除され、各 マイクロコントローラはスロット内サイジング情報を判定し、かつインスロット 走査テストを実行する。この時点で、三つのNOVRAMテーブルの最初のもの 、すなわ ち各マザーボードの物理的ハードウェアを記述したテーブルが構築される。イン スロットサイジングは電源およびブロワに対するSB1およびSB2走査ブリッ ジをバイパスするが、これはこれらがオフボード走査テスト中にマスタマイクロ コントローラによってテストされるからである。インスロット走査テスト中にエ ラーが検出された場合には、下記を除いて構成解除するために、上記で概説した ステップにしたがう。 走査テストはオンボードマイクロコントローラ診断テストと異なり、失敗した 場合に、マザーボードの構成解除を必要としない。たとえば、いずれかのドータ ボード個有テストが失敗した場合、そのドータボードだけを構成解除することが 必要である。しかしながら、いずれかのマザーボード個有テストが失敗した場合 には、そのマザーボードが構成解除される。マザーボード/ドータボード相互接 続テストが失敗した場合には、ドータボードまたはマザーボード全体のいずれか が、テストによって与えられている分離の程度に応じて構成解除される。走査テ スト(たとえば、TAPIT中のJP0ドータボードの)中にFRUが不良であ ると判定された場合には、これがただちに構成解除され、したがって、走査テス トの他の部分についてはバ イパスされる。すべての個有エラー情報、ならびにオンボードサイジング情報は 各マザーボードのNOVRAMにローカルに維持される。 オンボード走査テストが完了するか、マザーボードが走査テスト中にいずれか の点で不良であると判定された場合には、メッセージが走査可能なメールボック スに入れられて、走査テストの結果に関してマスタマイクロコントローラに通知 される。このメッセージの内容は致命マザーボード構成解除エラーが生じたこと 、あるいはマザーボードがテストに合格したことを述べているだけのものである 。合否メッセージはデフォルトのマスタマイクロコントローラの位置であるスロ ット0のマザーボード用のマイクロコントローラのメール/スキャンボックスに も入れられる。スロット0のマザーボードの障害の場合には、スロット1のマザ ーボードが結局タイムアウトし、マスタ権を引き受け、スロット0のマザーボー ドのスキャンボックス情報へのアクセス権を取得する。 マイクロコントローラはDIRQ Nをアサート解除して、マスタマイクロコ ントローラとの同期を取り、それぞれの走査可能なメールボックスからの他のコ マンドを待つ。マスタマイ クロコントローラが次いで選択される。このようなマスタの目的は一つのマスタ コントローラだけがシステムサイジング情報を収集し、アウトオブスロット走査 テストを実行できるようにすることである。さらに、マイクロコントローラは以 前のテスト障害のため、ならびにスロットハードウェア構成の違いのため同期し なくなる。システム内のすべてのマイクロコントローラを同期させるのは、マス タマイクロコントローラの仕事である。スロット1のマザーボード土のマイクロ コントローラがマスタマイクロコントローラとして選択された場合、この時点以 降、マスタマイクロコントローラはデフォルトのものではなくなる。 マスタマイクロコントローラは他のマザーボード上のマイクロコントローラが インスロット走査テストを完了するのを待つ。これはすべてのマイクロコントロ ーラに走査動作の開始前に、まずDIRQ Nをローにさせることによって達成 される。各マイクロコントローラは走査テストを完了すると、それぞれのDIR Q Nを個別にハイにする。マスタマイクロコントローラはそれ自体のテストを 完了すると、DIRQ Nラインを監視し、DIRQ Nラインがハイになると 、すべての走査テス トが完了したことがわかる。すべてのマイクロコントローラはこの時点で同期し ていなければならない。 マスタマイクロコントローラは次いでコンピュータシステムのサイジングを行 って、どの基板が存在しているのかを判定する。サイジングの一部として、各マ イクロコントローラの走査可能なメールボックスをマスタマイクロコントローラ によってポーリングして、リソースバスまたはオンボード走査の障害があったか どうかを判定する。マスタマイクロコントローラ権が移された場合には、メイル ボックスの内容はそのまま残され、待機している要求は確認されないまま残され 、これらのステップを繰り返さなければならない。メイルボックスの情報は各基 板に対する障害を生じたマザーボードの状況を示すか、あるいは移転の指示を示 す。スキャンボックスに指示(すなわち、リセット値)が存在しない場合には、 マザーボードに障害があると想定する。障害が存在している場合には、関連する マザーボードがオフボード走査テストから除外される。この時点で、SEEPR OMシステムバックパネルIDテストが行われ、SEEPROMからのデータを 使用して、マスタマイクロコントローラは三つのNOVRAMテーブルのうち第 二のものを構 築する。このテーブルは前回システムに電源を投入したときのシステムハードウ ェアが何であったかを示すSEEPROMサイジング情報を含んでいる。ミッド プレーンSEEPROMは「診断マスタ」JPが選択されるまで、新しい構成デ ータによって更新されない。 マスタマイクロコントローラは電源テスト、ブロワテスト、およびバックパネ ル相互接続テストを含む、残りのオフボード走査テストを実行する。以前のテス トの結果として構成解除されたマザーボードはバックパネル相互接続テストには 含められない。オフボード走査テストが成功した場合には、その旨のメッセージ がスロット1のマザーボードのメールボックスに入れられる。ここでアイドルル ープに入っているスロット1のマザーボードのマイクロコントローラはフィード バックDUARTを介してシステムコンソールへ送られた特別な印刷不能文字、 ならびにこの走査可能なメールボックス内の状況メッセージを定期的に調べる。 このDUART文字は走査メッセージが送られるのと同時に、すなわちオフボー ド走査テストが完了した直後に、スロット0のマザーボードによって発行される 。 マスタマイクロコントローラがスロット1のマザーボードで ある場合、上述のメッセージバッファおよびDUART検査は実行されない。オ フボード走査テストがスロット0のマザーボードに起因する態様、または分離で きない態様で失敗し、現行のマスタがスロット0のマザーボードである場合、マ イクロコントローラのマスタ権が走査可能なメールボックスを介してスロット1 のマザーボードへ渡される。これは二つの事例の第一のものであって、タイムア ウト機構を省いて、マスタ権がスロット0のマザーボードによって直接渡される 。オフボード走査テストが他のマザーボードに起因する態様で失敗し、現行のマ スタが基板0である場合には、問題を起こしたマザーボードが構成解除され、マ スタ権は基板0によって保持される。 オフボード走査テストが失敗し、現行のマスタが基板1である場合には、スロ ット1のマザーボードが必要なステップを取って、障害によって示されるすべて の問題を起こしたマザーボードを構成解除する。エラーがスロット1のマザーボ ードに起因する場合には、致命システムエラーが生じる。上述のいずれかの理由 でマスタ権がまだ渡されていないと想定して、DUARTおよびメッセージ移転 プロトコルはスロット0のマザーボードから走査テスト障害を検出する代替手段 を提供する。スロ ット1のマザーボードがいずれかの形態の通信を受け取らず、まだマスタになっ ていない場合には、指定されたタイムアウト期間後に、マイクロコントローラの マスタ権を引き継ぎ、マスタマイクロコントローラの上述の動作を行う。 スロット0のマザーボードが自己オフボード走査テスト障害または非属性オフ ボード走査テスト傷害を受けた場合には、エラーがそのNOVRAMにログされ 、マスタ権が渡される。しかしながら、オフボードテストを行えることを除いて 、良品の基板であることが今までのところ判明しているため、マザーボードは構 成解除されない。本来また当然、これがシステム走査機能を実行することを担っ ていない限り、システムの残りの部分に脅威とはならない。スロット1のマザー ボードは引継ぎを行った場合に、すべてのオフボードリソースにアクセスするの に何の問題もないことを証明するためだけに、スロット0のマザーボードがどれ くらい離れているかに関わりなく、オフボード走査テストをもっとも先頭から開 始しなければならない。スロット1のマザーボードがスロット0のマザーボード で問題を検出した場合には、スロット0のマザーボードが構成解除される。問題 が見つからなかった場合には、スロット0のマザーボ ードの問題はそのオフボード走査ハードウェアに起因するものである。テストを 継続した場合に他のことが明らかとならない限り、これは良好なシステムボード である。 構成解除するために、マスタマイクロコントローラは走査可能なメールボック スを介してコマンドを発行する。構成解除メッセージを受信することにより、問 題を起こしたマザーボードはNOVRAMテーブルに保管されている現行の基板 状況のローカルコピーを更新する。 マスタマイクロコントローラは走査可能なメールボックスを介して、あらゆる マイクロコントローラにシステムおよびスロットの両方に対してウォームリセッ トをアサート解除するように伝え、JPSをリセットから解除し始める。すべて のマイクロコントローラはこの時点で同期していなければならない。各マザーボ ードのマイクロコントローラはNOVRAMテーブルに示されている、開始され ようとしているJPテストに構成解除されたドータボードとマザーボードとが含 まれないようにする。上述したように、走査可能なメールボックスはすべて各マ ザーボードの合否の指示を依然含んでいる。ローカルNOVRAMが「診断マス タ」によってアクセス不能であり、それ故、 障害の少なくとも若干の指示を維持している場合、この情報は維持される。 マイクロコントローラは各インスロットJPを一つずつリセットから解除する 。各JPは基本サニティ診断を含んでいる「一次テスト」のスィートを実行する 。マイクロコントローラはインスロットJPによって更新されたオンボードSR AM位置を読み取ることによって、これらのテストの状況を監視する。このよう にして、マイクロコントローラはテストの完了、失敗およびハングを認識するこ とができる。 各マイクロコントローラはインスロットJP(その「一次テスト」を正常に完 了した)を選択して、「二次テスト」スィートを実行する。このテストスィート はメモリおよびI/O初期化/テストという時間のかかる動作を含んでいる。し かしながら、このようなテストを並列に、すなわちマザーボードを横切って行え るようにすることにより、全体的な電源投入時間の短縮が援助される。一次テス トの場合と同様にして、各マイクロコントローラはテスト完了、障害およびハン グを含んでいる。二次テストは少なくとも一つのすべての広範囲のテストを渡す か、すべてのインスロットJPが使い切られるまで、二次テス トが実行される。各マイクロコントローラは次いで、「ボードスレーブ」および 「ボードマスタ」メッセージを、該当するインスロットJPに送る。 マスタマイクロコントローラは上述したDIRQ N機構を介して、すべての JPの「二次テスト」の完了を待機する。マスタマイクロコントローラは次いで 、その基板マスタJPに「三次テスト」を実行するよう伝える。このテストの最 初の部分はマスタがRI/リソースバスパスを介して、各非構成解除マザーボー ドのNOVRAMから広範囲の構成情報を読み取った場合に開始される。この情 報はマスタが三次テストを行うのに必要とされる。このテストスィートはすべて のJPおよびメモリの診断を含んでいる。 テストが成功した場合、「診断マスタ」メッセージがこの基板マスタJPへ送 られる。スロット0のマザーボードで三次テストが失敗した場合には、エラーが NOVRAMにマークされ、システムはデフォルトマスタとしてのスロット1の マザーボードのマイクロコントローラだけを使用して再び電源投入を試みる。ス ロット1のマザーボードも三次テストに失敗した場合には、致命システムエラー が生じる。いずれかのマスタが三次テ スト中に他のマザーボードで問題を検出した場合には、これらの障害を起こした マザーボードが構成解除される。「診断マスタ」が最終的に選択されると、その 関連するマザーボードがグローバルリソースボードとしてマップされる。 診断マスタを選択する全プロセス中に、すべての障害を起こしたテストとその 結果生じたマザーボード/ドータボードの構成解除は各基板NOVRAMエラー ログおよびNOVRAM構成テーブルにログされる。オンボードマイクロコント ローラ診断および走査障害について行われたものとまったく同じである。「診断 マスタ」選択の完了時に、診断マスタJPは各種のNOVRAMをポーリングし て、完全なエラーおよび構成解除情報があれば、これを判定する。すべての現行 のシステム構成情報はシステムID SEEPROM204に書き込まれる。 機械開始(MI)コールアウトをここで発行して、すべての失敗したテストお よび構成解除にフラグをつけ、すべてのスキャンボックスをクリアする。NOV RAMのこのポーリングはリソースバスのRI ASICアクセスを介して、診 断マスタによって行われる。すでに構成解除されているいずれかのマザーボード に対してこのRIパスアクセスが失敗した場合、まだ 存在しているスキャンボックス情報を限定された情報源として使用することがで きる。あるいは、NOVRAMにアクセスし、障害を起こしたマザーボードのス キャンボックスを介して情報を戻すように、DMが障害を起こしたマザーボード マイクロコントローラに要求することができる。さらに他の態様においては、基 板を構成解除する直前に、エラーおよび構成解除情報をローカルマザーボードS EEPROMにコピーする。そこから、マスタマイクロコントローラはオフボー ド走査を介して、情報にアクセスすることができる。 最後に、各マイクロコントローラはその「アイドルループ」に入る。ループ内 で、マイクロコントローラは定期的にオンボードSRAMを読み取って、システ ムJPからの(グローバルまたはローカルな)要求を処理する。さらに、ウォッ チドッグ処理、基板スニッフィング、および実行LED点滅をこのループ内で定 期的に実行する。 各JPがリセットから抜ける時までに、各基板上のマイクロコントローラがそ のローカルリソース260(たとえば、NOVRAM、EEPROM、SRAM など)、ブロワ、および電源にあるあらゆる物をテストしているものと想定する 。また、 マザーボードも走査テストされている。上記のテストに何らかの障害がある場合 には、マイクロコントローラはマザーボードが適正に機能するのに最小限の要件 を満たしていることを確認するための処置を取る。それ以外の場合には、そのマ ザーボードに対するJPはいずれもリセットから解除されず、マザーボードはリ セット状態に戻される。さらに、JPは電源投入時にブロワおよび電源の障害を 調べない。 JP PROM電源投入シーケンスは三つの段階に分割されている。各ステッ プの実行時に、各JPはその基板上のマイクロコントローラへメッセージを送り 、NOVRAMでテストされようとしているFRUまたはDRUを書き込む。エ ラーコードもNOVRAMに書き込まれるので、障害/ハングが生じた場合に、 システムは問題がどこにあるかを知り、MIコールアウトを行うための情報を有 する。テストが失敗した場合、マイクロコントローラはJPからエラーメッセー ジを取得し、またハングの場合には、マイクロコントローラはタイムアウトする 。第14図から第16図には、JPおよびDM JPによって行われる電源投入 時テストの一覧表が挙げられている。 各基板上のJPはJP0、JP1、JP2、およびJP3の順 でリセットから解除される。次のステップの各々に対して、各JPにより三つの 処置が行われる。1)マイクロコントローラに次にどのテストを実行するかを知 らせる。2)テストに関与するFRUの名前およびエラーコードをNOVRAM に書き込む。3)テストを実行する。各段階の完了時に、JPはマイクロコント ローラからの、次に何をするか、すなわち次の段階へ進むのか、アイドル状態の ままでいるのかの命令を待つ。 一次段階テストの場合、マイクロコントローラはそのマザーボード上の各JP を一つずつリセット状態から取り出す。一次段階では、次のテストが行われる。 −JPが自己テストを実行して、適正に機能していることを確認する。 −JPがPROMアクセステストを実行して、PROMに適正にアクセスでき ることを確認する。 −JPがローカルSRAMアクセスをテストする。 −JPがNOVRAMアクセスをテストする。 −JPがSRAM内のスタック、SCM、FE、およびスパッドを初期化する 。 −JPが障害をドータボードに分離するテスト(すなわち、 88110/88410キャッシュ、CI、TLCC、EDACテスト)を実行 する。これらのテストの中には、リセット状態でない複数のJPがある場合に、 JP間の対話をテストできるが、それでもドータボードへ分離するように戻るも のもある。 −JPがそれ自体からの読み書きのためにバックドア方法を使用することを含 む、RIレジスタアクセス(読み書き)テストを実行する。 −JPがPIレジスタアクセス(読み書き)テストを実行する。 −JPがGGレジスタアクセス(読み書き)テストを実行する。 −JPがMCレジスタアクセス(読み書き)テストを実行する。 −JPがマザーボード上のMC、PI、EDACレジスタおよびメインメモリ をサイジングし、初期化する。 −JPがそのマザーボード上にSIMMがある場合に、クイックメインメモリ テストを実行する。このテストはメモリの第一のバンクの第一のSIMMでのみ 実行される(すなわち、せいぜい32MBがテストされる)。このテストはJP がメモリ にアクセスできることを確認する。 マイクロコントローラはステップのいずれかで失敗したJPをリセット状態に する。JPドータボード上の二つのJPのいずれか一方がこのテストのいずれか で失敗した場合には、そのJPおよびドータボードにデッドとマークをつけ、構 成解除する。また、DMによってMIコールを後で行う。両方のJPドータボー ドが構成解除された場合には、関連するマザーボードの他のものが、DMが判定 された後でテストされる。すべてのドータボードがスロット0および1の両方で 不良品である場合には、システムの電源が切られる。 各JPは一次段階を完了した後、二次段階へ進むか、あるいはスレーブJPに なり、アイドルループに入るかがマイクロコントローラによって通知されるのを 待つ。次のテストが二次段階で実行される。 −JPがそれ自体の基板のサイジングを行い、その情報をNOVRAMに書き 込む。 −JPがグローバルテストパターンを書き込み、後でテストするためパターン 有効フラグをSRAMに設定する。 −JPがすべてのMADVレジスタをその基板に設定する。 −JPがいくつかの広範囲なテストをMC EDAC、ディレクトリSIMM 、およびオンボードメインメモリで実行する。 −SIMの障害があった場合、JPPROMがエラー状態のSIMMバンクを 構成解除する。MC、EDAC、およびディレクトリにおけるテストのいずれか が失敗した場合には、メモリサブシステム全体を構成解除する。 −JPがそのオンボードメインメモリ(存在している場合)を使用して、オン ボードキャッシュテストを実行する。 −これらのテストのいずれかが失敗したら、JPが搭載されているドータボー ドが構成解除される。 −JPがすべてのPCI装置のサイジングを行い、それ自体の基板上のGGを 初期化する。 −JPが広範囲なテストを統合SCSIおよびLANコントローラで実行する 。これらのテストはマザーボード上の各GGASICで一つずつ実行される。テ ストのいずれかが失敗した場合には、GG/PCIバスサブシステムが構成解除 される。両方のGG ASICに障害があれば、マザーボードが構成解除される 。 −各基板マスタはすべてのオンボード情報(たとえば、どの ASICが良品/不良品なのか、どのJPが良品/不良品なのか、そのPROM の改訂番号など)を収集し、これをNOVRAMに書き込む。 −各基板マスタは基板に残っているもの、たとえばモデムを初期化する。 上述のテストは他の基板上でも互いに並列に実行される。これらのタスクが行 われてから、基板はPIバス上で使用可能とされる。このテストは特定の基板を 診断マスタ権について考慮できるかどうかを判定するために使用される。 マスタマイクロコントローラはそのマザーボード上の最初のJPに、活動診断 マスタ(ADM)になり、三次段階のテストに進み、これを行うための二次段階 のテストが正常に完了したことを通知し、他のJPは命令を待つ。以下のテスト が三次段階で行われる。 −ADMが自己PIループバックテスト(ThD)を実行する。 −ADMがオフボードテストを実行して、システム内の他の基板にアクセスで きるかどうかを判定する。 −ADMがシステム内のJPに広範囲なキャッシュテストを 実行するよう通知する。 −ADMがRIバックドア法を使用して、各ACTIVE基板の構成情報を収 集する。 −ADMがミッドプレーン上で使用可能となる。すなわち、RIおよびPI両 方におけるグローバルビットをリセットする。 −ADMが稼働中のJPが載っていない他のマザーボードを初期化し、これを テストするか、ニアメモリを有していない基板上でI/Oテストを実行する。D Mはそれ自体の基板上のメモリをSCSIスクリプト位置に使用する。 −ADMのNOVRAM内のテーブル1、2、および3の間でハードウェア構 成情報が異なっている場合、AMDがMIコールを行う。 −ADMがマスタマイクロコントローラに、そのNOVRAM−テーブル3内 の情報に従ってバックパネル上のSEEPROMを更新するよう通知する。 −ADMがシステム全体に対して最終的な初期化を行い、オペレーティングシ ステム、すなわちDG/UXに対していくつかの制御スペースレジスタを設定す る。 −ADMがすべての良品のスレーブJPにアイドルループか ら抜けるように通知し、SCMに入る。 上記により四つの結果が生じると考えられる。 1)すべてのテストに合格する。ADMはDMとなり、他のステップを完了し、 SCMで停止する。 2)テストが失敗し、ADMはそれがそれ自体のマザーボード上の問題であるこ とを知る。 3)これらのテストの実行中にADMがハングし、そのマイクロコントローラが タイムアウトする。 4)テストが失敗し、ADMはどの基板が問題なのかを知る。 事例3を除くすべての場合に、ADMはマスタマイクロコントローラにテスト の結果を通知する。事例2および3の場合、マスタマイクロコントローラはその SEEPROM内でそれ自体をデッドとマークし、システムに再度電源を投入す る。事例4の場合、マスタマイクロコントローラは障害を生じた基板のマイクロ コントローラに、それ自体をシステムから構成解除するよう通知する。マスタマ イクロコントローラは肯定応答を取得した後、ADMに三次テストを再起動し、 キャッシュテストを実行するよう通知する。 上述のマイクロコントローラおよびJPのテストが行われた 後、コンピュータシステムはデフォルトのブートパスでブートする。オペレーテ ィングシステム(DC/UX)のブート後、すべてのJPはオペレーティングシ ステムの制御を受け、JPPROMはシステムコールが行われた場合を除き、実 行されなくなる。 システムの動作中に、各マザーボード202上のマイクロコントローラ300 はコンピュータシステムのある種の部品が適正に機能していることを確認するス ニッフィングタスクを実行する。リソースバス固有のテストは、NOVRAMチ ェックサムテスト、DUART機能性テスト、PSSS一致による電源/ブロワ 状況テスト、EEPROMチェックサムテストおよびTBCテストを含んでいる 。マスタマイクロコントローラも、走査チェーン動作により電源およびブロワの 状況の設定を担う。マイクロコントローラはセマフォロックをチェックしてから 、スニッフィングタスクでこれらの領域のいずれかにアクセスし、JPが領域の 更新または領域へのアクセスを試みたときに、データが失われないようにする必 要がある。 上記したように、バックプレートのスロット0および1にあるマザーボード上 のマイクロコントローラおよびJPだけが、 マスタマイクロコントローラおよび診断マスタそれぞれの存続可能な候補である 。デフォルトでは、スロット0のマザーボード上のマイクロコントローラと、J Pの一つとがこれに指定される。両方のスロットのマザーボードおよび/または 両方のスロットのJPが障害を生じており、構成解除可能である場合には、シス テムが遮断される。 本発明の好ましい実施の形態を特定の用語を使用して説明してきたが、このよ うな説明は説明のためだけのものであり、以下の請求の範囲の精神および範囲を 逸脱することなく、変更および改変を行えることを理解すべきである。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 コツクス,ジヨージフ アメリカ合衆国、マサチユーセツツ・ 02346、ミドルボロ、ノース・メイン・ス トリート(番地なし) (72)発明者 ジエリナス,ロバート・ジー アメリカ合衆国、マサチユーセツツ・ 01581、ウエストボロ、フランダース・ロ ード・47 (72)発明者 ジロツト,バリー・イー アメリカ合衆国、マサチユーセツツ・ 01640、ウシエスター、サンダーランド・ ロード・270−46 (72)発明者 ガイヤー,ジエイムズ・エム アメリカ合衆国、マサチユーセツツ・ 01532、ノースボロ、ブルアー・ストリー ト・246 (72)発明者 ヘイダ,アンドレア アメリカ合衆国、マサチユーセツツ・ 01720、アクトン、マグノリア・ドライ ブ・4 (72)発明者 ホツク,ダン・アール アメリカ合衆国、マサチユーセツツ・ 01545、シユローズベリー、ベイベリー・ サークル・11 (72)発明者 ハント,マイケル・エフ アメリカ合衆国、マサチユーセツツ・ 01721、アツシユランド、ジヨアンヌ・ド ライブ・7・ナンバー・3 (72)発明者 キーテイング,デイビツド・エル アメリカ合衆国、マサチユーセツツ・ 01746、ホリストン、パインクレスト・ロ ード・56 (72)発明者 キメル,ジエフ・エス アメリカ合衆国、ノース・カロライナ・ 27514、チヤペル・ヒル、クレイン・メド ウ・プレイス・107 (72)発明者 パイク,ロブ・ジエイ アメリカ合衆国、マサチユーセツツ・ 01609、ウスター、ソマーセツト・ストリ ート・15・ナンバー・3 (72)発明者 ラドグナ,トム・ブイ アメリカ合衆国、マサチユーセツツ・ 01701、フラミントン、ポーツモア・レイ ン・5 (72)発明者 ルークス,フイル・ジエイ アメリカ合衆国、マサチユーセツツ・ 01746、ホリストン、ジヨーンズ・ロー ド・12 (72)発明者 シヤーマン,アート・エイ アメリカ合衆国、マサチユーセツツ・ 01721、アツシユランド、ミーテイングハ ウス・96 (72)発明者 スポーター,マイクル アメリカ合衆国、マサチユーセツツ・ 02181、ウエルズリー、ロングフエロー・ ロード・31 (72)発明者 トウルーベンバツク,リズ・エム アメリカ合衆国、マサチユーセツツ・ 01776、サドベリー、フアイヤーカツト・ レイン・5 (72)発明者 タツカー,ダグ・ジエイ アメリカ合衆国、マサチユーセツツ・ 01532、ノースボロ、サイヤー・ストリー ト・10・エム (72)発明者 バレンタイン,ロブ・ピー アメリカ合衆国、マサチユーセツツ・ 01501、アーバーン、グリーンウツド・ド ライブ・10 (72)発明者 ユン,サイモン・エヌ アメリカ合衆国、マサチユーセツツ・ 02146、ブルツクライン、ハーバード・ア ベニユー・48・ナンバー・5

Claims (1)

  1. 【特許請求の範囲】 1.障害状態の発見後コンピュータシステムを自動的に回復する方法であって、 自己テストおよび自己診断機能を有するコンピュータシステムを設けるステッ プと、 コンピュータシステムを自動的にテストするステップと、 前記テストステップにより一つまたは複数の障害構成要素の存在を自動的に特 定するステップと、 コンピュータシステムを構成解除して、前記の自動特定ステップにより特定さ れた障害構成要素を機能的にコンピュータシステムから除去するステップと を備えている方法。 2.前記テストステップの前に、前記コンピュータシステムのメモリの内容を回 復するステップをさらに含んでいる請求の範囲第1項に記載の方法。 3.前記回復ステップがコンピュータシステムの構成要素に関する、および構成 要素間の相互接続に関する連続性チェックを行うことを含んでいるテストステッ プを含んでおり、前記の特 定が連続性チェックを分析して、障害構成要素および相互接続を特定することを 含んでいる請求の範囲第1項に記載の方法。 4.提供されるコンピュータシステムが少なくとも一個の特定用途向け集積回路 (ASIC)を含んでおり、前記ASICが該ASICの論理F/Fへクロック パルスを自動的および選択的に分配するゲート式バランスクロックツリー回路を 有しており、クロックツリーがこれから延びる複数のブランチを有しており、前 記方法が ゲート式バランスクロックツリー回路を構成して、コンピュータシステムが第 一の動作状態にあるときに、クロックパルスが少なくともいくつかの論理F/F に分配されるようにするステップと、 ゲート式バランスクロックツリー回路を再構成して、コンピュータシステムが 第二の動作状態にあるときに、少なくともいくつかの論理F/Fへのクロックパ ルスの分配をブロックするようにするステップ とをさらに含んでいる請求の範囲第1項に記載の方法。 5.コンピュータシステムが二つの冗長システムクロックをさらに含んでおり、 一方のシステムクロックのクロックが一時に コンピュータシステムに与えられ、 前記方法がコンピュータシステムへクロックを与えるシステムクロックを障害 について監視するステップと、 前記監視ステップがシステムクロックの障害を特定したときに、コンピュータ システムを構成して、障害を起こしたシステムクロックを機能的に除去し、その 後クロックを冗長システムクロックから供給するステップとをさらに含んでいる 請求の範囲第1項に記載の方法。 6.特定用途向け集積回路(ASIC)の論理フリップフロップ(F/F)へク ロックパルスを自動的選択的に供給するゲート式バランスクロックツリー回路で あって、 クロックパルスがASICの論理F/Fへ流れ、クロックツリー回路がこれか ら延びている複数のブランチを有しているクロックトランクと、 少なくともいくつかの論理F/Fに給送を行っているクロックトランクの少な くとも一つのブランチに配置された少なくとも一つのANDゲートと、 少なくとも一つのANDゲートの各々を制御して、少なくともいくつかの論理 F/Fにいくつかのクロックパルスだけが給 送されるようにする制御回路とを備えており、 ASICを使用するコンピュータシステムの第一の動作状態の間中、クロック パルスが少なくともいくつかの論理F/Fに給送されることをANDゲートが自 動的に可能とするように前記制御回路が構成されており、コンピュータシステム の第二の動作状態にあるときに、クロックパルスがANDゲートにより自動的に ブロックされるようにも前記制御回路が構成されている ゲート式バランスクロックツリー回路。 7.クロックトランクへ給送されるクロック信号を制御する位相ロックループ装 置(PLL)と、 前記PLLおよび前記クロックツリーの選択されたブランチに電気的に接続さ れた遅延セルとをさらに含んでおり、遅延セルがクロックツリーの選択されたブ ランチからの各クロックパルスを所定量遅延させて、論理F/Fへのクロックパ ルスのスキュー解除を行い、 コンピュータシステムの第二の動作状態にあるときに、選択されたブランチか らのクロックパルスがPLLへ行くのをブロックされない 請求の範囲第6項に記載のゲート式バランスクロックツリー回路。 8.第三の動作状態にあるときに、ANDゲートがクロックパルスを論理F/F へ給送できるように前記制御回路が構成されている請求の範囲第6項に記載のゲ ート式バランスクロックツリー回路。 9.第一の動作状態がコンピュータシステムの正規動作に対応しており、第二の 動作状態がコンピュータシステムの致命エラー状態に対応しており、第三の動作 状態が電源投入時および致命エラー状態後の少なくとも一方のコンピュータシス テムのシステムテストに対応している請求の範囲第8項に記載のゲート式バラン スクロックツリー回路。 10.クロックトランクの選択されたブランチ以外のすべてのブランチを通るク ロックパルスを制御する複数のANDゲートをさらに含んでいる請求の範囲第6 項に記載のゲート式バランスクロックツリー回路。 11.特定用途向け集積制御回路(ASIC)の論理フリップフロップ(F/F )へのクロックパルスを制御する方法であって、 論理F/Fへクロックパルスを自動的選択的に分配する、複数のブランチが延 びているゲート式バランスクロックツリー回路を有するASICを設けるステッ プと、 ゲート式バランスクロックツリー回路を構成して、コンピュータシステムが第 一の動作状態にあるときに、クロックパルスが少なくともいくつかの論理F/F に給送されるようにするステップと、 ゲート式バランスクロックツリー回路を再構成して、コンピュータシステムが 第二の動作状態にあるときに、少なくともいくつかの論理F/Fへのクロックパ ルスの分配をブロックするステップと を備えているクロックパルスを制御する方法。 12.ゲート式バランスクロックツー回路が少なくとも一つのANDゲートを含 んでおり、前記構成ステップが一つの信号をANDゲートに与えて、クロックパ ルスが分配されるようにすることを含んでおり、前記再構成ステップが第二の信 号をANDゲートに与えて、クロックパルスをブロックすることを含んでいる請 求の範囲第11項に記載のクロックパルスを制御する方法。 13.ゲート式バランスクロックツリー回路がクロックトランクへ給送されるク ロック信号を制御する位相ロックループ装置(PLL)を含んでおり、 前記方法が クロックパルスをクロックツリー回路の選択したブランチからPLLへフィー ドバックするステップと、 フィードバックされるクロックパルスを所定量遅延させて、論理F/Fへのク ロックパルスのスキュー解除を行うステップとをさらに含んでおり、 コンピュータシステムの第二の動作状態にあるときに、フィードバックされる クロックパルスがPLLへ行くのをブロックされない請求の範囲第11項に記載 のクロックパルスを制御する方法。 14.クロックパルスが分配されるようにゲート式バランスクロックツリー回路 を構成する前記ステップが、コンピュータシステムが第三の動作状態にあるとき にも行われる請求の範囲第11項に記載のクロックパルスを制御する方法。 15.第一の動作状態がコンピュータシステムの正規動作に対応しており、第二 の動作状態がコンピュータシステムの致命エ ラー状態に対応しており、第三の動作状態が電源投入時および致命エラー状態後 の少なくとも一方のコンピュータシステムのシステムテストに対応している請求 の範囲第14項に記載のクロックパルスを制御する方法。 16.ゲート式バランスクロックツリー回路が複数のANDゲートを含んでおり 、前記構成ステップが一つの信号を複数のANDゲートに与えて、クロックパル スが分配されるようにすることを含んでおり、前記再構成ステップが第二の信号 を複数のANDゲートに与えて、クロックパルスをブロックすることを含んでい る請求の範囲第11項に記載のクロックパルスを制御する方法。 17.クロックパルスが第二の信号によってクロックツリー回路の選択されたブ ランチ以外のすべてのブランチにおいてブロックされる請求の範囲第16項に記 載のクロックパルスを制御する方法。 18.コンピュータシステムにクロックパルスを供給するシステムにおいて、 少なくとも第一および第二のクロック生成および分配装置を備えており、第一 のクロック生成および分配装置がシステムに よって供給されるクロックパルスの供給源として設定されており、 第一および第二のクロック生成および分配装置の各々が 周期的な信号パルスを生成するように電気的に構成された一次発振回路と、 発振回路によって生成された周期的パルスを監視して、回路の障害を検出する ように電気的に構成された検出回路と、 発振回路の障害の検出を表す出力信号をもたらすように構成された、検出回路 に応答する信号生成回路とを含んでおり、 第一のクロック生成および分配装置の信号生成回路からの障害信号に応じる第 二のクロック生成および分配装置として、クロック供給システムが供給されるク ロックパルスの供給源を自動的に再指定するように構成されたクロックパルスフ ェイルオーバ回路を前記システムが備えている クロック供給システム。 19.検出回路が発振回路と異なる周波数で周期的な信号を生成する二次発振回 路と三つのフリップフロップ(F/F)とを含んでおり、三つのF/Fが互いに 、また一次および二次発振回路と電気的に相互接続されて、F/Fが一次発振回 路の障害 を検出し、障害を表す出力を与える請求の範囲第18項に記載のクロックパルス 供給システム。 20.障害を表す出力が三つのF/Fのうち二つからの信号出力である請求の範 囲第19項に記載のクロックパルス供給システム。 21.三つのF/Fがそれぞれ第一、第二、および第三のF/Fであり、第一の F/Fが第二および第三のF/Fならびに二次発振回路に電気的に相互接続され ており、第二および第三のF/Fが一次発振回路に電気的に相互接続されている 請求の範囲第19項に記載のクロックパルス供給システム。 22.一次発振回路が100MHzの水晶を含んでおり、二次発振回路が105 MHzの水晶を含んでいる請求の範囲第19項に記載のクロックパルス供給シス テム。 23.コンピュータシステムにおいてクロックパルスを供給する方法において、 周期的な信号パルスを生成する二つの冗長信号生成装置と、一方の装置が供給 されるクロックパルスの供給源として当初指定される供給されるクロックパルス の供給源を自動的選択可能に制御する回路とを含んでいるクロック供給システム を設ける ステップと、 システムに対してクロックパルスを供給する信号生成装置によって生成される 周期的な信号を監視するステップと、 周期的な信号パルスを生成する第一の装置の障害の検出に応じて冗長信号発生 装置へ自動的にフェイルオーバするステップと を備えているクロックパルス供給方法。 24.各信号生成装置が異なる周波数で周期的な信号パルスを生成する一次およ び二次発振回路を含んでおり、前記監視ステップが一次および二次発振回路の出 力を監視して、一次監視装置の障害を検出することを含んでいる請求の範囲第2 3項に記載のクロックパルス供給方法。 25.高稼働率スケーラブルマルチプロセッサコンピュータシステムにおいて、 少なくとも一本のバックプレーン通信バスと診断バスを含んでいるバックプレ ーンと、 前記バックプレーンに脱着可能に接続され、各々が前記の少なくとも一本のバ ックプレーン通信バスと前記診断バスとにインタフェースしている複数枚のマザ ーボードとを備えており、 前記複数枚のマザーボードの各々が 前記複数枚のマザーボードの少なくとも一枚を前記の少なくとも一本のバック プレーン通信バスにインタフェースする少なくとも一つのバックプレーン通信バ スインタフェース機構と、 前記複数枚のマザーボードの間に分散されたメインメモリ、他のマザーボード 上のキャッシュとのメインメモリの一貫性を維持するディレクトリメモリ、およ び前記メインメモリおよびディレクトリメモリにアクセスし、かつ前記マザーボ ード通信バスとインタフェースするメモリコントローラモジュールを含んでいる メモリシステムと、 前記マザーボードに脱着可能に接続され、前記マザーボード通信バスとインタ フェースする少なくとも一枚のドータボードとを含んでおり、前記の少なくとも 一枚のドータボードが 前記の少なくとも一枚のドータボードを前記マザーボード通信バスおよび前記 ドータボード上のローカルバスにインタフェースするマザーボード通信バスイン タフェースモジュールと、 キャッシュメモリおよび前記スケーラブルマルチプロセッサコンピュータシス テムのプロセッサに対して前記キャッシュメモリを維持するキャッシュコントロ ーラモジュールを含んでい る少なくとも一つのキャッシュメモリシステムとを含んでおり、 前記複数枚のマザーボードの各々が 前記複数枚のマザーボードの各々を前記バックプレーン診断バスにインタフェ ースするバックプレーン診断バスインタフェース機構と、 情報を処理し、出力をもたらすマイクロコントローラと、 レジスタが含まれているテストバスコントローラ機構と、 をさらに含んでおり、 前記コンピュータシステムが 各マザーボードおよび前記少なくとも一枚のドータボードの各々に実装された 機能性構成要素を前記テストバスコントローラに電気的に相互接続する走査チェ ーンと、 機能性構成要素ならびに電気接続および相互接続を自動的にテストし、障害構 成要素の存在を自動的に判定し、障害構成要素をコンピュータシステムから自動 的にかつ機能的に除去する命令および基準を含んでいる、前記マイクロコントロ ーラによって実行されるアプリケーションプログラムと をさらに含んでいる高稼働率スケーラブルマルチプロセッサコンピュータシステ ム。 26.前記の複数枚のマザーボードの少なくとも一枚と前記の少なくとも一枚の ドータボードが少なくとも一つの特定用途向け集積回路(ASIC)をさらに含 んでおり、前記ASICがASICの論理F/Fへ自動的選択的にクロックパル スを分配するゲート式バランスクロックツリーを有しており、該ゲート式バラン スクロックツリー回路が クロックパルスがASICの論理F/Fへ流れ、クロックツリーがこれから延 びている複数のブランチを有しているクロックトランクと、 少なくともいくつかの論理F/Fに給送を行っているクロックトランクの少な くとも一つのブランチに配置された少なくとも一つのANDゲートと、 少なくとも一つのANDゲートの各々を制御して、少なくともいくつかのF/ Fにいくつかのクロックパルスだけが給送されるようにする制御回路とを含んで おり、 コンピュータシステムの第一の動作状態の間中、クロックパルスが少なくとも いくつかの論理F/Fに給送されることをANDゲートが自動的に可能とするよ うに前記制御回路が構成されており、コンピュータシステムの第二の動作状態に あるとき に、クロックパルスがANDゲートにより自動的にブロックされるようにも前記 制御回路が構成されている 請求の範囲第25項に記載の高稼働率スケーラブルマルチプロセッサコンピュー タシステム。 27.前記ゲート式バランスクロックツリー回路が クロックトランクへ給送されるクロック信号を制御する位相ロックルーブ装置 (PLL)と、 前記PLLおよび前記クロックツリーの選択されたブランチに電気的に接続さ れた遅延セルとをさらに含んでおり、遅延セルがクロックツリーの選択されたブ ランチからの各クロックパルスを所定量遅延させて、論理F/Fへのクロックパ ルスのスキュー解除を行い、 コンピュータシステムの第二の動作状態にあるときに、選択されたブランチか らのクロックパルスがPLLへ行くのをブロックされない 請求の範囲第26項に記載の高稼働率スケーラブルマルチプロセッサコンピュー タシステム。 28.第三の動作状態にあるときに、ANDゲートがクロックパルスを論理F/ Fへ給送できるように前記制御回路が構成さ れている請求の範囲第26項に記載の高稼働率スケーラブルマルチプロセッサコ ンピュータシステム。 29.第一の動作状態がコンピュータシステムの正規動作に対応しており、第二 の動作状態がコンピュータシステムの致命エラー状態に対応しており、第三の動 作状態が電源投入時および致命エラー状態後の少なくとも一方のコンピュータシ ステムのシステムテストに対応している請求の範囲第28項に記載の高稼働率ス ケーラブルマルチプロセッサコンピュータシステム。 30.前記ゲート式バランスクロックツリー回路がクロックトランクの選択され たブランチ以外のすべてのブランチを通るクロックパルスを制御する複数のAN Dゲートをさらに含んでいる請求の範囲第26項に記載の高稼働率スケーラブル マルチプロセッサコンピュータシステム。 31.前記の少なくとも一つのASICの各々が前記の少なくとも一つの走査チ ェーンに相互接続されて、前記マイクロコントローラが前記の少なくとも一つの ASICの各々をテストできる請求の範囲第26項に記載の高稼働率スケーラブ ルマルチプロセッサコンピュータシステム。 32.コンピュータシステムにクロックパルスを供給するシス テムをさらに含んでおり、該システムが 少なくとも第一および第二のクロック生成および分配装置を含んでおり、第一 のクロック生成および分配装置がシステムによって供給されるクロックパルスの 供給源として設定されており、 第一および第二のクロック生成および分配装置の各々が 周期的な信号パルスを生成するように電気的に構成された一次発振回路と、 発振回路によって生成された周期的パルスを監視して、回路の障害を検出する ように電気的に構成された検出回路と、 発振回路の障害の検出を表す出力信号をもたらすように構成された、検出回路 に応答する信号生成回路とを含んでおり、 第一のクロック生成および分配装置の信号生成回路からの障害信号に応じる第 二のクロック生成および分配装置として、クロック供給システムが供給されるク ロックパルスの供給源を自動的に再指定するように構成されたクロックパルスフ ェイルオーバ回路を前記システムが含んでいる 請求の範囲第25項に記載の高稼働率スケーラブルマルチプロセッサコンピュー タシステム。 33.検出回路が発振回路と異なる周波数で周期的な信号を生成する二次発振回 路と三つのフリップフロップ(F/F)とを含んでおり、三つのF/Fが互いに 、また一次および二次発振回路と電気的に相互接続されて、F/Fが一次発振回 路の障害を検出し、障害を表す出力を与える請求の範囲第32項に記載の高稼働 率スケーラブルマルチプロセッサコンピュータシステム。
JP9509578A 1995-08-14 1996-08-14 高稼働率コンピュータおよびこれに関連する方法 Withdrawn JPH11510934A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US232095P 1995-08-14 1995-08-14
US60/002,320 1995-08-14
PCT/US1996/013742 WO1997007457A1 (en) 1995-08-14 1996-08-14 A high availability computer system and methods related thereto

Publications (1)

Publication Number Publication Date
JPH11510934A true JPH11510934A (ja) 1999-09-21

Family

ID=21700234

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9509578A Withdrawn JPH11510934A (ja) 1995-08-14 1996-08-14 高稼働率コンピュータおよびこれに関連する方法

Country Status (5)

Country Link
US (3) US5887146A (ja)
EP (1) EP0852035A4 (ja)
JP (1) JPH11510934A (ja)
CA (2) CA2183223A1 (ja)
WO (1) WO1997007457A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7519856B2 (en) 2004-12-21 2009-04-14 Nec Corporation Fault tolerant system and controller, operation method, and operation program used in the fault tolerant system

Families Citing this family (253)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7308629B2 (en) 2004-12-07 2007-12-11 Texas Instruments Incorporated Addressable tap domain selection circuit with TDI/TDO external terminal
US6272600B1 (en) * 1996-11-15 2001-08-07 Hyundai Electronics America Memory request reordering in a data processing system
US6055600A (en) * 1996-12-19 2000-04-25 International Business Machines Corporation Method and apparatus for detecting the presence and identification of level two cache modules
US5978379A (en) * 1997-01-23 1999-11-02 Gadzoox Networks, Inc. Fiber channel learning bridge, learning half bridge, and protocol
US6718375B1 (en) * 1997-01-31 2004-04-06 Hewlett-Packard Development Company, L.P. Using local storage to handle multiple outstanding requests in a SCI system
US6230245B1 (en) 1997-02-11 2001-05-08 Micron Technology, Inc. Method and apparatus for generating a variable sequence of memory device command signals
US6175894B1 (en) 1997-03-05 2001-01-16 Micron Technology, Inc. Memory device command buffer apparatus and method and memory devices and computer systems using same
FR2763712B1 (fr) * 1997-05-26 2001-07-13 Bull Sa Dispositif d'instrumentation pour machine avec memoire a acces non uniforme
FR2763714B1 (fr) * 1997-05-26 1999-07-02 Bull Sa Compteurs de remplacement pour machine avec memoire a acces non uniforme
FR2764097B1 (fr) * 1997-06-02 1999-07-02 Bull Sa Detection de points chauds dans une machine avec memoire a acces non uniforme
US5996043A (en) 1997-06-13 1999-11-30 Micron Technology, Inc. Two step memory device command buffer apparatus and method and memory devices and computer systems using same
US6484244B1 (en) 1997-06-17 2002-11-19 Micron Technology, Inc. Method and system for storing and processing multiple memory commands
KR100237545B1 (ko) * 1997-06-24 2000-01-15 김영환 시디엠에이 시스템의 이중화 시간/주파수 발생장치
US6094709A (en) * 1997-07-01 2000-07-25 International Business Machines Corporation Cache coherence for lazy entry consistency in lockup-free caches
US6044438A (en) * 1997-07-10 2000-03-28 International Business Machiness Corporation Memory controller for controlling memory accesses across networks in distributed shared memory processing systems
EP0892352B1 (en) * 1997-07-18 2005-04-13 Bull S.A. Computer system with a bus having a segmented structure
US6026448A (en) * 1997-08-27 2000-02-15 International Business Machines Corporation Method and means for exchanging messages, responses and data between different computer systems that require a plurality of communication paths between them
US6202119B1 (en) 1997-12-19 2001-03-13 Micron Technology, Inc. Method and system for processing pipelined memory commands
DE19805711C2 (de) * 1998-02-12 1999-11-18 Siemens Ag Verfahren und Anordnung zum Austausch einer defekten Baugruppe vorzugsweise innerhalb einer digitalen Vermittlungsstellenanlage
US6446149B1 (en) * 1998-03-03 2002-09-03 Compaq Information Technologies Group, L.P. Self-modifying synchronization memory address space and protocol for communication between multiple busmasters of a computer system
US6038651A (en) * 1998-03-23 2000-03-14 International Business Machines Corporation SMP clusters with remote resource managers for distributing work to other clusters while reducing bus traffic to a minimum
US6415397B1 (en) * 1998-04-08 2002-07-02 Kingston Technology Company Automated multi-PC-motherboard memory-module test system with robotic handler and in-transit visual inspection
US6357023B1 (en) * 1998-04-08 2002-03-12 Kingston Technology Co. Connector assembly for testing memory modules from the solder-side of a PC motherboard with forced hot air
US6351827B1 (en) * 1998-04-08 2002-02-26 Kingston Technology Co. Voltage and clock margin testing of memory-modules using an adapter board mounted to a PC motherboard
US6094530A (en) * 1998-04-29 2000-07-25 Intel Corporation Remotely monitoring execution of a program
US6389513B1 (en) * 1998-05-13 2002-05-14 International Business Machines Corporation Disk block cache management for a distributed shared memory computer system
US6463550B1 (en) * 1998-06-04 2002-10-08 Compaq Information Technologies Group, L.P. Computer system implementing fault detection and isolation using unique identification codes stored in non-volatile memory
US6505276B1 (en) * 1998-06-26 2003-01-07 Nec Corporation Processing-function-provided packet-type memory system and method for controlling the same
US6067611A (en) * 1998-06-30 2000-05-23 International Business Machines Corporation Non-uniform memory access (NUMA) data processing system that buffers potential third node transactions to decrease communication latency
US6286083B1 (en) * 1998-07-08 2001-09-04 Compaq Computer Corporation Computer system with adaptive memory arbitration scheme
US6175905B1 (en) 1998-07-30 2001-01-16 Micron Technology, Inc. Method and system for bypassing pipelines in a pipelined memory command generator
US6085293A (en) * 1998-08-17 2000-07-04 International Business Machines Corporation Non-uniform memory access (NUMA) data processing system that decreases latency by expediting rerun requests
US6178488B1 (en) 1998-08-27 2001-01-23 Micron Technology, Inc. Method and apparatus for processing pipelined memory commands
KR100578112B1 (ko) 1998-10-16 2006-07-25 삼성전자주식회사 메모리 클럭 신호를 제어하는 컴퓨터 시스템 및그 방법
US7430171B2 (en) * 1998-11-19 2008-09-30 Broadcom Corporation Fibre channel arbitrated loop bufferless switch circuitry to increase bandwidth without significant increase in cost
US6253269B1 (en) * 1998-12-22 2001-06-26 3Com Corporation Bus arbiter system and method for managing communication buses
US6549988B1 (en) * 1999-01-22 2003-04-15 Ilya Gertner Data storage system comprising a network of PCs and method using same
US8225002B2 (en) 1999-01-22 2012-07-17 Network Disk, Inc. Data storage and data sharing in a network of heterogeneous computers
US6421775B1 (en) 1999-06-17 2002-07-16 International Business Machines Corporation Interconnected processing nodes configurable as at least one non-uniform memory access (NUMA) data processing system
US6560725B1 (en) * 1999-06-18 2003-05-06 Madrone Solutions, Inc. Method for apparatus for tracking errors in a memory system
US6421712B1 (en) * 1999-07-16 2002-07-16 Silicon Graphics, Inc. Method and apparatus for broadcasting invalidation messages in a computer system
US6601183B1 (en) * 1999-09-30 2003-07-29 Silicon Graphics, Inc. Diagnostic system and method for a highly scalable computing system
US6502128B1 (en) * 1999-10-01 2002-12-31 Hewlett-Packard Company Server and a method for communicating event messages from the server connected to a peripheral device and a client computer
US6757762B1 (en) 1999-10-29 2004-06-29 Unisys Corporation Multi-mode processor bus bridge
US6728668B1 (en) * 1999-11-04 2004-04-27 International Business Machines Corporation Method and apparatus for simulated error injection for processor deconfiguration design verification
US6732235B1 (en) 1999-11-05 2004-05-04 Analog Devices, Inc. Cache memory system and method for a digital signal processor
US6738845B1 (en) 1999-11-05 2004-05-18 Analog Devices, Inc. Bus architecture and shared bus arbitration method for a communication device
US6415424B1 (en) * 1999-11-09 2002-07-02 International Business Machines Corporation Multiprocessor system with a high performance integrated distributed switch (IDS) controller
US6553447B1 (en) 1999-11-09 2003-04-22 International Business Machines Corporation Data processing system with fully interconnected system architecture (FISA)
US6792513B2 (en) * 1999-12-29 2004-09-14 The Johns Hopkins University System, method, and computer program product for high speed backplane messaging
US6681320B1 (en) * 1999-12-29 2004-01-20 Intel Corporation Causality-based memory ordering in a multiprocessing environment
US6247100B1 (en) * 2000-01-07 2001-06-12 International Business Machines Corporation Method and system for transmitting address commands in a multiprocessor system
US6598193B1 (en) * 2000-01-24 2003-07-22 Dell Products L.P. System and method for testing component IC chips
US6594802B1 (en) * 2000-03-23 2003-07-15 Intellitech Corporation Method and apparatus for providing optimized access to circuits for debug, programming, and test
US6658522B1 (en) 2000-06-16 2003-12-02 Emc Corporation Method to reduce overhead associated with system I/O in a multiprocessor computer system
EP1170665B1 (en) * 2000-07-06 2004-02-04 Texas Instruments France Multi-processor system verification circuitry
US6848024B1 (en) * 2000-08-07 2005-01-25 Broadcom Corporation Programmably disabling one or more cache entries
US6826619B1 (en) 2000-08-21 2004-11-30 Intel Corporation Method and apparatus for preventing starvation in a multi-node architecture
US6415369B1 (en) * 2000-08-29 2002-07-02 Agere Systems Guardian Corp. Shared devices and memory using split bus and time slot interface bus arbitration
US6567900B1 (en) * 2000-08-31 2003-05-20 Hewlett-Packard Development Company, L.P. Efficient address interleaving with simultaneous multiple locality options
US6738836B1 (en) * 2000-08-31 2004-05-18 Hewlett-Packard Development Company, L.P. Scalable efficient I/O port protocol
US6487643B1 (en) 2000-09-29 2002-11-26 Intel Corporation Method and apparatus for preventing starvation in a multi-node architecture
US7028115B1 (en) * 2000-10-06 2006-04-11 Broadcom Corporation Source triggered transaction blocking
US6985956B2 (en) * 2000-11-02 2006-01-10 Sun Microsystems, Inc. Switching system
US9639553B2 (en) * 2000-11-02 2017-05-02 Oracle International Corporation TCP/UDP acceleration
WO2002046866A2 (en) * 2000-11-02 2002-06-13 Pirus Networks Switching system
US7865596B2 (en) * 2000-11-02 2011-01-04 Oracle America, Inc. Switching system for managing storage in digital networks
US7313614B2 (en) * 2000-11-02 2007-12-25 Sun Microsystems, Inc. Switching system
US7089293B2 (en) 2000-11-02 2006-08-08 Sun Microsystems, Inc. Switching system method for discovering and accessing SCSI devices in response to query
US7099383B2 (en) * 2001-01-19 2006-08-29 Raze Technologies, Inc. Apparatus and associated method for operating upon data signals received at a receiving station of a fixed wireless access communication system
US6629099B2 (en) * 2000-12-07 2003-09-30 Integrated Silicon Solution, Inc. Paralleled content addressable memory search engine
US6772298B2 (en) 2000-12-20 2004-08-03 Intel Corporation Method and apparatus for invalidating a cache line without data return in a multi-node architecture
DE10065418A1 (de) * 2000-12-27 2002-07-18 Siemens Ag Integrationsverfahren für Automatisierungskomponenten
US7234029B2 (en) * 2000-12-28 2007-06-19 Intel Corporation Method and apparatus for reducing memory latency in a cache coherent multi-node architecture
US6791412B2 (en) * 2000-12-28 2004-09-14 Intel Corporation Differential amplifier output stage
US20020087775A1 (en) * 2000-12-29 2002-07-04 Looi Lily P. Apparatus and method for interrupt delivery
US6721918B2 (en) 2000-12-29 2004-04-13 Intel Corporation Method and apparatus for encoding a bus to minimize simultaneous switching outputs effect
US20020087766A1 (en) * 2000-12-29 2002-07-04 Akhilesh Kumar Method and apparatus to implement a locked-bus transaction
US7080375B2 (en) * 2000-12-30 2006-07-18 Emc Corporation/Data General Parallel dispatch wait signaling method, method for reducing contention of highly contended dispatcher lock, and related operating systems, multiprocessor computer systems and products
US6981087B1 (en) * 2001-01-02 2005-12-27 Juniper Networks, Inc. Multi-master and diverse serial bus in a complex electrical system
US6883070B2 (en) * 2001-03-14 2005-04-19 Wisconsin Alumni Research Foundation Bandwidth-adaptive, hybrid, cache-coherence protocol
US6529053B2 (en) * 2001-04-05 2003-03-04 Koninklijke Philips Electronics N.V. Reset circuit and method therefor
WO2002091692A1 (en) * 2001-04-13 2002-11-14 Girard Gregory D Ditributed edge switching system for voice-over-packet multiservice network
US6748495B2 (en) 2001-05-15 2004-06-08 Broadcom Corporation Random generator
US7287649B2 (en) * 2001-05-18 2007-10-30 Broadcom Corporation System on a chip for packet processing
US20020184566A1 (en) * 2001-06-01 2002-12-05 Michael Catherwood Register pointer trap
US6799217B2 (en) * 2001-06-04 2004-09-28 Fujitsu Limited Shared memory multiprocessor expansion port for multi-node systems
US6711652B2 (en) * 2001-06-21 2004-03-23 International Business Machines Corporation Non-uniform memory access (NUMA) data processing system that provides precise notification of remote deallocation of modified data
US6971098B2 (en) 2001-06-27 2005-11-29 Intel Corporation Method and apparatus for managing transaction requests in a multi-node architecture
JP2003031666A (ja) * 2001-07-12 2003-01-31 Mitsubishi Electric Corp 半導体デバイスまたは半導体ウェハ一括のテスト装置及びテスト方法
US6839892B2 (en) * 2001-07-12 2005-01-04 International Business Machines Corporation Operating system debugger extensions for hypervisor debugging
US7239636B2 (en) 2001-07-23 2007-07-03 Broadcom Corporation Multiple virtual channels for use in network devices
US6910062B2 (en) * 2001-07-31 2005-06-21 International Business Machines Corporation Method and apparatus for transmitting packets within a symmetric multiprocessor system
US6671644B2 (en) * 2001-08-15 2003-12-30 International Business Machines Corporation Using clock gating or signal gating to partition a device for fault isolation and diagnostic data collection
JP4152319B2 (ja) * 2001-09-07 2008-09-17 アイピーフレックス株式会社 データ処理システムおよびその制御方法
US6999998B2 (en) * 2001-10-04 2006-02-14 Hewlett-Packard Development Company, L.P. Shared memory coupling of network infrastructure devices
US20030069949A1 (en) * 2001-10-04 2003-04-10 Chan Michele W. Managing distributed network infrastructure services
US6920485B2 (en) * 2001-10-04 2005-07-19 Hewlett-Packard Development Company, L.P. Packet processing in shared memory multi-computer systems
US7958199B2 (en) * 2001-11-02 2011-06-07 Oracle America, Inc. Switching systems and methods for storage management in digital networks
US6848015B2 (en) * 2001-11-30 2005-01-25 Hewlett-Packard Development Company, L.P. Arbitration technique based on processor task priority
KR100441712B1 (ko) * 2001-12-29 2004-07-27 엘지전자 주식회사 확장 가능형 다중 처리 시스템 및 그의 메모리 복제 방법
US6820149B2 (en) * 2002-01-11 2004-11-16 International Business Machines Corporation Method, system, and program for testing a bus interface
US20030158985A1 (en) * 2002-02-15 2003-08-21 Edward Fried Systems and methods for fair arbitration between multiple request signals
US6968416B2 (en) * 2002-02-15 2005-11-22 International Business Machines Corporation Method, system, and program for processing transaction requests during a pendency of a delayed read request in a system including a bus, a target device and devices capable of accessing the target device over the bus
US7295555B2 (en) 2002-03-08 2007-11-13 Broadcom Corporation System and method for identifying upper layer protocol message boundaries
US6728938B2 (en) * 2002-04-26 2004-04-27 Sun Microsystems, Inc. Knowledge-based intelligent full scan dump processing methodology
US7266587B2 (en) * 2002-05-15 2007-09-04 Broadcom Corporation System having interfaces, switch, and memory bridge for CC-NUMA operation
DE60304930T2 (de) * 2002-05-15 2007-05-03 Broadcom Corp., Irvine Programmierbarer Cache für die Partitionierung von lokalen und entfernten Cacheblöcken
US6957369B2 (en) * 2002-05-30 2005-10-18 Corrigent Systems Ltd. Hidden failure detection
US7171610B2 (en) * 2002-06-12 2007-01-30 International Business Machines Corporation Method, system, and article of manufacture for preventing data loss
TW579467B (en) * 2002-07-24 2004-03-11 Via Tech Inc Method for blocking request to bus
US7434106B2 (en) 2002-07-31 2008-10-07 Seagate Technology Llc Reference clock failure detection on serial interfaces
US6968408B2 (en) * 2002-08-08 2005-11-22 Texas Instruments Incorporated Linking addressable shadow port and protocol for serial bus networks
US7051235B2 (en) * 2002-08-27 2006-05-23 Sun Microsystems, Inc. Clock distribution architecture having clock and power failure protection
US7934021B2 (en) 2002-08-29 2011-04-26 Broadcom Corporation System and method for network interfacing
US7346701B2 (en) 2002-08-30 2008-03-18 Broadcom Corporation System and method for TCP offload
US7313623B2 (en) 2002-08-30 2007-12-25 Broadcom Corporation System and method for TCP/IP offload independent of bandwidth delay product
US8180928B2 (en) 2002-08-30 2012-05-15 Broadcom Corporation Method and system for supporting read operations with CRC for iSCSI and iSCSI chimney
EP1554842A4 (en) 2002-08-30 2010-01-27 Corporation Broadcom SYSTEM AND METHOD FOR TREATING FRAMES OUTSIDE THE ORDER
US6934806B2 (en) * 2002-09-23 2005-08-23 International Business Machines Corporation Method and system for improving input/output performance by proactively flushing and locking an entire page out of caches of a multiprocessor system
JP4560409B2 (ja) * 2002-10-08 2010-10-13 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ データを交換する集積回路および方法
US6895530B2 (en) * 2003-01-24 2005-05-17 Freescale Semiconductor, Inc. Method and apparatus for controlling a data processing system during debug
US20050044174A1 (en) * 2003-04-11 2005-02-24 Sun Microsystems, Inc. Multi-node computer system where active devices selectively initiate certain transactions using remote-type address packets
US6976109B2 (en) * 2003-04-16 2005-12-13 Neomagic Israel Ltd. Multi-level and multi-resolution bus arbitration
US6975954B2 (en) * 2003-06-24 2005-12-13 Intel Corporation Functional testing of logic circuits that use high-speed links
US7210070B2 (en) * 2003-07-11 2007-04-24 Unisys Corporation Maintenance interface unit for servicing multiprocessor systems
US7237152B2 (en) * 2003-10-24 2007-06-26 Honeywell International Inc. Fail-operational global time reference in a redundant synchronous data bus system
KR20050043426A (ko) * 2003-11-06 2005-05-11 삼성전자주식회사 파이프라인 버스 시스템에서 커맨드 전송 방법 및 장치
US7415634B2 (en) * 2004-03-25 2008-08-19 International Business Machines Corporation Method for fast system recovery via degraded reboot
US7734797B2 (en) 2004-03-29 2010-06-08 Marvell International Ltd. Inter-processor communication link with manageability port
US20050229020A1 (en) * 2004-04-06 2005-10-13 International Business Machines (Ibm) Corporation Error handling in an embedded system
US20060031596A1 (en) * 2004-08-05 2006-02-09 International Business Machines Corporation Method and apparatus for providing an alternate route to system memory
JP4455411B2 (ja) * 2004-08-06 2010-04-21 キヤノン株式会社 情報処理装置及びその情報通知方法、並びに制御プログラム
EP1794944B1 (en) * 2004-08-27 2014-03-05 Board of Regents, The University of Texas System Method for memory assignment, computer program and system thereof
TW200609721A (en) * 2004-09-03 2006-03-16 Inventec Corp Redundancy control system and method thereof
CN101044461A (zh) * 2004-10-19 2007-09-26 皇家飞利浦电子股份有限公司 数据处理系统和用于监控处理单元的高速缓冲存储器一致性的方法
US7150186B2 (en) * 2004-10-29 2006-12-19 Spx Corporation Door interlock apparatus and method for alternator/starter bench testing device
US7152464B2 (en) * 2004-10-29 2006-12-26 Spx Corporation Belt tensioning apparatus and method for alternator testing
US7690573B2 (en) * 2006-07-27 2010-04-06 Spx Corporation Alternator and starter tester with bar code functionality and method
US7336462B2 (en) * 2004-10-29 2008-02-26 Spx Corporation Alternator and starter tester protection apparatus and method
US7134324B2 (en) * 2004-10-29 2006-11-14 Spx Corporation Alternator holding apparatus and method for alternator testing
US7212911B2 (en) * 2004-10-29 2007-05-01 Spx Corporation Alternator and starter tester apparatus and method
US7300041B2 (en) * 2004-10-29 2007-11-27 Spx Corporation Vertical alternator holding apparatus and method for alternator testing
US7134325B2 (en) * 2004-10-29 2006-11-14 Spx Corporation Starter motor holding apparatus and method for starter motor testing
TW200617955A (en) * 2004-11-24 2006-06-01 Cheerteck Inc Method for applying downgraded dram to the electronic device and the electronic device thereof
US7970980B2 (en) * 2004-12-15 2011-06-28 International Business Machines Corporation Method and apparatus for accessing memory in a computer system architecture supporting heterogeneous configurations of memory structures
US7694064B2 (en) * 2004-12-29 2010-04-06 Hewlett-Packard Development Company, L.P. Multiple cell computer systems and methods
US8205046B2 (en) * 2005-01-31 2012-06-19 Hewlett-Packard Development Company, L.P. System and method for snooping cache information using a directory crossbar
JP2006252006A (ja) * 2005-03-09 2006-09-21 Seiko Epson Corp デバッグシステム、半導体集積回路装置、マイクロコンピュータ及び電子機器
US7568122B2 (en) * 2005-03-16 2009-07-28 Dot Hill Systems Corporation Method and apparatus for identifying a faulty component on a multiple component field replaceable unit
JP4313833B2 (ja) * 2005-03-18 2009-08-12 富士通株式会社 サービスプロセッサを用いたcpu縮退システム及び縮退方法
US7487327B1 (en) 2005-06-01 2009-02-03 Sun Microsystems, Inc. Processor and method for device-specific memory address translation
US7498806B2 (en) * 2005-06-20 2009-03-03 Spx Corporation Apparatus and method for isolating noise from a signal
US20060294317A1 (en) * 2005-06-22 2006-12-28 Berke Stuart A Symmetric multiprocessor architecture with interchangeable processor and IO modules
US20070022349A1 (en) * 2005-07-07 2007-01-25 Agilent Technologies, Inc. Test apparatus with tester channel availability identification
US7376799B2 (en) * 2005-07-21 2008-05-20 Hewlett-Packard Development Company, L.P. System for reducing the latency of exclusive read requests in a symmetric multi-processing system
US7269682B2 (en) * 2005-08-11 2007-09-11 P.A. Semi, Inc. Segmented interconnect for connecting multiple agents in a system
US7318138B1 (en) 2005-08-30 2008-01-08 Symantec Operating Corporation Preventing undesired trespass in storage arrays
US7263642B1 (en) 2005-09-15 2007-08-28 Azul Systems, Inc Testing replicated sub-systems in a yield-enhancing chip-test environment using on-chip compare to expected results for parallel scan chains testing critical and repairable sections of each sub-system
US7265556B2 (en) * 2005-09-28 2007-09-04 Lucent Technologies Inc. System and method for adaptable testing of backplane interconnections and a test tool incorporating the same
US20070168740A1 (en) * 2006-01-10 2007-07-19 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for dumping a process memory space
US20070248111A1 (en) * 2006-04-24 2007-10-25 Shaw Mark E System and method for clearing information in a stalled output queue of a crossbar
JP2007293701A (ja) * 2006-04-26 2007-11-08 Canon Inc 動的再構成可能デバイスの制御装置及び方法
US20070258445A1 (en) * 2006-05-02 2007-11-08 Harris Corporation Systems and methods for protocol filtering for quality of service
US20070258459A1 (en) * 2006-05-02 2007-11-08 Harris Corporation Method and system for QOS by proxy
US8516153B2 (en) * 2006-06-16 2013-08-20 Harris Corporation Method and system for network-independent QoS
US20070291767A1 (en) * 2006-06-16 2007-12-20 Harris Corporation Systems and methods for a protocol transformation gateway for quality of service
US20070291768A1 (en) * 2006-06-16 2007-12-20 Harris Corporation Method and system for content-based differentiation and sequencing as a mechanism of prioritization for QOS
US20070291765A1 (en) * 2006-06-20 2007-12-20 Harris Corporation Systems and methods for dynamic mode-driven link management
US8730981B2 (en) * 2006-06-20 2014-05-20 Harris Corporation Method and system for compression based quality of service
US20080013559A1 (en) * 2006-07-14 2008-01-17 Smith Donald L Systems and methods for applying back-pressure for sequencing in quality of service
US8463589B2 (en) * 2006-07-28 2013-06-11 Synopsys, Inc. Modifying a virtual processor model for hardware/software simulation
US20080025318A1 (en) * 2006-07-31 2008-01-31 Harris Corporation Systems and methods for dynamically customizable quality of service on the edge of a network
US20100238801A1 (en) * 2006-07-31 2010-09-23 Smith Donald L Method and system for stale data detection based quality of service
US20100241759A1 (en) * 2006-07-31 2010-09-23 Smith Donald L Systems and methods for sar-capable quality of service
US8300653B2 (en) * 2006-07-31 2012-10-30 Harris Corporation Systems and methods for assured communications with quality of service
US7450588B2 (en) * 2006-08-24 2008-11-11 Intel Corporation Storage network out of order packet reordering mechanism
US7533297B2 (en) * 2006-09-14 2009-05-12 International Business Machines Corporation Fault isolation in a microcontroller based computer
CN101150792A (zh) * 2006-09-20 2008-03-26 深圳富泰宏精密工业有限公司 恢复暂时失能用户识别卡操作功能的方法及移动通信装置
US8719807B2 (en) 2006-12-28 2014-05-06 Intel Corporation Handling precompiled binaries in a hardware accelerated software transactional memory system
US8644305B2 (en) * 2007-01-22 2014-02-04 Synopsys Inc. Method and system for modeling a bus for a system design incorporating one or more programmable processors
US8060775B1 (en) 2007-06-14 2011-11-15 Symantec Corporation Method and apparatus for providing dynamic multi-pathing (DMP) for an asymmetric logical unit access (ALUA) based storage system
US7707367B1 (en) * 2007-06-28 2010-04-27 Emc Corporation Data storage system having separate atomic operation/non-atomic operation paths
US7987229B1 (en) 2007-06-28 2011-07-26 Emc Corporation Data storage system having plural data pipes
US8090789B1 (en) 2007-06-28 2012-01-03 Emc Corporation Method of operating a data storage system having plural data pipes
US7979572B1 (en) 2007-06-28 2011-07-12 Emc Corporation Data storage system having operation code in address portion for atomic operations
US7979588B1 (en) * 2007-06-28 2011-07-12 Emc Corporation Data storage system having acceleration path for congested packet switching network
US20090006712A1 (en) * 2007-06-29 2009-01-01 Fatma Ehsan Data ordering in a multi-node system
US7619484B2 (en) * 2007-10-19 2009-11-17 Hewlett-Packard Development Company, L.P. Oscillator phase matching
US7941399B2 (en) 2007-11-09 2011-05-10 Microsoft Corporation Collaborative authoring
US8825758B2 (en) 2007-12-14 2014-09-02 Microsoft Corporation Collaborative authoring modes
US8185338B2 (en) * 2007-12-24 2012-05-22 Stmicroelectronics International N.V. Low pin interface testing module
US8745337B2 (en) * 2007-12-31 2014-06-03 Teradyne, Inc. Apparatus and method for controlling memory overrun
US8521951B2 (en) * 2008-01-16 2013-08-27 S. Aqua Semiconductor Llc Content addressable memory augmented memory
US8301588B2 (en) 2008-03-07 2012-10-30 Microsoft Corporation Data storage for file updates
US8352870B2 (en) 2008-04-28 2013-01-08 Microsoft Corporation Conflict resolution
US8429753B2 (en) * 2008-05-08 2013-04-23 Microsoft Corporation Controlling access to documents using file locks
US8825594B2 (en) * 2008-05-08 2014-09-02 Microsoft Corporation Caching infrastructure
US8417666B2 (en) * 2008-06-25 2013-04-09 Microsoft Corporation Structured coauthoring
US8386750B2 (en) * 2008-10-31 2013-02-26 Cray Inc. Multiprocessor system having processors with different address widths and method for operating the same
US20100131836A1 (en) * 2008-11-24 2010-05-27 Microsoft Corporation User-authored notes on shared documents
US20100185896A1 (en) * 2009-01-22 2010-07-22 International Business Machines Corporation Method and apparatus for fully redundant control of low-speed peripherals
US8346768B2 (en) * 2009-04-30 2013-01-01 Microsoft Corporation Fast merge support for legacy documents
US20120210069A1 (en) * 2009-10-25 2012-08-16 Plurality Ltd. Shared cache for a tightly-coupled multiprocessor
CN102053847B (zh) * 2009-11-09 2014-04-23 英业达股份有限公司 服务器与其更新方法
CN101699406B (zh) * 2009-11-12 2011-12-14 威盛电子股份有限公司 数据储存系统与方法
TWI417887B (zh) * 2009-12-02 2013-12-01 Via Tech Inc 資料儲存系統與方法
US8639885B2 (en) * 2009-12-21 2014-01-28 Oracle America, Inc. Reducing implementation costs of communicating cache invalidation information in a multicore processor
US8195883B2 (en) 2010-01-27 2012-06-05 Oracle America, Inc. Resource sharing to reduce implementation costs in a multicore processor
US8650431B2 (en) 2010-08-24 2014-02-11 International Business Machines Corporation Non-disruptive hardware change
FR2982960B1 (fr) * 2011-11-22 2014-06-27 Schneider Electric Usa Inc Adaptation dynamique a des changements dans une topologie de systeme de commande
US9104529B1 (en) 2011-12-30 2015-08-11 Emc Corporation System and method for copying a cache system
US9158578B1 (en) 2011-12-30 2015-10-13 Emc Corporation System and method for migrating virtual machines
US9053033B1 (en) * 2011-12-30 2015-06-09 Emc Corporation System and method for cache content sharing
US9235524B1 (en) 2011-12-30 2016-01-12 Emc Corporation System and method for improving cache performance
US8930947B1 (en) 2011-12-30 2015-01-06 Emc Corporation System and method for live migration of a virtual machine with dedicated cache
US9009416B1 (en) * 2011-12-30 2015-04-14 Emc Corporation System and method for managing cache system content directories
US8892800B2 (en) * 2012-02-09 2014-11-18 Intel Corporation Apparatuses for inter-component communication including slave component initiated transaction
US9244828B2 (en) * 2012-02-15 2016-01-26 Advanced Micro Devices, Inc. Allocating memory and using the allocated memory in a workgroup in a dispatched data parallel kernel
US10055711B2 (en) 2012-02-22 2018-08-21 Bosch Automotive Service Solutions Inc. Alternator and starter tester with warranty code functionality and method
US9128156B2 (en) 2012-05-03 2015-09-08 Bosch Automotive Service Solutions Inc. Alternator and starter tester with other failures determination functionality and method
US8903595B2 (en) 2012-09-17 2014-12-02 Bosch Automotive Service Solutions Llc Alternator and starter tester with increased load and cable identification
US9251073B2 (en) 2012-12-31 2016-02-02 Intel Corporation Update mask for handling interaction between fills and updates
US9411014B2 (en) 2013-03-22 2016-08-09 Synopsys, Inc. Reordering or removal of test patterns for detecting faults in integrated circuit
US9417287B2 (en) 2013-04-17 2016-08-16 Synopsys, Inc. Scheme for masking output of scan chains in test circuit
US9588179B2 (en) * 2013-06-12 2017-03-07 Synopsys, Inc. Scheme for masking output of scan chains in test circuit
US10459784B2 (en) * 2013-06-28 2019-10-29 Infineon Technologies Ag Frequency signal generator, a frequency modulated continuous wave radar system and a method for generating a frequency signal
US10067187B2 (en) 2013-07-19 2018-09-04 Synopsys, Inc. Handling of undesirable distribution of unknown values in testing of circuit using automated test equipment
US9344525B2 (en) * 2013-11-25 2016-05-17 Violin Memory Inc. Method and apparatus for data migration
US9274835B2 (en) 2014-01-06 2016-03-01 International Business Machines Corporation Data shuffling in a non-uniform memory access device
US9256534B2 (en) 2014-01-06 2016-02-09 International Business Machines Corporation Data shuffling in a non-uniform memory access device
US9558064B2 (en) * 2015-01-28 2017-01-31 Micron Technology, Inc. Estimating an error rate associated with memory
FR3033428A1 (fr) * 2015-04-10 2016-09-09 Continental Automotive France Procede de determination de l'origine d'un defaut de securite
US9524769B2 (en) * 2015-04-17 2016-12-20 Samsung Electronics Co., Ltd. Smart in-module refresh for DRAM
US9761296B2 (en) 2015-04-17 2017-09-12 Samsung Electronics Co., Ltd. Smart in-module refresh for DRAM
RU2591180C1 (ru) * 2015-05-29 2016-07-10 Юрий Анатольевич Ткаченко Защищенный компьютер, сохраняющий работоспособность при повреждении
US9797956B2 (en) 2015-11-24 2017-10-24 Bosch Automotive Service Solutions Inc. System and method for testing alternator default mode operation
US10193413B2 (en) 2015-12-15 2019-01-29 Bosch Automotive Service Solutions Inc. Mounting bracket for water cooled type alternator
RU2615314C1 (ru) * 2015-12-25 2017-04-04 Акционерное общество "Научно-исследовательский институт электронной техники" Способ повышения надежности микроэвм
US9923579B2 (en) * 2016-03-08 2018-03-20 International Business Machines Corporation Clock path technique for using on-chip circuitry to generate a correct encode pattern to test the on-chip circuitry
US9910090B2 (en) * 2016-03-08 2018-03-06 International Business Machines Corporation Bypassing an encoded latch on a chip during a test-pattern scan
US10474601B2 (en) 2017-02-06 2019-11-12 Oracle International Corporation Distributed fairness protocol for interconnect networks
CN107273100B (zh) * 2017-06-15 2021-06-08 华为技术有限公司 一种数据实时处理及存储装置
US11080188B1 (en) 2018-03-28 2021-08-03 Apple Inc. Method to ensure forward progress of a processor in the presence of persistent external cache/TLB maintenance requests
US10866892B2 (en) 2018-08-13 2020-12-15 Apple Inc. Establishing dependency in a resource retry queue
US10747928B2 (en) * 2018-12-29 2020-08-18 Intel IP Corporation Diagnostic testing of FPGAs for safety critical systems
US10972408B1 (en) 2020-02-10 2021-04-06 Apple Inc. Configurable packet arbitration with minimum progress guarantees
WO2021215011A1 (ja) * 2020-04-24 2021-10-28 株式会社東陽テクニカ パケットキャプチャ装置及び方法
WO2022047306A1 (en) * 2020-08-28 2022-03-03 Deep Vision Inc A processor system and method for increasing data-transfer bandwidth during execution of a scheduled parallel process
US11422946B2 (en) 2020-08-31 2022-08-23 Apple Inc. Translation lookaside buffer striping for efficient invalidation operations
US11675710B2 (en) 2020-09-09 2023-06-13 Apple Inc. Limiting translation lookaside buffer searches using active page size
US11615033B2 (en) 2020-09-09 2023-03-28 Apple Inc. Reducing translation lookaside buffer searches for splintered pages
CN113034878B (zh) * 2021-03-09 2022-04-22 何思源 一种自定义语音控制的万能型家电遥控装置

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3069562A (en) * 1956-08-06 1962-12-18 Digital Control Systems Inc Highly reliable rectifier unit
US3226569A (en) * 1962-07-30 1965-12-28 Martin Marietta Corp Failure detection circuits for redundant systems
US4920540A (en) * 1987-02-25 1990-04-24 Stratus Computer, Inc. Fault-tolerant digital timing apparatus and method
US4644498A (en) * 1983-04-04 1987-02-17 General Electric Company Fault-tolerant real time clock
US4939694A (en) * 1986-11-03 1990-07-03 Hewlett-Packard Company Defect tolerant self-testing self-repairing memory system
US4801869A (en) * 1987-04-27 1989-01-31 International Business Machines Corporation Semiconductor defect monitor for diagnosing processing-induced defects
US4873685A (en) * 1988-05-04 1989-10-10 Rockwell International Corporation Self-checking voting logic for fault tolerant computing applications
JPH0797328B2 (ja) * 1988-10-25 1995-10-18 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン フオールト・トレラント同期システム
US5392297A (en) * 1989-04-18 1995-02-21 Vlsi Technology, Inc. Method for automatic isolation of functional blocks within integrated circuits
US5042032A (en) * 1989-06-23 1991-08-20 At&T Bell Laboratories Packet route scheduling in a packet cross connect switch system for periodic and statistical packets
US4961013A (en) * 1989-10-18 1990-10-02 Hewlett-Packard Company Apparatus for generation of scan control signals for initialization and diagnosis of circuitry in a computer
US5157781A (en) * 1990-01-02 1992-10-20 Motorola, Inc. Data processor test architecture
US5313455A (en) * 1990-04-23 1994-05-17 Koninklijke Ptt Nederland N.V. Transmission system with recording of untransmitted packets
US5159273A (en) * 1990-09-28 1992-10-27 Hughes Aircraft Company Tri-state bus driver to support reconfigurable fault tolerant logic
US5166604A (en) * 1990-11-13 1992-11-24 Altera Corporation Methods and apparatus for facilitating scan testing of asynchronous logic circuitry
US5271019A (en) * 1991-03-15 1993-12-14 Amdahl Corporation Scannable system with addressable scan reset groups
US5269013A (en) * 1991-03-20 1993-12-07 Digital Equipment Corporation Adaptive memory management method for coupled memory multiprocessor systems
US5260979A (en) * 1991-05-28 1993-11-09 Codex Corp. Circuit and method of switching between redundant clocks for a phase lock loop
US5522080A (en) * 1991-10-24 1996-05-28 Intel Corporation Centralized control SIMD processor having different priority levels set for each data transfer request type and successively repeating the servicing of data transfer request in a predetermined order
JP2854474B2 (ja) * 1992-09-29 1999-02-03 三菱電機株式会社 バス使用要求調停装置
US5533188A (en) * 1992-10-19 1996-07-02 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Fault-tolerant processing system
JPH0760395B2 (ja) * 1992-11-06 1995-06-28 日本電気株式会社 フォールトトレラントコンピュータシステム
US5434993A (en) * 1992-11-09 1995-07-18 Sun Microsystems, Inc. Methods and apparatus for creating a pending write-back controller for a cache controller on a packet switched memory bus employing dual directories
JP2522140B2 (ja) * 1992-11-18 1996-08-07 日本電気株式会社 論理回路
US5396619A (en) * 1993-07-26 1995-03-07 International Business Machines Corporation System and method for testing and remapping base memory for memory diagnostics
US5577204A (en) * 1993-12-15 1996-11-19 Convex Computer Corporation Parallel processing computer system interconnections utilizing unidirectional communication links with separate request and response lines for direct communication or using a crossbar switching device
US5535405A (en) * 1993-12-23 1996-07-09 Unisys Corporation Microsequencer bus controller system
CA2145553C (en) * 1994-03-30 1999-12-21 Yuuki Date Multi-processor system including priority arbitrator for arbitrating request issued from processors
US5613153A (en) * 1994-10-03 1997-03-18 International Business Machines Corporation Coherency and synchronization mechanisms for I/O channel controllers in a data processing system
US5623672A (en) * 1994-12-23 1997-04-22 Cirrus Logic, Inc. Arrangement and method of arbitration for a resource with shared user request signals and dynamic priority assignment
US5603005A (en) * 1994-12-27 1997-02-11 Unisys Corporation Cache coherency scheme for XBAR storage structure with delayed invalidates until associated write request is executed
US5487074A (en) * 1995-03-20 1996-01-23 Cray Research, Inc. Boundary scan testing using clocked signal
DE69616402T2 (de) * 1995-03-31 2002-07-18 Sun Microsystems Inc Schnelle Zweitor-Cachesteuerungsschaltung für Datenprozessoren in einem paketvermittelten cachekohärenten Multiprozessorsystem
US5691985A (en) * 1995-04-19 1997-11-25 Lucent Technologies Inc. System and method for increasing throughput of inter-network gateways using a hardware assist engine
US5805905A (en) * 1995-09-06 1998-09-08 Opti Inc. Method and apparatus for arbitrating requests at two or more levels of priority using a single request line

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7519856B2 (en) 2004-12-21 2009-04-14 Nec Corporation Fault tolerant system and controller, operation method, and operation program used in the fault tolerant system

Also Published As

Publication number Publication date
CA2183223A1 (en) 1997-02-15
EP0852035A4 (en) 1999-10-13
US6026461A (en) 2000-02-15
US6122756A (en) 2000-09-19
CA2229441A1 (en) 1997-02-27
US5887146A (en) 1999-03-23
EP0852035A1 (en) 1998-07-08
WO1997007457A1 (en) 1997-02-27

Similar Documents

Publication Publication Date Title
US6122756A (en) High availability computer system and methods related thereto
US5220668A (en) Digital data processor with maintenance and diagnostic system
AU725945B2 (en) Digital data processing methods and apparatus for fault isolation
US6684343B1 (en) Managing operations of a computer system having a plurality of partitions
US6760868B2 (en) Diagnostic cage for testing redundant system controllers
US6574748B1 (en) Fast relief swapping of processors in a data processing system
US8327113B2 (en) Method, system, and apparatus for dynamic reconfiguration of resources
JP4124507B2 (ja) 構成可能なハードウエア・システム・ドメインを有するマルチプロセッサ・コンピュータ
US5386551A (en) Deferred resource recovery
US7007192B2 (en) Information processing system, and method and program for controlling the same
US20050034039A1 (en) Methods and devices for injecting commands in systems having multiple multi-processor clusters
JPH09128356A (ja) フェイル−ファースト、フェイル−ファンクショナル、フォルトトレラント・マルチプロセッサ・システム
CA2032067A1 (en) Fault-tolerant computer system with online reintegration and shutdown/restart
US7127638B1 (en) Method and apparatus for preserving data in a high-availability system preserving device characteristic data
JPH11161625A (ja) コンピュータ・システム
US7568138B2 (en) Method to prevent firmware defects from disturbing logic clocks to improve system reliability
JP3301992B2 (ja) 電源故障対策を備えたコンピュータシステム及びその動作方法
US7916722B2 (en) Method for indirect access to a support interface for memory-mapped resources to reduce system connectivity from out-of-band support processor
JPH0934809A (ja) 高信頼化コンピュータシステム
JPH1011319A (ja) マルチプロセッサシステムの保守方法
JPH09134336A (ja) フェイル−ファースト、フェイル−ファンクショナル、フォルトトレラント・マルチプロセッサ・システム
US7302690B2 (en) Method and apparatus for transparently sharing an exception vector between firmware and an operating system
JPH09128347A (ja) フェイル−ファースト、フェイル−ファンクショナル、フォルトトレラント・マルチプロセッサ・システム
JPH0916426A (ja) 2ポートコンソールを持つフォールトトレラントコンピュータ
Siewiorek et al. Reliability in multiprocessor systems: a case study of C. mmp, Cm* and C. vmp.

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050621

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20050915

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20051031

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051220

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060912

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061227

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070118

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20070329

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090413