JPH10326261A

JPH10326261A - 分散コンピュータ・システムのハードウェア要素によりエラーを報告するシステム

Info

Publication number: JPH10326261A
Application number: JP10091149A
Authority: JP
Inventors: Mary Desnoyears Christine; クリスティン・メアリー・デスノイヤーズ; Reroi Gaameyer Derek; デリック・レロイ・ガーマイヤ; Eleane Herman Antoinette; アントワネット・エレーヌ・ヘルマン; Robert F Stucke; ロバート・フレデリック・スタック; Alfred Campf Francis; フランシス・アルフレッド・カンプフ
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1997-04-08
Filing date: 1998-04-03
Publication date: 1998-12-08
Anticipated expiration: 2018-04-03
Also published as: CN1195813A; JP3649580B2; US5968189A

Abstract

(57)【要約】【課題】エラーをプロセッサに報告するより効率のよ
いシステムを提供すること。【解決手段】エラーが検出されたとき、分散コンピュ
ータ・システムのハードウェア要素によってエラー・メ
ッセージが生成される。次いで、このエラー・メッセー
ジがハードウェア要素から分散コンピュータ・システム
の１つまたは複数の指定処理ノードに転送される。ハー
ドウェア要素には、たとえば検出されたエラーを報告す
るように適合された交換要素または通信アダプタが含ま
れる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は一般に分散コンピュ
ータ・システムに関し、詳細にはこうしたシステムのハ
ードウェア構成要素を使ってそれらのハードウェア構成
要素が検出したエラーを報告することに関する。

【０００２】

【従来の技術】通常、分散コンピュータ・システムは相
互接続ネットワークによって互いに結合されたいくつか
のプロセッサを含んでいる。プロセッサのうち１台はコ
ンピュータ・システム内の装置障害を監視するタスクを
有する。たとえば、心拍型プロトコルは、システム内の
各装置を定期的にポーリングして、それが依然として活
動状態にあるかどうか判定する。かつて活動状態にあっ
た装置がもはや活動状態にない場合、プロセッサは装置
を検査して、エラーが発生したかどうか突きとめる。す
べての装置をポーリングするのに要する時間は、システ
ムのサイズが増大するのに比例して増加する。

【０００３】障害が検出されると、プロセッサは障害装
置と通信して障害の原因を決定し、かつ適当な回復スキ
ームを開始する必要がある。たとえば、相互接続ネット
ワーク内で障害が発生した場合、プロセッサはそのネッ
トワークと通信して、相互接続ネットワークが捕捉した
障害情報を取り出し、かつ適切な回復措置を開始する必
要がある。しかし、相互接続ネットワークとプロセッサ
の間に直接接続が存在する保証はないので、この通信に
は一般に代替機構が使用される。

【０００４】

【発明が解決しようとする課題】プロセッサを使用し
て、このような形で障害情報を探索して取り出し、さら
に代替機構を使用して、相互接続ネットワーク内でエラ
ーが発生したときに、障害情報を取り出すのは、望むほ
ど効率がよくない。したがって、対処のためエラーをプ
ロセッサに報告するより効率のよい方法が求められてい
る。詳細には、プロセッサに障害情報を探索させて取り
出させる代りに、たとえば相互接続ネットワーク自体が
報告を行う機構が求められている。

【０００５】

【課題を解決するための手段】分散コンピュータ・シス
テムにおけるエラーを報告するシステムを提供すること
により、従来技術の欠点が克服され、追加の利点が提供
される。このシステムは、エラーが検出されたとき、エ
ラー・メッセージを生成するように適合された、前記分
散コンピュータ・システムのハードウェア要素を含んで
いる。このハードウェア要素はさらに、このハードウェ
ア要素から分散コンピュータ・システムの第１の指定処
理ノードにそのエラー・メッセージを転送するように適
合されている。

【０００６】本発明の他の実施形態では、ハードウェア
要素は、交換要素または通信アダプタを含んでいる。

【０００７】本発明の他の実施形態では、ハードウェア
要素はさらに、エラー・メッセージを第１の指定処理ノ
ードが受け取ったとの指示をハードウェア要素が受け取
る前に、追加のエラーを収集するように適合されてい
る。

【０００８】さらに別の例では、ハードウェア要素はさ
らに、ハードウェア要素からコンピュータ・システムの
第２の指定処理ノードにエラー・メッセージを送るよう
に適合されている。

【０００９】本発明のエラー報告機能により、障害があ
るかどうか装置を監視する必要がなくなり、経路または
経路区間の争奪が軽減される。さらに、本発明のエラー
報告機能により、システムが後続のエラー・パケットで
混雑することが防止され、システムの残りの部分が正常
に動作できるようになる。本発明のエラー報告機能は、
ソフトウェアまたは任意のプロセッサ論理ではなくシス
テム内部のハードウェアを使って実施される。

【００１０】本発明の技術によってその他の特徴および
利点も実現される。本発明のその他の実施形態および態
様は本明細書に詳しく記載してあり、特許請求される発
明の一部と見なされる。

【００１１】

【発明の実施の形態】本発明の原理によれば、分散コン
ピュータ・システムのハードウェア要素がコンピュータ
・システムの指定された処理ノードにエラー状態を報告
する。ハードウェア要素は、ソフトウェアやプロセッサ
論理を必要とせずにエラーを報告する。

【００１２】本発明の報告機能を組み込みそれを使用す
る分散コンピュータ・システムの一例を図１に示す。一
実施形態においては、分散コンピュータ・システム１０
０は、インターナショナル・ビジネス・マシーンズ・コ
ーポレイションから提供されるＲＩＳＣシステム／６０
００スケーラブルＰＯＷＥＲパラレル・システムであ
り、相互接続ネットワーク１０４に結合された複数の処
理ノード１０２を含んでいる。処理ノードおよび相互接
続ネットワークの一例については下記に説明する。

【００１３】処理ノードは、たとえば、インターナショ
ナル・ビジネス・マシーンズ・コーポレイションから提
供されるＲＳ／６０００プロセッサなどのプロセッサ１
０６と、たとえばシステム入出力バス１０９を介してプ
ロセッサに結合された通信アダプタ１０８とを含む。通
信アダプタは、システム内のあるプロセッサから別のプ
ロセッサに、または相互接続ネットワークからプロセッ
サに通信を行う際に使用される入出力装置である。通信
ネットワークの一例は、下記で図６に関してさらに詳し
く説明する。

【００１４】処理ノード１０２は、相互接続ネットワー
ク１０４に結合され、相互接続ネットワーク１０４は、
たとえばインターナショナル・ビジネス・マシーンズ・
コーポレイションから提供されるスケーラブルＰＯＷＥ
Ｒパラレル交換機（ＳＰ交換機）を含む。相互接続ネッ
トワークの一実施形態については下記で説明するが、デ
リック・ガーマイヤ（Derrick Garmire）著の白書「IBM
POWERparallel Technology Briefing: Interconnectio
n Technologies for High-Performance Computing (RS/
6000 SP)」（1996年6月6日）、および同じくデリック・
ガーマイヤ著「The RS/6000 SP High-Performance Comm
unication Network」（1996年6月6日）にも記載されて
いる。

【００１５】相互接続ネットワークは、各プロセッサが
同時にメッセージを送受できるように分散コンピュータ
・システムのプロセッサを互いに接続する。一実施形態
では、相互接続ネットワーク１０４は、１台または複数
の交換機１１０を含み、各交換機は処理ノードまたは別
の交換機あるいはその両方に結合される。たとえば、図
１において、交換機＃１はここでは１次ノードと称する
第１処理ノードと、他の１つまたは複数の処理ノードに
接続されている。これはさらに、システムのスケーラビ
リティを高めるために交換機＃２に接続されている。交
換機＃２は、交換機＃１と他の少なくとも１つの処理ノ
ード１０２に接続されている。

【００１６】さらに大きな構成では、システムのスケー
ラビリティをさらに高めるために、追加レベルの中間交
換機をも含めることができる（図２参照）。図２に示し
た例では、中間交換機２００はフレーム２０４内に位置
する交換機２０２に接続されている。各フレームは、交
換機２０２の他に、たとえば２〜１６個の処理ノードを
含む。中間交換機は交換機を他の交換機に接続するもの
であって、交換機を処理ノードに接続することはしな
い。図２に示すように、処理ノードへの接続は、中間交
換機２００ではなく交換機２０２によって行われる。

【００１７】図１に戻ると、一例では、各交換機１０１
は複数（たとえば８個）の交換要素１１２を含み、それ
らは、それに接続された各ノードの接続点および他の交
換要素の接続点を提供する。この交換要素の構成によ
り、処理ノード間に複数の経路が得られ、単一の経路ま
たは素子が障害を起こしてもノードが相互に分離されな
くなる。具体的には、各処理ノードは交換要素への接続
を２つ有し、各接続は入出力接続である。

【００１８】本発明の原理によれば、各交換要素１１２
は、たとえば分散コンピュータ・システム１００内の指
定された処理ノード（たとえば１次ノード）からその交
換要素に転送される交換機初期設定パケットを使って初
期設定される。一実施形態では、初期設定サービス・パ
ケットは、このパケットが交換機初期設定パケットであ
り、したがって交換ネットワーク内の次の段に渡されな
いことを示すコマンドと、システムの第１の指定処理ノ
ード（たとえば１次ノード）への経路を示す１次経路
と、第１の指定処理ノードへの第２の経路または第２の
指定処理ノード（たとえばバックアップ・ノード）への
経路を示す２次経路と、交換要素の識別子と、その交換
要素に関する、本発明では論じる必要のないその他の様
々な初期設定データを含んでいる。

【００１９】一例では、各交換要素１１２は単一ＣＭＯ
Ｓチップ上に集積された８チャネル−８チャネル・パケ
ット経路指定ユニットである。そのようなチップの一実
施形態は、米国特許第５５４６３９１号に詳しく記載さ
れている。

【００２０】交換要素１１２の一実施形態（たとえば交
換チップ）についてはまた図３に関して詳しく説明す
る。一例では、交換要素１１２は、交換要素の各入力ポ
ートごとに１個ずつ、複数の受信モジュール３０２（た
とえば８個のモジュール）と、交換要素の各出力ボード
ごとに１個ずつ、複数の送信モジュール３０４（たとえ
ば８個のモジュール）とを含む。

【００２１】交換要素１１２はまた、指定された出力ポ
ートが使用可能なとき、パケットが受信モジュールから
送信モジュールに直接移動できるようにする、バッファ
のないクロスバー３０６を含む。さらに、バッファ付き
時間多重化８方向ルータを実施した中央待ち行列３０８
をも含む。この中央待ち行列３０８は、当該の出力ポー
トが使用中のとき、受信モジュールからメッセージを受
け取って格納する。その後、その当該の送信モジュール
から要求があったとき、中央待ち行列３０８はメッセー
ジをその送信モジュールに渡す。

【００２２】さらに、交換要素１１２は、その動作中に
使用されるハードウェア・サービス論理３１０を含む。
具体的には、ハードウェア・サービス論理３１０は受信
ポートからメッセージを受け取って処理し、交換機の送
信モジュールを介してシステムの処理ノードにメッセー
ジを送ることにより動作を確認する。さらに、本発明に
よれば、ハードウェア・サービス論理３１０は本発明の
エラー報告機能を提供する。

【００２３】本発明のエラー報告機能に使用されるハー
ドウェア・サービス論理の一実施形態を図４に関して詳
細に説明する。一例では、下記に述べる機能はハードウ
ェア状態機械を使って実施される。

【００２４】図４を参照すると、最初に、たとえばパリ
ティ・エラー、巡回冗長検査（ＣＲＣ）エラー、順序エ
ラーなどのエラーを交換要素が検出したかどうか判定す
る（照会４００）。たとえば、交換要素内の状態機械の
現状態を検査して、それが予想される状態にあるかどう
か判定することによって、交換要素は順序エラーがある
かどうか検査する。それが予想される状態にない場合
は、エラーが発生した訳である。しかし状態が適正な場
合は、順序エラーはない。

【００２５】エラーが検出されなかったときは、流れは
照会４００に戻り、予め選択した時間間隔で判定を行う
ことができる。一方、エラーが検出された場合は、下記
に述べるように処理が続行する。

【００２６】エラー・メッセージが既に送られたかどう
か判定を行う（照会４０２）。たとえば、エラーを含む
エラー・サービス・パケットが既に交換要素によって指
定の処理ノードに送られたかどうか検査を行って判定す
る。一例では、この判定は、エラー・サービス・パケッ
トが送られたかどうかを示す交換要素内のビットを検査
して行う。

【００２７】エラー・サービス・パケットが送られてい
ないときは、パケットを送るためにたとえば２つのポー
ト、１次ポートおよび２次ポートのアクセスを要求する
（ステップ４０６）。ポートの指定は、前述のように初
期設定時に交換要素に提供される。アクセスが要求され
ると、各ポートは肯定応答を送り返し、最初に受信され
たポートがメッセージを送出するのに使用される最初の
ポートとなる。たとえば、１次ポートが肯定応答を送り
返した最初のポートである場合（照会４０８）、第１の
指定処理ノード（たとえば１次ノード）宛のエラー・サ
ービス・パケットが生成される（ステップ４１０）。

【００２８】一例では、エラー・サービス・パケット
は、開始制御文字、交換要素の初期設定中に提供され
る、第１の指定処理ノードへの経路、エラーが発生した
ことを示すコマンド、初期設定中に提供される交換要素
の識別子、どのエラー・ビットが活動状態であるかを示
すエラー・データ、データが壊れていないことを確認す
るために第１の指定ノードにある通信アダプタが使用す
る検査パターンを含む、巡回冗長検査、および終了制御
文字を含んでいる。開始制御文字および終了制御文字
は、パケットの開始位置および終了位置を定義し、した
がってハードウェアがパケット長やその他類似のタイプ
の情報を記録する必要はない。

【００２９】エラー・サービス・パケットの作成に続い
て、パケットは標準の送信技術を用いて第１の指定処理
ノードに送り出される。第１の指定処理ノードでは、通
信アダプタがパケットを受信し、それをバッファし、そ
の処理ノードのプロセッサに渡す。

【００３０】パケットを１次ポートから送出した後、そ
のパケットが両方のポートから送出されたかどうか検査
して判定する（照会４１２）。パケットが両方のポート
から送出されていないときは、流れは、ステップ４０６
「ポート間で調停する」に戻る。このとき、交換機は、
既にパケットを１次ポートから送出したことを知ってお
り、したがってバックアップ・ポートを選択する（照会
４１４）。

【００３１】その後、エラーを第２の指定処理ノード
（たとえば、バックアップ・ノード）に報告するための
エラー・サービス・パケットが生成される（ステップ４
１０）。このパケットは、指定経路が１次処理ノードで
はなくてバックアップ処理ノード宛である点を除き、最
初のパケットに関して上述したものと同じ情報を含んで
いる。

【００３２】パケットが両方のポートから送出されると
（照会４１２）、流れは照会４００「エラーを検出した
か」に戻る。

【００３３】照会４０２「エラー・パケットが既に送ら
れたか」に戻ると、エラー・パケットが既に送られてい
るときは、そのエラーに対するリセット・サービス・パ
ケットを交換要素が受け取ったかどうか判定が行われる
（照会４１８）。一実施形態では、この判定は交換要素
が着信サービス・パケットのコマンドを検査することに
よって行う。

【００３４】そのコマンドが、リセット・サービス・パ
ケットを受け取っていないことを示すときは、システム
がエラー・メッセージであふれないように追加のエラー
が収集される（ステップ４２０）。具体的には、リセッ
ト・サービス・パケットを受け取るまで、他のエラー・
サービス・パケットは交換要素から転送されない。次い
で処理は照会４００「エラーを検出したか」に戻る。

【００３５】照会４１８に戻って、送られたエラー・サ
ービス・パケットに対するリセット・サービス・パケッ
トを受け取った場合は、処理は図５に進む（ステップ４
２２）。一実施形態では、図５の機能はハードウェア状
態機械を使って実施される。

【００３６】図５を参照すると、一例では、エラー・パ
ケットを受信した指定ノードの少なくとも１つがリセッ
ト・サービス・パケットを生成する。一例では、リセッ
ト・サービス・パケットは、それがリセット・パケット
であることを示すコマンドおよびリセット・データを含
む。リセット・サービス・パケットを生成した後、その
指定ノードはエラー・サービス・パケット中で識別され
た交換要素にそのパケットを送信し、その交換要素はリ
セット・パケットを受け取ったことを検出する。（ステ
ップ５００）。

【００３７】リセット・サービス・パケットの受信に続
いて、交換要素はそのリセット・データを使って（たと
えば、エラー・ビットをリセットすることにより）エラ
ーをリセットし、さらにエラー報告機能をリセットし
て、別のエラー・パケットが送られるのを禁止する（ス
テップ５０２）。一例では、この機能は対応するビット
をリセットすることによってリセットされる。

【００３８】次に、リセット・パケットをどのポートに
送信するか選択が行われる（ステップ５０４）。１次ポ
ートが最初に選択された（すなわち、最初に要求に肯定
応答する）場合（照会５０６）、肯定応答サービス・パ
ケットが生成される（ステップ５０８）。一実施形態で
は、肯定応答サービス・パケットは、第１の指定処理ノ
ードに対するエラー・サービス・パケットについて上述
したのと同じ情報を含んでいる。ただし、エラー・デー
タはステップ４２０（図４）で収集されたすべてのエラ
ーを含む。具体的には、肯定応答サービス・パケット
は、開始制御文字、１次ノードへの経路、それがエラー
であることを示すコマンド、交換要素の識別子、収集さ
れたエラー・データのすべて、ＣＲＣ、および終了制御
文字を含む。生成された肯定応答サービス・パケットは
１次処理ノードに送信される。

【００３９】パケットが両方のポートから送出されては
いない場合（照会５１０）、処理はステップ５０４「ポ
ート間で調停する」に進む。このときは、２次ポートが
選択され（照会５１２）、次いで第２の指定処理ノード
に対する肯定応答サービス・パケットが生成される（ス
テップ５１４）。この場合も、このパケットは、指定経
路がバックアップ・ノード宛である点を除き、１次ノー
ドに対する肯定応答について上述したように生成され
る。

【００４０】パケットが両方のポートから送出される
と、処理は、最後のリセット・パケットに含まれる新し
いエラー・メッセージについての照会４１８「リセット
・パケットが受信されたか」に進む（ステップ５１
６）。

【００４１】上記の実施形態では、エラー／肯定応答が
２つの処理ノードに報告される。これは一例にすぎな
い。別の実施形態では冗長性が除去され、１つの処理ノ
ードだけにエラー／肯定応答が送られる。さらに別の実
施形態では、パケットは必ずしも別の処理ノードに送ら
れず、別の経路を通って同じ処理ノードに送られる。こ
れらの変形形態もその他の実施形態もすべて本発明の範
囲および趣旨に含まれる。

【００４２】上記では、交換要素が分散コンピュータ・
システムの１つまたは複数の指定処理ノードに検出済み
エラーを報告するための機構について述べたが、別の実
施形態では、エラー情報が失われた場合、処理ノードは
交換要素にエラー状況パケットを要求することができ
る。

【００４３】本発明の別の実施形態では、やはり分散コ
ンピュータ・システムのハードウェア構成要素である通
信アダプタがエラーを検出し、１つまたは複数の指定処
理ノードに報告する。

【００４４】通信アダプタの一例については図６に関し
て詳細に説明し、通信アダプタの報告機能に関連する論
理の一実施形態については図７に関して詳細に説明す
る。

【００４５】図６を参照すると、一例では、通信アダプ
タ６００は、バス・インターフェース・ハードウェア論
理６０２、送信メッセージ・バッファ６０４、受信メッ
セージ・バッファ６０６、送信リンク・ハードウェア論
理６０８、６１０、および受信リンク・ハードウェア論
理６１２、６１４を含む。そのそれぞれについて下記で
説明する。

【００４６】バス・インターフェース・ハードウェア論
理６０２は、通信アダプタの残りの構成要素とシステム
・バスの間のインターフェースをとる。このシステム・
バスは通信アダプタを処理ノード上の対応するプロセッ
サに接続する。システム・バスは、他のアダプタ構成要
素またはプロセッサからエラー情報を受け取り、クリテ
ィカルなエラーが検出されたとき、チェック停止エラー
信号を送出する。

【００４７】バス・インターフェースは送信メッセージ
・バッファ６０４に結合される。これはバス・インター
フェース・ハードウェア論理６０２からメッセージを受
け取る。送信メッセージ・バッファ６０４はパケット化
されていないメッセージを後で送信するために一時記憶
し、エラーを検出した場合はそれをバス・インターフェ
ース・ハードウェア論理６０２に報告する。

【００４８】送信メッセージ・バッファ６０４は、送信
リンク・ハードウェア論理６０８および６１０に結合さ
れる。これらは、相互接続ネットワークにメッセージを
送信する際に使用される二重ポートである。各送信リン
ク・ハードウェア論理は、メッセージをパケット化し、
バッファし、所与のリンクから相互接続ネットワークに
送出する。さらに検出したエラーをバス・インターフェ
ース・ハードウェア論理６０２に報告する。送信リンク
・ハードウェア論理が活動状態のチェック停止信号を受
信したときは、現状態（たとえば状態機械に記憶されて
いる）に割り込んで、下記で詳しく説明するように、エ
ラー・サービス・パケットを送る。その後、リセットを
受け取るまでリンク論理は遊休状態となる。

【００４９】二重ポート送信リンクに加えて、通信アダ
プタは、二重ポート受信リンク、すなわち受信リンク・
ハードウェア論理６１２および６１４をも含む。受信リ
ンク・ハードウェア論理は、通信アダプタを相互接続ネ
ットワークに接続するリンクからメッセージ・パケット
を受け取る。この論理は、受信データを受信メッセージ
・バッファ６０６に渡し、エラーをバス・インターフェ
ース・ハードウェア論理６０２に報告する。さらに、チ
ェック停止信号が活動状態の場合、動作を停止する。

【００５０】受信リンクは受信メッセージ・バッファ６
０６に結合され、後者はリンクからデータを受け取り、
バス・インターフェース・ハードウェア論理６０２に渡
す。また、エラーを検出した場合はそれをバス・インタ
ーフェース・ハードウェア論理６０２に報告する。

【００５１】本発明の原理によれば、通信アダプタは、
それに対応するローカル・プロセッサによって初期設定
される。たとえば、ローカル・プロセッサは、指定処理
ノードへの経路、アダプタの識別子、および初期設定に
必要な他の情報を提供する。アダプタがそれらの情報を
受け取ると、それはアダプタのハードウェア記憶エレメ
ントに記憶される。

【００５２】上述のように、通信アダプタは、クリティ
カルなエラーを検出した場合それを自発的に１つまたは
複数の指定処理ノードに報告し、したがって処理ノード
が通信アダプタをポーリングして、エラーが発生したか
どうか判定する必要はない。本発明の原理による、この
ようなエラーを報告するのに使用されるハードウェア論
理について、図７に関してさらに説明する。一例では、
下記に述べる機能は、通信アダプタの異なる構成要素の
ハードウェア状態機械を使って実施される。

【００５３】図７を参照すると、最初に、通信アダプタ
がクリティカルなエラーを検出したかどうか判定を行う
（照会７００）。この判定は、交換要素によるエラーの
検出と類似の形で行われる。クリティカルなエラーが検
出されなかったときは、再度検査が行われる（照会７０
０）。しかし、クリティカルなエラーが検出されたとき
は、通信アダプタが、オフラインになる（たとえば割込
み状態に入る）ことによって現動作に割り込む（ステッ
プ７０２）。

【００５４】続いて、エラー・サービス・パケット（チ
ェック停止パケットとも呼ばれる）が生成され、１つま
たは複数の指定処理ノードに送られる（ステップ７０
４）。一例では、第１の指定処理ノードに対してエラー
・サービス・パケットが生成され、第２の指定処理ノー
ドに対して別のパケットが生成される。各エラー・パケ
ットは、交換要素が生成するエラー・サービス・パケッ
トについて前述したのと同様の情報を含む。たとえば、
それぞれ開始制御文字、１次ノードまたは２次ノードへ
の経路、エラー・コマンド、アダプタ識別子、エラー・
データ、巡回冗長検査、および終了制御文字を含む。

【００５５】パケットが生成された後、第１の指定処理
ノード宛のパケットが指定された１次ポートから送出さ
れ、第２の指定処理ノード宛のパケットが指定された２
次ポートから送出される（ステップ７０６）。２つのポ
ートの使用により、パケットの１つがシステムを通過し
て指定ノードの１つに到着する確率、または指定経路の
１つを通過する確率が増大する。

【００５６】その後、通信アダプタは、それ以上エラー
が伝播するのを防止するためにリセットされるまで遊休
状態に留まる（ステップ７０８）。アダプタがその対応
するプロセッサによってリセットされると（照会７１
０）、流れは照会７００「エラーが検出されたか」に戻
る。

【００５７】上記の実施形態では、クリティカルなエラ
ーは指定処理ノードに報告される。アダプタによって検
出されたクリティカルでないエラーはローカル・プロセ
ッサにのみ報告される。しかし、別の実施形態では、す
べてのエラーが指定処理ノードに報告される。

【００５８】別の実施形態では、交換機構の場合と同様
に、エラー・パケットを２つのポートから送出する必要
はない。その上、パケットを２つ（以上）の経路を通っ
て同一の処理ノードに送ることもできる。これらその他
の実施形態は、特許請求される本発明の範囲および趣旨
に含まれる。

【００５９】本発明のエラー報告機能は、障害がないか
どうか装置を監視する必要がなく、その結果、経路また
は経路区間に対する争奪が軽減される。エラーが検出さ
れると、交換要素またはアダプタによりサービス・パケ
ットを介して報告される。交換要素は追加のエラーを収
集するだけで、リセット・サービス・パケットを受信す
るまではそれを報告しないので、追加のエラー・パケッ
トでシステムがあふれることはない。アダプタはオフラ
インになり、したがって、システムは後続のエラー・パ
ケットであふれることはなく、システムの残りの部分は
正常に機能することができる。

【００６０】本発明の機構はさらに、障害のある構成要
素が報告経路の１つ中にある場合、高度のフォールト・
トレラント性を提供する。

【００６１】本明細書で述べた分散コンピュータ・シス
テムは一例にすぎない。本発明の報告機能は、本発明の
趣旨から逸脱することもなく、他のシステム内に組み込
むことができ、または他のシステムと共に使用すること
ができ、あるいはその両方が可能である。たとえば、本
発明の趣旨から逸脱することなく、異なるアーキテクチ
ャまたはハードウェア構成要素あるいはその両方を使用
することができる。さらに、状態機械以外のハードウェ
ア構成要素を使って本発明のハードウェア論理を実施す
ることもできる。

【００６２】上記のことに加えて、別の実施形態では、
検出されたエラーは、エラーの発生回数が閾値に達した
後に初めて報告される。閾値に達したとき、本発明の原
理に従ってエラーが報告される。

【００６３】本明細書に示した流れ図は例示的なものに
すぎない。それらの図に述べた図やその中に示されたス
テップ（または動作）には、本発明の趣旨から逸脱せず
に、多数の変形例があり得る。たとえば、各ステップを
異なる順序で実行することもでき、またステップを追加
し、あるいは変更することもできる。これらの変形例は
すべて、特許請求される本発明の一部分と見なされる。

【００６４】まとめとして、本発明の構成に関して以下
の事項を開示する。

【００６５】（１）分散コンピュータ・システムのハー
ドウェア要素によりエラーを報告するシステムであっ
て、エラーが検出されたとき、エラー・メッセージを生
成するように適合された、前記分散コンピュータ・シス
テムのハードウェア要素を備え、前記ハードウェア要素
がさらに、前記ハードウェア要素から前記分散コンピュ
ータ・システムの第１の指定処理ノードに前記エラー・
メッセージを転送するように適合されている、システ
ム。（２）前記ハードウェア要素が交換要素または通信アダ
プタを備える、上記（１）に記載のシステム。（３）前記ハードウェア要素がさらに、前記エラー・メ
ッセージを前記ハードウェア要素から前記分散コンピュ
ータ・システムの第２の指定処理ノードに送るように適
合されている、上記（１）に記載のシステム。（４）前記ハードウェア要素がさらに、前記エラー・メ
ッセージと前記第１の指定処理ノードへの経路とを含む
サービス・パケットを作成するように適合されている、
上記（１）に記載のシステム。（５）前記ハードウェア要素がさらに、前記経路を使っ
て前記エラー・メッセージを前記第１の指定処理ノード
に送るように適合されている、上記（４）に記載のシス
テム。（６）前記エラー・メッセージを前記第１の指定処理ノ
ードが受け取ったとの指示を前記ハードウェア要素が受
け取る前に、前記ハードウェア要素がさらに、追加のエ
ラーを収集するように適合されている、上記（１）に記
載のシステム。（７）前記ハードウェア要素がさらに、前記指示の受信
を確認するように適合され、前記追加のエラーに関する
追加のエラー・メッセージを、前記分散コンピュータ・
システムの前記第１の指定処理ノードおよび第２の指定
処理ノードの少なくとも一方に転送するように適合され
ている、上記（６）に記載のシステム。（８）前記ハードウェア要素が通信アダプタを備え、前
記通信アダプタが、前記エラー・メッセージを生成する
前に前記通信アダプタの現在の動作を中断するように適
合されている、上記（１）に記載のシステム。

【図面の簡単な説明】

【図１】本発明の報告機能を組み込みそれを使用する分
散コンピュータ・システムの一例を示す図である。

【図２】本発明の原理による、中間交換機を含む図１の
分散コンピュータ・システムの相互接続ネットワークの
一実施形態を示す図である。

【図３】本発明の原理による交換要素の一例を示す図で
ある。

【図４】本発明の原理による、図３の交換要素によって
検出されたエラーを報告する際に使用されるハードウェ
ア・サービス論理の一実施形態を示す図である。

【図５】本発明の原理による、リセット・サービス・パ
ケットの受信を図３の交換要素によって確認し、追加の
エラーを転送する際に使用されるハードウェア・サービ
ス論理の一実施形態を示す図である。

【図６】本発明の原理による、図１の分散コンピュータ
・システムの通信アダプタの一例を示す図である。

【図７】本発明の原理による、図６の通信アダプタによ
って検出されたエラーを報告する際に使用されるハード
ウェア・サービス論理の一実施形態を示す図である。

【符号の説明】

１００分散コンピュータ・システム１０２処理ノード１０４相互接続ネットワーク１０６プロセッサ１０８通信アダプタ１０９システム入出力バス１１０交換機１１２交換要素３０２受信モジュール３０４送信モジュール３０６クロスバー３０８中央待ち行列３１０ハードウェア・サービス論理

───────────────────────────────────────────────────── フロントページの続き (72)発明者デリック・レロイ・ガーマイヤアメリカ合衆国12401 ニューヨーク州キングストンウェスト・チェストナット・ストリート 233 (72)発明者アントワネット・エレーヌ・ヘルマンアメリカ合衆国13760 ニューヨーク州ポーキープシーカレッジ・アベニュー 26 エイ (72)発明者ロバート・フレデリック・スタックアメリカ合衆国12477 ニューヨーク州ソジャティーズリッジ・ロード 14 (72)発明者フランシス・アルフレッド・カンプフアメリカ合衆国05453 バーモント州フェアファックスメイン・ストリート 1224 アパートメント102

Claims

【特許請求の範囲】

【請求項１】分散コンピュータ・システムのハードウェ
ア要素によりエラーを報告するシステムであって、エラーが検出されたとき、エラー・メッセージを生成す
るように適合された、前記分散コンピュータ・システム
のハードウェア要素を備え、前記ハードウェア要素がさらに、前記ハードウェア要素
から前記分散コンピュータ・システムの第１の指定処理
ノードに前記エラー・メッセージを転送するように適合
されている、システム。
【請求項２】前記ハードウェア要素が交換要素または通
信アダプタを備える、請求項１に記載のシステム。
【請求項３】前記ハードウェア要素がさらに、前記エラ
ー・メッセージを前記ハードウェア要素から前記分散コ
ンピュータ・システムの第２の指定処理ノードに送るよ
うに適合されている、請求項１に記載のシステム。
【請求項４】前記ハードウェア要素がさらに、前記エラ
ー・メッセージと前記第１の指定処理ノードへの経路と
を含むサービス・パケットを作成するように適合されて
いる、請求項１に記載のシステム。
【請求項５】前記ハードウェア要素がさらに、前記経路
を使って前記エラー・メッセージを前記第１の指定処理
ノードに送るように適合されている、請求項４に記載の
システム。
【請求項６】前記エラー・メッセージを前記第１の指定
処理ノードが受け取ったとの指示を前記ハードウェア要
素が受け取る前に、前記ハードウェア要素がさらに、追
加のエラーを収集するように適合されている、請求項１
に記載のシステム。
【請求項７】前記ハードウェア要素がさらに、前記指示
の受信を確認するように適合され、前記追加のエラーに
関する追加のエラー・メッセージを、前記分散コンピュ
ータ・システムの前記第１の指定処理ノードおよび第２
の指定処理ノードの少なくとも一方に転送するように適
合されている、請求項６に記載のシステム。
【請求項８】前記ハードウェア要素が通信アダプタを備
え、前記通信アダプタが、前記エラー・メッセージを生
成する前に前記通信アダプタの現在の動作を中断するよ
うに適合されている、請求項１に記載のシステム。