JP2003216592A

JP2003216592A - ヘッド・オンリ循環バッファを介してインフィニバンド・ワーク及び完了キューを管理する方法及び装置

Info

Publication number: JP2003216592A
Application number: JP2002275672A
Authority: JP
Inventors: Richard Louis Arndt; リチャード・ルイス・アルント; David F Craddock; デービッド・エフ・クラッドック; Thomas A Gregg; トーマス・アンソニー・グレッグ; Ian David Judd; イアン・デービット・ジャド; Gregory Francis Pfister; グレゴリー・フランシス・ファイスター; Renato John Recio; レナト・ジョン・レシオ; William Schmidt Donald; ドナルド・ウィリアム・シュミット
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2001-09-24
Filing date: 2002-09-20
Publication date: 2003-07-31
Also published as: US20030058875A1; TW583543B

Abstract

(57)【要約】（修正有）【課題】コンシューマからチャネル・アダプタ・ハー
ドウェアにワーク・リクエストを送るための及びいくつ
かの最適化技法と共にワーク完了をコンシューマに送る
ための方法、装置、及びプログラムを提供する。【解決手段】ホスト及びＩ／Ｏエンド・ノードと、ス
イッチと、ルータと、これらのコンポーネントを相互接
続するリンクとを有する分散型コンピューティング・シ
ステムが提供される。エンド・ノードは、メッセージを
送信及び受信するために送信及び受信キュー・ペアを使
用する。エンド・ノードは、いつメッセージが完全に送
信又は受信されたか、及びメッセージの送信又は受信プ
ロセス中にエラーが生じたかどうかをエンド・ユーザに
知らせるために完了キューを使用する。ハードウェアに
おけるヘッド・ポインタだけを使用してコンシューマか
らチャネル・アダプタ・ハードウェアへのワーク・リク
エストの転送を制御する機構が開示される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、データ処理システ
ムの改良に関する。更に詳しく云えば、本発明は、キュ
ー・ペア及び完了キューを効率的にハードウェアで実現
するために、キュー・ペアに対するヘッド・ポインタ及
び完了キューに対するテール・ポインタだけを使用して
循環バッファを管理する装置及び方法に関する。

【０００２】

【従来の技術】インフィニバンド（ＩＢ）は、入出力装
置（Ｉ／Ｏ）及び汎用コンピューティング・ノード相互
間のプロセス間通信（ＩＰＣ）のために使用可能なハー
ドウェアのメッセージ・パス機構を提供する。コンシュ
ーマは、ＩＢチャネル・アダプタ（ＣＡ）における送信
／受信ワーク・キューに送信／受信メッセージを送付す
ることによって、ＩＢメッセージ・パス・ハードウェア
をアクセスする。送信／受信ワーク・キュー（ＷＱ）
は、コンシューマにキュー・ペア（ＱＰ）として割り当
てられる。コンシューマは、完了キュー（ＣＱ）からＩ
Ｂ送信及び受信ワーク完了（ＷＣ）を介してこれらのメ
ッセージの結果を検索する。

【０００３】ソースＣＡは、アウトバウンド・メッセー
ジをセグメント化してそれらを宛先に送るという動作を
扱う。宛先ＣＡは、インバウンド・メッセージを再アセ
ンブルしてそれらを宛先のコンシューマにより指定され
たメモリ・スペースに入れるという動作を扱う。ＣＡの
タイプには、ホストＣＡ及びターゲットＣＡの２つがあ
る。ホストＣＡは、ＩＢファブリックをアクセスするた
めに、汎用コンピューティング・ノードによって使用さ
れる。コンシューマは、ホストＣＡの機能をアクセスす
るために、ＩＢバーブ（verb）を使用する。バーブを解
釈してＣＡを直接にアクセスするソフトウェアは、チャ
ネル・インターフェース（ＣＩ）として知られている。

【０００４】

【発明が解決しようとする課題】コンシューマからＣＡ
ハードウェアにワーク・リクエストをパスするための、
効率的な機構が必要である。更に、ＣＡハードウェアが
コンシューマにワーク完了をパスするためにも同様の機
構が必要である。従って、コンシューマからＣＡハード
ウェアにワーク・リクエストを送るために、及びいくつ
かの最適化技法と共にワーク完了をコンシューマに送る
ために、そのような方法、装置、及びプログラムを持つ
ことが有利であろう。

【０００５】

【課題を解決するための手段】本発明は、（ホスト及び
Ｉ／Ｏ）エンド・ノードと、スイッチと、ルータと、こ
れらのコンポーネントを相互接続するリンクとを有する
分散型コンピューティング・システムを提供する。エン
ド・ノードは、メッセージを送信及び受信するために送
信及び受信キュー・ペアを使用する。エンド・ノード
は、いつメッセージが完全に送信又は受信されたか、及
びメッセージの送信又は受信プロセス中にエラーが生じ
たかどうかをエンド・ユーザに知らせるために完了キュ
ーを使用する。本発明は、これらのキュー・ペア及び完
了キューをハードウェアで実現するための機構を開示す
る。ハードウェアにおけるヘッド・ポインタだけを使用
してコンシューマからＣＡハードウェアへのワーク・リ
クエストの転送を制御するための方法が、ハードウェア
におけるテール・ポインタだけを使用してＣＡハードウ
ェアからコンシューマにワーク完了を送るための方法と
共に開示される。この方式では、ＣＡハードウェアは、
ワーク・リクエストが完了したことをＣＩに知らせるこ
とができ、システム・メモリへの単一の書き込みだけで
ワーク完了情報を与えることができる。更に、種々のメ
モリ構成のもとでこのプロセスの全体的な効率を改善す
るために使用し得るいくつかの機構が提供される。

【０００６】

【発明の実施の形態】本発明は、ワーク・キューのため
のハードウェアにおけるヘッド・ポインタ及び完了キュ
ーのためのハードウェアにおけるテール・ポインタを使
用してワーク・キュー及び完了キューを管理するための
装置及び方法を提供する。本発明は、ハードウェア、ソ
フトウェア、又はハードウェア及びソフトウェアの組み
合わせで実施可能である。本発明は、エンド・ノード
と、スイッチと、ルータと、これらのコンポーネントを
相互接続するリンクとを有するシステム・エリア・ネッ
トワーク（ＳＡＮ）において実施されることが望まし
い。各エンド・ノードは、メッセージを送信及び受信す
るために、送信及び受信キュー・ペアを使用する。エン
ド・ノードは、メッセージをパケットの形にセグメント
化し、リンクを介してそれらのパケットを送信する。ス
イッチ及びルータは、エンド・ノードを相互接続し、パ
ケットを適切なエンド・ノードに経路指定する。エンド
・ノードは、宛先においてそれらのパケットをメッセー
ジの形に再アセンブルする。

【０００７】図１は、本発明の望ましい実施例に従って
分散型コンピュータ・システムを示す図である。図１に
示された分散型コンピュータ・システムは、システム・
エリア・ネットワーク（ＳＡＮ）１００の形を取り、単
に例示の目的で示される。後述される本発明の実施例
は、他の数多くのタイプ及び構成のコンピュータ・シス
テムにおいて実施可能である。例えば、本発明を実施す
るコンピュータ・システムは、１つのプロセッサ及び幾
つかの入出力（Ｉ／Ｏ）アダプタを有する小型サーバか
ら、数百個又は数千個のプロセッサ及び数千個のＩ／Ｏ
アダプタを有する超並列スーパコンピュータ・システム
までの範囲に及び得る。更に、本発明は、インターネッ
ト又はイントラネットによって接続されたリモート・コ
ンピュータ・システムの施設においても実施され得る。

【０００８】ＳＡＮ１００は、分散型コンピュータ・シ
ステムにおけるノードを相互接続する高帯域幅の低待ち
時間ネットワークである。ノードは、ネットワークの１
つ又は複数のリンクに接続され、ネットワーク内にメッ
セージの発信元及び（又は）宛先を形成する任意のコン
ポーネントである。図示の例では、ＳＡＮ１００は、ホ
スト・プロセッサ・ノード１０２、ホスト・プロセッサ
・ノード１０４、新磁気ディスク制御機構（ＲＡＩＤ）
サブシステム・ノード１０６、及びＩ／Ｏシャシー・ノ
ード１０８の形式のノードを含む。図１に示されたノー
ドは、単なる例示のためのものであり、ここでは、ＳＡ
Ｎ１００は、任意の数及び任意のタイプの独立したプロ
セッサ・ノード、Ｉ／Ｏアダプタ・ノード、及びＩ／Ｏ
装置ノードを接続することができる。それらのノードの
何れも、ＳＡＮ１００においてメッセージ又はフレーム
を発信し又はそれらを最終的に使用する装置であるとし
て定義されるエンド・ノードとして機能し得る。

【０００９】本発明の１つの実施例では、分散型コンピ
ュータ・システムにはエラー処理機構が存在する。この
場合、そのエラー処理機構は、ＳＡＮ１００のような分
散型コンピュータ・システムにおけるエンド・ノード相
互間の高い信頼度の接続又は高い信頼度のデータグラム
通信を可能にする。

【００１０】本願において使用されるメッセージは、デ
ータ交換に関するアプリケーション定義の単位であり、
連携したプロセス相互間の通信に関する基本単位であ
る。パケットは、ネットワーク・プロトコル・ヘッダ又
はトレーラによりカプセル化された１単位のデータであ
る。ヘッダは、一般に、ＳＡＮ１００を介してフレーム
を送るための制御及び経路指定情報を提供する。トレー
ラは、一般に、パケットが破壊された内容を配送しない
ことを保証するための制御データ及び巡回冗長検査（Ｃ
ＲＣ）データを含む。

【００１１】ＳＡＮ１００は、分散型コンピュータ・シ
ステムにおけるＩ／Ｏ及びプロセッサ間通信（ＩＰＣ）
の両方をサポートする通信及び管理機構を含む。図１に
示されたＳＡＮ１００は、交換回線通信ファブリック１
１６を含み、これは、多くの装置が安全な且つ遠隔的に
管理された環境において高帯域幅及び低待ち時間でデー
タを同時に転送することを可能にする。エンド・ノード
は、複数のポートを介して通信を行うことができ、ＳＡ
Ｎファブリックを介して複数のパスを利用することがで
きる。図１に示されたＳＡＮを介した複数のポート及び
パスは、フォールト・トレランス（fault tolerance）
及び増加帯域幅データ転送のために使用され得る。

【００１２】図１におけるＳＡＮ１００は、スイッチ１
１２、１１４、１４６、及びルータ１１７を含む。スイ
ッチは、複数のリンクを接続する装置であり、小規模ヘ
ッダの宛先ローカル識別コード（ＤＬＩＤ）フィールド
を使用して、サブネット内の１つのリンクから他のリン
クへのパケットの経路指定を可能にする。ルータは、複
数のサブネットを接続する装置であり、大規模ヘッダの
宛先グローバル・ユニーク識別コード（ＤＧＵＩＤ）を
使用して、第１サブネットにおける１つのリンクから第
２サブネットにおける他のリンクにフレームを経路指定
することができる。

【００１３】１つの実施例では、リンクは、エンド・ノ
ード、スイッチ、又はルータのような任意の２つのネッ
トワーク・ファブリック・エレメント相互間の全二重チ
ャネルである。適当なリンクの例は、バックプレーン及
び印刷回路ボード上の銅ケーブル、光ケーブル、及び印
刷回路銅トレースを含むが、それに限定されるものでは
ない。

【００１４】高い信頼度のサービス・タイプに対して
は、ホスト・プロセッサのエンド・ノード及びＩ／Ｏア
ダプタのエンド・ノードのようなエンド・ノードが、リ
クエスト・パケット及びリターン肯定応答パケットを発
生する。スイッチ及びルータは、ソースから宛先にパケ
ットを送り込む。ネットワークにおける各ステージで更
新される可変ＣＲＣトレーラ・フィールドを除いて、ス
イッチは、パケットを未修正のまま送り込む。ルータ
は、可変ＣＲＣトレーラ・フィールドを更新し、しかも
パケットが経路指定される時にはヘッダにおける他のフ
ィールドを修正する。

【００１５】図１に示されたＳＡＮ１００では、ホスト
・プロセッサ・ノード１０２、１０４、及びＩ／Ｏシャ
シー・ノード１０８が、ＳＡＮ１００に対してインター
フェースするための少なくとも１つのチャネル・アダプ
タ（ＣＡ）を含む。１つの実施例では、各チャネル・ア
ダプタは、ＳＡＮファブリック１１６を介して送信され
たパケットのソースを明確にするか又はそのパケットを
シンクさせるに十分な細部にわたってチャネル・アダプ
タ・インターフェースを具現化するエンドポイントであ
る。ホスト・プロセッサ・ノード１０２は、ホスト・チ
ャネル・アダプタ（ＨＣＡ）１１８及び１２０の形をし
たチャネル・アダプタを含む。ホスト・プロセッサ・ノ
ード１０４は、ホスト・チャネル・アダプタ（ＨＣＡ）
１２２及び１２４を含む。ホスト・プロセッサ・ノード
１０２は、バス・システム１３４によって相互接続され
た中央処理装置（ＣＰＵ）１２６−１３０及びメモリ１
３２も含む。ホスト・プロセッサ・ノード１０４は、同
様に、バス・システム１４４によって相互接続された中
央処理装置（ＣＰＵ）１３６−１４０及びメモリ１４２
を含む。

【００１６】ホスト・チャネル・アダプタ１１８及び１
２０は、スイッチ１１２及び１１４への接続を提供し、
一方、ホスト・チャネル・アダプタ１２２及び１２４
は、スイッチ１１２及び１１４への接続を提供する。

【００１７】１つの実施例では、ホスト・チャネル・ア
ダプタはハードウェアで実装される。この実施方法で
は、ホスト・チャネル・アダプタのハードウェアは、中
央処理装置及びＩ／Ｏアダプタ通信のオーバヘッドの大
部分をオフロードする。ホスト・チャネル・アダプタに
関するこのハードウェアの実施方法は、通信プロトコル
と関連した従来のオーバヘッドのない交換回線ネットワ
ークを介した多重同時通信も可能にする。１つの実施例
では、それらのホスト・チャネル・アダプタ及び図１に
おけるＳＡＮ１００は、オペレーティング・システム・
カーネル・プロセスを含むことなく分散型コンピュータ
・システムのＩ／Ｏ及びプロセッサ間通信（ＩＰＣ）の
コンシューマにゼロのプロセッサ−コピー・データ転送
を提供し、高い信頼度の耐障害通信を提供するためのハ
ードウェアを使用する。

【００１８】図１に示されるように、ルータ１１７は、
他のホスト又は他のルータへの広域ネットワーク（ＷＡ
Ｎ）又はローカル・エリア・ネットワーク（ＬＡＮ）の
接続部に結合される。図１におけるＩ／Ｏシャシー・ノ
ード１０８は、Ｉ／Ｏスイッチ１４６及び複数のＩ／Ｏ
モジュール１４８−１５６を含む。これらの例では、そ
れらのＩ／Ｏモジュールはアダプタ・カードの形を取
る。図１に示された例示のアダプタ・カードは、Ｉ／Ｏ
モジュール１４８のためのＳＣＳＩアダプタ・カード；
Ｉ／Ｏモジュール１５２のためのファイバ・チャネル・
ハブ及びファイバ・チャネル−調整済みループ（ＦＣ−
ＡＬ）装置へのアダプタ・カード；Ｉ／Ｏモジュール１
５０のためのイーサネット（Ｒ）・アダプタ・カード；
Ｉ／Ｏモジュール１５４のためのグラフィックス・アダ
プタ・カード；及びＩ／Ｏモジュール１５６のためのビ
デオ・アダプタ・カードを含む。任意の既知のタイプの
アダプタ・カードが実装可能である。Ｉ／Ｏアダプタ・
カードは、更に、そのアダプタ・カードをＳＡＮファブ
リックに結合するためにＩ／Ｏアダプタ・バックプレー
ンにおいてスイッチを含む。これらのモジュールは、タ
ーゲット・チャネル・アダプタ（ＴＣＡ）１５８−１６
６を含む。

【００１９】この例では、図１におけるＲＡＩＤサブシ
ステム・ノード１０６は、プロセッサ１６８、メモリ１
７０、ターゲット・チャネル・アダプタ（ＴＣＡ）１７
２、及び複数の冗長な又はストライピングされた記憶デ
ィスク・ユニット１７４を含む。ターゲット・チャネル
・アダプタ１７２は、十分に機能的なホスト・チャネル
・アダプタであってもよい。

【００２０】ＳＡＮ１００は、Ｉ／Ｏのためのデータ通
信及びプロセッサ間通信を処理する。ＳＡＮ１００は、
Ｉ／Ｏのために必要な高帯域幅及び拡張容易性をサポー
トし、更に、プロセッサ間通信のために必要な極めて小
さい待ち時間及び小さいＣＰＵオーバヘッドをサポート
する。ユーザ・クライアントは、オペレーティング・シ
ステム・カーネル・プロセスを迂回し、効率的なメッセ
ージ送信プロトコルを可能にするホスト・チャネル・ア
ダプタのようなネットワーク通信ハードウェアを直接に
アクセスすることができる。ＳＡＮ１００は、現在のコ
ンピューティング・モジュールに適しており、Ｉ／Ｏ及
びコンピュータ・クラスタ通信という新しい形式のため
のビルディング・ブロックである。更に、図１における
ＳＡＮ１００は、Ｉ／Ｏアダプタ・ノードがそれらの間
で通信すること、又は分散型コンピュータ・システムに
おけるいずれかの又はすべてのプロセッサ・ノードと通
信することを可能にする。ＳＡＮ１００にＩ／Ｏアダプ
タを付加することによって、その結果生じるＩ／Ｏアダ
プタ・ノードは、ＳＡＮ１００における任意のホスト・
プロセッサ・ノードと実質的に同じ通信能力を有する。

【００２１】１つの実施例では、図１に示されたＳＡＮ
１００がチャネル・セマンティックス及びメモリ・セマ
ンティックスをサポートする。チャネル・セマンティッ
クスは、送信／受信オペレーション又はプッシュ通信オ
ペレーションと呼ばれることがある。チャネル・セマン
ティックスは、ソース装置がデータをプッシュし、宛先
装置がそのデータの最終的な宛先を決定するという従来
のＩ／Ｏチャネルにおいて使用された通信のタイプであ
る。チャネル・セマンティックスにおいて、ソース・プ
ロセスから送られたパケットは、宛先プロセスの通信ポ
ートを指定するが、宛先プロセスのメモリ・スペースに
おける何処にそのパケットが書き込まれるべきかを指定
しない。従って、チャネル・セマンティックスでは、宛
先プロセスは、送信されたデータを何処に入れるべきか
を事前割り当てする。

【００２２】メモリ・セマンティックスでは、ソース・
プロセスは、リモート・ノードの宛先プロセスの仮想ア
ドレス・スペースを直接に読み取るか又は書き込む。リ
モート・ノードの宛先プロセスは、データのためのバッ
ファのロケーションとのみ通信する必要があり、如何な
るデータの転送にも関与する必要がない。従って、メモ
リ・セマンティックスでは、ソース・プロセスは、宛先
プロセスの宛先バッファ・メモリ・アドレスを含むデー
タ・パケットを送る。メモリ・セマンティックスでは、
宛先プロセスは、ソース・プロセスがそれのメモリをア
クセスすることに対する許可を予め与える。

【００２３】チャネル・セマンティックス及びメモリ・
セマンティックスは、一般に、Ｉ／Ｏ及びプロセッサ間
通信の両方を必要とする。一般的なＩ／Ｏオペレーショ
ンは、チャネル・セマンティックス及びメモリ・セマン
ティックスの組み合わせを使用する。図１に示された分
散型コンピュータ・システムの例示的なＩ／Ｏオペレー
ションでは、ホスト・プロセッサ１０２のようなホスト
・プロセッサ・ノードが、チャネル・セマンティックス
を使用してＲＡＩＤサブシステムのターゲット・チャネ
ル・アダプタ（ＴＣＡ）１７２のようなディスクＩ／Ｏ
アダプタにディスク書き込みコマンドを送ることによっ
て、Ｉ／Ｏオペレーションを開始させる。ディスクＩ／
Ｏアダプタは、そのコマンドを調べ、メモリ・セマンテ
ィックスを使用してホスト・プロセッサ・ノードのメモ
リ・スペースからデータ・バッファを直接に読み取る。
データ・バッファが読み取られた後、ディスクＩ／Ｏア
ダプタはチャネル・セマンティックスを使用してＩ／Ｏ
完了メッセージをホスト・プロセッサ・ノードにプッシ
ュ・バックする。

【００２４】１つの典型的な実施例では、図１に示され
た分散型コンピュータ・システムが、全メモリに対する
正しい且つ適切なアクセスを保証するために仮想アドレ
ス及び仮想メモリ保護機構を使用するオペレーションを
実行する。そのような分散型コンピュータ・システムに
おいて実行されるアプリケーションは、如何なるオペレ
ーションに対しても物理的アドレシングを使用する必要
がない。

【００２５】次に図２を参照すると、本発明の望ましい
実施例に従って、ホスト・プロセッサ・ノードの機能的
ブロック図が示される。ホスト・プロセッサ・ノード２
００は、図１におけるホスト・プロセッサ・ノード１０
２のようなホスト・プロセッサ・ノードの１つの例であ
る。この例では、図２に示されたホスト・プロセッサ・
ノード２００は一連のコンシューマ２０２−２０８を含
む。それらのコンシューマは、ホスト・プロセッサ・ノ
ード２００において実行されるプロセスである。ホスト
・プロセッサ・ノード２００は、チャネル・アダプタ２
１０及び２１２も含む。チャネル・アダプタ２１０はポ
ート２１４及び２１６を含み、一方、チャネル・アダプ
タ２１２はポート２１８及び２２０を含む。各ポートは
１つのリンクに接続している。それらのポートは、図１
におけるＳＡＮ１００のような１つのＳＡＮサブネット
又は複数のＳＡＮサブネットに接続することができる。
これらの例では、チャネル・アダプタは、ホスト・チャ
ネル・アダプタの形式を取る。

【００２６】コンシューマ２０２−２０８は、バーブ・
インターフェース２２２並びにメッセージ及びデータ・
サービス２２４を介してＳＡＮにメッセージを転送す
る。バーブ・インターフェースは、本質的には、ホスト
・チャネル・アダプタの機能に関する抽象的な記述であ
る。オペレーティング・システムは、それのプログラミ
ング・インターフェースを介してバーブ機能のうちの幾
つか又はすべてを公開することが可能である。基本的に
は、このインターフェースは、ホストの行為を定義す
る。更に、ホスト・プロセッサ・ノード２００は、メッ
セージ及びデータ・サービス２２４を含む。そのメッセ
ージ及びデータ・サービスは、バーブ層よりも高いレベ
ルのインターフェースであり、チャネル・アダプタ２１
０及びチャネル・アダプタ２１２を介して受信されたメ
ッセージ及びデータを処理するために使用される。メッ
セージ及びデータ・サービス２２４は、メッセージ及び
他のデータを処理するために、コンシューマ２０２−２
０８に対するインターフェースを提供する。

【００２７】次に、図３の（Ａ）を参照すると、本発明
の望ましい実施例に従って、ホスト・チャネル・アダプ
タを表す図が示される。図３の（Ａ）に示されたホスト
・チャネル・アダプタ３００Ａは、一連のキュー・ペア
（ＱＰ）３０２Ａ−３１０Ａを含み、それらのキュー・
ペアは、メッセージをホスト・チャネル・アダプタ・ポ
ート３１２Ａ−３１６Ａに転送するために使用される。
ホスト・チャネル・アダプタ・ポート３１２Ａ−３１６
Ａへのデータのバッファリングが仮想レーン（virtual
lane - ＶＬ）３１８Ａ−３３４Ａを介して行われる。
なお、各ＶＬは、それ自身のフロー・コントロールを有
する。サブネット・マネージャは、各物理的ポートに対
するローカル・アドレス、即ち、ポートのＬＩＤを有す
るチャネル・アダプタを構成する。サブネット・マネー
ジャ・エージェント（ＳＭＡ）３３６Ａは、チャネル・
アダプタを構成する目的でサブネット・マネージャと通
信を行うエンティティである。メモリ変換及び保護機構
（ＭＴＰ）３３８Ａは、仮想アドレスを物理アドレスに
変換し、アクセス権を検証する機構である。ダイレクト
・メモリ・アクセス（ＤＭＡ）３４０Ａは、キュー・ペ
ア３０２Ａ−３１０Ａに関連してメモリ３４１Ａを使用
するダイレクト・メモリ・アクセス・オペレーションを
行う。

【００２８】図３の（Ａ）に示されたホスト・チャネル
・アダプタ３００Ａのような単一のチャネル・アダプタ
は、数千個のキュー・ペアをサポートすることができ
る。対照的に、Ｉ／Ｏアダプタにおけるターゲット・チ
ャネル・アダプタは、一般に、ずっと小さい数のキュー
・ペアしかサポートしない。各キュー・ペアは、送信ワ
ーク・キュー（ＳＷＱ）及び受信ワーク・キューより成
る。送信ワーク・キューは、チャネル及びメモリ・セマ
ンティック・メッセージを送るために使用される。受信
ワーク・キューは、チャネル・セマンティック・メッセ
ージを受信する。コンシューマは、オペレーティング・
システム特有のプログラミング・インターフェースをコ
ールする。そのプログラミング・インターフェースは、
本願ではバーブ（verb）と呼ばれ、ワーク・リクエスト
（ＷＲ）をワーク・キューに入れるためのものである。

【００２９】図３の（Ｂ）は、本発明の望ましい実施例
に従ってスイッチ３００Ｂを示す。スイッチ３００Ｂ
は、仮想レーン３０６Ｂのような仮想レーンを介して多
数のポート３０４Ｂと通信を行うパケット・リレー３０
２Ｂを含む。一般に、スイッチ３００Ｂのようなスイッ
チは、１つのポートから同じスイッチにおける他の任意
のポートにパケットを経路指定することができる。

【００３０】同様に、図３の（Ｃ）は、本発明の望まし
い実施例に従ってルータ３００Ｃを示す。ルータ３００
Ｃは、仮想レーン３０６Ｃのような仮想レーンを介して
多数のポート３０４Ｃと通信を行うパケット・リレー３
０２Ｃを含む。スイッチ３００Ｂと同様に、ルータ３０
０Ｃは、一般に、１つのポートから同じルータにおける
他の任意のポートにパケットを経路指定することができ
るであろう。

【００３１】チャネル・アダプタ、スイッチ、及びルー
タは、単一の物理リンク内の複数の仮想レーンを使用す
る。図３の（Ａ）、（Ｂ）、及び（Ｃ）に示されるよう
に、物理ポートは、エンド・ノード、スイッチ、及びル
ータをサブネットに接続する。ＳＡＮファブリックに導
入されたパケットは、そのパケットのソースからそのパ
ケットの宛先まで１つ又は複数の仮想レーンを辿る。選
択される仮想レーンは、そのパケットと関連したサービ
ス・レベルからマップされる。所与の物理リンクでは、
一時に１つの仮想レーンしか進行しない。仮想レーン
は、他の仮想レーンに影響を与えることなく、リンク・
レベル・フロー制御を１つの仮想レーンに適用するため
の技法を提供する。１つの仮想レーン上のパケットが競
合のためにサービス品質（ＱＯＳ）を損なう時、異なる
仮想レーンにおけるパケットが進行することを可能にさ
れる。仮想レーンは、数多くの理由のために使用され、
それらのうちの幾つかを次に示す。

【００３２】仮想レーンはＱＯＳを提供する。１つの例
示的な実施例では、或る仮想レーンがＱＯＳを提供する
ために高い優先順位又は等時性トラフィックに対して予
約される。

【００３３】仮想レーンはデッドロック回避方法を提供
する。仮想レーンは、ループを含むトポロジがすべての
物理リンクにわたってパケットを送ることを可能にし、
そのループがデッドロックを生じ得るバック・プレッシ
ャ依存関係を生じさせないことを保証される。

【００３４】仮想レーンは、ラインの頭部（head of li
ne）ブロッキングを緩和する。スイッチが、所与の仮想
レーンを利用するパケットにとって利用可能なクレジッ
トを最早持たない時、十分なクレジットを有する異なる
仮想レーンを利用するパケットは順方向に進行すること
を許される。

【００３５】次に、図４を参照すると、本発明の望まし
い実施例に従って、ワーク・リクエストの処理を表す図
が示される。図４において、受信ワーク・キュー４０
０、送信ワーク・キュー４０２、及び完了キュー４０４
がコンシューマ４０６からのリクエスト及びコンシュー
マ４０６に対するリクエストを処理するために存在す
る。コンシューマ４０６からのこれらのリクエストは、
最終的には、ハードウェア４０８に送られる。この例で
は、コンシューマ４０６は、ワーク・リクエスト４１０
及び４１２を発生し、ワーク完了４１４を受信する。図
４に示されるように、ワーク・キュー上に入れられたワ
ーク・リクエストは、ワーク・キュー・エレメント（Ｗ
ＱＥ）と呼ばれる。

【００３６】送信ワーク・キュー４０２は、ＳＡＮファ
ブリックを介して送信されるべきデータを記述したワー
ク・キュー・エレメント（ＷＱＥ）４２２−４２８を含
む。受信ワーク・キュー４００は、ＳＡＮファブリック
からの着信チャネル・セマンティック・データをどこに
入れるべきかを記述したワーク・キュー・エレメント
（ＷＱＥ）４１６−４２０を含む。ワーク・キュー・エ
レメントは、ホスト・チャネル・アダプタにおけるハー
ドウェア４０８によって処理される。

【００３７】バーブは、完了したワークを完了キュー４
０４から検索するための機構も提供する。図４に示され
るように、完了キュー４０４は、完了キュー・エレメン
ト（ＣＱＥ）４３０−４３６を含んでいる。完了キュー
・エレメントは、以前に完了したワーク・キュー・エレ
メントに関する情報を含んでいる。完了キュー４０４
は、複数のキュー・ペアに対して単一ポイントの完了通
知を作成するために使用される。完了キュー・エレメン
トは、完了キューにおけるデータ構造である。このエレ
メントは、完了済みワーク・キュー・エレメントを記述
する。完了キュー・エレメントは、キュー・ペア及び完
了した特定のワーク・キュー・エレメントを決定するに
十分な情報を含んでいる。完了キュー・コンテキスト
は、長さに対するポインタ及び個々の完了キューを管理
するために必要な他の情報に対するポインタを含む情報
のブロックである。

【００３８】図４に示された送信ワーク・キュー４０２
のためのサポートされる例示のワーク・リクエストは次
のようなものである。送信ワーク・リクエストは、リモ
ート・ノードの受信ワーク・キュー・エレメントによっ
て参照されたデータ・セグメントに一組のローカル・デ
ータ・セグメントを押し込むためのチャネル・セマンテ
ィック・オペレーションである。例えば、ワーク・キュ
ー・エレメント４２８は、データ・セグメント４（４３
８）、データ・セグメント５（４４０）、及びデータ・
セグメント６（４４２）に対する基準を含んでいる。送
信ワーク・リクエストのデータ・セグメントの各々は、
仮想的に連続したメモリ領域を含んでいる。ローカル・
データ・セグメントを参照するために使用される仮想ア
ドレスは、ローカル・キュー・ペアを作成したプロセス
のアドレス・コンテキスト内にある。

【００３９】リモート・ダイレクト・メモリ・アクセス
（ＲＤＭＡ）の読み取りワーク・リクエストは、リモー
ト・ノードにおける仮想的に連続したメモリ・スペース
を読み取るためにメモリ・セマンティック・オペレーシ
ョンを行う。メモリ・スペースは、メモリ領域の一部分
又はメモリ・ウィンドウの一部分であってもよい。メモ
リ領域は、仮想アドレス及び長さによって定義された仮
想的に連続したメモリ・アドレスの事前登録されたセッ
トのことである。メモリ・ウィンドウは、事前登録され
た領域にバインドされている仮想的に連続したメモリ・
アドレスのセットにのことである。

【００４０】「ＲＤＭＡ読み取り」ワーク・リクエスト
は、リモート・エンド・ノードにおける仮想的に連続し
たメモリ・スペースを読み取り、仮想的に連続したロー
カル・メモリ・スペースにそのデータを書き込む。送信
ワーク・リクエストと同様に、ローカルデータ・セグメ
ントを参照するために「ＲＤＭＡ読み取り」ワーク・キ
ュー・エレメントによって使用される仮想アドレスは、
ローカル・キュー・ペアを作成したプロセスのアドレス
・コンテキストにある。例えば、受信ワーク・キュー４
００におけるワーク・キュ−・エレメント４１６は、デ
ータ・セグメント１（４４４）、データ・セグメント２
（４４６）、及びデータ・セグメント３（４４８）を参
照する。リモート仮想アドレスは、「ＲＤＭＡ読み取
り」ワーク・キュー・エレメントによってターゲットに
されたリモート・キュー・ペアを所有するプロセスのア
ドレス・コンテキストにある。

【００４１】「ＲＤＭＡ書き込み」ワーク・キュー・エ
レメントは、リモート・ノードにおける仮想的に連続し
たメモリ・スペースを書き込むためのメモリ・セマンテ
ィック・オペレーションを行う。「ＲＤＭＡ書き込み」
ワーク・キュー・エレメントは、ローカルの仮想的に連
続したメモリ・スペースのスキャッタ・リスト及びロー
カル・メモリ・スペースが書き込まれるリモート・メモ
リ・スペースの仮想アドレスを含む。

【００４２】「ＲＤＭＡフェッチＯｐ」ワーク・キュー
・エレメントは、リモート・ワードにおけるアトミック
・オペレーション行うためのメモリ・セマンティック・
オペレーションを提供する。「ＲＤＭＡフェッチＯｐ」
ワーク・キュー・エレメントは、「ＲＤＭＡ読み取
り」、「修正」、及び「ＲＤＭＡ書き込み」オペレーシ
ョンを結合したものである。「ＲＤＭＡフェッチＯｐ」
ワーク・キュー・エレメントは、等しい場合の「比較交
換（ＣｏｍｐａｒｅａｎｄＳｗａｐ）」のような幾
つかの読み取り／修正／書き込みオペレーションをサポ
ートすることができる。バインド（アンバインド）リモ
ート・アクセス・キー（Ｒキー）ワーク・キュー・エレ
メントは、メモリ・ウィンドウをメモリ領域に関連付け
る（関連を解く）ことによってメモリ・ウィンドウを修
正（破壊）するためのコマンドをホスト・チャネル・ア
ダプタ・ハードウェアに供給する。Ｒキーは、各ＲＤＭ
Ａアクセスの一部であり、リモート・プロセスがバッフ
ァへのアクセスを許可したことを検証するために使用さ
れる。

【００４３】１つの実施例では、図４に示された受信ワ
ーク・キュー４００は、受信ワーク・キュー・エレメン
トと呼ばれる１つのタイプのワーク・キュー・エレメン
トしかサポートしない。受信ワーク・キュー・エレメン
トは、着信する送信メッセージが書き込まれるローカル
・メモリ・スペースを記述するチャネル・セマンティッ
ク・オペレーションを行う。受信ワーク・キュー・エレ
メントは、幾つかの仮想的に連続したメモリ・スペース
を記述したスキャッタ・リストを含む。着信する送信メ
ッセージは、これらのメモリ・スペースに書き込まれ
る。仮想アドレスは、ローカル・キュー・ペアを作成し
たプロセスのアドレス・コンテキストにある。

【００４４】プロセッサ間通信のために、ユーザ・モー
ド・ソフトウェア・プロセスは、バッファがメモリ内に
存在する位置からキュー・ペアを介して直接にデータを
転送する。１つの実施例では、それらのキュー・ペアを
介した転送は、オペレーティング・システムを迂回し、
わずかなホスト命令サイクルしか消費しない。キュー・
ペアは、オペレーティング・システムのカーネル関与の
ないプロセッサ−コピー・データ転送をゼロにさせる。
プロセッサ−コピー・データ転送がゼロであることは、
高い帯域幅及び小さい待ち時間という通信の効率的なサ
ポートを提供する。

【００４５】キュー・ペアが作成される時、そのキュー
・ペアは、１つの選択されたタイプのトランスポート・
サービスを提供するようにセットされる。１つの実施例
では、本発明を実施する分散型コンピュータ・システム
が４つのタイプのトランスポート・サービス、即ち、高
い信頼度の接続サービス、低い信頼度の接続サービス、
高い信頼度のデータグラム接続サービス、及び低い信頼
度のデータグラム接続サービスをサポートする。

【００４６】高い信頼度の及び低い信頼度の接続サービ
スは、ローカル・キュー・ペアを１つの、しかも唯一の
リモート・キュー・ペアと関連付ける。接続サービス
は、プロセスが、そのＳＡＮファブリックを介して通信
を行うべき各プロセスに対してキュー・ペアを作成する
ことを必要とする。従って、Ｎ個のホスト・プロセッサ
・ノードの各々がＰ個のプロセスを含み、各ノードにお
けるＰ個のプロセスすべてが他のすべてのノードにおけ
るすべてのプロセスと通信を行うことを望んでいる場
合、各ホスト・プロセッサ・ノードは、Ｐ²＊（Ｎ−
１）個のキュー・ペアを必要とする。更に、プロセス
は、キュー・ペアを、同じホスト・チャネル・アダプタ
における他のキュー・ペアに結合することができる。

【００４７】図５には、分散型プロセス相互間で通信を
行うために高い信頼度の接続サービスを使用する分散型
コンピュータ・システムの一部分が概略的に示される。
図５における分散型コンピュータ・システム５００は、
ホスト・プロセッサ・ノード１、ホスト・プロセッサ・
ノード２、及びホスト・プロセッサ・ノード３を含む。
ホスト・プロセッサ・ノード１は、プロセスＡ（５１
０）を含む。ホスト・プロセッサ・ノード３は、プロセ
スＣ（５２０）及びプロセスＤ（５３０）を含む。ホス
ト・プロセッサ・ノード２は、プロセスＥ（５４０）を
含む。

【００４８】ホスト・プロセッサ・ノード１は、キュー
・ペア４、６、及び７を含み、それらのキュー・ペアの
各々は送信ワーク・キュー及び受信ワーク・キューを有
する。ホスト・プロセッサ・ノード２はキュー・ペア９
を有し、ホスト・プロセッサ・ノード３はキュー・ペア
２及び５を有する。分散型コンピュータ・システム５０
０の高い信頼度の接続サービスは、ローカル・キュー・
ペアを１つの、しかも唯一のリモート・キュー・ペアと
関連付ける。従って、キュー・ペア４は、キュー・ペア
２と通信を行うために使用される。キュー・ペア７は、
キュー・ペア５と通信を行うために使用される。キュー
・ペア６は、キュー・ペア９と通信を行うために使用さ
れる。

【００４９】高い信頼度の接続サービスにおける１つの
キュー・ペアに入れられたＷＱＥは、その接続されたキ
ュー・ペアの「受信ＷＱＥ」によって参照される受信メ
モリ・スペースにデータを書き込ませる。ＲＤＭＡオペ
レーションは、接続されたキュー・ペアのアドレス・ス
ペースにおいて動作する。

【００５０】本発明の１つの実施例では、高い信頼度の
接続サービスは、ハードウェアがシーケンス番号を維持
し且つすべてのパケット転送を確認するので、信頼し得
るものにされる。ハードウェア及びＳＡＮドライバ・ソ
フトウェアの組み合わせは、失敗した如何なる通信も再
試行する。キュー・ペアのプロセス・クライアントは、
ビット・エラー、受信アンダーラン、及びネットワーク
輻輳が存在する場合でも、高い信頼度の通信を得る。Ｓ
ＡＮファブリックに代替えとなるパスが存在する場合、
ファブリック・スイッチ、リンク、又はチャネル・アダ
プタ・ポートの障害が存在する場合でも、高い信頼度の
通信が維持され得る。

【００５１】更に、ＳＡＮファブリックを通してデータ
を高い信頼度で配送するために、肯定応答が使用可能で
ある。肯定応答は、プロセス・レベル肯定応答、即ち、
受信プロセスがそのデータを消滅させてしまったことを
確認する肯定応答であってもよく、そうでなくてもよ
い。別の方法として、肯定応答は、データがそれの宛先
に到達したことだけを表すものであってもよい。

【００５２】高い信頼度のデータグラム・サービスがロ
ーカル・エンド・ツー・エンド（ＥＥ）コンテキストを
１つの、しかも唯一のリモート・エンド・ツー・エンド
・コンテキストと関連付ける。高い信頼度のデータ・グ
ラム・サービスは、１つのキュー・ペアのクライアント
・プロセスが他の任意のリモート・ノードにおける他の
任意のキュー・ペアと通信を行うことを可能にする。受
信ワーク・キューにおいて、高い信頼度のデータグラム
・サービスは、他の任意のリモート・ノードにおける任
意の送信ワーク・キューからの着信メッセージを許容す
る。

【００５３】高い信頼度のデータグラム・サービスは、
その高い信頼度のデータグラム・サービスがコネクショ
ンレス型のものであるので、拡張容易性を大きく改善す
る。従って、一定数のキュー・ペアを有するエンド・ノ
ードは、高い信頼度のデータグラム・サービスによっ
て、高い信頼度の接続トランスポート・サービスによる
よりもずっと多くのプロセスと通信を行うことができ
る。例えば、Ｎ個のホスト・プロセッサ・ノードの各々
がＰ個のプロセスを含み、各ノードにおけるＰ個のプロ
セスすべてが他のすべてのノードにおけるすべてのプロ
セスと通信を行うことを望んでいる場合、高い信頼度の
接続サービスは、各ノードにおいてＰ²＊（Ｎ−１）個
のキュー・ペアを必要とする。比較すると、コネクショ
ンレス型の高い信頼度のデータグラム・サービスは、全
く同じ通信に対して、各ノードにおいて、Ｐ個のキュー
・ペア＋（Ｎ−１）個のＥＥコンテキストしか必要とし
ない。

【００５４】図６には、分散したプロセス相互間で通信
を行うために高い信頼度のデータグラム・サービスを使
用する分散型コンピュータ・システムの一部分が示され
る。図６における分散型コンピュータ・システム６００
は、ホスト・プロセッサ・ノード１、ホスト・プロセッ
サ・ノード２、及びホスト・プロセッサ・ノード３を含
む。ホスト・プロセッサ・ノード１は、キュー・ペア４
を有するプロセスＡ（６１０）を含む。ホスト・プロセ
ッサ・ノード２は、キュー・ペア２４を有するプロセス
Ｃ（６２０）及びキュー・ペア２５を有するプロセスＤ
（６３０）を含む。ホスト・プロセッサ・ノード３は、
キュー・ペア１４を有するプロセスＥ（６４０）を含
む。

【００５５】分散型コンピュータ・システム６００にお
いて実施される高い信頼度のデータグラム・サービスで
は、キュー・ペアは、コネクションレス型トランスポー
ト・サービスと呼ばれるものにおいて結合される。例え
ば、高い信頼度のデータグラム・サービスは、キュー・
ペア４をキュー・ペア２４、２５、及び１４に結合す
る。詳しく云えば、高い信頼度のデータグラム・サービ
スは、キュー・ペア４の送信ワーク・キューがキュー・
ペア２４、２５、及び１４における受信ワーク・キュー
にメッセージを高い信頼度で転送することを可能にす
る。同様に、キュー・ペア２４、２５、及び１４の送信
ワーク・キューは、キュー・ペア４における受信ワーク
・キューに高い信頼度でメッセージを転送することがで
きる。

【００５６】本発明の１つの実施例では、高い信頼度の
データグラム・サービスは、高い信頼度の接続サービス
と同程度の信頼性を保証するために、各メッセージ・フ
レームと関連したシーケンス番号及び肯定応答を使用す
る。エンド・ツー・エンド（ＥＥ）コンテキストは、シ
ーケンス番号、肯定応答、及びタイム・アウト値を憶え
ておくためにエンド・ツー・エンド特有の状態を維持す
る。ＥＥコンテキストに保持されたエンド・ツー・エン
ド状態は、１対のエンド・ノードの間のすべてのコネク
ションレス型キュー・ペア通信によって共用される。各
エンド・ノードは、それが高い信頼度のデータグラム・
サービスにおいて通信を行いたいすべてのエンド・ノー
ドに対して少なくとも１つのＥＥコンテキストを必要と
する（例えば、所与のエンド・ノードは、Ｎ個の他のエ
ンド・ノードとの高い信頼度のデータグラム・サービス
を持つことができるためには少なくともＮ個のＥＥコン
テキストを必要とする）。

【００５７】低い信頼度のデータグラム・サービスはコ
ネクションレス型である。低い信頼度のデータ・グラム
・サービスは、新しいスイッチ、ルータ、及びエンド・
ノードを見つけてそれらを所与の分散型コンピュータ・
システムに統合するために、管理アプリケーションによ
って使用される。低い信頼度のデータグラム・サービス
は、高い信頼度の接続サービス及び高い信頼度のデータ
グラム・サービスの信頼性保証を提供しない。従って、
低い信頼度のデータグラム・サービスは、各エンド・ノ
ードに維持された少ない状態情報でもって動作する。

【００５８】次に、図７を参照すると、本発明の望まし
い実施例に従って、データ・パケットを表す図が示され
る。データ・パケットは、ＳＡＮファブリックを通して
経路指定される１単位の情報である。データ・パケット
は、エンド・ノード・ツー・エンド・ノード構成であ
り、従って、エンド・ノードによって作成及び消費され
る。チャネル・アダプタ（ホスト又はターゲット）を行
き先とするパケットに対して、ＳＡＮファブリックにお
けるスイッチ及びルータによって、データ・パケットが
生成されることはなく、消費されることもない。チャネ
ル・アダプタを行き先とするデータ・パケットの代り
に、スイッチ及びルータが単にリクエスト・パケット又
は肯定応答パケットを最終的な宛先の近くに移動し、そ
のプロセスにおいて種々のリンク・ヘッダ・フィールド
を修正する。パケットがサブネット境界と交差する時、
ルータは、そのパケットのネットワーク・ヘッダも修正
する。サブネットを横断する場合、シングル・パケット
はシングル・サービス・レベルに留まる。

【００５９】メッセージ・データ７００は、データ・セ
グメント１（７０２）、データ・セグメント２（７０
４）、及びデータ・セグメント３（７０６）を含む。そ
れらのデータ・セグメントは、図４に示されたデータ・
セグメントと同じである。この例では、これらのデータ
・セグメントは、データ・パケット７１２におけるパケ
ット・ペイロード７１０に入れられるパケット７０８を
形成する。更に、データ・パケット７１２は、エラー・
チェックのために使用されるＣＲＣ７１４を含む。更
に、ルーティング・ヘッダ７１６及びトランスポート・
ヘッダ７１８がデータ・パケット７１２内に存在する。
ルーティング・ヘッダ７１６は、データ・パケット７１
２に対するソース・ポート及び宛先ポートを識別するた
めに使用される。この例におけるトランスポート・ヘッ
ダ７１８は、データ・パケット７１２に対する宛先キュ
ー・ペアを指定する。更に、トランスポート・ヘッダ７
１８は、データ・パケット７１２に対するオペレーショ
ン・コード、パケット・シーケンス番号、及びパーティ
ションのような情報も提供する。

【００６０】オペレーション・コードは、そのパケット
がメッセージの第１のパケット、最後のパケット、中間
のパケット、又は唯一のパケットのどれであるかを識別
する。オペレーション・コードは、そのオペレーション
が送信、ＲＤＭＡ書き込み、ＲＤＭＡ読み取り、又はア
トミックのどれであるかも指定する。パケット・シーケ
ンス番号は、通信が確立される時に初期設定され、キュ
ー・ペアが新しいパケットを作成する度にインクリメン
トする。エンド・ノードのポートは、パーティションと
呼ばれる１つ又は複数のオーバラップする可能性のある
セットのメンバであるように構成され得る。

【００６１】図８には、例示のリクエスト及び肯定応答
トランザクションを説明するために、分散型コンピュー
タ・システムの一部分が示される。図８における分散型
コンピュータ・システムは、ホスト・プロセッサ・ノー
ド８０２及びホスト・プロセッサ・ノード８０４を含
む。ホスト・プロセッサ・ノード８０２は、ホスト・チ
ャネル・アダプタ８０６を含む。ホスト・プロセッサ・
ノード８０４は、ホスト・チャネル・アダプタ８０８を
含む。図８における分散型コンピュータ・システムは、
スイッチ８１２及びスイッチ８１４を含むＳＡＮファブ
リック８１０を含む。そのＳＡＮファブリック８１０
は、ホスト・チャネル・アダプタ８０６をスイッチ８１
２に結合するリンク；スイッチ８１２をスイッチ８１４
に結合するリンク、及びホスト・チャネル・アダプタ８
０８をスイッチ８１４に結合するリンクを含む。

【００６２】例示のトランザクションでは、ホスト・プ
ロセッサ・ノード８０２がクライアント・プロセスＡを
含む。ホスト・プロセッサ・ノード８０４がクライアン
ト・プロセスＢを含む。クライアント・プロセスＡは、
キュー・ペア２３（送信ワーク・キュー８２４及び受信
ワーク・キュー８２６）を介してホスト・チャネル・ア
ダプタ・ハードウェア８０６と相互作用する。クライア
ント・プロセスＢは、キュー・ペア２４（送信ワーク・
キュー８２８及び受信ワーク・キュー８３０）を介して
ホスト・チャネル・アダプタ・ハードウェア８０８と相
互作用する。キュー・ペア２３及び２４は、送信ワーク
・キュー及び受信ワーク・キューを含むデータ構造であ
る。プロセスＡは、ワーク・キュー・エレメントをキュ
ー・ペア２３の送信ワーク・キュー８２４に入力するこ
とによってメッセージ・リクエストを開始する。そのよ
うなワーク・キュー・エレメントは図４に示される。ク
ライアント・プロセスＡのメッセージ・リクエストは、
送信ワーク・キュー・エレメントに含まれた集合リスト
によって参照される。集合リストにおける各データ・セ
グメントは、図４におけるメッセージ・パート１、２、
及び３をそれぞれ保持したデータ・セグメント１、２、
及び３によって表されるようなメッセージの一部分を含
む仮想的に連続したローカル・メモリ・スペースを指示
する。

【００６３】ホスト・チャネル・アダプタ８０６におけ
るハードウェアは、ワーク・キュー・エレメントを読み
取り、仮想連続バッファに記憶されたメッセージを、図
７に示されたデータ・パケットのようなデータ・パケッ
トの形にセグメント化する。データ・パケットはＳＡＮ
ファブリックを通して経路指定され、高い信頼度の転送
サービスのために、最終的な宛先エンド・ノードによっ
て肯定応答される。連続して肯定応答されない場合、デ
ータ・パケットがソース・エンド・ノードによって再伝
送される。データ・パケットは、ソース・エンド・ノー
ドによって生成され、宛先エンド・ノードによって消費
される。

【００６４】図９を参照すると、本発明に従って、分散
型ネットワーク・システムにおいて使用されるネットワ
ーク・アドレシングを表す図が示される。ホスト名は、
ホスト・プロセッサ・ノード又はＩ／Ｏアダプタ・ノー
ドのようなホスト・ノードに対して論理的識別を与え
る。ホスト名は、メッセージがそのホスト名によって識
別されたエンド・ノードにあるプロセスを宛先とするよ
うに、メッセージに対するエンド・ポイントを識別す
る。従って、１つのノードに対して１つのホスト名が存
在するが、ノードは複数のＣＡを有する。単一のＩＥＥ
Ｅ割り当ての６４ビット識別子（ＥＵＩ−６４）９０２
が各コンポーネントに割り当てられる。コンポーネント
は、スイッチ、ルータ、又はＣＡであってもよい。

【００６５】１つ又は複数のグローバル的にユニークな
ＩＤ（ＧＵＩＤ）識別子９０４がＣＡポートに対して割
り当てられる。幾つかの理由で、複数のＧＵＩＤ（ａ.
ｋ.ａ.ＩＰアドレス）が使用され得る。それらの理由の
幾つかが以下の例で示される。１つの例では、異なるＩ
Ｐアドレスがエンド・ノードにおける異なるパーティシ
ョン又はサービスを識別する。別の実施例では、異なる
ＩＰアドレスが異なるサービス品質（ＱＯＳ）アトリビ
ュートを指定するために使用される。更にもう１つの実
施例では、異なるＩＰアドレスがイントラ・サブネット
・ルートを介して異なるパスを識別する。

【００６６】１つのＧＵＩＤ９０８がスイッチ９１０に
割り当てられる。ローカルＩＤ（ＬＩＤ）は、単一のサ
ブネット内のＣＡポートを識別するために使用される短
いアドレスＩＤのことである。１つの実施例では、サブ
ネットは、２¹⁶個までのエンド・ノード、スイッチ、及
びルータを有し、従って、ＬＩＤは１６ビットである。
ソースＬＩＤ（ＳＬＩＤ）及び宛先ＬＩＤ（ＤＬＩＤ）
は、ローカル・ネットワーク・ヘッダにおいて使用され
るソースＬＩＤ及び宛先ＬＩＤである。シングルＣＡポ
ート９０６は、２^LMC個までのＬＩＤをそれに割り当て
られる。なお、ＬＭＣは、ＣＡにおけるＬＩＤマスク制
御フィールドを表す。マスクは、他のデータ・セットに
おけるビット・パターンを受け容れるために又は拒否す
るために使用されるビット・パターンである。

【００６７】複数のＬＩＤが、次のような例によって与
えられる幾つかの理由のために使用可能である。１つの
実施例では、種々のＬＩＤがエンド・ノードにおける種
々のパーティション又はサービスを識別する。別の実施
例では、種々のＬＩＤが種々のＱＯＳアトリビュートを
指定するために使用される。更にもう１つの実施例で
は、種々のＬＩＤがサブネットを通した種々のパスを指
定する。シングル・スイッチ・ポート９１４は、１つの
ＬＩＤ９１６をそれと関連付けられる。

【００６８】ＬＩＤとＧＵＩＤとの間に１対１の対応関
係が必ずしも存在するわけではない。それは、ＣＡが各
ポートに対するＧＵＩＤよりも多い又は少ないＬＩＤを
持つことができるためである。複数のＳＡＮファブリッ
クに対して冗長なポート及び冗長な導電率を有するＣＡ
に関して、それらのＣＡは、それのポートの各々におい
て同じＬＩＤ及びＧＵＩＤを使用することができるが、
それを使用する必要はない。

【００６９】図１０には、本発明の望ましい実施例に従
って、分散型コンピュータ・システムの一部分が示され
る。分散型コンピュータ・システム１０００は、サブネ
ット１００２及びサブネット１００４を含む。サブネッ
ト１００２は、ホスト・プロセッサ・ノード（エンド・
ノード）１００６、１００８、及び１０１０を含む。サ
ブネット１００４は、ホスト・プロセッサ・ノード（エ
ンド・ノード）１０１２及び１０１４を含む。サブネッ
ト１００２は、スイッチ１０１６及び１０１８を含む。
サブネット１００４は、スイッチ１０２０及び１０２２
を含む。

【００７０】ルータは、サブネットを接続する。例え
ば、サブネット１００２は、ルータ１０２４及び１０２
６によってサブネット１００４に接続される。１つの実
施例では、サブネットは、２¹⁶個までのエンド・ノー
ド、スイッチ、及びルータを有する。

【００７１】サブネットは、単一のユニットとして管理
されるエンド・ノード及びカスケード・スイッチのグル
ープとして定義される。一般には、サブネットは、単一
の地理的又は機能的エリアを占める。例えば、１つの部
屋における単一のコンピュータ・システムが、サブネッ
トとして定義され得る。１つの実施例では、サブネット
におけるスイッチは、メッセージに対して非常に高速の
ワームホール（ｗｏｒｍｈｏｌｅ）又はカット・スルー
（ｃｕｔ−ｔｈｒｏｕｇｈ）経路指定を行うことができ
る。

【００７２】サブネット内のスイッチは、そのスイッチ
が着信メッセージ・パケットを素早く且つ効率的に経路
指定することを可能にするために、そのサブネットにお
ける独特のＤＬＩＤを検査する。１つの実施例では、ス
イッチは比較的簡単な回路であり、一般には、単一の集
積回路として実装される。サブネットは、カスケード・
スイッチによって形成された数百乃至数千個のエンド・
ノードを有することができる。

【００７３】図１０に示されるように、ずっと大きなシ
ステムに拡張するためには、サブネットがルータ１０２
４及び１０２６のようなルータに接続される。ルータ
は、ＩＰ宛先ＩＤ（例えば、ＩＰｖ６宛先ＩＤ）を解釈
し、そのＩＰに適したパケットを経路指定する。

【００７４】スイッチの例示的実施例が図３の（Ｂ）に
おいて概略的に示される。スイッチ又はルータにおける
各Ｉ／Ｏパスはポートを有する。一般に、スイッチは、
１つのポートから同じスイッチ上の他の任意のポートに
パケットを経路指定することができる。

【００７５】サブネット１００２又はサブネット１００
４のようなサブネットでは、ソース・ポートから宛先ポ
ートまでのパスが宛先ホスト・チャネル・アダプタ・ポ
ートのＬＩＤによって決定される。サブネット相互間に
おけるパスは、宛先ホスト・チャネル・アダプタ・ポー
トのＩＰアドレス（例えば、ＩＰｖ６アドレス）によっ
て、及び宛先のサブネットに到達するために使用される
ルータ・ポートのＬＩＤアドレスによって決定される。

【００７６】１つの実施例では、リクエスト・パケット
及びリクエスト・パケットの対応する正の肯定応答（Ａ
ＣＫ）又は負の肯定応答（ＮＡＫ）フレームによって使
用されるパスは、対称的である必要はない。或る経路指
定を使用する１つの実施例では、スイッチがＤＬＩＤに
基づいて出力ポートを選択する。１つの実施例では、ス
イッチがそれのすべての入力ポートに対して一連の経路
指定の判断基準を使用する。１つの例示的実施例では、
経路指定の判断基準が１つの経路指定テーブルに含まれ
る。別の実施例では、スイッチが各入力ポートに対して
別の一組の基準を使用する。

【００７７】本発明の分散型コンピュータ・システムに
おけるデータ・トランザクションは、一般に、幾つかの
ハードウェア及びソフトウェア・ステップから成る。ク
ライアント・プロセス・データ・トランスポート・サー
ビスは、ユーザ・モード又はカーネル・モード・プロセ
スであってもよい。クライアント・プロセスは、図３の
（Ａ）、図５、及び図６に示されたキュー・ペアのよう
な１つ又は複数のキュー・ペアを介してホスト・チャネ
ル・アダプタ・ハードウェアをアクセスする。クライア
ント・プロセスは、本願では「バーブ」と呼ばれるオペ
レーティング・システム特有のプログラミング・インタ
ーフェースをコールする。バーブを実施するソフトウェ
ア・コードは、ワーク・キュー・エレメントを所与のキ
ュー・ペア・ワーク・キューに送付する。

【００７８】ワーク・キュー・エレメントを送付する多
くの可能な方法があり、種々のコスト／パフォーマンス
設計ポイントを可能にするがインターオペラビリティ
（interoperability）には影響しない多くの可能なワー
ク・キュー・エレメント・フォーマットがある。しか
し、ユーザ・プロセスは、明確に定義された方法でバー
ブに対して通信を行わなければならず、ＳＡＮファブリ
ックにまたがって伝送されるデータのフォーマット及び
プロトコルは、装置が異機種のベンダ環境において相互
協調処理することを可能にするために、完全に指定され
なければならない。

【００７９】１つの実施例では、チャネル・アダプタ・
ハードウェアがワーク・キュー・エレメントの送付を検
出し、ワーク・キュー・エレメントをアクセスする。こ
の実施例では、チャネル・アダプタ・ハードウェアがワ
ーク・キュー・エレメントの仮想アドレスを変換及び検
証し、データをアクセスする。

【００８０】発信メッセージは、１つ又は複数のデータ
・パケットの形に分割される。１つの実施例では、チャ
ネル・アダプタ・ハードウェアがトランスポート・ヘッ
ダ及びネットワーク・ヘッダを各パケットに加える。ト
ランスポート・ヘッダは、シーケンス番号及び他のトラ
ンスポート情報を含む。ネットワーク・ヘッダは、宛先
ＩＰアドレス及び他のネットワーク経路指定情報のよう
な経路指定情報を含む。リンク・ヘッダは、宛先ローカ
ル識別コード（ＤＬＩＤ）又は他のローカル経路指定情
報を含む。いつも、適切なリンク・ヘッダがパケットに
加えられる。宛先エンド・ノードがリモート・サブネッ
トにある場合、適切なグローバル・ネットワーク・ヘッ
ダが所与のパケットに加えられる。

【００８１】高い信頼度のトランスポート・サービスが
使用される場合、リクエスト・データ・パケットがそれ
の宛先エンド・ノードに到達する時、そのリクエスト・
データ・パケットが検証され、宛先エンド・ノードにお
いて受け容れられたことをリクエスト・データ・パケッ
トの発信側に知らせるために、肯定応答データ・パケッ
トが宛先エンド・ノードによって使用される。肯定応答
データ・パケットは、１つ又は複数の有効な且つ受け容
れられたリクエスト・データ・パケットに肯定応答す
る。リクエスタは、それが何らかの肯定応答を受信する
前に、複数の未処理のリクエスト・データ・パケットを
持つことが可能である。１つの実施例では、複数の未処
理のメッセージ、即ち、リクエスト・データ・パケット
の数は、キュー・ペアが作成される時に決定される。

【００８２】図１１には、本発明を実施するための階層
化アーキテクチャ１１００の１つの実施例が概略的に示
される。図１１の階層化アーキテクチャの図は、データ
通信パスの種々の層及び層相互間で送られるデータ及び
制御情報の編成を示す。

【００８３】ホスト・チャネル・アダプタ・エンド・ノ
ード・プロトコル層（例えば、エンド・ノード１１１１
によって使用される）は、コンシューマ１１０３によっ
て定義された高レベル・プロトコル１１０２、トランス
ポート層１１０４、ネットワーク層１１０６、リンク層
１１０８、及び物理層１１１０を含む。スイッチ層（例
えば、スイッチ１１１３によって使用される）は、リン
ク層１１０８及び物理層１１１０を含む。ルータ層（例
えば、ルータ１１１５によって使用される）は、ネット
ワーク層１１０６、リンク層１１０８、及び物理層１１
１０を含む。

【００８４】階層化アーキテクチャ１１００は、一般
に、古典的な通信スタックの輪郭を呈している。エンド
・ノード１１１１のプロトコル層に関して、例えば、高
レベル・プロトコル１１０２は、トランスポート層１１
０４においてメッセージを作成するためにバーブを使用
する。ネットワーク層１１０６は、ネットワーク・サブ
ネット相互間におけるパケットを経路指定する（１１１
６）。リンク層１１０８は、ネットワーク・サブネット
におけるパケットを経路指定する（１１１８）。物理層
１１１０は、ビット又はビットのグループを他の装置の
物理層に送る。それらの層の各々は、上位の層又は下位
の層が如何にしてそれらの機能を遂行するかを知らな
い。

【００８５】コンシューマ１１０３及び１１０５は、エ
ンド・ノード相互間で通信を行うために他の層を使用す
るアプリケーション又はプロセスを表す。トランスポー
ト層１１０４は、終端間のメッセージ移動を行う。１つ
の実施例では、トランスポート層は、上記のような４つ
のタイプのトランスポート・サービス、即ち、高い信頼
度の接続サービス、高い信頼度のデータグラム・サービ
ス、低い信頼度のデータグラム・サービス、及び生のデ
ータグラム・サービスを提供する。ネットワーク層１１
０６は、サブネット又は複数のサブネットを介して宛先
エンド・ノードへのパケット経路指定を行う。リンク層
１１０８は、フロー制御された、エラー・チェックされ
た、及び優先順位付けられたパケット配送をリンクにま
たがって行う。

【００８６】物理層１１１０は、テクノロジ依存性のビ
ット伝送を行う。ビット又はビットのグループがリンク
１１２２、１１２４、及び１１２６を介して物理層相互
間で送られる。リンクは、印刷回路銅トレース、銅ケー
ブル、光ケーブルでもって、又は他の適当なリンクでも
って実施され得る。

【００８７】本発明は、図１乃至図１１に関連して上述
したＳＡＮ環境において動作する。本発明は、ヘッド・
ポインタ及びテール・ポインタを使用して、ＳＡＮアー
キテクチャにおいてワーク・キュー及び完了キューを管
理するための機構を提供する。ヘッド・ポインタ及びテ
ール・ポインタがそれぞれ使用される方法の理解を与え
るために、本発明の説明は、ワーク・キュー及び完了キ
ューの両方に関して行われるであろう。ワーク・キュー
及び完了キューによる本発明のオペレーションに関する
以下の説明が例示的なものであること、及び本発明の精
神及び技術的範囲を逸脱することなく修正が行われ得る
ことは明らかであろう。

【００８８】Ａ．ワーク・キューの構造図１２は、送信キュー又は受信キューであってもよい例
示的なワーク・キューを示す。ワーク・キュー１２００
は、１つ又は複数のページから成り、それらのページ
は、一般に、４Ｋバイトであるが、他のサイズも使用可
能である。図１２における例では、キューは、４つのペ
ージ、即ち、システム・メモリ１２０５に設けられたペ
ージ０（１２０１）、ページ１（１２０２）、ページ２
（１２０３）、及びページ３（１２０４）を使用する。
ＷＱＥサイズは、１ページに適合したＷＱＥの数が２の
累乗となるように選択される。例えば、６４バイトのＷ
ＱＥの場合、６４個のＷＱＥが４Ｋのページに適合する
であろう。図１２の例では、これは、２５６個のＷＱＥ
のキュー項目数（depth）を与えるであろう。ワーク・
キューを形成するページの数を変更することによって、
種々のキュー項目数が提供され得る。ハードウェアは、
ワーク・キューのサイズの選択においてかなりの融通性
を維持しながら、このページの数を２の累乗にすること
によって単純化される。

【００８９】ワーク・キュー・ページ・テーブル（ＷＱ
ＰＴ）１２１０が維持され、それはそのワーク・キュー
を形成するページのリスト１２１５を含む。これは、シ
ステム・メモリ又はＨＣＡメモリ内に設けられ得るが、
いずれの場合も、それのロケーションはＨＣＡ１２２０
に記憶される。ＨＣＡは、各ワーク・キューのためのワ
ーク・キュー・ポインタ１２３０に対して２つのインデ
ックスを維持する。第１のＷＱＰＴインデックス１２３
２は、前述のＷＱＰＴにおいてインデックスするために
使用される。４ページから成るワーク・キューを有する
図１２の例では、ＷＱＰＴインデックスは２ビットであ
る。第２のインデックスは、ＷＱページ・インデックス
１２３４であり、それは、ワーク・キューの各ページに
おいてインデックスするために使用される。例えば、６
４バイトＷＱＥ及び４Ｋページの場合、ＷＱページ・イ
ンデックスは６ビットであろう。

【００９０】ワーク・キューに対して、ＣＩがテール・
ポインタ１２５０を維持し、ＨＣＡがヘッド・ポインタ
１２３６を維持する。ＣＩによって維持されたテール・
ポインタは、次のＷＱＥが設けられるワーク・キューに
おけるロケーションを指示する。ＨＣＡによって維持さ
れたヘッド・ポインタは、処理されるべき次のＷＱＥの
ワーク・キューにおけるロケーションを指示する。

【００９１】ＨＣＡは、キューにおけるＷＱＥの数を表
すＷＱＥカウンタ１２６０を維持し、ＷＱＥがＷＱＥア
ダー１２６２を使用してキューに送られる時、ＣＩがこ
のカウントをインクリメントすることを可能にするため
の機構を提供する。また、ＣＩは、ワーク・キューにお
けるＷＱＥの数を表すカウント１２５４を維持する。Ｃ
Ｉは、ＣＱからそれの関連のＣＱＥを検索することによ
って、それがＷＱＥをエンキューする時に１だけそれの
ＷＱＥカウント１２５４をインクリメントし、ＷＱＥが
処理されてしまったことを確認する時に１だけそれをデ
クリメントする。ＨＣＡは、ＣＩがそのＷＱＥの数をエ
ンキューする時、ＣＩによってＷＱＥアダー１２６２に
書き込まれた数だけそれのＷＱＥカウント１２６４をイ
ンクリメントする。ＨＣＡは、ＷＱＥが処理されてしま
った時、それのＷＱＥカウント１２６４を１だけデクリ
メントする。

【００９２】ＷＱの初期状態はエンプティであり、それ
によって、ＨＣＡによって維持されたヘッド・インデッ
クス１２３６は、ＣＩによって維持されるテール・イン
デックス１２５０に等しくなり、両方ともキューのヘッ
ド（即ち、先頭）を指示する。更に、ＨＣＡ及びＣＩの
両方によって維持されたＷＱＥカウントはゼロである。

【００９３】Ｂ．完了キューの構造図１３は、例示的な完了キューを示す。完了キュー１３
００は、１ページ又は複数ページから成り、そのページ
は、一般には、４Ｋバイトのサイズであるが、他のサイ
ズも使用可能である。図１３における例では、キュー
は、４つのページ、即ち、システム・メモリ１３０５に
設けられたページ０（１３０１）、ページ１（１３０
２）、ページ２（１３０３）、及びページ３（１３０
４）を使用する。ＣＱＥサイズは、１ページに適合する
ＣＱＥの数が２の累乗となるように選択される。例え
ば、６４バイトのＣＱＥの場合、６４個のＣＱＥが４Ｋ
ページに適合するであろう。図１３における例では、こ
れは、２５６個のＣＱＥのキュー項目数を提供するであ
ろう。ＣＱを形成するページの数を変更することによっ
て、種々のキュー項目数が提供され得る。このページの
数を２の累乗にすることによって、完了キューのサイズ
の選択において大きな融通性を維持しながら、ハードウ
ェアが簡素化される。

【００９４】ＣＱを形成するページのリスト１３１５を
含む完了キュー・ページ・テーブル（ＣＱＰＴ）１３１
０が維持される。これは、システム・メモリ又はＨＣＡ
メモリに設けられ得るが、いずれの場合も、そのロケー
ションはＨＣＡ１３２０に記憶される。ＨＣＡは、各Ｃ
Ｑのための完了キュー・ポインタ１３３０に対して２つ
のインデックスを維持する。第１のＣＱＰＴインデック
ス１３３２は、前述のＣＱＰＴをインデックスするため
に使用される。４ページから成るＣＱを有する図１３に
おける例では、ＣＱＰＴインデックスは２ビットであ
る。第２のインデックスはＣＱページ・インデックス１
３３４であり、それは、ＣＱの各ページをインデックス
するために使用される。例えば、６４バイトＣＱＥ及び
４Ｋページの場合、ＣＱページ・インデックスは６ビッ
トになるであろう。

【００９５】ＣＱに対して、ＣＩは、ヘッド・ポインタ
１３４０を維持し、ＨＣＡは、テール・ポインタ１３３
８を維持する。ＣＩによって維持されたヘッド・ポイン
タ１３４０は、処理されるべき次のＣＱＥの完了キュー
におけるロケーションを指示する。ＨＣＡによって維持
されたテール・ポインタは、次のＣＱＥがエンキューさ
れる完了キューにおけるロケーションを指示する。

【００９６】フリーＣＱＥカウントは、ＣＱにおいて得
られるエンプティ・スロットの数である。ＨＣＡは、Ｃ
ＱＥカウンタ１３６０を維持し、ＣＱＥがフリーＣＱＥ
アダー１３６２を使用して処理されてしまった後、ＣＩ
がフリーＣＱＥカウント１３６４に加わることを可能に
する機構を維持する。ＣＩは、それがＣＱＥを処理する
時、フリーＣＱＥカウント１３６４を１だけインクリメ
ントする。ＣＩは、フリーＣＱＥアダー１３６２に１を
書き込むことによってこのインクリメントを遂行するよ
うにＨＣＡに命令する。ＨＣＡは、ＣＱＥがＣＱにおい
てエンキューされる時、それのフリーＣＱＥカウントを
１だけデクリメントする。

【００９７】ＣＱの初期状態はエンプティであり、それ
によって、ＨＣＡによって維持されたテール・インデッ
クス１３３８は、ＣＩによって維持されたヘッド・イン
デックス１３４０に等しくなり、両方ともキューのヘッ
ドを参照する。更に、ＨＣＡによって維持されたフリー
ＣＱＥカウントは、ＣＱに記憶され得るＣＱＥの最大数
に等しい。

【００９８】Ｃ．詳細なワーク・リクエスト・オペレー
ション図１４を参照すると、本発明の望ましい実施例に従っ
て、コンシューマがワーク・リクエストをワーク・キュ
ーに送付する時のチャネル・インターフェースのオペレ
ーションを表すフローチャートが示される。プロセス
は、ワーク・リクエストを受信することによって開始
し、ＣＩは、ＷＱＥカウントのＣＩのローカル・コピー
を、そのワーク・キューに記憶され得るＷＱＥの最大数
と比較することによって、そのワーク・キューが満杯で
あるかどうかをチェックする（ステップ１４０２）。そ
れらが等しい場合、そのキューは満杯であり、従って、
１つ又は複数のＷＱＥが１つ又は複数のＣＱＥを完了キ
ューに発信することによって処理されてしまったことを
ＨＣＡが表すまで、このワーク・リクエストは受け容れ
られない（ステップ１４０４）。そのキューがステップ
１４０２では満杯でない場合、ＷＱＥは、テール・イン
デックスによって参照されたロケーションに書き込まれ
る（ステップ１４０６）。

【００９９】ＣＩは、リクエストを定義するＷＱＥを形
成し、このＷＱＥをキューのテール（即ち、末尾）に書
き込む。テールのロケーションは、ＷＱＰＴインデック
ス及びＷＱページ・インデックスの組み合わせであるテ
ール・インデックスから決定される。ページ・アドレス
及びそのページへのオフセットの組み合わせは、ＷＱＥ
が置かれるアドレスを提供する。別の方法として、ワー
ク・キュー・ページが連続した仮想アドレス・スペース
に対応する場合、ＣＩは、仮想アドレスであるＷＱテー
ル・ポインタを維持し、ハードウェア・アドレス変換機
構を使用してそのキューにおける適切なロケーションに
ＷＱＥを記憶する。

【０１００】そこで、テール・インデックスはインクリ
メントされ、次のＷＱＥが入れられるロケーションを指
示する（ステップ１４０８）。次に、ＣＩは、ＨＣＡ機
構を使用してＨＣＡのＷＱＥカウントを１だけインクリ
メントし（ステップ１４１０）、処理を必要とする１つ
又は複数のＷＱＥがワーク・キュー上に存在するという
ことをＨＣＡに知らせる。ＷＱＥカウントのＣＩのロー
カル・コピーもインクリメントされる。しかる後、プロ
セスは終了する。

【０１０１】テール・インデックスがインクリメントさ
れる時、ページ・インデックスがラップする場合、ＷＱ
ＰＴインデックスが１だけインクリメントされる。ＷＱ
ＰＴインデックスがラップする場合、ワーク・キューが
そのキューのヘッドにラップしている。ＣＩがテール・
インデックスをチェック及び更新し、ＷＱＥをキューの
テールに書き込むプロセスにある間、他のプロセスによ
って使用されないようにこれらのリソースの排他的ロッ
クを得ることが必要である。

【０１０２】次に、図１５を参照すると、本発明の望ま
しい実施例に従って、ホスト・チャネル・アダプタのオ
ペレーションを表すフローチャートが示される。プロセ
スが始まり、ＨＣＡは、ＷＱＥカウントを周期的にチェ
ックすることによってワーク・キューをモニタする（ス
テップ１５０２）。ＷＱＥカウントがゼロであるかどう
かに関する決定が行われる（ステップ１５０４）。それ
がゼロである場合、キューはエンプティであり、プロセ
スはＷＱＥカウントを検査するためにステップ１５０２
に戻る。ステップ１５０４においてＷＱＥカウントがゼ
ロでない場合、処理されるべきＷＱＥが存在し、ＨＣＡ
がリクエストされたメッセージを送信する。別の方法と
して、ＣＩがＨＣＡにおけるＷＱＥカウントに加えるた
めの機構を使用する時、ＨＣＡは、処理されるべきＷＱ
Ｅが存在するという表示としてこれを使用してもよい。

【０１０３】処理すべきＷＱＥが存在する時、ＨＣＡ
は、ＷＱＥを含むページを先ず位置指定することによっ
てＷＱＥのロケーションを決定する（ステップ１５０
６）。これは、ＨＣＡのヘッドＷＱＰＴインデックスを
使用してＷＱＰＴをインデックスすることにより行われ
る。しかる後、ＷＱページ・インデックス及びＷＱＥの
サイズに基づいて、そのページ内のロケーションが決定
される。

【０１０４】しかる後、プロセスはメッセージを送信す
る（ステップ１５０８）。必要とされ得るすべての肯定
応答が受信され、ＷＱＥ処理が完了する。ＨＣＡは、ヘ
ッド・インデックスのそれ自身のコピーをインクリメン
トする（ステップ１５１０）。ヘッド・インデックスが
インクリメントされる時、ページ・インデックスがラッ
プする場合、ＷＱＰＴインデックスが１だけインクリメ
ントされる。ＷＱＰＴインデックスがラップする場合、
ワーク・キューがキューのヘッドにラップしている。Ｈ
ＣＡがそれのＷＱＥカウントを１だけデクリメントす
る。

【０１０５】ＷＱＥ処理が完了した後、ＨＣＡは、ＣＱ
ＥをＣＱのテールに書き込むことによってＣＩに通知す
る。このＣＱＥにおけるフィールドの１つは、これが有
効なＣＱＥであることをＣＩに表示する有効ビットであ
る。有効ビットが書き込まれる前に、又はそれが書き込
まれると同時に、ＣＱＥにおける他のフィールドがすべ
て書き込まれていることをハードウェアが保証しなけれ
ばならないということに留意してほしい。ＣＱＥを書き
込む前に、ＨＣＡは、先ず、フリーＣＱＥカウントがゼ
ロであることをチェックすることによってＣＱが満杯で
ないことをチェックする（ステップ１５１２）。それが
ゼロである場合、ＣＱは満杯であり、オペレーションが
エラーで終了する（ステップ１５１４）。ステップ１５
１２においてＣＱが満杯でない場合、ＨＣＡは、ＨＣＡ
のテールＣＱＰＴインデックスを使用して先ずそのペー
ジを位置指定することにより、ＣＱＥを記憶すべきロケ
ーションを決定する（ステップ１５１６）。しかる後、
ＣＱページ・インデックス及びＣＱＥのサイズに基づい
てそのページ内のロケーションが決定され、プロセス
は、ＣＱＥを完了キューに書き込む（ステップ１５１
８）。そこで、ＨＣＡは、それのＣＱテール・インデッ
クスをインクリメントし、それによって、ページ・イン
デックスがラップする場合、ＣＱＰＴインデックスが１
だけインクリメントされる（ステップ１５２０）。ＣＱ
ＰＴインデックスがラップする場合、ＣＱテールはキュ
ーのヘッドにラップされている。ＨＣＡは、それのフリ
ーＣＱＥカウントを１だけデクリメントし（ステップ１
５２２）、終了する。

【０１０６】次に、図１６を参照すると、本発明の望ま
しい実施例に従って、コンシューマがワーク完了情報を
リクエストした時のチャネル・インターフェースのオペ
レーションを表すフローチャートが示される。プロセス
が始まり、そのプロセスは、ＣＱのヘッドに置かれたＣ
ＱＥがそれの有効性を表すためにそれの有効ビットをセ
ットされているかどうかをチェックする（ステップ１６
０２）。そこで、ＣＩは、ＣＱがエンプティであるかど
うかを決定する（ステップ１６０４）。ＣＱがエンプテ
ィである場合、プロセスは終了する。ステップ１６０４
においてＣＱがエンプティでない場合、ＣＩは、ＣＱの
ヘッドにおけるＣＱＥを読み取る（ステップ１６０
５）。このＣＱＥは、ＣＱページ・テーブルと結合して
ＣＰヘッド・インデックスによって参照される。別の方
法として、ＣＱページが連続した仮想アドレス・スペー
スに対応する場合、ＣＩは、仮想アドレスであるＣＱヘ
ッド・ポインタを維持し、ハードウェアのアドレス変換
を使用してＣＱＥをＣＱにおける適切なロケーションか
らフェッチする。そこで、ワーク完了情報をリクエスト
したコンシューマにその情報を戻すためにＣＱＥの内容
が使用される（ステップ１６０６）。

【０１０７】ＣＱＥがＣＩによって処理されてしまった
後、ＣＩがＷＱテール・インデックスをインクリメント
する方法と同様の方法でＣＱヘッド・インデックスがイ
ンクリメントされる（ステップ１６０８）。ＣＩは、Ｃ
ＱＥにおける有効ビットを、それが有効でないことを表
すようにセットすることによって、再びＨＣＡによる使
用のためにＣＱＥを利用可能にする（ステップ１６１
０）。そこで、ＣＩは、ＨＣＡ機構を使用してＨＣＡの
フリーＣＱＥカウントを１だけインクリメントすること
によって、ＣＱＥが処理されてしまったことをＨＣＡに
知らせる（ステップ１６１２）。更に、ＣＩは、ＷＱ
ＷＱＥカウントのＣＩのコピーを１だけデクリメントす
ることによって、このＣＱＥに対応したＷＱＥを再利用
することができ（ステップ１６１４）、プロセスは終了
する。ＣＩは、ワーク・キューにおけるスペースを空け
る前にＣＱ上に対応するスペースが存在することを保証
するために、ＷＱＥカウントのこの更新を行うことを要
求される。

【０１０８】ＣＩは、ＣＱヘッド・インデックスをチェ
ック及び更新し、ＣＱＥをそのキューのヘッドから読み
取り、そしてＣＱＥ有効ビットをリセットするというプ
ロセス中にある間、他のプロセスによって使用されない
ようにするために、これらのリソースの排他的ロックを
得る必要がある。

【０１０９】Ｄ．最適化次に、本願における前述の基本的な方法に対する最適化
事項を箇条書きにして示す：（１）ＣＩは、いくつかのＷＱＥがワーク・キュー上に
置かれた後にＨＣＡのＷＱＥカウントを１回だけ更新す
ること及び送付されたＷＱＥの数を加えることによっ
て、ＨＣＡへの書き込みの数を減らすことが可能であ
る。（２）ＣＩは、いくつかのＣＱＥがＣＱから検索された
後にＨＣＡのフリーＣＱＥカウントを１回だけ更新する
ことによって、ＨＣＡへの書き込みの数を減らすことが
可能である。この場合、ＣＡは、フリー・カウントを１
の代わりに可変数ｎだけインクリメントするための機構
を設ける必要がある。（３）ワーク・キュー又はＣＱが仮想アドレス・スペー
スにおいて連続している場合、ＣＩは、記憶又はフェッ
チを行うために、仮想アドレスを使用して及びハードウ
ェアのアドレス変換機構を使用してそのキューを参照す
ることが可能である。この場合、キューを参照するため
に使用される仮想アドレスは、ラップが生じた時を検出
するために、キューの末端の仮想アドレスに対してアク
セス及びチェックが行われた後、ＷＱＥ又はＣＱＥの長
さだけインクリメントされるであろう。（４）キューが小さいか又はページ・サイズが大きい時
に起こり得る単一ページに適合したワーク・キューに対
して、ＷＱＰＴ及びＷＱＰＴインデックスが除去され得
る。その単一ページの実アドレスは、依然として記憶さ
れる必要があるであろう。（５）キューが小さいか又はページ・サイズが大きい時
に起こり得る単一ページに適合したＣＱに対して、ＣＱ
ＰＴ及びＣＱＰＴインデックスが除去され得る。その単
一ページの実アドレスは、依然として記憶される必要が
あるであろう。（６）ワーク・キューが連続した実メモリに位置決めさ
れる場合、それは、ＣＩ及びＨＣＡの両方によってアク
セス可能であり、ＷＱＰＴ及びＷＱＰＴインデックスは
除去され得る。（７）ＣＱが連続した実メモリに位置決めされる場合、
それはＣＩ及びＨＣＡの両方によってアクセス可能であ
り、ＣＱＰＴ及びＣＱＰＴインデックスは除去され得
る。

【０１１０】十分に機能するデータ処理システムに関連
して本発明を説明したけれども、本発明のプロセスが命
令に関するコンピュータ可読媒体の形で及び種々の形で
分配され得ること、及び本発明が分配を行うために実際
に使用される特定のタイプの信号保持媒体に関係なく等
しく適用することが当業者には明らかであるということ
に留意することは重要である。コンピュータ可読媒体の
例は、フロッピー（Ｒ）・ディスク、ハード・ディスク
・ドライブ、ＲＡＭ、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭの
ような記録可能タイプの媒体、並びに、ディジタル及び
アナログ通信リンク、例えば、無線周波及び光波（ligh
t wave）伝送のような伝送形式を使用した有線又は無線
通信のような伝送タイプの媒体を含む。コンピュータ可
読媒体は、特定のデータ処理システムにおいて実際に使
用するためにデコードされるコード化フォーマットの形
式を取り得る。

【０１１１】本発明の記述は、例示及び説明を目的とし
て与えられ、網羅的であること又は開示された形式の発
明に限定されることを意図するものではない。当業者に
は、多くの修正及び変更が明らかであろう。実施例は、
発明の原理、実用的な応用例を最もよく説明するため
に、及び意図された特定の用途に適する種々の修正を伴
う種々の実施例に関して当業者以外の人が発明を理解し
得るように、選択及び記述された。

【０１１２】まとめとして、本発明の構成に関して以下
の事項を開示する。

【０１１３】（１）キューを管理するための方法にし
て、チャネル・インターフェースにおいてキュー・テー
ル・インデックスを発生するステップと、ホスト・チャ
ネル・アダプタにおいて前記キューに対するキュー・ヘ
ッド・インデックスを発生するステップと、前記ホスト
・チャネル・アダプタにおいて前記キューに対するキュ
ー・エントリ・カウントを発生するステップと、前記キ
ュー・ヘッド・インデックス、前記キュー・テール・イ
ンデックス、及び前記キュー・エントリ・カウントを使
用して前記キューを制御するステップと、を含む方法。（２）前記キューがワーク・キューであり、前記ワーク
・キューが満杯であるかどうかを決定するために前記キ
ュー・エントリ・カウントが使用される、請求項１に記
載の方法。（３）前記キューがワーク・キューであり、ワーク・キ
ュー・エントリがチャネル・インターフェースによって
書き込まれ得る前記ワーク・キューにおける位置を決定
するために前記キュー・テール・インデックスが使用さ
れる、請求項１に記載の方法。（４）前記キューがワーク・キューであり、前記ホスト
・チャネル・アダプタによって処理されるべきワーク・
キュー・エントリを決定するために前記キュー・ヘッド
・インデックスが使用される、請求項１に記載の方法。（５）前記キューがワーク・キューであり、前記ワーク
・キューがエンプティであるかどうかを決定するために
前記キュー・エントリ・カウントが使用される、請求項
１に記載の方法。（６）前記キュー・ヘッド・インデックスがキュー・ポ
インタ・テーブル・インデックス及びキュー・ページ・
インデックスから成る、請求項１に記載の方法。（７）前記キューがワーク・キューであり、前記キュー
を制御するステップは、前記ワーク・キューが満杯であ
るかどうかを決定すること、及び前記ワーク・キューが
満杯でない場合、ワーク・リクエストを受け入れること
を含む、請求項１に記載の方法。（８）前記ワーク・リクエストを受け入れることは、前
記キュー・テール・ポインタによって識別された前記ワ
ーク・キューの位置に、前記ワーク・リクエストに対応
するワーク・キュー・エントリを書き込むこと、前記キ
ュー・テール・ポインタをインクリメントすること、及
び前記キュー・エントリ・カウントをインクリメントす
ることを含む、請求項７に記載の方法。（９）前記キュー・エントリ・カウントをインクリメン
トすることは、前記キュー・テール・ポインタのインク
リメント毎には行われない、請求項８に記載の方法。（１０）前記キューがワーク・キューであり、前記キュ
ーを制御するステップは、前記ワーク・キューがエンプ
ティであるかどうかを決定すること、前記ワーク・キュ
ーがエンプティでない場合、前記ホスト・チャネル・ア
ダプタにおいて、前記キュー・ヘッド・インデックスに
対応するワーク・キュー・エントリを処理すること、及
び前記ワーク・キュー・エントリの処理が完了した後、
完了キューに完了キュー・エントリを送付することを含
む、請求項１に記載の方法。（１１）キューを管理するための方法にして、チャネル
・インターフェースにおいて前記キューに対するキュー
・ヘッド・インデックスを発生するステップと、ホスト
・チャネル・アダプタにおいて前記キューに対するキュ
ー・テール・インデックスを発生するステップと、前記
ホスト・チャネル・アダプタにおいて前記キューに対す
るフリー・キュー・エントリ・カウントを発生するステ
ップと、前記キュー・ヘッド・インデックス、前記キュ
ー・テール・インデックス、及び前記フリー・キュー・
エントリ・カウントを使用して前記キューを制御するス
テップと、を含む方法。（１２）前記キューが完了キューであり、前記チャネル
・インターフェースによって処理されるべき完了キュー
・エントリを識別するために前記キュー・ヘッド・イン
デックスが使用される、請求項１１に記載の方法。（１３）前記キューが完了キューであり、前記完了キュ
ーがエンプティであるかどうかを決定するために前記フ
リー・キュー・エントリ・カウントが使用される、請求
項１１に記載の方法。（１４）前記キューが完了キューであり、前記完了キュ
ーが満杯であるかどうかを決定するために前記フリー・
キュー・エントリ・カウントが使用される、請求項１１
に記載の方法。（１５）前記キューが完了キューであり、完了キュー・
エントリが書き込まれる前記完了キューにおける位置を
識別するために前記キュー・テール・インデックスが使
用される請求項１１に記載の方法。（１６）前記キュー・テール・インデックスがキュー・
ポインタ・テーブル・インデックス及びキュー・ページ
・インデックスから成る、請求項１１に記載の方法。（１７）前記キューが完了キューであり、前記キューを
制御するステップは、前記完了キューが満杯であるかど
うかを決定すること、及び前記完了キューが満杯でない
場合、前記キュー・テール・インデックスによって識別
された前記完了キューの位置に完了キュー・エントリを
書き込むことを含む、請求項１１に記載の方法。（１８）前記キューが完了キューであり、前記キューを
制御するステップは、前記完了キューがエンプティであ
るかどうかを決定すること、及び前記完了キューがエン
プティでない場合、前記キュー・ヘッド・インデックス
によって識別された完了キュー・エントリを処理するこ
とを含む、請求項１７に記載の方法。（１９）コンピュータ可読媒体にあって、キューを管理
するためのコンピュータ・プログラムにして、チャネル
・インターフェースにおいてキュー・テール・インデッ
クスを発生するための命令と、ホスト・チャネル・アダ
プタにおいて前記キューに対するキュー・ヘッド・イン
デックスを発生するための命令と、前記ホスト・チャネ
ル・アダプタにおいて前記キューに対するキュー・エン
トリ・カウントを発生するための命令と、前記キュー・
ヘッド・インデックス、前記キュー・テール・インデッ
クス、及び前記キュー・エントリ・カウントを使用して
前記キューを制御するための命令と、を含むコンピュー
タ・プログラム。（２０）前記キューがワーク・キューであり、前記ワー
ク・キューが満杯であるかどうかを決定するために前記
キュー・エントリ・カウントが使用される、請求項１９
に記載のコンピュータ・プログラム。（２１）前記キューがワーク・キューであり、前記ワー
ク・キューがエンプティであるかどうかを決定するため
に前記キュー・エントリ・カウントが使用される、請求
項１９に記載のコンピュータ・プログラム。（２２）前記キューがワーク・キューであり、前記キュ
ーを制御するための命令は、前記ワーク・キューが満杯
であるかどうかを決定するための命令、及び前記ワーク
・キューが満杯でない場合、ワーク・リクエストを受け
入れるための命令を含む、請求項１９に記載のコンピュ
ータ・プログラム。（２３）前記ワーク・リクエストを受け入れるための命
令は、前記キュー・テール・ポインタによって識別され
た前記ワーク・キューの位置に、前記ワーク・リクエス
トに対応するワーク・キュー・エントリを書き込むため
の命令、前記キュー・テール・ポインタをインクリメン
トするための命令、及び前記キュー・エントリ・カウン
トをインクリメントするための命令を含む、請求項２２
に記載のコンピュータ・プログラム。（２４）前記キュー・エントリ・カウントは、前記キュ
ー・テール・ポインタのインクリメント毎には更新され
ない、請求項２３に記載のコンピュータ・プログラム。（２５）前記キューがワーク・キューであり、前記キュ
ーを制御するための命令は、前記ワーク・キューがエン
プティであるかどうかを決定するための命令、前記ワー
ク・キューがエンプティでない場合、前記ホスト・チャ
ネル・アダプタにおいて、前記キュー・ヘッド・インデ
ックスに対応するワーク・キュー・エントリを処理する
ための命令、及び前記ワーク・キュー・エントリの処理
が完了した後、完了キューに完了キュー・エントリを送
付するための命令を含む、請求項１９に記載のコンピュ
ータ・プログラム。（２６）コンピュータ可読媒体にあって、キューを管理
するためのコンピュータ・プログラムにして、チャネル
・インターフェースにおいて前記キューに対するキュー
・テール・インデックスを発生するための命令と、ホス
ト・チャネル・アダプタにおいて前記キューに対するキ
ュー・ヘッド・インデックスを発生するための命令と、
前記ホスト・チャネル・アダプタにおいて前記キューに
対するフリー・キュー・エントリ・カウントを発生する
ための命令と、前記キュー・ヘッド・インデックス、前
記キュー・テール・インデックス、及び前記フリー・キ
ュー・エントリ・カウントを使用して前記キューを制御
するための命令と、を含むコンピュータ・プログラム。（２７）前記キューが完了キューであり、前記完了キュ
ーがエンプティであるかどうかを決定するために前記フ
リー・キュー・エントリ・カウントが使用される、請求
項２６に記載のコンピュータ・プログラム。（２８）前記キューが完了キューであり、前記完了キュ
ーが満杯であるかどうかを決定するために前記フリー・
キュー・エントリ・カウントが使用される、請求項２６
に記載のコンピュータ・プログラム。（２９）前記キューが完了キューであり、前記キューを
制御するための命令は、前記完了キューが満杯であるか
どうかを決定するための命令、及び前記完了キューが満
杯でない場合、前記キュー・テール・インデックスによ
って識別された前記完了キューの位置に完了キュー・エ
ントリを書き込むための命令を含む、請求項２６に記載
のコンピュータ・プログラム。（３０）前記キューが完了キューであり、前記キューを
制御するための命令は、前記完了キューがエンプティで
あるかどうかを決定するための命令、及び前記完了キュ
ーがエンプティでない場合、前記キュー・ヘッド・イン
デックスによって識別された完了キュー・エントリを処
理するための命令を含む、請求項２９に記載のコンピュ
ータ・プログラム。（３１）ワーク・キューを管理するための装置にして、
チャネル・インターフェースと、前記チャネル・インタ
ーフェースに結合されたホスト・チャネル・アダプタと
を含み、前記チャネル・インターフェースが前記キュー
に対するキュー・テール・インデックスを含み、前記ホ
スト・チャネル・アダプタが前記キューに対するキュー
・ヘッド・インデックス及び前記キューに対するキュー
・エントリ・カウントを含み、前記ホスト・チャネル・
アダプタ及びチャネル・インターフェースが前記ヘッド
・インデックス、前記テール・インデックス、及び前記
キュー・エントリ・カウントを使用して前記キューを管
理する、装置。（３２）完了キューを管理するための装置にして、チャ
ネル・インターフェースと、前記チャネル・インターフ
ェースに結合されたホスト・チャネル・アダプタとを含
み、前記チャネル・インターフェースが前記キューに対
するキュー・ヘッド・インデックスを含み、前記ホスト
・チャネル・アダプタが前記キューに対するキュー・テ
ール・インデックス及び前記キューに対するキュー・エ
ントリ・カウントを含み、前記ホスト・チャネル・アダ
プタ及びチャネル・インターフェースが前記ヘッド・イ
ンデックス、前記テール・インデックス、及び前記キュ
ー・エントリ・カウントを使用して前記キューを管理す
る、装置。

【図面の簡単な説明】

【図１】本発明の望ましい実施例に従って示された分散
型コンピュータ・システムを表す図である。

【図２】本発明の望ましい実施例に従って示されたホス
ト・プロセッサ・ノードの機能的ブロック図である。

【図３】（Ａ）は本発明の望ましい実施例に従って示さ
れたホスト・チャネル・アダプタの図であり、（Ｂ）は
本発明の望ましい実施例に従って示されたスイッチの図
であり、（Ｃ）は本発明の望ましい実施例に従って示さ
れたルータの図である。

【図４】本発明の望ましい実施例に従って、ワーク・リ
クエストの処理を図解した図である。

【図５】本発明の望ましい実施例に従って、高い信頼度
の接続サービスが使用される分散型コンピュータ・シス
テムの一部分を表す図である。

【図６】本発明の望ましい実施例に従って、高い信頼度
のデータグラム・サービス接続が使用される分散型コン
ピュータ・システムの一部分を表す図である。

【図７】本発明の望ましい実施例に従って、データ・パ
ケットを示す図である。

【図８】本発明の望ましい実施例に従って、分散型コン
ピュータ・システムの一部分を表す図である。

【図９】本発明の望ましい実施例に従って、分散型コン
ピュータ・システムにおいて使用されるネットワーク・
アドレッシングを示す図である。

【図１０】本発明の望ましい実施例に従って、ＳＡＮフ
ァブリック・サブネットの構造が図解された分散型コン
ピュータ・システムの一部分を表す図である。

【図１１】本発明の望ましい実施例において使用された
層化された通信アーキテクチャを表す図である。

【図１２】本発明の望ましい実施例に従って、ページ・
ポインタ、インデックス、及びアダーの組み合わせを使
用してキューをアクセスするために、ハードウェアとし
てはヘッド・ポインタしか使用しないワーク・キューの
例示的実施態様を示す図である。

【図１３】本発明の望ましい実施例に従って、ページ・
ポインタ、インデックス、及びアダーの組み合わせを使
用してキューをアクセスするために、ハードウェアとし
てはテール・ポインタしか使用しない完了キューの例示
的実施態様を示す図である。

【図１４】本発明の望ましい実施例に従って、コンシュ
ーマがワーク・キューにワーク・リクエストを送付する
時のチャネル・インターフェースのオペレーションを示
すフローチャートである。

【図１５】本発明の望ましい実施例に従って、ホスト・
チャネル・アダプタのオペレーションを示すフローチャ
ートである。

【図１６】本発明の望ましい実施例に従って、コンシュ
ーマがワーク完了情報ををリクエストした時のチャネル
・インターフェースのオペレーションを示すフローチャ
ートである。

【符号の説明】

４００受信ワーク・キュー４０２送信ワーク・キュー４０４完了キュー４０６コンシューマ４０８ハードウェア４１０、４１２ワーク・リクエスト４１４ワーク完了４１６−４２８ワーク・キュー・エレメント４３０−４３６完了キュー・エレメント

───────────────────────────────────────────────────── フロントページの続き (72)発明者リチャード・ルイス・アルントアメリカ合衆国78746、テキサス州、オースチン、バーン・スワロー・ドライブ 1607 (72)発明者デービッド・エフ・クラッドックアメリカ合衆国12561、ニューヨーク州、ニュー・パルツ、オールド・フォード・ロード 1130 (72)発明者トーマス・アンソニー・グレッグアメリカ合衆国12528、ニューヨーク州、ハイランド、ベルビュー・ロード 121 (72)発明者イアン・デービット・ジャド英国Ｓ021 ２ＥＧ、ウィンチェスター、オッターボーン、コールス・メド 33 (72)発明者グレゴリー・フランシス・ファイスターアメリカ合衆国78746、テキサス州、オースチン、サー・アイボー・コーブ 5905 (72)発明者レナト・ジョン・レシオアメリカ合衆国78759、テキサス州、オースチン、ウィネペッグ・コーブ 6707 (72)発明者ドナルド・ウィリアム・シュミットアメリカ合衆国12484、ニューヨーク州、ストーン・ブリッジ、ヴィンセント・レーン 77 Ｆターム(参考） 5B045 BB17 BB28 BB34 BB42

Claims

【特許請求の範囲】

【請求項１】キューを管理するための方法にして、チャネル・インターフェースにおいてキュー・テール・
インデックスを発生するステップと、ホスト・チャネル・アダプタにおいて前記キューに対す
るキュー・ヘッド・インデックスを発生するステップ
と、前記ホスト・チャネル・アダプタにおいて前記キューに
対するキュー・エントリ・カウントを発生するステップ
と、前記キュー・ヘッド・インデックス、前記キュー・テー
ル・インデックス、及び前記キュー・エントリ・カウン
トを使用して前記キューを制御するステップと、を含む方法。
【請求項２】前記キューがワーク・キューであり、前記ワーク・キューが満杯であるかどうかを決定するた
めに前記キュー・エントリ・カウントが使用される、請求項１に記載の方法。
【請求項３】前記キューがワーク・キューであり、ワーク・キュー・エントリがチャネル・インターフェー
スによって書き込まれ得る前記ワーク・キューにおける
位置を決定するために前記キュー・テール・インデック
スが使用される、請求項１に記載の方法。
【請求項４】前記キューがワーク・キューであり、前記ホスト・チャネル・アダプタによって処理されるべ
きワーク・キュー・エントリを決定するために前記キュ
ー・ヘッド・インデックスが使用される、請求項１に記載の方法。
【請求項５】前記キューがワーク・キューであり、前記ワーク・キューがエンプティであるかどうかを決定
するために前記キュー・エントリ・カウントが使用され
る、請求項１に記載の方法。
【請求項６】前記キュー・ヘッド・インデックスがキュ
ー・ポインタ・テーブル・インデックス及びキュー・ペ
ージ・インデックスから成る、請求項１に記載の方法。
【請求項７】前記キューがワーク・キューであり、前記キューを制御するステップは、前記ワーク・キューが満杯であるかどうかを決定するこ
と、及び前記ワーク・キューが満杯でない場合、ワーク
・リクエストを受け入れることを含む、請求項１に記載
の方法。
【請求項８】前記ワーク・リクエストを受け入れること
は、前記キュー・テール・ポインタによって識別された前記
ワーク・キューの位置に、前記ワーク・リクエストに対
応するワーク・キュー・エントリを書き込むこと、前記キュー・テール・ポインタをインクリメントするこ
と、及び前記キュー・エントリ・カウントをインクリメ
ントすることを含む、請求項７に記載の方法。
【請求項９】前記キュー・エントリ・カウントをインク
リメントすることは、前記キュー・テール・ポインタの
インクリメント毎には行われない、請求項８に記載の方
法。
【請求項１０】前記キューがワーク・キューであり、前記キューを制御するステップは、前記ワーク・キューがエンプティであるかどうかを決定
すること、前記ワーク・キューがエンプティでない場合、前記ホス
ト・チャネル・アダプタにおいて、前記キュー・ヘッド
・インデックスに対応するワーク・キュー・エントリを
処理すること、及び前記ワーク・キュー・エントリの処
理が完了した後、完了キューに完了キュー・エントリを
送付することを含む、請求項１に記載の方法。
【請求項１１】キューを管理するための方法にして、チャネル・インターフェースにおいて前記キューに対す
るキュー・ヘッド・インデックスを発生するステップ
と、ホスト・チャネル・アダプタにおいて前記キューに対す
るキュー・テール・インデックスを発生するステップ
と、前記ホスト・チャネル・アダプタにおいて前記キューに
対するフリー・キュー・エントリ・カウントを発生する
ステップと、前記キュー・ヘッド・インデックス、前記キュー・テー
ル・インデックス、及び前記フリー・キュー・エントリ
・カウントを使用して前記キューを制御するステップ
と、を含む方法。
【請求項１２】前記キューが完了キューであり、前記チャネル・インターフェースによって処理されるべ
き完了キュー・エントリを識別するために前記キュー・
ヘッド・インデックスが使用される、請求項１１に記載の方法。
【請求項１３】前記キューが完了キューであり、前記完了キューがエンプティであるかどうかを決定する
ために前記フリー・キュー・エントリ・カウントが使用
される、請求項１１に記載の方法。
【請求項１４】前記キューが完了キューであり、前記完了キューが満杯であるかどうかを決定するために
前記フリー・キュー・エントリ・カウントが使用され
る、請求項１１に記載の方法。
【請求項１５】前記キューが完了キューであり、完了キュー・エントリが書き込まれる前記完了キューに
おける位置を識別するために前記キュー・テール・イン
デックスが使用される請求項１１に記載の方法。
【請求項１６】前記キュー・テール・インデックスがキ
ュー・ポインタ・テーブル・インデックス及びキュー・
ページ・インデックスから成る、請求項１１に記載の方
法。
【請求項１７】前記キューが完了キューであり、前記キューを制御するステップは、前記完了キューが満杯であるかどうかを決定すること、
及び前記完了キューが満杯でない場合、前記キュー・テ
ール・インデックスによって識別された前記完了キュー
の位置に完了キュー・エントリを書き込むことを含む、
請求項１１に記載の方法。
【請求項１８】前記キューが完了キューであり、前記キューを制御するステップは、前記完了キューがエンプティであるかどうかを決定する
こと、及び前記完了キューがエンプティでない場合、前
記キュー・ヘッド・インデックスによって識別された完
了キュー・エントリを処理することを含む、請求項１７
に記載の方法。
【請求項１９】コンピュータ可読媒体にあって、キュー
を管理するためのコンピュータ・プログラムにして、チャネル・インターフェースにおいてキュー・テール・
インデックスを発生するための命令と、ホスト・チャネル・アダプタにおいて前記キューに対す
るキュー・ヘッド・インデックスを発生するための命令
と、前記ホスト・チャネル・アダプタにおいて前記キューに
対するキュー・エントリ・カウントを発生するための命
令と、前記キュー・ヘッド・インデックス、前記キュー・テー
ル・インデックス、及び前記キュー・エントリ・カウン
トを使用して前記キューを制御するための命令と、を含むコンピュータ・プログラム。
【請求項２０】前記キューがワーク・キューであり、前記ワーク・キューが満杯であるかどうかを決定するた
めに前記キュー・エントリ・カウントが使用される、請求項１９に記載のコンピュータ・プログラム。
【請求項２１】前記キューがワーク・キューであり、前記ワーク・キューがエンプティであるかどうかを決定
するために前記キュー・エントリ・カウントが使用され
る、請求項１９に記載のコンピュータ・プログラム。
【請求項２２】前記キューがワーク・キューであり、前記キューを制御するための命令は、前記ワーク・キューが満杯であるかどうかを決定するた
めの命令、及び前記ワーク・キューが満杯でない場合、
ワーク・リクエストを受け入れるための命令を含む、請
求項１９に記載のコンピュータ・プログラム。
【請求項２３】前記ワーク・リクエストを受け入れるた
めの命令は、前記キュー・テール・ポインタによって識別された前記
ワーク・キューの位置に、前記ワーク・リクエストに対
応するワーク・キュー・エントリを書き込むための命
令、前記キュー・テール・ポインタをインクリメントするた
めの命令、及び前記キュー・エントリ・カウントをイン
クリメントするための命令を含む、請求項２２に記載の
コンピュータ・プログラム。
【請求項２４】前記キュー・エントリ・カウントは、前
記キュー・テール・ポインタのインクリメント毎には更
新されない、請求項２３に記載のコンピュータ・プログ
ラム。
【請求項２５】前記キューがワーク・キューであり、前記キューを制御するための命令は、前記ワーク・キューがエンプティであるかどうかを決定
するための命令、前記ワーク・キューがエンプティでない場合、前記ホス
ト・チャネル・アダプタにおいて、前記キュー・ヘッド
・インデックスに対応するワーク・キュー・エントリを
処理するための命令、及び前記ワーク・キュー・エント
リの処理が完了した後、完了キューに完了キュー・エン
トリを送付するための命令を含む、請求項１９に記載の
コンピュータ・プログラム。
【請求項２６】コンピュータ可読媒体にあって、キュー
を管理するためのコンピュータ・プログラムにして、チャネル・インターフェースにおいて前記キューに対す
るキュー・テール・インデックスを発生するための命令
と、ホスト・チャネル・アダプタにおいて前記キューに対す
るキュー・ヘッド・インデックスを発生するための命令
と、前記ホスト・チャネル・アダプタにおいて前記キューに
対するフリー・キュー・エントリ・カウントを発生する
ための命令と、前記キュー・ヘッド・インデックス、前記キュー・テー
ル・インデックス、及び前記フリー・キュー・エントリ
・カウントを使用して前記キューを制御するための命令
と、を含むコンピュータ・プログラム。
【請求項２７】前記キューが完了キューであり、前記完了キューがエンプティであるかどうかを決定する
ために前記フリー・キュー・エントリ・カウントが使用
される、請求項２６に記載のコンピュータ・プログラム。
【請求項２８】前記キューが完了キューであり、前記完了キューが満杯であるかどうかを決定するために
前記フリー・キュー・エントリ・カウントが使用され
る、請求項２６に記載のコンピュータ・プログラム。
【請求項２９】前記キューが完了キューであり、前記キューを制御するための命令は、前記完了キューが満杯であるかどうかを決定するための
命令、及び前記完了キューが満杯でない場合、前記キュ
ー・テール・インデックスによって識別された前記完了
キューの位置に完了キュー・エントリを書き込むための
命令を含む、請求項２６に記載のコンピュータ・プログ
ラム。
【請求項３０】前記キューが完了キューであり、前記キューを制御するための命令は、前記完了キューがエンプティであるかどうかを決定する
ための命令、及び前記完了キューがエンプティでない場
合、前記キュー・ヘッド・インデックスによって識別さ
れた完了キュー・エントリを処理するための命令を含
む、請求項２９に記載のコンピュータ・プログラム。
【請求項３１】ワーク・キューを管理するための装置に
して、チャネル・インターフェースと、前記チャネル・インターフェースに結合されたホスト・
チャネル・アダプタとを含み、前記チャネル・インターフェースが前記キューに対する
キュー・テール・インデックスを含み、前記ホスト・チャネル・アダプタが前記キューに対する
キュー・ヘッド・インデックス及び前記キューに対する
キュー・エントリ・カウントを含み、前記ホスト・チャネル・アダプタ及びチャネル・インタ
ーフェースが前記ヘッド・インデックス、前記テール・
インデックス、及び前記キュー・エントリ・カウントを
使用して前記キューを管理する、装置。
【請求項３２】完了キューを管理するための装置にし
て、チャネル・インターフェースと、前記チャネル・インターフェースに結合されたホスト・
チャネル・アダプタとを含み、前記チャネル・インターフェースが前記キューに対する
キュー・ヘッド・インデックスを含み、前記ホスト・チャネル・アダプタが前記キューに対する
キュー・テール・インデックス及び前記キューに対する
キュー・エントリ・カウントを含み、前記ホスト・チャネル・アダプタ及びチャネル・インタ
ーフェースが前記ヘッド・インデックス、前記テール・
インデックス、及び前記キュー・エントリ・カウントを
使用して前記キューを管理する、装置。