JP3178470B2

JP3178470B2 - データフロー制御スイッチ及びそのスケジューリング方法

Info

Publication number: JP3178470B2
Application number: JP2000055103A
Authority: JP
Inventors: ディアスー・ジー・キャベンディッシュ
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1999-06-18
Filing date: 2000-03-01
Publication date: 2001-06-18
Anticipated expiration: 2020-03-01
Also published as: EP1061763A2; DE60043801D1; EP1061763A3; EP1061763B1; JP2001007822A; US7058063B1

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、ネットワークによ
るデータのフローを制御するネットワークシステムおよ
びスイッチに係り、特に、大容量スイッチを通じてのデ
ータフローを管理するスケジューラに関する。

【０００２】

【従来の技術】入力キュースイッチアーキテクチャは、
常に高速交換システムの有力な選択肢であった。それは
主に、入力バッファのメモリアクセス速度が、全交換容
量とともにスケールするのではなく、単一の入線の速度
とともにスケールするからである。しかし、入力バッフ
ァ型スイッチは、ＨＯＬ(head-of-line)ブロッキングの
問題があることが以前から知られており、これにより全
スループットは５８．６％という理論限界に制限される
（M. J. Karol, M. G. Hluchyj, S. P. Morgan,"Input
Versus Output Queuing on a Space-Division Packet S
witch", IEEE Transactions on Communications, Vol.C
OM-35, No.12, pp.1347-1356, Dec. 1987、参照）。

【０００３】最近になって、入力スイッチのＨＯＬブロ
ッキングの問題を克服するために、仮想出力キューイン
グ（ＶＯＱ：Virtual Output Queuing）という入力キュ
ーイング方式が提案された（Y. Tamir and G. Frazier,
"High Performance Multi-queue Buffers for VLSI Co
mmunication Switches", Proceedings of 15th Ann.Sym
p. on Comp. Arch., pp.343-354, June 1988、および、
T. Anderson, S. Owicki, J. Saxe, C. Thacker, "High
Speed Switch Scheduling for Local Area Networks",
ACM Transactions on Computer Systems, pp.319-352,
Nov. 1993、参照）。その考え方は、スイッチの各出力
ポートごとに別々のキューを設け、空き出力ポート宛の
パケットが、別のポートに対する競合により進めない先
頭パケットによってサービスをブロックされる可能性が
なくなるようにするというものである。この場合、Ｎ×
Ｎスイッチは入力ポートごとにＮ個のキュー、すなわ
ち、Ｎ²個のキューを有する。他の研究者によって議論
されているように（A. Mekkittikul, N. McKeown, "A P
ractical Scheduling Algorithm to Achieve 100% Thro
ugh-put in Input-Queued Switches", Proceedings of
Infocom98, April 1998、参照）、ＶＯＱ法をさらに研
究することによって、高性能のスケジューラの設計によ
り実に１００％のスループットが達成可能であることが
示されている。

【０００４】従って、ＶＯＱ入力バッファ型スイッチの
スケジューラは高速入力バッファ型スイッチの重要な設
計ポイントのうちの１つとなる。ＶＯＱの場合、スケジ
ューラは、通常の先入力先出力（ＦＩＦＯ）入力キュー
イングアーキテクチャの場合よりも、バックログのある
入力ポートから出力ポートへパケットを交換するのには
るかに多くの選択肢を有する。バックログのある入力ポ
ートのうちで、あらゆる入出力ポート対を選択すること
ができる。

【０００５】このようなスケジューラに対する研究のほ
とんどは以下のように分類することができる。集中スケ
ジューラは、スケジューラがＮ²個のすべてのＶＯＱに
関する情報を有する単一のエンティティであって、パケ
ットスロットごとにすべての可能な入出力ポート対に関
するスケジューリング決定を行うものである（例えば、
A. Mekkittikul, N. McKeown, "A Practical Schedulin
g Algorithm to Achieve 100% Through-put in Input-Q
ueued Switches", Proceedings of Infocom98,April 19
98、参照）。

【０００６】他方、分散スケジューラは、スケジューラ
がいくつかの機能ブロック（通常は入力あるいは出力ポ
ート当たり１又は２個のブロック、あるいは、入出力ク
ロスポイント当たり１ブロック）に分割されたものであ
る（例えば、N. McKeown, M.Izzard, A. Mekkittikul,
W. Ellersick, M. Horowitz, "The Tiny Tera: A Packe
t Switch Core", IEEE Micro, Jan/Feb 1997, pp.26-3
2、および、Y. Tamirand H-C Chi, "Symmetric Crossba
r Arbiters for VLSI Communication Switches", IEEE
Transactions on Parallel and Distributed Systems,
Vol.4, No.1,pp.13-27, 1993、参照）。

【０００７】図１は、集中スケジューラの一例を示す概
略的ブロック図である。集中スケジューラは、スケジュ
ーリング決定を行う前に、Ｎ²個の情報にアクセスする
必要がある。このようなスケジューラは、一般に、スケ
ジューラを実装するハードウェアがスイッチラインの数
Ｎに強く依存するという意味で、スケーラブルではな
い。

【０００８】分散スケジューラは、ハードウェアに対し
てスイッチポート数への依存性をより少なくする可能性
を有する。しかし、これまで提案されているものは依然
として、個々のパケットスロットに対するスケジューリ
ング決定を行うことができる前に、Ｎ²個のすべてのキ
ューに関する情報を提供する通信メカニズムを必要とす
る。この通信は、並列に（ＳＬＩＰスケジューラの場合
のように。N. McKeown, M. Izzard, A. Mekkittikul,
W. Ellersick, M. Horowitz, "The Tiny Tera:A Packet
Switch Core", IEEE Micro, Jan/Feb 1997, pp.26-3
2、参照）、あるいは、ラウンドロビン方式で（Y. Tami
r and H-C Chi, "Symmetric Crossbar Arbiters for VL
SI Communication Switches", IEEE Transactions on P
arallel and Distributed Systems, Vol.4, No.1, pp.1
3-27, 1993、参照）行うことが可能である。

【０００９】図２（Ａ）及び（Ｂ）は、並列方式及びラ
ウンドロビン方式のアーキテクチャをそれぞれ示す模式
図である。図２（Ａ）における並列通信アーキテクチャ
では、各ブロックがスイッチのサイズに陽に依存してし
まう。各ブロックがＮ²個のメッセージを受け取らなけ
ればならないからである。図２（Ｂ）におけるラウンド
ロビンアーキテクチャはこの問題点を克服するが、別の
問題点を生じる。すなわち、すべての出力ポートに関す
るスケジューリング決定を達成するためには、メッセー
ジ受渡しは、単一のパケットスロット中に１ラウンドを
完了しなければならないという点である。これは、スケ
ジューリング決定よりも少なくともＮ倍高速なメッセー
ジ処理を必要とする。

【００１０】さらに最近になって、ラウンドロビン・グ
リーティ・スケジューラ（ＲＲＧＳ：Round-Robin Gree
dy Scheduler)が提案された。これは、メッセージパッ
シング（受渡し）に基づくスケジューラであり、各入力
ポートがスケジューリング決定を行い、この情報をラウ
ンドロビン方式で次のポートに渡すものである（本出願
人による特願平１１−１７２５８４号を参照）。メッセ
ージ受渡し速度要求条件を緩和するために、ＲＲＧＳは
パイプライン機能を導入している。入力ポートは、十分
将来のスロットに関するスケジューリング決定を行い、
メッセージ受渡しメカニズムがこの情報を他の入力ポー
トに広めるのに十分な時間があるようにする。ＲＲＧＳ
は高速なスケジューリングを実現することができる。

【００１１】先ず、一般的なパイプライン型スケジュー
ラのアーキテクチャについて説明する。図３は入力バッ
ファスイッチアーキテクチャを例示する模式図である。
スイッチアーキテクチャに関して、スケジューリング
は、純粋なノンブロッキングＮ×Ｎクロスバスイッチに
適用されると仮定する。また、仮想出力キュー（ＶＯ
Ｑ）を用いてＨＯＬブロッキング問題に対処すると仮定
する。

【００１２】さらに、固定サイズパケットおよび一様リ
ンク速度を仮定する。時間はスロット化される。１つの
スロットは、出力リンクによる１パケットの送信にかか
る時間として定義される。出力ポート競合が存在しない
場合、ノンブロッキングクロスバは、タイムスロット当
たりＮパケットまでを交換することができる。スケジュ
ーラの基本的な仕事は、スロットごとに、空でないＮ²
個のＶＯＱキューのうちのいずれが出力ポートにアクセ
スすることができるかを判断することである。効率のた
めに、スケジューラは、１タイムスロット内でバックロ
グのあるキューの間のすべての競合を解決しなければな
らない。

【００１３】ライン速度が増大すると、スケジューリン
グアルゴリズムが大容量スイッチにもスケーラブルであ
ることが重要となる。従って、分散アーキテクチャが有
力であると思われる。分散アーキテクチャでは、高速ス
イッチにおいてパケットスケジューリングに要求される
きつい処理時間が緩和されるからである。例えば、１０
Ｇｂｉｔ／ｓのライン速度の１６×１６ポートスイッチ
で、スケジューリング決定は、各パケット送信時に行わ
なければならず、４２４ビットのＡＴＭセルに対して４
２ｎｓである。シーケンシャルスケジューラを使用する
場合、各決定は、１６×１６スイッチでは０．１６ｎｓ
未満で行わなければならない。Ｎ²個の決定をしなけれ
ばならないからである。光コアを使用する場合、光コア
の全交換帯域幅要求条件をそのままにして、電子ハード
ウェアをポートごとに分散することには意味がある。さ
らに、分散スケジューラは、当然、任意のライン数にあ
わせてスケールされる。図４にそのようなスケジューラ
を例示する。

【００１４】図４において、各クロスバ入力ポートは、
入力ポートスケジューラモジュール（ＳＭ：Scheduler
Module）を有する。各ＳＭは、個別のＩＤであるＳＭ−
ＩＤを有する。ライン数とのスケーラビリティを維持す
るために、ＳＭは、隣の１個のＳＭとのみ通信すること
が許される。これにより、ＳＭハードウェアブロックは
任意のＮ×Ｎクロスバファブリックで使用可能であるこ
とが保証される。ＳＭ通信チェインが図４に示されてい
る。これは、タイムスロット、スロット所有権、および
出力ポート予約のようなスケジューリング情報を通信す
るために使用される。クロスバモジュールとＳＭとの間
の唯一の相互作用は、グローバルクロックを通じてのも
のである。これは、あらゆるＳＭに、どのスロットが現
在のシステムタイムスロット（ＣＴＳ：Current system
Time Slot）であるかということと、ＣＴＳで交換され
る入出力ポート対に関する現在の決定テーブル（図示せ
ず）とを知らせる。これは、スケジューラによって書き
込まれ、クロスバファブリックによって読み出されるグ
ローバルメモリによって実現することが可能である。

【００１５】タイムスロットごとに、各ＳＭは、アクセ
ス要求先の出力ポートに関して完全な選択の自由がある
と仮定される。同様の選択をするＳＭどうしは「コリジ
ョン」（衝突）を生じ、これは、与えられたスロットに
対するグローバルスケジューリングパターンを決定する
前に解決する必要がある。ＳＭが、他のすべての要求に
関する現在の情報を有することになる場合、通信チェイ
ンは、スケジューリング決定の速度よりもＮ倍速い速度
で動作しなければならない。すなわち、ＳＭは、１つの
スケジューリング決定を行う前に、Ｎ個のメッセージを
受信することができなければならない。

【００１６】ＳＭハードウェアの速度をライン速度とと
もにスケーラブルに保つために、Ｎルックアヘッド（先
読み）スケジューリング方式を使用することが可能であ
る。すなわち、各ＳＭは、現在のスロットの少なくとも
Ｎスロット先のタイムスロットに関してスケジューリン
グ決定をすることになる。この機能により、ＳＭは、ス
ケジューリング決定をする前に、同じタイムスロットに
対してなされている他のスケジューリング決定に関して
知っていることが保証される。さらに、この機能は、通
信チェインを入力ライン速度のＮ倍に高速化する必要が
ない。ＲＲＧＳは上記のような、分散スケジューリン
グ、パイプラインスケジューリングの特徴と、Ｎルック
アヘッド（先読み）スケジューリングの特徴を備えてい
る。

【００１７】図５は、４×４クロスバースイッチを用い
た場合のＲＲＧＳスケジューリングの一例を示すタイム
チャートである。図５では、４個のＳＭ１〜ＳＭ４と、
それらの入力が出力ポートを選択するタイムスロットＴ
６、Ｔ７・・・との関係が示されている。

【００１８】図５において、例えばタイムスロットＴ５
で、ＳＭ１はタイムスロットＴ１０で送信を行うための
出力ポートの選択（スケジューリング）を行い、ＳＭ３
はタイムスロットＴ９におけるスケジューリングを行っ
ている。また、次のタイムスロットＴ６では、ＳＭ１は
タイムスロットＴ８におけるスケジューリングを行って
いる。以下同様である。

【００１９】上記のように各ＳＭがスケジューリングを
行い、その結果を次段のＳＭに転送することによって、
あらゆるＳＭが、既にスケジューリングされたポートに
関する情報を適時に得ることが保証される。あるＳＭ
が、前の「訪問者（visitor）」（即ち、１タイムスロ
ット前のＳＭ）によって既に選ばれた出力ポートを選ぶ
ことを避ければ、コリジョンを完全に回避することがで
きる。

【００２０】

【発明が解決しようとする課題】しかしながら、ＲＲＧ
Ｓでは、一つのＳＭが予約を行っていくタイムスロット
の巡回順序が複雑になる。図６は、図５を個々のＳＭの
タイムスロット巡回順序に着目して表現したタイムチャ
ートである。例えば、ＳＭ１について見ると、タイムス
ロット巡回順序は、Ｔ１０、Ｔ８、Ｔ１１、Ｔ９・・・
となり、時系列的あるいは逆時系列的な一定の規則的順
序にはなっていない。これはＲＲＧＳの実装及び制御が
複雑になるという問題を示している。

【００２１】さらに、前記特願平１１−１７２５８４号
に示されるように、ＲＲＧＳは、ＳＭが偶数の場合と奇
数の場合でスケジューリング動作が異なる。これは、Ｓ
Ｍを追加する際に制御を変更しなければならないことを
示しており、実装及び制御が複雑になるという問題があ
る。

【００２２】また、ＲＲＧＳでは、ＳＭが、まだ選ばれ
ていない出力ポートを選ぶように制限されるため、ＶＯ
Ｑサービスレートは予測が困難になる。さらに、重大な
公平性の問題が生じる。例えば、図４において、ＳＭ＃
１とＳＭ＃２は与えられた出力ポートのキューにコンス
タントにバックログがあり、他のＳＭの対応するキュー
は空であるとする。この場合、ＳＭ＃１は、図５にて定
義される巡回順序においてＳＭ＃２の前に４スロットの
うちの３スロットを訪れるため、４スロットのうち３ス
ロットはＳＭ＃１によって取られることになる（前記特
願平１１−１７２５８４号を参照）。

【００２３】このように、上記のＲＲＧＳスケジューラ
は高速なスケジューリングを実現することが可能である
が、実装及び制御が複雑になるという問題がある。ま
た、予測可能かつ調整可能なサービスレートを実現でき
ない。また、上述したようにＶＯＱのいくつかが他のＶ
ＯＱの状態によりスケジューリングを妨げられるという
公平性の問題もある。

【００２４】本発明の目的は、ＲＲＧＳの実装及び制御
の複雑さを解消した簡易なスケジューラの基本方式を提
供することにある。

【００２５】本発明の他の目的は、ＶＯＱキューがスケ
ジューリングを行う際の完全な選択の自由を可能にする
大容量スイッチのためのスケジューラを提供することに
ある。

【００２６】本発明のさらに他の目的は、ＶＯＱサービ
スレートを予測可能かつ調整可能にするスケジューラを
提供することにある。

【００２７】本発明のその他の目的は、いずれのＶＯＱ
も他のＶＯＱの状態に拘わらず同じ確率でスケジューリ
ングされるという意味で公平であるようなスケジューラ
を提供することにある。

【００２８】スケジューラ設計におけるもう１つの制約
は、次にスケジューリングされる与えられた入線に属す
るＮ個のＶＯＱのうちのどのＶＯＱを、スケジューラの
制御から外すかの決定である。換言すれば、入力ポート
ごとに、どの出力ポートが次にスケジューリングされる
かを、ある外部エンティティが全く自由に決定すること
である。この要請は将来のサービス品質（ＱｏＳ）のサ
ポートにとって重要である。これによりＶＯＱの予測可
能なサービスレートをより予測可能にする最大スループ
ットを低下させる可能性があることは明らかである。し
かしながら、これは重要な点である。スイッチ全体のス
ループットの最大化は、一部のキューの枯渇、ひいて
は、それらのキューに関連するフローも妨げられる可能
性があるからである。

【００２９】

【課題を解決するための手段】本発明の第１の観点によ
れば、ネットワークにおけるデータのフローを制御する
スイッチは、複数の入力ポートと、複数の出力ポート
と、複数の入力ポートスケジュールモジュールを有する
スケジューラとを有する。各スケジュールモジュール
は、前記複数の出力ポートのうちの指定された出力ポー
トへデータを送るように、前記複数の入力ポートのうち
の特定の入力ポートをスケジューリングする。スケジュ
ールモジュールは、モジュール間でスケジューリングメ
ッセージを受け渡し、各スケジュールモジュールは、当
該スケジュールモジュールが指定出力ポートにアクセス
しようとする将来のタイムスロットを計算する。スケジ
ュールモジュールは、更に、前記将来のタイムスロット
が当該スケジュールモジュールによって現在予約されて
いるかどうか、前記将来のタイムスロットが阻止されて
いるかどうか、及び前記将来のタイムスロットが他のス
ケジュールモジュールによって取られているかどうかに
基づいて、前記将来のタイムスロットが有効かどうかを
判断する。有効な場合、スケジュールモジュールは前記
将来のタイムスロットを取り、スケジューリングメッセ
ージに前記将来のタイムスロットが取られたことを示す
情報を入れる。

【００３０】スイッチのスケジューラは、前記将来のタ
イムスロットが予約されているとき又は取られていると
きに、前記将来のタイムスロットを所定数のタイムスロ
ットだけ前進させる。

【００３１】スイッチは、前記出力ポートのそれぞれに
対して別々のキューを維持する仮想出力キューイングを
用いて、前記入力ポートを通じてデータ入力をキューイ
ングする。あるいは、個々のポートに対する仮想出力キ
ューイングは、他のポートに対する仮想出力キューイン
グとは独立であることも可能である。さらに、スイッチ
は予測可能かつ調整可能な仮想出力キューイングのサー
ビスレートを有する。また、スイッチスケジューラは重
み付きラウンドロビンに基づいて指定出力ポートを選択
する。

【００３２】本発明の第２の観点によれば、スイッチの
複数の入力ポートに到着する入力パケットをスイッチの
複数の出力ポートに送るようにスケジューリングする方
法が提供される。ここで、スケジューラは、複数の入力
ポートスケジュールモジュールを有する。この方法は、ａ）現スケジュールモジュールが、前のスケジュールモ
ジュールからスケジューリングメッセージを受信するス
テップと、ｂ）前記現スケジュールモジュールが、前記複数の出力
ポートのうちの１つにアクセスしようとする将来のタイ
ムスロットを計算するステップと、ｃ）前記将来のタイムスロットにおける送信用にスケジ
ューリングするように前記複数の出力ポートのうちの１
つを選択するステップと、ｄ）前記将来のタイムスロットが前記現スケジュールモ
ジュールによって既に予約されているかどうかを判断す
るステップと、ｅ）前記将来のタイムスロットが前記現スケジュールモ
ジュールによって予約されていない場合、前記将来のタ
イムスロットが阻止されているかどうかを判断するステ
ップと、ｆ）前記将来のタイムスロットが阻止されていない場
合、前記将来のタイムスロットが他のスケジュールモジ
ュールによって既に取られているかどうかを判断するス
テップと、ｇ）前記将来のタイムスロットが、他のスケジュールモ
ジュールによって既に取られているか又は前記現スケジ
ュールモジュールによって既に予約されている場合、前
記スケジューリングメッセージから、繰越し動作が既に
開始されているかどうかを判断するステップと、ｈ）前記繰越し動作が既に開始されている場合、前記将
来のタイムスロットを阻止状態に設定してステップｄに
戻るステップと、ｉ）前記繰越し動作が開始されていない場合、前記将来
のタイムスロットを所定数のタイムスロットだけ前進さ
せ、繰越しフラグをセットして、ステップｄに戻るステ
ップと、ｊ）前記将来のタイムスロットが他のスケジュールモジ
ュールによって取られていない場合には前記将来のタイ
ムスロットを取り、前記将来のタイムスロットが取られ
たことを示す情報を前記スケジューリングメッセージに
入れるステップと、ｋ）前記スケジューリングメッセージを次のスケジュー
ルモジュールに渡すステップと、からなる。

【００３３】複数の入力ポートを通じて入力するデータ
は、各出力ポートに対して別々のキューを維持する仮想
出力キューイングを用いてキューイングされる。個々の
ポートに対する仮想出力キューイングは他のポートに対
する前記仮想出力キューイングとは独立である。また、
前記仮想出力キューイングのサービスレートは予測可能
かつ調整可能である。スケジューラは、重み付きラウン
ドロビンに基づいて、前記指定出力ポートを選択する。

【００３４】ネットワークにおけるデータのフローを制
御するスイッチは、複数の入力ポートと、複数の出力ポ
ートと、前記複数の出力ポートのうちの指定出力ポート
へデータを送るように、前記複数の入力ポートのうちの
特定の入力ポートをスケジューリングするＮ個の複数の
入力ポートスケジューリングモジュールを有するスケジ
ューラと、を有し、前記スケジューラは、前記各入力ポ
ートスケジューリングモジュールがリング状に接続さ
れ、Ｎ個のタイムスロットを単位とするフレームを定義
し、前記フレーム時間内で、前記フレームの次フレーム
中のＮ個のタイムスロットでのスケジューリングを、タ
イムスロット単位に、各入力ポートスケジューリングモ
ジュールが、前段のスケジューリングモジュールから、
ある予約タイムスロットの予約状況情報を受信し、各入
力ポートスケジューリングモジュールが、その予約タイ
ムスロットにおける当該入力ポートスケジューリングモ
ジュールからのパケット送出予約可否を決定し、各入力
ポートスケジューリングモジュールが、前段のスケジュ
ーリングモジュールから受信した予約状況情報に、自ス
ケジューリングモジュールの予約結果を反映させて、次
段のスケジューリングモジュールに送信する、ことによ
り実行する。

【００３５】複数の入力スケジューリングモジュールを
有するパケットスイッチの入力ポートと出力ポートの接
続状態を決定し接続を予約する（以下、スケジューリン
グという。）方法は、Ｎ個のタイムスロットを単位とす
るフレームを定義して、前記フレーム時間内で、前記フ
レームの次フレーム中のＮ個のタイムスロットでのスケ
ジューリングを行うことを特徴とする。

【００３６】上記スケジューリング方法は、ａ）現在のスケジュールモジュールが、前のスケジュー
ルモジュールからスケジューリングメッセージを受信す
るステップと、ｂ）前記現在のスケジュールモジュールが、前記複数の
出力ポートのうちの１つにアクセスしようとする将来の
タイムスロットを予め次フレーム内の特定のタイムスロ
ットに決定するステップと、ｃ）前記複数の出力ポートのうちの１つを前記将来のタ
イムスロットでの送信用にスケジューリングするように
選択するステップと、ｄ）前記将来のタイムスロットが他のスケジュールモジ
ュールによって既に取られているかどうかを判断するス
テップと、ｅ）前記将来のタイムスロットが他のスケジュールモジ
ュールによって取られていない場合には、前記将来のタ
イムスロットを取り、前記将来のタイムスロットが取ら
れたことを示す情報を前記スケジューリングメッセージ
に入れるステップと、ｆ）前記スケジューリングメッセージを次のスケジュー
ルモジュールに渡すステップと、からなる。

【００３７】さらに、上記スケジューリング方法は、タ
イムスロットでのスケジューリング決定過程（接続決定
過程）の観点から見た場合、前記複数の接続決定過程
が、フレームの先頭で同時に開始され、フレーム内で同
時にパイプライン処理により進行し、フレームの末端で
同時に完了する。

【００３８】また、このスケジューリング方法は、前記
入力ポートスケジューリングモジュールが、フレームの
先頭で同時に開始する前記各接続決定過程において、次
のフレーム内の各々異なる予約タイムスロットを対象と
して処理を開始する。

【００３９】上記スケジューリング方法は、ある与えら
れた将来のタイムスロットにおけるＮ個の入力ポートス
ケジューリングモジュールの規則的な巡回順序を定義す
るＮ×Ｎマトリクスを参照することによって、現在のフ
レームにおける入力信号が次のフレームでどの出力ポー
トへ送出されるかを決定する。

【００４０】

【発明の実施の形態】本発明によるキャリーオーバ（繰
越し）ラウンドロビン・パイプライン・スケジューラ
（Carry Over Round-robin Pipelined Scheduler、以下
ＣＯＲＰＳという。）は、高速クロスバファブリックに
対する公平なスケジューラであり、従来技術のスケジュ
ーラの問題点を解決するものである。ＣＯＲＰＳは、高
速スイッチファブリックのライン速度およびライン数の
双方に関するスケーラビリティ性を有する。ライン数に
関するスケーラビリティのために、メッセージ受渡しを
有する分散アーキテクチャが選択される。更に、ＲＲＧ
Ｓと同様に、メッセージ処理要求条件をライン速度とと
もにスケーラブルに維持するために、パイプラインアー
キテクチャが用いられる。

【００４１】さらに、本発明によれば、時間軸を単にＮ
個の連続するスロット列であるスロットフレームに分割
して、時間をフレームの列とみなす。競合するスケジュ
ーラモジュールＳＭ間のコリジョンを解決する基準を設
定するために、優先マトリクスを使用する。Ｎ×Ｎ優先
マトリクスは、将来の与えられたタイムスロットをＳＭ
が巡回する順序を定義するマトリクスである。マトリク
スの行は現在のフレーム（現在のシステムスロットを含
むフレーム）内のスロットをインデクス付けし、マトリ
クスの列は次に訪れるフレーム内のスロットをインデク
ス付けしている。マトリクスの要素は、どのＳＭが、列
インデクスによって示される次フレーム内のスロットを
「訪れる(visit)」べきかを指定する。

【００４２】図７は４×４優先マトリクスを示す図であ
り、図８は、図７に示したマトリクスに対するパイプラ
イン化されたタイムスロット巡回順序を例示している。
パイプライン化された決定プロセスは、優先マトリクス
の使用に既に含まれていることに注意すべきである。例
えば、システムの現在のタイムスロットが現フレームの
第２スロットであるとき、ＳＭ＃１が次フレームの第４
スロットに関するスケジューリング決定をしている間
に、ＳＭ＃３は次フレームの第２スロットに関するスケ
ジューリング決定をしている。

【００４３】優先マトリクスを使用することにより時間
軸がフレーム化され、タイムスロット巡回順序が規則的
になる。例えば、フレームＦ１における各ＳＭの動作に
着目すると、各ＳＭのスケジューリング決定過程は、フ
レームＦ１の先頭で同時に開始され、スケジューリング
決定を行うタイムスロットの巡回順序はＴ８→Ｔ７→Ｔ
６→Ｔ５→Ｔ８となり、フレームＦ１の末端で同時に完
了する。これは、図６に示したＲＲＧＳにおけるタイム
スロット巡回順序（Ｔ１０、Ｔ８、Ｔ１１、Ｔ９・・
・）と比較して規則的になっている。このためＳＭの実
装及び制御が容易になる。更に、Ｎ×Ｎ優先マトリクス
はＳＭの個数に関して偶奇の区別なく、同一規則にてタ
イムスロットの巡回順序を定義する。

【００４４】図９は５×５優先マトリクスを示す図であ
り、図１０は、図９に示したマトリクスに対するパイプ
ライン化されたタイムスロット巡回順序を例示してい
る。フレームサイズは５タイムスロットとなるが、Ｎ＝
４の場合と同様に、タイムスロット巡回順序は規則的な
ものとなる。図８と同様に、フレームＦ１における各Ｓ
Ｍの動作に着目すると、各ＳＭのスケジューリング決定
過程は、フレームＦ１の先頭で同時に開始され、スケジ
ューリング決定を行うタイムスロットの巡回順序がＴ１
０→Ｔ９→Ｔ８→Ｔ７→Ｔ６→Ｔ１０となり、フレーム
Ｆ１の末端で同時に完了する。ＳＭの個数に関して偶奇
の区別なく同一規則にてＮ×Ｎ優先マトリクスを規定で
きるため、ＲＲＧＳと比較してＳＭの実装及び制御が容
易になる。

【００４５】Ｎ×Ｎ優先マトリクスは、通信チェインメ
ッセージ受渡しの同じ方向に、ＳＭの列を回転させるこ
とによって生成される。これにより、あらゆるＳＭが、
既にスケジューリングされたポートに関する情報を適時
に得ることが保証される。あるＳＭが、前の「訪問者(v
isitor)」（即ち、１タイムスロット前のＳＭ）によっ
て既に選ばれた出力ポートを選ぶことを避ければ、コリ
ジョンを完全に回避することができる。

【００４６】以上のように、時間軸をフレーム化して優
先マトリクスを用いた予約を行うことにより、ＳＭの個
数に関して偶奇の区別なくタイムスロット巡回順序が規
則的なものとなり、ＳＭの実装及び制御が容易になる。

【００４７】更に、本発明では、分散アーキテクチャ及
びメッセージ受渡し方式を維持しつつ公平性を提供する
ために、繰越し（キャリーオーバ）動作を導入する。こ
の考え方は、あるスケジューラモジュールＳＭａが、そ
れに先行するスケジューラモジュールＳＭによって所望
の出力ポートが既に予約されているスロットを訪れると
きに、処理しようとしたスロットから将来にＮスロット
分だけそのポートのスケジューリング試行を繰り越すと
いうものである。もし当該スロットが同じ出力ポートに
取られていることが分かれば、ＳＭは所望の出力ポート
がまだ取られていないスロットを見つけるまで更にＮス
ロット先に進む。

【００４８】図１１は、複数のスケジューラモジュール
ＳＭの間での繰越し動作を例示する説明図である。繰越
し動作は、与えられたタイムスロットにおいて「衝突し
ている」ＳＭの個数に依存してＮフレームまで広げるこ
とができる。繰越し動作によって影響されるスロット
は、コリジョン（衝突）を解決するために取られるスロ
ットの集合（以下、コリジョン解決セットという。）と
みなすことができる。なお、繰越し動作を受けたスロッ
トは、後続するフレームですべてのＳＭにより再び訪問
されるであろう。従って、繰越し動作によって取られる
スロットは、潜在的に新たなコリジョンを受け、コリジ
ョン解決セットの重畳を引き起こす可能性がある。これ
は、複数のコリジョンを解決するためにＮ²個のフレー
ム、すなわち全部でＮ³個のスロットを必要とする可能
性がある。

【００４９】システムのメモリ要求条件を緩和すると共
にスケジューリング遅延を短縮するために、繰越し動作
によって影響されるフレームの個数は、繰越し動作を実
行したＳＭが、当該コリジョンを解決するために取られ
た複数のスロットにわたって同じ出力ポートに対して他
のスケジューリングをしないように制限される。換言す
れば、１つのスロットが、同時に複数のコリジョンを解
決するようには使用されない。

【００５０】例えば、ＳＭａが、与えられたポートｐに
よって取られたスロットｍを見つけ、これにより繰越し
動作がトリガされると仮定する。この繰越し動作の結果
としてＳＭａによって予約されたスロットをｍｘとす
る。スロットｍｎ（１≦ｎ＜ｘ）のいずれも、同じポー
トｐについてはＳＭａにとって利用不可（阻止、ブロッ
キング）となる。従って、この阻止機能は、与えられた
スロットに関する複数のコリジョンが禁止されることを
保証する。

【００５１】ＣＯＲＰＳスケジューリングアルゴリズム
について以下で説明する。先ず、通信チェインで渡され
るメッセージと、スケジューリング決定が記録されるＳ
Ｍデータベースについて説明し、その後、アルゴリズム
の流れについて説明する。

【００５２】各セルスロットで、チェイン内のあるＳＭ
から次のＳＭに渡されるスケジューリング決定要素のベ
クトルを定義する。Ｓメッセージは、たかだか最後のＮ
個のセルスロットでなされたスケジューリング決定のス
ケジューリング要素（scheduling element、以下ＳＥと
記す。）を含む。すなわち、Ｓメッセージは、たかだか
Ｎ個のＳＥを有する。Ｓメッセージは以下のフォーマッ
トを有する。

【００５３】図１２は、Ｓメッセージのフォーマットを
示す図である。同図において、Ｓメッセージの各スケジ
ューリング要素ＳＥは、存続時間(ＴＴＬ：Time To Liv
e)、タイムスロットＩＤ（ＴＳＩ：Time Slot ID）、Ｓ
Ｍ−ＩＤ、及び出力ポートＩＤ（ＯＰＩ：Output Port
ID）からなる。・存続時間(ＴＴＬ)は、当該ＳＥを生成したＳＭによっ
て最初にＮにセットされる。・タイムスロットＩＤ（ＴＳＩ）は、現在のＴＳ（タイ
ムスロット）からスロットがスケジューリングされるま
でのスロット数として定義される、スケジューリングさ
れるスロットのＩＤである。・ＳＭ−ＩＤは、スケジューリング予約をした入力ポー
トスケジューリングモジュールのＩＤである。・出力ポートＩＤ（ＯＰＩ）は、スケジューリングされ
る出力ポートのＩＤである。

【００５４】スロットの最初に、各ＳＭは先行するＳＭ
からＳメッセージを受信する。これは、最後のＮ個のス
ロットに付けられたＳＥを含む。あらゆるＳＭは、タイ
ムスロット当たりたかだか１回のスケジューリング決定
を行う。ＳＭｐがスケジューリング決定を行う場合、Ｓ
Ｍｐは以下の内容を有する新しいＳＥを作成する。

【００５５】・ＴＴＬ＝Ｎ・ＴＳＩ＝現在のスロットから選択されたタイムスロッ
トまでの（それを含む）スロットの個数ｍ・ＳＭ−ＩＤ＝ｐ・ＯＰＩ＝タイムスロット（ＣＴＳ＋ｍ）におけるパケ
ットが入力ポートｐから出力ポートｑに交換されるよう
な所望の出力ポートｑ。

【００５６】スケジューリング決定にかかわらず、各Ｓ
Ｍは、次のＳＭにメッセージを渡す前に、Ｓメッセージ
内の他のすべてのＳＥのＴＴＬをデクリメントし、ＴＴ
Ｌ＝０のＳＥを廃棄する。

【００５７】各ＳＭは、（Ｎ＋１）Ｎ個の位置を含むメ
モリアレイＳＣを有する。最初のＮ個の位置は、クロス
バスイッチモジュールによって読み出される現フレーム
のスケジューリング決定を記録する。これらの位置は、
すべてのＳＭの間で、現フレームに関する同一の情報を
有し、いくつかの方法でクロスバコントローラによって
アクセスされ得る。厳密にいえば、ＳＭは、この情報を
保持する必要はない。残りのＮ²個の位置は、将来のス
ケジューリング決定を記録するために使用される。メモ
リアレイは以下のフォーマットを有する。

【００５８】図１３に示すように、以下のフィールドが
定義される。・タイムスロットＩＤ：ＳＣアレイへのインデクスであ
る。これは、ＳＣ位置がスケジューリング情報を保持す
るタイムスロットＩＤを与える。これは、クロスバモジ
ュールによって提供されるグローバルクロックと同期す
る。このフィールドは、グローバルクロックが進行する
と共にラップアラウンドする。

【００５９】・阻止（Blockage）：これはＳＭがスケジ
ューリング予約をすることを阻止されている出力ポート
の集合を定義する。このフィールドにはＮ個までのエン
トリが存在しうる。なお、最初は空である。

【００６０】・予約（Reservations）：これは与えられ
たタイムスロットに対するスケジューリング予約を記録
する。ＣＯＲＰＳは、現タイムスロット（ＣＴＳ）に対
してこのフィールド内のすべてのエントリがすべてのＳ
Ｍにわたり同一であることを保証する。従って、クロス
バモジュールは、任意のＳＭ（ＣＴＳ）から、セルの現
在の入出力スケジューリングを読み出すことができる。
アルゴリズムの一貫性チェックは、クロスバコントロー
ラが十分な処理時間を有する場合に、すべてのＳＭの間
でこのフィールドを比較することにより、クロスバモジ
ュールによって実行されることができる。

【００６１】ＣＯＲＰＳスケジューリングアルゴリズム各ＳＭは、ここで説明するＣＯＲＰＳスケジューリング
アルゴリズムに従う。ＣＯＲＰＳには、与えられたＳＭ
がどの出力ポートをスケジューリングしようとするかに
関する制約はない。どの出力ポートをスケジューリング
しようとするかの選択は、各ＳＭにまかされ、そのＶＯ
Ｑにサービスする固有のポリシーに従う。図１４はＣＯ
ＲＰＳスケジューリングアルゴリズムを示すフローチャ
ートである。以下、タスクボックス１０１〜１１０につ
いて、同図のフローに従いながら説明する。

【００６２】先ず、タスク１０１において、前のＳＭか
らＳメッセージを受信し、各ＳＥに対してＴＴＬ（存続
時間）をデクリメントする。更に、与えられたＳＥに対
してＴＴＬ＞０の場合には、ＴＳＩ（タイムスロットＩ
Ｄ）をデクリメントし、ＴＳＩにおけるメモリアレイＳ
Ｃを更新する。ＴＴＬ＝０の場合には、そのＳＥをＳメ
ッセージから除去する。また、キャリー（ＣＡＲＲＹ）
フラグをＣＡＲＲＹ＝ＦＡＬＳＥにリセットする（タス
ク１０９参照）。

【００６３】続いて、タスク１０２（試行スロットの計
算）において、適当な優先マトリクスを用いて、どの将
来のタイムスロット（ＦＴＳ：Future Time Slot）をス
ケジューリングしようとするかを計算する。簡単のた
め、そのマトリクスは、ＦＴＳ＝ｆ（ＣＴＳ，ＳＭ＿Ｉ
Ｄ）の形の関数ｆにエンコードされうる。

【００６４】更に、ＳＭが送信用にどの出力ポート（Ｏ
ＰＩＳ）をスケジューリングしようとするかを選択する
（タスク１０３：出力ポートの選択）。なお、出力ポー
トを選択するストラテジは、前のタスクの結果に依存す
る可能性がある。ＣＯＲＰＳはこのストラテジを指定し
ない（例えば、出力ポートの重み付きラウンドロビン選
択が使用可能である）。

【００６５】続いて、ＳＣ（ＦＴＳ）の予約エントリの
うちで、ＳＭ−ＩＤがこのスケジューリングを実行する
ＳＭに等しいものがあるかどうかを単にチェックする
（タスク１０４：スロットを自分が所有しているかのテ
スト）。

【００６６】もし、ＳＭ−ＩＤがこのスケジューリング
を実行するＳＭと異なるならば（タスク１０４のＮ
Ｏ）、更に、ＳＣ（ＦＴＳ）の阻止エントリのうちで、
ＯＰＩ（出力ポートＩＤ）が、スケジューリングを試み
ている出力ポートＯＰＩＳに等しいものがあるかどうか
をチェックする（タスク１０５：自分は阻止されている
かのテスト）。

【００６７】自分が阻止されているならば（タスク１０
５のＹＥＳ）、Ｓメッセージを次のＳＭに渡す（タスク
１０６）。

【００６８】自分が阻止されていないならば（タスク１
０５のＮＯ）、ＳＣ（ＦＴＳ）の予約エントリのうち
で、ＯＰＩ（出力ポートＩＤ）が、スケジューリングを
試みている出力ポートＯＰＩＳに等しいものがあるかど
うかをチェックする（タスク１０７：そのスロットは取
られているかのテスト）。

【００６９】そのスロットが取られていない場合には
（タスク１０７のＮＯ）、ＳＣ（ＦＴＳ）に、自己のＳ
Ｍ−ＩＤを有しＯＰＩがＯＰＩＳに等しい予約エントリ
を作成し、ＴＴＬ＝Ｎ、ＴＳＩ＝ＦＴＳで、ＳＭ−ＩＤ
は自己のＩＤに等しく、ＯＰＩ＝ＯＰＩＳであるＳＥを
作成する（タスク１０８：スロットを取る）。その後、
タスク１０６（Ｓメッセージの受け渡し）へ進む。

【００７０】このスロットを自分が所有している場合
（タスク１０４のＹＥＳ）あるいはそのスロットが既に
取られている場合（タスク１０７のＹＥＳ）には、繰越
し動作が既に開始されているかどうかを検査し、フラグ
ＣＡＲＲＹ＝ＴＲＵＥ／ＦＡＬＳＥをチェックする。Ｃ
ＡＲＲＹ＝ＴＲＵＥの場合には、ＳＣ（ＦＴＳ）の阻止
フィールドに、ＯＰＩ＝ＯＰＩＳのエントリを作成し、
そうでない場合にはＣＡＲＲＹ＝ＴＲＵＥにセットし、
更に、ＦＴＳ＝ＦＴＳ＋Ｎにセットする（タスク１０
９：繰越し）。

【００７１】タスク１０９により繰越し動作が実行され
ると、続いて健全性チェックが行われる（タスク１１
０）。即ち、ＦＴＳは、ＣＴＳから２Ｎ²より遠くに離
れてはならない。（ＦＴＳ−ＣＴＳ）＞２Ｎ²である場
合（タスク１１０のＮＯＫ）、エラーメッセージを出し
て処理を中止する。ＦＴＳ−ＣＴＳ）≦２Ｎ²の場合に
は（タスク１１０のＯＫ）、タスク１０４へ戻る。

【００７２】ＣＯＲＰＳアルゴリズムを用いることで以
下の利点が生じる。バックログのあるＶＯＱは、最終的
にはそのＳＭによって選択されると仮定しても、枯渇す
ることはない。ＶＯＱｑがＳＭｐによって選択されると
仮定すると、図１４によれば、ＳＭｐがｑをスケジュー
リングすることに成功せずに予約ループを抜ける唯一の
場合は、試みたスロットに対して阻止されている場合で
ある。ＳＭｐが阻止されているとは、キューｑが既にス
ケジューリングされていることを意味するが、以下の点
に注意すべきである。ループを抜ける他の唯一の場合が
あるとすれば、健全性チェックを通る場合であるが、こ
れは、繰越し動作が次のＮフレームに空きスロットを見
つけなかったことを意味する。１つのコリジョンにかか
わるＳＭはたかだかＮ個であり、複数のコリジョンは阻
止手続きによって禁止されるため、ループからこのよう
にして抜けることはない。

【００７３】同じ出力ポートｑを連続してスケジューリ
ングしようとするｍ個の入力ポート（ＳＭ）のセットを
Ｍとする。さらに、Δｔのタイムスロットの間に出力ポ
ートｑに対してＳＭｉによってスケジューリングされる
スロットの個数をｎ_i ^q（Δｔ）とする。スケジューラ
は、任意の期間Δｔ及びｉ，ｊ∈Ｍに対して、｜ｎ_i ^q（Δｔ）−ｎ_j ^q（Δｔ）｜≦Ｎである場合、ｍ−フェア（ｍ−公平）であるという。換
言すれば、ＳＭは、他のいずれのＳＭよりも前にＮ個の
予約をすることはできない。

【００７４】ＣＯＲＰＳは、ｍ−公平（１＜ｍ≦Ｎ）で
ある。与えられたスロットｔｓにおいて出力ポートｑに
対してｍ個のＳＭが衝突していると仮定する。衝突して
いるｍ個のＳＭはそれぞれ、そのスロットに対して阻止
されてはいない。もし阻止されていれば、そのスロット
が既に取られているかどうかのテストをすることさえで
きないからである（図１４のタスク１０５）。これらの
ｍ個のＳＭがスロットｔｓにおいて阻止されていない場
合、ｔｓ＋ｎＮ（１＜ｎ≦ｉ）の間にｍ個の空きスロッ
トがなければならない。なぜならば、将来にこれらのス
ロットにアクセスする唯一の方法は繰越し動作を通して
であり、しかも、これらのＳＭはこれらのスロットに対
して繰越し動作を実行していないことが分かっている
（さもなければそれらはｔｓにおいて阻止されている）
からである。このことは、次のｉフレーム以内に、衝突
中のＳＭがそれぞれｑに対してスケジューリング要求を
することになることを意味する。ここで、それらは現フ
レームのＮ個の連続するスロットに対して衝突し続け、
しかも、各コリジョン（衝突）はＳＭごとに次のｉフレ
ームに１つのスケジューリングを生成するとすれば、各
ＳＭは、出力ポートｑに対して次のｉフレームに全部で
Ｎスロット予約することになる。このように、コリジョ
ンが解決されるｉフレームのｉＮ個のスロットから取ら
れるスロットのいずれのサブセットも、他のＳＭよりも
Ｎスロットより多い利益を有するＳＭを含むことはでき
ない。

【００７５】最後の注意は興味深いものである。それ
は、たとえ測定期間がどれほど長くても、連続してバッ
クログのあるＶＯＱは、他のＳＭの対応するＶＯＱの前
にＮ個より多くのパケットをサービスされることはない
ことを意味するからである。実際、十分長い期間では、
すべての衝突するＳＭは厳密に同数の予約を得ることに
なる。

【００７６】さらに、重い負荷のもとでは、共通の出力
ポートを有するキューはすべて、それらのＳＭによって
同じ回数だけ選択されると仮定すれば、すべて同じスル
ープットを有する（図１４のタスク１０８）。

【００７７】ＣＯＲＰＳアーキテクチャについていくつ
かのコメントをしておかなければならない。ＳＭどうし
の間でスケジューリング情報を渡すために用いられる通
信チェインは、将来の少なくともＮ個のスロットである
限り、任意の方法でスロットのスケジューリングパター
ンを変更するために使用することが可能である。例え
ば、出力ポート予約を取り下げることも可能である。こ
の機能は、ＳＭがコリジョンにより遠い将来に予約をし
たばかりであるが、ちょうど次のスロットにおいて、要
求するポートが空いたことに気がついた場合に有用とな
る。ＳＭが、同じパケットに対して別の予約（より近い
もの）をする場合、遠いほうの予約は、取下げがなけれ
ば帯域の浪費を引き起こす。しかし、予約取下げは、上
記の性質に悪影響を及ぼす可能性もある。例えば、衝突
したＳＭが後で予約を取り下げた場合、同じコリジョン
においてその後にスケジューリングされたパケットの遅
延に悪影響を及ぼす。換言すれば、ｉ−１個の他のＳＭ
と衝突したＳＭが、この衝突による予約を後で取り下げ
た場合、システムは、最初にｉ−１個のＳＭのみが衝突
したのと同じ状態にはない。このスケジューラは、最初
の設計目標を満たしながら、できる限り単純なものであ
る。これにより、最終的な実装に要求されるハードウェ
アは単純なままであることが保証される。

【００７８】ＣＯＲＰＳは、複数のフレームにわたりパ
ケットスケジューリングを広げることによって衝突を解
決する。従って、他のスケジューラに比べて、平均パケ
ット遅延が大きくなると期待することはもっともであ
る。このため、一様トラフィックのもとでＣＯＲＰＳの
パフォーマンスを分析する。最終目標は、繰越し動作が
どのくらいパケット遅延に影響するかを評価し、競合す
るスケジューリングアルゴリズムと比べて、システムか
ら最大利用率を得ることである。

【００７９】トラフィック負荷に対するパケット遅延に
関してスケジューラのパフォーマンスを評価するため
に、ＣＯＲＰＳの分析モデルを作成する。以下では、簡
単のため、次の２つの主要な仮定をする。

【００８０】（ｉ）一様トラフィック到着過程、および（ｉｉ）各ＳＭによるランダムなＶＯＱキュー選択（図
１４のタスク１０３）。

【００８１】与えられたＳＭｍの、出力ポートｎ宛のタ
ーゲットＶＯＱキューＱ_mnを定義する。パケットは、強
度ｐでベルヌーイ過程に従ってあらゆる入力ポートに到
着する。具体的には、与えられたスロットにおいて、１
つのパケットが１つの入力ポートに到着する確率がｐで
ある。さらに、あらゆるパケットは、いずれの出力ポー
ト宛の確率も等しい（仮定ｉ）。従って、ターゲットＶ
ＯＱキューにおけるパケット到着過程は、パラメータｐ
／Ｎのベルヌーイ分布を有する。

【００８２】ＶＯＱ選択に関して、与えられたＳＭの空
でない各キューは、スケジューリングのために等確率で
選択される（仮定ｉｉ）。従って、任意のＶＯＱに対し
て、当該ＶＯＱが空でなければ、ｑは選択される確率で
ある。以下、Chipalkatti等（“Protocols for Optical
Star-Coupler Network using WDM,”IEEE Journalon S
elected Areas in Communications, Vol. 11, NO. 4, M
ay 1993）に従うと、すべてのＶＯＱの利用率がρであ
る場合、１つのＳＭにおいて期待される空でないＶＯＱ
キューの個数は１＋（Ｎ−１）ρによって与えられる。

【００８３】さらに、ｑと密接に関連する別の確率を導
入すると便利である。ｒを任意のキューがそのスケジュ
ーラによって選択される確率とする。ｑが当該キューが
空でないと仮定しているのに対して、ｒにはこの制限が
ないという点で、ｒはｑとは異なる。次式が成り立つの
を見るのは困難ではない。

【００８４】ｒ＝ρｑ＝ｐ／Ｎ（１）

【００８５】Ｑ_mnのふるまいは以下のようにモデル化す
ることができる。パケット到着間時間は明らかに、パラ
メータｐ／Ｎの幾何分布に従う。先頭パケットは、ＳＭ
によって選択されるまで待機しなければならない。その
選択は、与えられたスロットにおいて確率ｑで起こる。
選択された後、図１４のタスク１０５に従って、スケジ
ューリングから阻止される可能性がある。与えられたス
ロットにおいてポートｍに対して阻止される確率がＰ_b ^m
である場合、先頭パケットがＳＭによって選択されるま
での待機時間は、パラメータｓ＝ｑ（１−Ｐ_b）の幾何
分布に従う。ここで確率はすべての出力ポートに対して
同一であるので、上付き添字ｍを落とすことができる。
Ｑ_mnが選択された後、常に予約が将来のタイムスロット
において行われ、且つパケットはキューから一種のベル
トコンベヤへと送出されると仮定する。ここでパケット
は、予約タイムスロットがやって来るのを待機し、やっ
て来た時点でシステムから出る。

【００８６】図１５は、Ｑ_mnキューイングシステムに用
いられるモデル全体を示す模式図である。到着パケット
はまずＧｅｏ（ｐ／Ｎ）／Ｇｅｏ（ｓ）／１キューに加
わる。パケットは、このキューを出ると、追加遅延Ｄ
_corpsを受ける。これは、ＣＯＲＰＳがコリジョンを解
決する特定の方法の結果生じる遅延である。これは、無
限個のサーバを有するボックスによってモデル化され
る。

【００８７】ＣＯＲＰＳを通過するパケットの期待遅延
は、Ｇｅｏ（ｐ／Ｎ）／Ｇｅｏ（ｓ）／１に対する期待
遅延と、平均遅延〈Ｄ_corps〉との和によって与えられ
る（M. J. Karol, M. G. Hluchyj, S. P. Morgan, "Inp
ut Versus Output Queuing ona Space-Division Packet
Switch", IEEE Transactions on Communications, Vo
l.COM-35, No.12, pp.1347-1356, Dec. 1987、参照）。
これは、次のように書くことができる（なお、数式中上
付きバーで表記している平均値は、明細書本文中で〈〉
で囲んで表記しているものと同一である）。

【００８８】

【数１】ただし、Ｓは、Ｇｅｏ（ｓ）時間分布の確率変数であ
る。次に、〈Ｄ_corps〉の計算について説明する。

【００８９】Ｑ_mnが選択された（先頭パケットがＧｅｏ
（ｐ／Ｎ）／Ｇｅｏ（ｓ）／１を出た）後、いくつかの
事象が起こり得る。まず、ＳＭｍは、試行しているスロ
ットを所有していないことを確認しなければならない
（図１４のタスク１０４）。スロットが、ＳＭによっ
て、出力ポートｎに対して所有される確率をＰ₀ ⁿとす
る。さらに、与えられたＳＭが、与えられたタイムスロ
ットにおいて、出力ポートｎに対して阻止される確率を
Ｐ_b ⁿとする。これから、次式を導くことができる。

【００９０】

【数２】

【００９１】ＣＯＲＰＳによれば、ＳＭが訪れているス
ロットは、このスロットが同じ出力ポートに対して前の
コリジョンを解決するために使用されている場合に限
り、そのＳＭが予約しようとするのを阻止することがで
きる。

【００９２】その結果、ＳＭがいずれかのポートを所有
する確率は、Ｐ₀＝１−（１−Ｐ₀ ⁿ）^N （５）となる。

【００９３】図１４のタスク１０４によって生じる期待
遅延〈Ｄ₀〉は次式によって与えられる。

【００９４】

【数３】

【００９５】ＳＭｍが最初に訪れたスロットが空いてい
る場合（図１４のタスク１０４、１０５、および１０７
のテストがすべてＮＯ）、優先マトリクス方式が使用さ
れていることにより、パケットの平均遅延〈Ｄ_corps〉
がＮになることを見るのは容易である。〈Ｄ_corps〉＞
Ｎで、コリジョンがない場合、少なくとも１つの予約
が、将来の第２のフレームへとこぼれる。ここで、コリ
ジョンによって受ける遅延Ｄ_cについて調べる。特定の
スロットに対してｉ−１個の他のＳＭとのコリジョンが
起こる場合、そのスロットに関してＳＭｍが有する優先
順位に依存して、遅延Ｄ_cはＮからｉＮまでの間で変わ
りうる。そこで、ＳＭｍがそのスロットを訪れるｉ番目
のＳＭである場合にパケット遅延がｊＮである確率をＰ
［Ｄ_corps＝ｊＮ｜ｖ＝ｉ］とする。例えば、ｍがその
スロットを訪れる最初のＳＭである場合、

【００９６】

【数４】となる。

【００９７】上記の式は単に、ＳＭｍがスロットを訪れ
る最初のＳＭである場合、そのパケットはＮスロット遅
延されるということである。コリジョンが起こらない場
合、ＣＯＲＰＳスケジューラは将来の１フレームをスケ
ジューリングするからである。次に、ＳＭｓ（ｓ≠ｍ）
の任意の出力ポート（特に出力ポートｎ）に対するＶＯ
Ｑキューが空でなく、かつ、ｓによって選択される確率
はｒであることを想起すると、Ｐ［Ｄ_corps＝ｊＮ｜ｖ
＝ｉ］に対する一般式が次のようになることを見るのは
困難ではない。

【００９８】

【数５】

【００９９】式（８）の上段は、ｍがスロットを訪れる
ｉ番目のＳＭである場合、その遅延はたかだかｉＮであ
るということである。下段の二項係数は、ｉ−１個のＳ
Ｍがｍの前にスロットを訪れた場合、これらのうちのｊ
−１個のＳＭがｍと衝突する可能性があるということで
ある。（Ｄ_corps＝ｊＮかつｖ＝ｉ）の形の事象の同時
分布は、上記の表式に１／Ｎを乗じることによって容易
に導出することができる。なぜなら、ＳＭｍは、スロッ
ト１≦ｉ≦Ｎのｉ番目の訪問者であることが等しく確か
らしいからである（図７参照）。

【０１００】次に、１つのパケットの期待遅延Ｄ_cは次
のように導出することができる。

【０１０１】

【数６】

【０１０２】ＣＯＲＰＳスケジューラにより生じる全遅
延は次のようになる。

【０１０３】

【数７】

【０１０４】計算すべき最後の確率はＰ_bである。これ
は、与えられた出力ポートｎに対して、与えられたスロ
ットにおいて、１つのＳＭが阻止される確率である。次
式を示すことができる。

【０１０５】

【数８】

【０１０６】Ｇｅｏ（ｓ）に対して、〈Ｓ〉＝１／ｓ
で、〈Ｓ（Ｓ−１）〉＝２（１−ｓ）／ｓ²であること
に注意すると、１つのパケットがシステムで受ける全平
均遅延は次のようになる。

【０１０７】

【数９】ただし、ｓ＝ｑ（１−Ｐ_b）である。最初の３項は、ス
ケジューリングが行われる前の、ＶＯＱキューにおける
遅延に対応する。第３項は、ＣＯＲＰＳのパイプライン
およびコリジョン解決機能により、パケットが待機する
のに必要な追加時間に対応する。

【０１０８】図１６に、ＣＯＲＰＳの遅延対スループッ
トの解析的結果を、ＣＯＲＰＳスケジューラを備えた１
６×１６スイッチのシミュレーションと比較したものを
示す。この図において、パイプラインおよびコリジョン
解決方式が使用されることにより、パケットがＳＭスケ
ジューラによって選択されるまでに受ける平均キューイ
ング遅延と、ＣＯＲＰＳ遅延との間に違いがある。図か
ら分かるように、解析的予測は、シミュレートされたシ
ステムのふるまいと良く一致する。

【０１０９】この図は、負荷のすべての範囲を通じて、
スケジューリング遅延がキューイング遅延よりも優勢で
あることを示している。非常に高い負荷の場合（キュー
が形成され始めるとき）にのみ、キューイング遅延が重
要になる。これは、パケットがＶＯＱキューに到着する
とすぐに将来のパケットをスケジューリングすることに
おいて、ＣＯＲＰＳがうまくはたらいていることを意味
する。他方、ＣＯＲＰSによって生じる平均遅延は、軽
負荷の場合のおよそ１フレームから、負荷が０．８５に
達するときの約５フレームまで、増大する。

【０１１０】完全を期するため、図１７に、１６×１６
ＣＯＲＰＳスイッチにおける全遅延の相補分布を示す。
曲線は、シミュレーションによって得られた、負荷が
０．８および０．８５の場合のものである。まず、いず
れのパケットも、システムを通過するのにＮ²スロット
より多くはかからないことに注目される。これは、ＣＯ
ＲＰＳでは多重コリジョンが起こることを許していない
ことによる。実際、分布のテールは、Ｎ²／２＝１２８
付近のあたりで終わっているように見える。しかし、シ
ステムが非常に大きい負荷によって駆動される場合、パ
ケット遅延はＮ²に近づくようである。

【０１１１】図１８は、ＣＯＲＰＳを実現するシステム
ブロック図である。ＶＯＱＭモジュールは、パケットを
仮想出力キューＶＯＱに入れる。また、このモジュール
は、与えられたキューに代わって、ＳＭモジュールに対
して要求を行う。ＳＭモジュールは、メッセージ受渡し
を制御し、ＣＯＲＰＳスケジューラを実現する。ＳＭモ
ジュールは、ＶＯＱＭと通信して、将来のスロット予約
について通知する。この通知はＶＯＱＭに保持され、与
えられたスロットにおいて、パケットが、交換されるべ
きクロスバレジスタに転送されるようにする。

【０１１２】図中、ＳＭとクロスバコントローラの間の
通信はバスを通じて行われるように示されているが、こ
の特定の種類の通信である必要はない。

【０１１３】スケジューリングアルゴリズムどうしの公
平な比較では、平均遅延やスループットのようなパフォ
ーマンス尺度のみならず、複雑さおよび実装コストも考
慮すべきである。第１の選択基準は高いスループットで
ある。さらに、ＶＯＱで動作するスケジューラのみを比
較する。そこで、本発明と競合するスケジューラとし
て、１−ＳＬＩＰ及びＲＲＧＳとの比較を行う。複数回
のイテレーションではなく１イテレーションのＳＬＩＰ
を選択する理由は、比較プロセスの公平性のためであ
る。すなわち、任意の入力ポートにおいて、スロット当
たりたかだか１回の決定をすることができると仮定す
る。ｉ−ＳＬＩＰ（ｉ＞１）は、実質的に、スロット当
たり複数回のスケジューリング決定を要求することにな
る。

【０１１４】パフォーマンス比較において、解析的結果
およびシミュレーション結果の両方をもとにする。一様
トラフィックに対するＲＲＧＳおよびＳＬＩＰの遅延パ
フォーマンスは次のように近似することができる。

【０１１５】

【数１０】

【０１１６】ＲＲＧＳの結果については、本出願人によ
る特願平１１−１７２５８４号に記載されており、ＳＬ
ＩＰの結果については、N. McKeown, "Scheduling Cell
s inan Input-Queued Switch", PhD Thesis, Universit
y of California at Berkeley, 1995、に記載されてい
る。

【０１１７】図１９に、これらのアルゴリズムの平均遅
延対スループットのパフォーマンスを、ＣＯＲＰＳと対
照して示す。この図から明らかなように、ＲＲＧＳ及び
ＣＯＲＰＳは、遅延が大きくなる前には、ＳＬＩＰより
もずっと高い負荷にたえることができる。容易に分かる
ように、これらの曲線の微分は、高負荷の場合、ＲＲＧ
Ｓ及びＣＯＲＰＳのほうがかなり小さい。しかし、いず
れのアルゴリズムも、中程度から軽い負荷ではオフセッ
ト遅延バジェットを有する。ＲＲＧＳの場合、これは、
パイプライン法が使用されていることのみによるもので
ある。ＣＯＲＰＳの場合、既に説明したように、追加遅
延はコリジョン解決によるものである。しかし、ＣＯＲ
ＰＳは、ＲＲＧＳに比べて２つの利点を有する。（ｉ）ＳＭがどの出力ポートを選択するかについて選択
の自由がある。（ｉｉ）厳密に公平なスケジューラである。ＳＬＩＰもまた公平なスケジューラであるが、そのコリ
ジョン解決プロセスは、ＣＯＲＰＳのものとは全く異な
る。

【０１１８】前述のように、ＣＯＲＰＳは、どの出力ポ
ートにスケジューリングを試みるかについて完全な選択
の自由を与える。すなわち、各ＶＯＱＭは、与えられた
ＶＯＱに代わって、スケジューリングされる出力ポート
を自由に選択することができる。このことは、スケジュ
ーラ設計ストラテジの重要な部分であった。従って、多
くのアルゴリズムが、ＣＯＲＰＳとともに、ＶＯＱ選択
に使用可能である。これまで、そのようなアルゴリズム
の１つ、すなわち、空でないＶＯＱのうちのランダム選
択について説明した。他のＶＯＱ選択ストラテジの例も
可能である。ＶＯＱ選択ストラテジは、協調的選択スト
ラテジおよび非協調的選択ストラテジという２つのクラ
スに分類することができる。

【０１１９】非協調的ＶＯＱ選択ストラテジは、ＶＯＱ
選択決定が、他の入力ポートとは独立に、入力ポート
（ＶＯＱＭ）ごとに行われるものである。ＣＯＲＰＳの
分析に用いたランダム選択ストラテジはこのクラスに属
する。

【０１２０】重み付き公平キューイング（ＷＦＱ：Weig
hted Fair Queuing）は、パケット交換研究文献におい
て広く知られたサービスストラテジである（例えば、H.
Zhang, "Service Disciplines for Guaranteed Perfor
mance Service in Packet-Switching Networks", In Pr
oceedings of IEEE, Vol.83, no.10, pp.1374-1396,Oc
t. 1995、参照）。その考え方は、所定の重みに従っ
て、出力リンク容量に対して競合する複数のキューのサ
ービスレートを規制するというものである。ＶＯＱＣ
ＯＲＰＳスイッチにおいて、出力ポート帯域は、ある種
の呼受付けコントローラによって複数のＶＯＱＭに分割
することができる。その場合に、ＷＦＱを用いて、ＶＯ
Ｑキューの最大サービスレートが、与えられた出力ポー
トのＶＯＱＭ帯域分を超えないように強制することがで
きる。

【０１２１】レート制御サービス（ＲＣＳ：Rate-Contr
olled Service）規律は、与えられたトラフィックフロ
ーが、ネットワークエントリポイントでいくつかのバー
スト性制約を満たすと仮定する（L. Georgiadis, R. Gu
erin, V. Pens, "EfficientNetwork QoS Provisioning
Based on per Node Traffic Shaping", Proceedingsof
INFOCOM96, vol.1, pp.102-110, 1996、参照）。これら
の制約は一般に、ネットワークのエッジにおけるトラフ
ィックシェーパによって強制される。さらに、トラフィ
ックシェーパは、中間スイッチにも配置され、トラフィ
ックが、ネットワーク内の各中間交換ポイントでそれら
の制約に従うようにされる。トラフィックシェーパは一
般に、リーキーバケットアルゴリズムによって実現され
る。J.Turner, "New Directions in Communications, o
r Which Way to the Information Age?", IEEE Communi
cations Magazine, Vol.24, pp.8-15, 1986、には、そ
のようなアルゴリズムの１つが記載されている。基本的
なリーキーバケットは、２つのキュー（１つはデータ用
で、１つはトークンすなわちパーミット用）を有するシ
ステムである。キュー上のデータパケットは、サービス
を受けるためにはパーミットを必要とする。制限された
個数のパーミットのみがパーミットキューに格納され
る。パーミットは、一定レートで生成される。この種の
トラフィックシェーパは、ＶＯＱのうちのいずれがサー
ビスを受けるかを規制するために使用可能である。適格
なＶＯＱのうちからは、キュー選択に任意のアルゴリズ
ムを用いることが可能である。

【０１２２】上記の２つのサービス規律は、パケットネ
ットワークにおけるサービス品質（ＱｏＳ）のサポート
に使用可能であり、それ自体、活発な研究分野である。
このようなＱｏＳサポートストラテジは、非協調的なタ
イプのものになることが多い。それは、他のトラフィッ
クストリームとは無関係に、ＶＯＱの予測されるサービ
ス挙動を保証することになるからである。このクラスに
属するアルゴリズムは、ビデオや音声ストリームのよう
な、厳しいＱｏＳアプリケーションをサポートするスイ
ッチで使用可能である。

【０１２３】協調的ＶＯＱ選択ストラテジは、ＶＯＱ選
択がスイッチ内のＶＯＱのセット全体の状態に依存する
ような選択ストラテジである。このストラテジは一般
に、各フローのサービスに集中するよりも、最大スルー
プットのようなスイッチ全体のふるまいを良くすること
を目標とする。従って、このようなストラテジをスイッ
チで使用するのは、ＱｏＳ要求条件に対する約束なし
に、データトラフィックをサポートする場合である。

【０１２４】協調的ストラテジの場合、他のＶＯＱの状
態のような追加情報をＣＯＲＰＳスケジューラに提供す
る必要がある。キューの状態に関する情報は常に「古
い」ため、サービスストラテジは、古い情報に関してロ
バストでなければならない。

【０１２５】最大マッチング問題とは、与えられたグラ
フの辺のうちから、グラフの頂点の対をつなぐ辺で、対
の総数を最大にするような辺のサブセットを求める問題
である（Cormen, Leiserson and Rivest, "Introductio
n to Algorithms", McGraw-Hill, 1990、参照）。しか
し、どの頂点も、つなぐ選択された辺を複数本有するこ
とはできない。あらゆるスロットで交換されるパケット
の個数を最大にする場合、最大２部マッチング（ＭＢ
Ｍ：Maximum Bipartite Matching）問題を解く必要があ
る（R. E. Tarjan, "Data Structures and Network Alg
orithms", Society for Industrial and Applied Mathe
matics, Pennsylvania, Nov. 1983、参照）。適当な計
算量でＭＢＭを解くアルゴリズムが利用可能である（J.
E. Hopcroft, R. M. Karp, "An n^5/2 Algorithm for M
aximum Matching in Bipartite Graphs", Society for
Industrial and Applied Mathematics J. Comput., 2
(1973), pp.225-231、参照）。本発明では、ＶＯＱが空
きであるか否かの状態情報は、通信チェインを通じて送
られて、ＶＯＱＭに渡される。ここで、ＭＢＭアルゴリ
ズムは、次フレームのスロットにどのキューがサービス
するかを決定する。興味深い点であるが、ＣＯＲＰＳに
よれば、ＭＢＭアルゴリズムによって選択されないキュ
ーも、将来の予約を試みることが可能である。

【０１２６】最大重み２部マッチング（ＭＷＢＭ：Maxi
mum Weight Bipartite Matching）問題は、上記のＭＢ
Ｍ問題と類似している。主な相違点は、前者では、重み
がグラフの辺に関連づけられ、目的は、マッチングの辺
の重みの総和を最大にする辺のセットを求めることであ
ることである。他の研究者は、ＭＷＢＭアルゴリズムを
用いると、非一様トラフィックのもとでは、スループッ
トに関してＭＢＭストラテジよりパフォーマンスが優れ
ていることを示している（N. McKeown, V. Anantharam,
J. Walrand, "Achieving 100% Throughput in an Inpu
t-Queued Switch", Proceedings of Infocom96, San Fr
ancisco, March 1996、参照）。考え方は、非一様トラ
フィックの場合を扱うために、ＶＯＱキューサイズを重
みとして用いることである。

【０１２７】また、上記文献によれば、入力トラフィッ
クが受付け可能である限り、ＭＷＢＭアルゴリズムは安
定である、すなわち、ＶＯＱキューは爆発しない。あら
ゆる出力ポートに対して、１個の出力ポートへの入力ト
ラフィックレートの総和がその容量を超えない場合に、
トラフィックが受付け可能であるという。この興味深い
結果は、ＭＷＢＮの安定性は、古い情報の存在下でも、
すなわち、重みがいくつかの過去のタイムスロットのキ
ューレベルに基づいていても、維持されるということで
ある。この場合も、ＶＯＱのキューレベル情報はすべて
のＶＯＱＭに渡され、出力ポートに対する要求がＳＭへ
と発行される前に、ＭＷＢＭアルゴリズムが各モジュー
ルで実行されるようにすることができる。

【０１２８】

【発明の効果】以上詳細に説明したように、本発明によ
れば、まず、時間軸をフレーム化して優先マトリクスを
用いた予約を行うことにより、タイムスロット巡回順序
を規則的なものとし、実装及び制御を容易にするという
効果がある。また、ＲＲＧＳとは異なり、スケジューリ
ングの規則をＳＭ個数の偶奇によって変える必要がな
く、この点でも実装及び制御が簡単であるといえる。

【０１２９】さらに、本発明による繰越しラウンドロビ
ンパイプラインスケジューラ（ＣＯＲＰＳ）によれば、
クロスバ高速スイッチファブリックの入線間での公平な
スケジューリングが可能となる。ＣＯＲＰＳは、将来の
スロットのパケットをスケジューリングすることによ
り、ラインごとスロットごとに１つのスケジューリング
決定を行う。スケジューリングされるキューの選択は任
意であるため、トラフィックのサービス品質をサポート
することに適している。ＣＯＲＰＳは、出力ポート間の
競合を公平に解決する。

【０１３０】さらに他の効果および変形を考えることは
当業者には容易であって、本発明は、ここで説明した具
体例に限定されない。特許請求の範囲に記載した本発明
の構成の技術思想あるいは技術的範囲から離れることな
く、さまざまな変形例を考えることが可能である。

【図面の簡単な説明】

【図１】集中ＶＯＱスケジューラを示す概略的ブロック
図である。

【図２】（Ａ）は並列方式の、（Ｂ）はラウンドロビン
方式のアーキテクチャをそれぞれ示す分散スケジューラ
アーキテクチャの模式図である。

【図３】入力バッファ型スイッチアーキテクチャの説明
図である。

【図４】入力ポート分散スケジューラの構成を例示する
概略的ブロック図である。

【図５】４×４クロスバースイッチを用いた場合のＲＲ
ＧＳによるパイプラインスケジューリング決定の一例を
示すタイムチャートである。

【図６】図５を個々のＳＭのタイムスロット巡回順序に
着目して表現したタイムチャートである。

【図７】本発明によるスケジューラの一実施形態におけ
るコリジョンを解決するのに用いられる優先マトリクス
の一例（ポート数Ｎ＝４）を示す説明図である。

【図８】本発明によるスケジューラの一実施形態におけ
るパイプラインスケジューリング決定の一例（ポート数
Ｎ＝４）を示す説明図である。

【図９】本発明によるスケジューラの一実施形態におけ
るコリジョンを解決するのに用いられる優先マトリクス
の一例（ポート数Ｎ＝５）を示す説明図である。

【図１０】本発明によるスケジューラの一実施形態にお
けるパイプラインスケジューリング決定の一例（ポート
数Ｎ＝５）を示す説明図である。

【図１１】本発明によるスケジューラの一実施形態にお
けるＳＭ間の繰越し動作を示す説明図である。

【図１２】本実施形態におけるＳメッセージのフォーマ
ット図である。

【図１３】本実施形態におけるスケジューラモジュール
のデータ構造体のフォーマット図である。

【図１４】本実施形態におけるＣＯＲＰＳスケジューリ
ングアルゴリズムを示すフローチャートである。

【図１５】ＣＯＲＰＳＶＯＱキューイングモデルを示
す模式図である。

【図１６】システム負荷の関数としてパケット遅延を表
すグラフである。

【図１７】ＣＯＲＰＳスケジューラを備えた１６×１６
スイッチの相補的遅延分散を示すグラフである。

【図１８】ＣＯＲＰＳコントローラの一例を示すブロッ
ク図である。

【図１９】さまざまな競合スケジューラの、システム負
荷に対する期待遅延を示すグラフである。

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平４−271546（ＪＰ，Ａ) 特開平２−87745（ＪＰ，Ａ) 特開平２−237337（ＪＰ，Ａ) 特開平４−58644（ＪＰ，Ａ) 特開平８−223213（ＪＰ，Ａ) 特開2000−78148（ＪＰ，Ａ) 特開2000−183884（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) H04L 12/56 H04L 12/28

Claims

(57)【特許請求の範囲】

【請求項１】ネットワークにおけるデータのフローを
制御するスイッチにおいて、複数の入力ポートと、複数の出力ポートと、前記複数の出力ポートのうちの指定出力ポートへデータ
を送るように、前記複数の入力ポートのうちの特定の入
力ポートをスケジューリングする複数の入力ポートスケ
ジュールモジュールを有するスケジューラと、を有し、現在のスケジュールモジュールは、前のスケジュールモジュールからスケジューリングメッ
セージを受信し、前記現在のスケジュールモジュールが前記指定出力ポー
トにアクセスしようとする将来のタイムスロットを計算
し、前記将来のタイムスロットが前記現在のスケジュールモ
ジュールによって既に予約されているかどうか、前記将
来のタイムスロットが阻止されているかどうか、及び前
記将来のタイムスロットが他のスケジュールモジュール
によって取られているかどうかに基づいて、前記将来の
タイムスロットが有効かどうかを判断し、有効な場合には、前記将来のタイムスロットを取り、前
記スケジューリングメッセージに前記将来のタイムスロ
ットが取られたことを示す情報を含め、前記将来のタイムスロットが予約されている場合及び取
られている場合のいずれかである時には、前記将来のタ
イムスロットを所定数のタイムスロットだけ前進させ
る、ことを特徴とするデータフロー制御スイッチ。
【請求項２】前記複数の出力ポートのそれぞれに対し
て別々のキューを維持する仮想出力キューイング（ＶＯ
Ｑ）を用いて、前記複数の入力ポートを通じて入力され
たデータをキューイングすることを特徴とする請求項１
記載のデータフロー制御スイッチ。
【請求項３】あるポートに対する前記仮想出力キュー
イングは、他のポートに対する前記仮想出力キューイン
グとは独立であることを特徴とする請求項２記載のデー
タフロー制御スイッチ。
【請求項４】前記仮想出力キューイングのサービスレ
ートは予測可能かつ調整可能であることを特徴とする請
求項２に記載のデータフロー制御スイッチ。
【請求項５】前記スケジューラは、重み付きラウンド
ロビンに基づいて、前記指定出力ポートを選択すること
を特徴とする請求項１記載のデータフロー制御スイッ
チ。
【請求項６】複数の入力ポートスケジュールモジュー
ルを有するスイッチの複数の入力ポートに到着する入力
信号を当該スイッチの複数の出力ポートに送るようにス
ケジューリングする方法において、ａ）現在のスケジュールモジュールが、前のスケジュー
ルモジュールからスケジューリングメッセージを受信す
るステップと、ｂ）前記現在のスケジュールモジュールが、前記複数の
出力ポートのうちの１つにアクセスしようとする将来の
タイムスロットを計算するステップと、ｃ）前記複数の出力ポートのうちの１つを前記将来のタ
イムスロットでの送信用にスケジューリングするように
選択するステップと、ｄ）前記将来のタイムスロットが前記現在のスケジュー
ルモジュールによって既に予約されているかどうかを判
断するステップと、ｅ）前記将来のタイムスロットが前記現在のスケジュー
ルモジュールによって予約されていない場合には、前記
将来のタイムスロットが阻止されているかどうかを判断
するステップと、ｆ）前記将来のタイムスロットが阻止されていない場合
には、前記将来のタイムスロットが他のスケジュールモ
ジュールによって既に取られているかどうかを判断する
ステップと、ｇ）前記将来のタイムスロットが、他のスケジュールモ
ジュールによって既に取られている場合及び前記現在の
スケジュールモジュールによって既に予約されている場
合のいずれかの場合には、前記スケジューリングメッセ
ージから繰越し動作が既に開始されているかどうかを判
断するステップと、ｈ）前記繰越し動作が既に開始されている場合には、前
記将来のタイムスロットを阻止状態に設定して前記ステ
ップ（ｄ）に戻るステップと、ｉ）前記繰越し動作が開始されていない場合には、前記
将来のタイムスロットを所定数のタイムスロットだけ前
進させ、繰越しフラグをセットしてステップ（ｄ）に戻
るステップと、ｊ）前記将来のタイムスロットが他のスケジュールモジ
ュールによって取られていない場合には、前記将来のタ
イムスロットを取り、前記将来のタイムスロットが取ら
れたことを示す情報を前記スケジューリングメッセージ
に入れるステップと、ｋ）前記スケジューリングメッセージを次のスケジュー
ルモジュールに渡すステップと、を有することを特徴とするスケジューリング方法。
【請求項７】前記複数の入力ポートを通じて入力した
データは、各出力ポートに対して別々のキューを維持す
る仮想出力キューイングを用いてキューイングされるこ
とを特徴とする請求項６記載の方法。
【請求項８】あるポートに対する前記仮想出力キュー
イングは、他のポートに対する前記仮想出力キューイン
グとは独立であることを特徴とする請求項７記載の方
法。
【請求項９】前記仮想出力キューイングのサービスレ
ートは予測可能かつ調整可能であることを特徴とする請
求項７記載の方法。
【請求項１０】前記スケジューラは、重み付きラウン
ドロビンに基づいて、前記指定出力ポートを選択するこ
とを特徴とする請求項６記載の方法。
【請求項１１】ネットワークにおけるデータのフロー
を制御するスイッチにおいて、複数の入力ポートと、複数の出力ポートと、前記複数の出力ポートのうちの指定出力ポートへデータ
を送るように、前記複数の入力ポートのうちの特定の入
力ポートをスケジューリングするＮ個の複数の入力ポー
トスケジューリングモジュールを有するスケジューラ
と、を有し、前記スケジューラは、前記各入力ポートスケジューリングモジュールがリング
状に接続され、Ｎ個のタイムスロットを単位とするフレームを定義し、
前記フレーム時間内で、前記フレームの次フレーム中の
Ｎ個のタイムスロットでのスケジューリングを、タイムスロット単位に、各入力ポートスケジューリングモジュールが、前段のス
ケジューリングモジュールから、ある予約タイムスロッ
トの予約状況情報を受信し、各入力ポートスケジューリングモジュールが、その予約
タイムスロットにおける当該入力ポートスケジューリン
グモジュールからのパケット送出予約可否を決定し、各入力ポートスケジューリングモジュールが、前段のス
ケジューリングモジュールから受信した予約状況情報
に、自スケジューリングモジュールの予約結果を反映さ
せて、次段のスケジューリングモジュールに送信する、ことにより実行する、ことを特徴とするデータフロー制御スイッチ。
【請求項１２】複数の入力スケジューリングモジュー
ルを有するパケットスイッチの入力ポートと出力ポート
の接続状態を決定し接続を予約する（以下、スケジュー
リングという。）方法において、Ｎ個のタイムスロットを単位とするフレームを定義し
て、前記フレーム時間内で、前記フレームの次フレーム
中のＮ個のタイムスロットでのスケジューリングを行
う、ことを特徴とするスケジューリング方法。
【請求項１３】前記スケジューリング方法は、ａ）現在のスケジュールモジュールが、前のスケジュー
ルモジュールからスケジューリングメッセージを受信す
るステップと、ｂ）前記現在のスケジュールモジュールが、前記複数の
出力ポートのうちの１つにアクセスしようとする将来の
タイムスロットを予め次フレーム内の特定のタイムスロ
ットに決定するステップと、ｃ）前記複数の出力ポートのうちの１つを前記将来のタ
イムスロットでの送信用にスケジューリングするように
選択するステップと、ｄ）前記将来のタイムスロットが他のスケジュールモジ
ュールによって既に取られているかどうかを判断するス
テップと、ｅ）前記将来のタイムスロットが他のスケジュールモジ
ュールによって取られていない場合には、前記将来のタ
イムスロットを取り、前記将来のタイムスロットが取ら
れたことを示す情報を前記スケジューリングメッセージ
に入れるステップと、ｆ）前記スケジューリングメッセージを次のスケジュー
ルモジュールに渡すステップと、を有することを特徴とする請求項１２記載のスケジュー
リング方法。
【請求項１４】前記スケジューリング方法は、タイムスロットでのスケジューリング決定過程（接続決
定過程）の観点から見た場合、前記複数の接続決定過程
が、フレームの先頭で同時に開始され、フレーム内で同時にパイプライン処理により進行し、フレームの末端で同時に完了する、ことを特徴とする請求項１２記載のスケジューリング方
法。
【請求項１５】前記スケジューリング方法は、前記入力ポートスケジューリングモジュールが、フレー
ムの先頭で同時に開始する前記各接続決定過程におい
て、次のフレーム内の各々異なる予約タイムスロットを
対象として処理を開始することを特徴とする請求項１２
記載のスケジューリング方法。
【請求項１６】前記スケジューリング方法は、ある与えられた将来のタイムスロットにおけるＮ個の入
力ポートスケジューリングモジュールの規則的な巡回順
序を定義するＮ×Ｎマトリクスを参照することによっ
て、現在のフレームにおける入力信号が次のフレームで
どの出力ポートへ送出されるかを決定することを特徴と
する請求項１２記載のスケジューリング方法。