JP3887313B2 - コンピュータ・ネットワークでの輻輳管理 - Google Patents

コンピュータ・ネットワークでの輻輳管理 Download PDF

Info

Publication number
JP3887313B2
JP3887313B2 JP2002558683A JP2002558683A JP3887313B2 JP 3887313 B2 JP3887313 B2 JP 3887313B2 JP 2002558683 A JP2002558683 A JP 2002558683A JP 2002558683 A JP2002558683 A JP 2002558683A JP 3887313 B2 JP3887313 B2 JP 3887313B2
Authority
JP
Japan
Prior art keywords
switch
pipe
data rate
congestion
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002558683A
Other languages
English (en)
Other versions
JP2004522337A (ja
Inventor
バーカー、ケネス、ジェームズ
デーヴィス、ゴードン、テーラー
ジェフリーズ、クラーク、デブズ
リナルディ、マーク、アンソニー
スデープ、カールティク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2004522337A publication Critical patent/JP2004522337A/ja
Application granted granted Critical
Publication of JP3887313B2 publication Critical patent/JP3887313B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/32Flow control; Congestion control by discarding or delaying data units, e.g. packets or frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/129Avoiding congestion; Recovering from congestion at the destination endpoint, e.g. reservation of terminal resources or buffer space

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Injection Moulding Of Plastics Or The Like (AREA)

Description

本発明は、全般的にはコンピュータ・ネットワークでの輻輳管理に関し、具体的にはネットワーク・ハードウェアによるフロー制御に関する。
スイッチは、MAC(メディア・アクセス制御)アドレスすなわち、当業者に周知のOSIモデルのレイヤ2に基づいてデータグラムを誘導するネットワーク・ノードである[Motorola Codex著、「The Basics Book of OSI and Network Management」、Addison-WesleyPublishing Company, Inc.刊、1993年を参照されたい]。スイッチは、マルチポート・ブリッジすなわち、2つのLANセグメントを一緒に接続し、レイヤ2データに基づいてパケットを転送する装置であるブリッジと見なすこともできる。ルータは、すべてがOSIモデルのレイヤ3に含まれる、データグラムのインターネット・プロトコル(IP)デスティネーション・アドレスに一致するプレフィックスのルーティング・テーブル内の最長プレフィックスの発見に基づいてデータグラムを誘導するネットワーク・ノードである。本発明では、ネットワーク・ノードを、スイッチ、ルータ、または、より一般的に、時々スイッチ/ルータと称するスイッチング機能およびルーティング機能の両方が可能な機械と見なす。簡潔にするために、本明細書での用語「スイッチ」は、ネットワーク・ノードの3つの論理タイプのすべてすなわち、スイッチ、ルータ、またはスイッチ/ルータ、もしくは、より一般的に、予測不可能な形で到着し、一時的に保管されなければならず、その後、1つまたは複数のヘッダのデスティネーションおよび値の情報に基づいて、転送または破棄されなければならないデータグラムを処理するすべての機械を含むように使用される。
どのスイッチも、トラフィック方向決定を待っているデータグラムの保管に使用される、有限の記憶容量を有する。輻輳のエピソード中に、大量および少量のいくつかのトラフィックが、ストレージが圧倒されないように意図的に破棄され、価値に無関係に着信データグラムの消失が発生する。したがって、インテリジェント・フロー制御の目的は、異なるクラスのフローの、そのサービス・レベル契約に対する挙動に留意し、必要な時に価値ポリシに従って大量の低価値パケットを破棄し、したがって、契約料金に従う貴重なデータグラムを正しく処理できることを保証することである。
通信ネットワークでの輻輳を管理するためのフロー制御の使用は、従来技術で周知である。通常のコンピュータ・システムでは、フロー制御によって、キューがある占有のレベルに達した時に、データグラムが単純に破棄される可能性があり、このポリシをテールドロップと称する。より高度なシステムでは、キュー占有に応答して周期的に更新される破棄の確率を用いて、データグラムをランダムに破棄することができる。すなわち、伝送されるデータグラムの分数(1引く破棄される分数に等しい)を、キュー占有がある下閾値未満の時に1、キュー占有がある上閾値を超える時に0にすることができる。これらの閾値の間では、キュー占有によって、線形に減少する伝送確率を決定することができる。そのようなフロー制御を、Random Early Detection(ランダム早期検出、RED)と称する。サービス・クラスが異なるが同一のキューを共用するデータグラムに、異なる上下の閾値が使用される場合に、そのフロー制御を、WeightedRandom Early Detection(重み付きランダム早期検出、WRED)と称する。そのような直観的な方法は、提供される負荷を変化する際に閾値のチューニングを必要とし、これが、サービス品質(QOS)設備でのそれらの使用の主要な短所になる。
従来技術の技法に関するもう1つの短所が、パケット破棄の決定が、スイッチ内でまたはあるタイプの処理がパケットに対して既に実行された後に行われることである。パケットを部分的に処理した後に破棄することによって、帯域幅の不要な浪費がもたらされる。
米国特許第6041038号は、入力インターフェース回路に位置するセル破棄判定ユニットを示す。
2000年3月31日出願の米国特許出願第09/540428号明細書 米国特許第6041038号 [Motorola Codex著、「The Basics Book of OSI and Network Management」、Addison-WesleyPublishing Company, Inc.刊、1993年
上記に鑑みて、高速ネットワークで破棄/伝送決定を行う、より効率的な装置および方法が必要である。
本発明では、添付の特許請求の範囲に記載した通りのインテリジェントな高速伝送/破棄決定を行うシステムおよび方法を提供する。
本発明の効果は、伝送/破棄決定が、ルーティング・スイッチ機能の上流で行われることである。したがって、本発明は、いずれにせよスイッチを介する処理の後まで存続しないデータグラムを事前に破棄することによって、スイッチ輻輳をなくすか減らす。それによって、本発明は、有限なリソースの輻輳のためにすべてのデータグラムの処理が不可能になる時に、より価値のあるタイプのトラフィックを処理するためにコンピューティング・リソースおよびストレージ・リソースを解放する。
本発明の好ましい実施形態の特徴的な特性は、過剰帯域幅信号B=0または1と称する信号が、スイッチ内の1つのリソースの挙動によって判定されるのではなく、さまざまな信号のAND演算、OR演算、およびNOT演算の正規表現として定義されることである。具体的に言うと、フロー制御の上流場所は、下で定義される入力インターフェース回路(IIC)である。各IICは、あるパイプの組内のフレームに対する伝送/破棄決定を行う。パイプは、ネットワークを介するエッジ・ツー・エッジ・パスと、そのパスを使用するいくつかのデータグラムの論理集約からなる。各IICに、パイプの組が関連し、これらのパイプは、そのIICを通過する。本実施形態では、Bの値が、そのIICのパイプによって使用される、IICによって供給されるスイッチ内のすべてのリソースの状態によって決定される。そのようなリソースは、一般に、同一のスイッチ上の他のIICに属する他のパイプによって共用される。いずれにしても、Bは、IIC内のフロー制御に周期的に報告され、これによって使用される複数のリソースの状態の正規表現である。
本発明の実施の鍵になる基礎は、2000年3月31日出願の米国特許出願第09/540428号明細書に記載の制御理論を、直観的な方法の代わりに使用することである。この特許明細書では、制御理論が、下記の5つの特性A、B、C、D、およびEの特徴がある、帯域幅割振り技術(BAT)と称するタイプのフロー制御で実施される。この特性を、ここで説明する。
・特性A。BATでは、1つのIICに集約されたパイプに関する範囲でスイッチの条件を要約した過剰帯域幅信号B=0または1を使用する。Bは、フロー制御伝送確率を計算するたびに計算される。Bが一貫して1である場合には、サービス・レベル・アグリーメント(SLA)に含まれる性能パラメータを傷つけるスイッチ・リソースの輻輳を引き起こさずに、すべてのパイプを100%伝送することができる。Bが一貫して0である場合には、少なくともいくつかの最善的トラフィックを有するすべてのパイプの伝送分数が、各パイプが少なくともその保証された帯域幅を有するがおそらくそれを超えない帯域幅を搬送するまで、減らされる。Bは、閾値に対するキュー値からの信号の組合せに関して定義することができる(したがって、キューが閾値未満の場合にB=1、それ以外の場合にB=0である)。その代わりに、キュー・レベルの変化の速度に関してBを定義することができる(したがって、キューが減っているか非常に少ない場合にB=1、それ以外の場合にB=0である)。もう1つの代替案として、Bを、フロー速度をフロー速度閾値と比較することによって定義することができる。Bの正確な構成は、本発明にとってクリティカルではない。Bのすべて1またはすべて0の値に関する上の暗示だけが、クリティカルである。
・特性B。BATでは、さらに、過剰帯域幅信号値Bの指数加重平均Eを計算する。好ましい実施形態では、時刻t+DtでのEの値が、次式によって計算される。
E(t+Dt)=(1−W)*E(t)+W*B(t)
ここで、E(t)は、時刻tのEの値であり、B(t)は、時刻tのBの値である。当業者に周知の通り、この式の重みはWである。好ましい実施形態では、Wの値が1/32である。1/16または1/64などの他の値を、同等に適当であるものとして使用することができる。クリティカルな態様は、Eが、B信号のなんらかの適度な平滑化であることである。
・特性C。BATでは、各パイプを調べ、パイプの帯域幅がその最小保証速度(本明細書ではそのminと称する)未満である場合に、多くとも少数の反復の後に、そのパイプが、BATによって自動的に100%伝送される。
・特性D。BATでは、さらに、各パイプを調べ、パイプの帯域幅がその最大上限(本明細書ではそのmaxと称する)を超える場合に、多くとも少数の反復の後に、BATによって伝送される量がmax以下になるまで、伝送分数が減らされる。
・特性E。BATでは、さらに、まだそのmin速度未満またはそのmax速度超でない各パイプを調べ、次のようにBを使用する。B=1の場合には、パイプiの時刻t+Dtの伝送分数Ti(t+Dt)が、
T(t+Dt)=T(t)+Ci*E(t)*Ti(t)
になる。ここで、Ciは、下で説明する方法によって初期化時に判定される定数である。さらに、B=0の場合には、パイプiの時刻t+Dtの伝送分数Ti(t+Dt)が、
T(t+Dt)=T(t)−Di*fi(t)
になる。ここで、Diは、下で説明する方法によって初期化時に判定される定数であり、fi(t)は、フロー制御の最後のエポック中の時刻tでのパイプiの伝送されたトラフィックのフロー速度である。
特性BおよびEおよび残り全体を通じて、記号*は、乗算を示す。
好ましい実施形態では、本発明は、スイッチのMAC(イーサネット(R))またはフレーマ(Packet over Sonet)データ・フロー構成要素で実施され、強制される制御理論の概念に基づくフロー制御を提供する。代替実施形態では、本発明に、スイッチの物理層インターフェース(PHY)で実施され、強制される制御理論の概念に基づくフロー制御も含まれる。どの場合でも、フロー制御機構は、データがスイッチの主パケット分類機能および転送機能に入る前の、入力インターフェース回路(IIC)に統合される。
さらに、本発明の実施形態では、IICに関連するパイプによって使用されるスイッチ・リソースに関して輻輳を正確に示す、スイッチからIICへの過剰帯域幅信号を使用する。IIC内のパイプによって使用されないスイッチ・リソースでの輻輳は、IICに報告されない。
過剰帯域幅信号のもう1つの態様は、それぞれが異なる出力ポートに関係する複数の過剰帯域幅表示を、単一の物理信号、おそらくは時分割多重(TDM)信号に組み合わせ、フロー制御アクションの焦点を、輻輳を経験している出力ポートに合わせられるようにすることである。
好ましい実施形態では、本発明の焦点が、さらに、ネットワーク・リンクからスイッチへの入力に合わせられる。データグラムが、入力インターフェース回路(IIC)に入り、周知の従来技術の技法の使用によってディジタル・データに変換された後に、1つまたは別のサービスのクラス(本明細書ではパイプと称する)へのメンバシップについてデータグラムの第1の部分だけをテストする機会がある。正の保証された帯域幅値を有するプレミアム・アシュアード転送(premium Assured Forwarding)パイプまたはそのような保証がない最善的パイプへのメンバシップとすることができる、パイプ・メンバシップの判定の後に、伝送確率の対応する値が、テーブルから選択される。テーブル自体は、IICを共用するパイプ内のフロー速度に応答し、そのIICからスイッチへの2進輻輳信号に応答して、周期的にリフレッシュされる。このテーブルは、さらに、グローバル・パイプ・パスおよび帯域幅契約値に基づいて初期化時に宣言される、パイプごとのある定数に鑑みて構成される。その後、伝送確率が、高速乱数ジェネレータの現在の状態と比較され、その比較の結果を使用して、IICが、到着するデータグラム全体を従来の処理およびルーティングのためにスイッチに伝送するか、到着するデータグラム全体をスイッチに送らずに破棄するかを決定する。
この説明において、包括的な用語IICは、PHY、イーサネット(R)・システムのメディア・アクセス制御(MAC)、またはフレーマ(Packet over Sonetシステムでの)を含むがこれに制限されない、さまざまな下位層機能のすべてを含むことが意図されている。そのような装置のすべてが、スイッチへのデータグラムの導管であり、したがって、そのような装置のすべてを、IICに関する包括的な用語で本明細書で説明されるものと同一のスイッチ機能に対する利益を有する事前のフロー制御の場所とすることができるので、当業者は、論理的な相似物を簡単に理解するであろう。
これらおよび他の概念を、以下で詳細に説明する。
具体的に言うと、データグラムは、光子信号またはアナログ信号としてスイッチに入り、この信号が、物理層インターフェース(PHY)の入力セクションでスイッチまたはルータによって使用可能な形のディジタル・データに変換される。PHYには、ポートの出力部分の相補的な機能も含まれる。ディジタル・データは、その後、元々伝送されたデータのフォーマットに従って、フレーマまたはMACの入力セクションによって個々のデータグラムまたはパケットに区分される。フレーマまたはMACにも、反対の方向に流れるデータのための相補的な機能が含まれる。本発明の焦点は、PHY、フレーマ、またはMACの入力セクション(以下では集合的に入力インターフェース回路(IIC)と呼称する)内の帯域幅割振り技術(BAT)などのフロー制御機構を使用可能にすることである。BATは、制御理論に基づくフロー制御のタイプであり、フロー制御に対する好ましいアプローチを表すが、当業者が、本発明の範囲から逸脱せずに、他の特定のフロー制御アルゴリズムを入力インターフェース回路内に適用することができる。BATの完全なアルゴリズムの説明は、下に示す。
ネットワーク内のスイッチ[図1を参照されたい]は、周知の構造[図2を参照されたい]を用いてデータグラムを渡す。スイッチは、PHYを介して光ファイバまたは銅ワイヤによって接続される[図3および図4を参照されたい]。本発明のフロー制御機構は、各データグラムを特定の集約フローまたはパイプに相関させるヘッダ情報を抽出する。この情報は、Type of Serviceバイト[図2を参照されたい]内のDifferentiated Services Code Point[参照によって本明細書に組み込まれる、ニコルズ(K.Nichols)、ブレイク(S. Blake)、ベーカー(F. Baker)、およびブラック(D. Black)共著、IETF RFC ReferenceRFC 2474 Definition of the Differentiated Services Field (DS Field) in the IPv4and IPv6 Headers、1998年12月に記載(Format:TXT=50576 bytes) (Obsoletes RFC1455,RFC1349) (Status: PROPOSED STANDARD)]とすることができる。この情報は、テーブル[図12を参照されたい]から伝送確率値を選択するのに使用され、その値を乱数と比較して、決定を行う。また、データ・フロー速度で、各パイプで伝送されたバイトをカウントして、伝送確率のBAT計算への入力を提供する。
フロー制御を実施するそのような設計は、スイッチがある形でIICに輻輳情報を通信することができるとすれば、主としてスイッチ設計に依存する。スイッチから各IICへの最も単純な信号すなわち、所与のIIC内のパイプと、おそらくは他のパイプによって同時に使用される、スイッチ内の共用リソースの輻輳状態を反映する最新の2進値だけが、必要である[図6および図7を参照されたい]。複数のすなわち、出力ブレードごとに1つの、別々にまたは共通の信号に混合されるのいずれかの、輻輳表示を設けることによって、機能強化された機能性を達成することができる。
3つの著しく異なる速度で進行する、IIC内の機能強化されたフロー制御機能の4つの論理タスクがある。低速では、デバイスが、集約フロー(以下ではパイプと呼称する)の座標および特性に関する、初期化時に供給される管理情報を更新する[図8を参照されたい]。中速では、装置が、BATフロー制御アルゴリズムで輻輳信号を使用して、パイプごとの伝送確率を計算する。伝送確率は、部分的に、やはり中速での、スイッチからの輻輳信号から導出される[図9を参照されたい]。さらに、データ・フロー速度で、カウンタが、パイプごとのフローを記録しなければならない。やはりデータ・フロー速度で、フロー制御装置が、伝送確率に従って、スイッチまたはルータに入る前に、データ・パケットを確率的に伝送または破棄する[表1と図10、図11、図12、および図13を参照されたい]。最後の機能すなわち確率的な伝送または破棄の決定は、IIC内に常駐しなければならない。他の機能は、スイッチ自体に常駐するフロー情報編成機能に移動することができる。
図1に、ローカル・エリア・ネットワーク(LAN)A、B、およびCを含むコンピュータ・ネットワークの抽象化を示す。これらのLANには、ワークステーション、サーバ、記憶装置、またはネットワーク内で情報を交換する他のコンピュータを含めることができる。ネットワークには、スイッチ10、12、14、および16ならびに、スイッチの対の間またはLANとスイッチの間の通信リンク11、13、15、17、19、および21のインフラストラクチャも含まれる。したがって、コンピュータ・ネットワークは、頂点(コンピュータおよびスイッチ)と辺(通信リンク)を有するグラフとして編成される。一般的な言葉では、本明細書に記載の実施形態の目的は、可用性およびサービス品質に関係するある契約、すなわち、コンピュータ・ネットワーク・サービスの消費者によって保持される契約を考慮して、コンピュータ・ネットワーク内のデータの効率的で公平な移動を促進することである。
a)サービス品質
スイッチの上流へのフロー制御の移動という総合的な目標は、ある種類の、サービス品質(QOS)に関する理想的なフロー制御により近く近づくことである。輻輳のエピソード中に、フロー制御機構が、一部の着信トラフィックすなわち、輻輳に起因してスイッチを通過しないデータグラムを、インテリジェントに破棄する。これによって、処理およびパケット記憶容量が、最終的に破棄されなければならないパケットに対して浪費されなくなるので、スイッチ内の分類機構およびルーティング機構の効率が高まる。この処理では、後にではなく早めに、これらのパケットを単純に破棄する。
QOSは、論理パイプに関して定義される。すべてのトラフィックが、あるQOS集約フロー・クラスまたはパイプに含まれると仮定する。また、一部のトラフィックが最善的ではないと仮定する。帯域幅の正しい割振りは、下で説明するMax-Minアルゴリズムによって決定される。
スイッチを通る各パイプのパスには、そのソース・ポート、スイッチを通るパス、およびターゲット・ポートの座標が含まれる。そのようなパスは、実際には、「エッジ・ツー・エッジ」でネットワークを通るパイプのパスの一片であり、ここで、用語エッジは、個々のワークステーション、サーバ、自立システム、または他のコンピュータ・ネットワーク・ソース実体を意味することができる。下で説明するように、過剰帯域幅の期間中に線形に増加するフローおよびそれ以外の期間中に指数関数的に減少するフローに関するある係数が、すべてのリソースおよびサービス・レベル・アグリーメント(SLA)のグローバルな知識から初期設定時に判定される。フロー制御の機能は、これらの係数を使用して、インテリジェントに、輻輳条件による必要に応じてパケットを破棄することである。
スイッチの上流のフロー制御およびネットワーク管理の関連する管理機構の使用の効果は、エッジ・ツー・エッジの定量的な帯域幅性能保証を伴う強いQOSの効率的な実施形態である。
b)帯域幅割振り技術(BAT)
スイッチの処理能力(フィルタ・ルール、ルーティング・テーブル、または他のルックアップ・機能の所与の相補物を伴う)が、既知であると仮定する。この知識は、IICごとの過剰帯域幅信号B=1または0の概念につながる。この信号は、所与のIICを通過してスイッチに入るすべてのパイプが、現在、0の破棄、許容可能な待ち時間、および許容可能なジッタを引き起こしながらスイッチ内の機構を通過している場合に、1になると定義される。したがって、Bは、閾値とのキュー占有比較のAND、OR、またはNOTのある組み合わせによって、ビット毎秒単位の処理速度の閾値との比較によって、もしくはキュー閾値比較およびフロー速度閾値比較の組み合わせによって、定義することができる。Bの正確な定義は、クリティカルではない。そうではなくて、Bは、2つの挙動だけを示すことが必要である。すなわち、繰り返すが、スイッチからIICに通信されるBの値が、一貫して1である場合には、そのシステムは、IIC内のすべてのパイプを許容可能なレベルでサービスしている。Bが常に0である場合には、いくつかのパイプで除去があるか、待ち時間統計またはジッタ統計が許容不能である。一貫したB=1信号の最終的な結果は、IIC内のすべてのパイプが、100%伝送されることである。一貫したB=0信号の最終的な結果は、IIC内のすべてのパイプが、すべての保証された最小帯域幅速度(min)に合致するのに十分に大きいが、おそらくはそれを超えない分数で伝送されることである。
追加の基本的な仮定は、SLAが販売され、その結果、すべての時刻にすべてのパイプが、その保証された最小(min)値以下の一定の提供される負荷を有する場合に、すべての過剰帯域幅信号が必ず1になることである。そのような提供される負荷では、IICを使用するすべてのパイプのすべてのSLAが、スイッチによって尊重され、すべてのB信号が1になる。
一実施形態では、複数のB信号を、輻輳情報の効率的な通信のために時分割多重(TDM)システムによって多重化することができる。この場合に、各B信号は、特定の出力ブレードまたはポートでの輻輳(または輻輳の不在)を表すことができる。この場合に、特定のIIC内で、フロー制御を、共通の出力ブレードまたはポートを共用するパイプのグループに対して独立に適用することができる。有利なことに、破棄アクションは、輻輳した出力ブレードまたはポートに宛てられたパイプだけに焦点を合わされ、輻輳していないブレードまたはポートに宛てられたものであれば、最善的トラフィックでさえ、破棄なしでスイッチに渡される。
c)入力インターフェース回路(IIC)
この節のコンテキストを、図2、図3、および図4に示す。
当業者に周知の通り、コンピュータ・ネットワークでは、データが、ヘッダおよびペイロードからなる構造を有するデータグラムの形で伝送される。ペイロード(または「データ」)自体は、たとえばイーサネット(R)(リンク層)、IP(ネットワーク層)、TCP(トランスポート層)などの異なる編成レベルのヘッダからなるものとすることができる。
イーサネット(R)の重要な例では、フレーム・フォーマットが、StandardISO/IEC 8802-3: (1996E), ANSI/IEEE Std. 802.3, 1996 Editionによって確立される。このフォーマットは次の通りである。
<inter−frame><peamble><sfd><eh><data><fcs>
ここで、inter−frameは、データグラムの間のギャップであり、peambleは、フレームが到着しようとしていることを指定するビットのコード化されたシーケンスであり、sfdは、フレーム開始区切り文字文字であり、ehは、イーサネット(R)・ヘッダであり、dataは、IPヘッダおよびデータを有するIPデータグラムからなるものとすることができるイーサネット(R)・ペイロードであり、fcsは、フレーム検査シーケンスである。詳細に言うと、プリアンブルは、少なくとも7バイトの「10101010」である。sfdバイトは、「10101011」である。IPは、レイヤ4トランスポート・プロトコル(TCPまたはUDP)から「パケット」を受け入れ、それ自体のヘッダをそれに追加し、「データグラム」をレイヤ2データ・リンク・プロトコルに配送する。IPは、ネットワークの最大伝送単位(MTU)をサポートするためにパケットをフラグメントに分割するこもでき、各フラグメントは、イーサネット(R)・フレームになる。
図2に、本実施形態に必要なデータグラムの編成を多少詳細に示す。データグラム30は、ビットの組である。IPバージョン4(IPv4)では、IPヘッダに、番号0、1、2、…の、少なくとも160ビットが含まれなければならない。番号8、9、…、15の8ビットが、Type of Serviceバイトを構成し、具体的には、DiffServ Code Pointが、番号8、9、…、13の6ビットからなる(他の2ビットは、将来の標準化のために予約済みである)。本明細書での議論は、IPv4に関するが、当業者は、本発明を、IPバージョン6または、構造化データグラム・ヘッダがQOS情報を有する他のシステムでも同様に実施できることを諒解するであろう。
図2に概略的に示されているように、フレーム・ヘッダは、フレーム開始セグメント32とフレーム・ヘッダ34を有する。時間的にフレーム・ヘッダのあとにあるのが、IPヘッダ36およびデータ・ペイロード38を有するIP構造である。IPヘッダ36内に、Type of Serviceバイト40がある。Type of Serviceバイトには、サービスのクラスを区別するのに使用することができる6ビットが含まれる。明らかに、ネットワーク内でQOSを編成する方法の1つは、すべてのデータグラムのTypeof Serviceバイトの6つのサービスのクラス・ビットとして一貫性のあるラベルを使用することである。たとえば、最善的データグラムのすべてに、6つの0のビットを用いてラベルを付けることができる。多数の他の方法および方式が、提案され、当業者に既知である。
本発明の一実施形態では、スイッチが、イーサネット(R)・リンクを介してネットワークに接続される。リンクは、ある数のビット毎秒でレーティングされ、したがって、リンク内の時間増分は、ビットまたはバイトと同等である。bが、ビット単位の測定値を表し、Bが、バイト単位の測定値を表すものとする。イーサネット(R)・フレーム間のギャップは、無信号の12Bと、フレーム開始区切り文字の1Bと、プリアンブルの7Bである。したがって、フレーム間ギャップは20Bである。フレーム自体は、64Bから1518Bまでとすることができる。Differentiated Services Code Point(DSCP)は、IPヘッダ内のType of Serviceバイトの6bの組である。
図3に、入力インターフェース回路(IIC)の論理的な位置付けを示す。データグラムは、リンク40および42を介してスイッチに出入りする。リンクは、論理的および物理的に、IIC44および46を介してスイッチ48のデータ処理機能に接続される。IICは、光ファイバ内の光子信号とワイヤ内の電子信号の間の変換を行う物理層インターフェース(PHY)とすることができる。または、IICを、イーサネット(R)技術のメディア・アクセス制御(MAC)回路またはPacket over Sonet技術のフレーマ回路などのフレーム構造(ヘッダ、ヘッダの構成要素)を認識する電子装置とすることができる。
動作中に、PHYは、フレーム開始を探し、次に、フレームのプリアンブルを探す。図4では、光子入力50が、PHYのリンクに到着する。PHY58が、光子信号(ビット)を電子信号(ビット)に変換する。電子信号は、PHYからスイッチへ、ワイヤ52内で渡される。データは、ワイヤ56内で電子形式でスイッチを出る。データは、PHY内で光子信号に変換され、その後、リンク内の光ファイバ54でPHYを出る。したがって、このリンクは、全二重(両方向)データグラム導管である。
イーサネット(R)・フレームが到着する時に、PHYが、Receive DataValid(R_DV、受信データ有効)信号をメディア・アクセス制御(MAC)に送る。フレームの間では、PHYは、アイドル信号をMACに送る。本発明がPHY内で実施される場合に、DiffServCode Point(DSCP)に達してフレームが流れる論理パイプを識別するために、PHY内にいくらかのストレージが必要である。一実施形態では、PHYが、そこからDSCPを読み取ることができるIPヘッダ(図2)を含めるために、8Bプリアンブルと追加の14Bを保管しなければならない。当業者は、イーサネット(R)・タイプの変形形態が、DCSPが別の場所に位置付けられる代替実施形態につながることを諒解するであろう。
MACまたはフレーマの場合には、同一のポリシを適用して、イーサネット(R)・フレームの先頭の比較的少数のビットを保管し、適当なビット位置からDSCPを読み取る。
読み取られる際に、DSCP(6ビット)が、N≦64個の伝送確率の1つにマッピングされる(N=所与のPHYを介してスイッチに入り、所与のMACに通過するパイプのクラスの数)。同一のDSCPを有する異なるソースから到着するパケットは、集約で扱われる。集約のそれぞれについて、伝送確率が、フロー制御によって計算される。各集約または各パイプのフレームが、伝送または破棄される。その決定は、PHY内またはMAC内(または、Packet over Sonetではフレーマ)のいずれかで行われる。一般に、この決定は、IIC内で行われる。[0、1]の値を有する伝送確率が、[0、1]の乱数の現在値と比較される。伝送確率が乱数以上である場合には、フレームが伝送される。そうでない場合には、フレームが除去され、これは、IICの論理が、既に保管されたビットおよび同一フレームのその後に到着するすべてのビットを消去することを意味する。
これらのIIC機能の論理位置を、図5に示す。IIC60が、入力62からデータグラムを受け取る。データグラムは、IIC内を通り、ヘッダ内の最小限の個数のビットが、保管され、帯域幅割振り技術(BAT)フロー制御74によって分析される。各データグラムは、除去78されるか、伝送76される可能性がある。伝送されるデータグラムは、ワイヤ66を介してスイッチ70に通って、分類、計量、およびルーティングを受ける。ワイヤ68からスイッチを出るデータグラムも、IICに入る。データ・ストリーム内のPHYが、電子信号を光子信号に変換し、この光子信号が、リンク64に入る。
IICでのフロー制御のさらなる詳細を、図6に示す。IIC80が、管理情報82(ネットワーク内のパイプのパスならびにパイプの帯域幅保証を反映する)を使用する。IICは、スイッチからの輻輳信号84の頻繁な値も使用する。この情報は、IICでのBAT96の実施に使用される。データグラムは、入力86でIICに入り、BATフロー制御が、データグラムを除去100するか、データグラムを伝送98するかを決定する。伝送される場合に、データグラムは、ワイヤ90でスイッチ94に流れ込む。データグラムは、ワイヤ92でスイッチを出るが、これは、IICがPHYである場合に、光子形態に変換される。どの場合でも、IICは、出てゆくデータグラムに、それらをリンク88を介して次のコンピュータ・ネットワーク・ノードに送れるようにするために、適当なタイミング構造を与える。
IICがPHYである場合には、本発明は、PHYに関する標準規格を利用することができる。標準規格には、たとえば100kHz有線信号などのスイッチとの保守インターフェースが含まれる。スイッチ内からまたはスイッチを介して働く制御点が、この保守インターフェースを介して各PHYと通信することができる。この既存の接続は、PHY内のパイプの初期化情報またはスイッチからPHYへの輻輳に関する更新のいずれかに使用することができる。その代わりに、追加インターフェースを、フロー制御機能にアクセスするために特に設計することができる。さらに、PHYは、エンコード機能、デコード機能、クロッキング機能、および同期化機能を提供することができる。
上で注記したように、当業者は、パイプ用の同一の論理フロー制御機能を、MAC(イーサネット(R)の場合)またはフレーマ(Packet over Sonetの場合)または他のIICで実行できることを簡単に諒解するであろう。どの場合でも、いくつかの論理パイプが、それらがスイッチに入るために共用するPHY、MAC、またはフレーマのリソースによって自然に編成される。さらに、ラベル・ビットおよび実験ビットを有するMPLSヘッダなどの他のヘッダを、DSCPの代わりに使用して、パケットをパイプに割り当てることができる。したがって、本発明を他の形態で実践して、そうでなければスイッチ内で破棄されるデータグラムの事前破棄に関する上の利益をもたらすことができる。そのような事前の伝送/破棄決定の目標は、同一であり、スイッチ自体の上流の接続装置内でフロー制御を可能にすることによって、スイッチ内の貴重な処理リソースおよびストレージ・リソースを非効率的に消費した後の不可避の破棄を避けることである。
d)過剰帯域幅信号BおよびMax-Minアルゴリズム
過剰帯域幅信号B=0、1は、IICによる使用のために下記のように定義されなければならない。これは、やはり下で説明する、Max-Min帯域幅割振りアルゴリズムのコンテキストで行われる。
図7に、IICへの過剰帯域幅信号B=0または1の報告の論理編成を示す。複数のパイプ102および104が、IIC106に入り、パイプ内のデータグラムが、フロー制御の対象になる。フロー制御は、部分的に、スイッチからのB信号132に依存する。B信号は、スイッチの制御点(CP)130で生成するか、その代わりに、より一般的に、図14のフロー制御データ編成ブロック308で生成することができる。制御点(または代替物)は、複数の閾値信号の累算、保管、および論理組み合わせ(AND、OR、またはNOTを用いる)を提供して、過剰帯域幅信号Bを生成し、周期的に伝送する。
さらに図7を参照すると、Bの値は、スイッチ内からの複数の閾値信号Th1、Th2、…の正規表現とすることができる。たとえば、Bの値を、複数の閾値信号のANDとすることができる。各閾値信号Thiは、所与のIICを通過するあるパイプによって使用されるストレージ・リソース116、118、および120のキュー・レベルが、それぞれ閾値122、124、および126未満である場合に1である。キュー・レベルが閾値を越える場合には、Thiの値を0とすることができる。図からわかるように、異なるパイプによって、一般に、スイッチ内の異なるリソースが使用される。同一のリソースが、他のIIC(図示せず)を通る他のパイプ(図示せず)によって使用される場合もある。パイプは、スイッチから、追加のIIC112および114を介して、リンク108および110から他のネットワーク・ノードへ進む。
もう1つの実施形態では、フロー速度を閾値フロー速度と比較して、1つまたは複数の閾値信号を生成することができる。もう1つの実施形態では、独自の閾値およびフロー閾値の組み合わせを使用することができる。
図8に、グローバルQOSフロー制御を可能にするためのネットワークの編成を示す。管理コンソール134が、必要に応じて、帯域幅保証を有するパイプのどれが、帯域幅能力を有するどのリソースを使用するかに関する情報を累積し、配布する。この情報は、必要に応じて、ネットワーク内のスイッチ136、138、および140に通信される。スイッチ138などの所与のスイッチが、管理コンソールからと図7に示されたスイッチ内の輻輳信号からの両方の情報を編成する制御点(CP)142を有することができる。CPは、管理情報および輻輳情報の両方を、情報チャネル148および150を介して、それぞれIIC144および146に渡す。
より具体的には、図8を参照すると、グローバルQOSを、次のように要約することができる。
・管理コンソール
パイプ・パス、保証に関する情報をソートし、送る
・それぞれが制御点(CP)を有するネットワーク内のスイッチ
パイプ情報を処理してBAT内の定数CiおよびDiを生成する
・スイッチ内のIIC
パイプ識別情報を受け入れ、保管する
パイプ情報ごとのCiおよびDiを受け入れ、保管する
パイプごとのCiおよびDiの好ましい定義が、この節の後方で与えられることに留意されたい。
さらに詳細に、図9に、関連するIICであるIIC1およびIIC2(172、174)へのスイッチ160内の輻輳情報からのシグナリングの編成が示されている。異なるキュー占有値またはおそらくはフロー速度値が、スイッチ内で比較されて、項目164および166として示された複数の過剰帯域幅信号B1、B2、…が作られる。各Biは、IIC番号i内のあるパイプによって使用されるあるリソースが輻輳する場合に0になる。そうでない場合には、Biは1である。過剰帯域幅信号は、通信チャネル168および170を介して適当なIICに送られる。IICは、到着するフレーム176および178を伝送するか破棄するかを決定する。IICは、フレームの出発180および182も可能にする。信号B1およびB2は、いくつかの共通の構成要素を共用することができる。
表1は、各IIC内のBATが必要とする計算リソースのリストである。
Figure 0003887313
図10に、IIC内のBATの実施形態でのフレームの伝送または破棄に関する決定処理の、コントローラの流れ図190を示す。この処理は、バッファへの少なくともヘッダ・フレームの保管192によって初期化される。ヘッダから、パイプ番号を識別する194。この番号は、テーブル(図12を参照されたい)から伝送確率を読み取るのに使用される196。伝送確率Tiは、[0、1]の2進値を有する(したがって、複数のビットTiは、範囲00…0ないし11…1の固定されたビット数Xを有するある2進値である)。各伝送確率は、0と1の間の分数とみなすことができ、1は、2^X−1と同等である。乱数を生成し200、この乱数は、Tiと同様の値を有するとみなされる。テーブルからの値を、乱数と比較する198、202。結果が肯定である場合204には、ブロック210に進む。否定の場合206には、ブロック208に進む。ブロック210では、パイプiのb/s値を更新する。その後、フレームが伝送されることを知らせる212。ブロック208では、フレームが破棄されることを知らせる。
図11に、パイプの伝送確率{Ti}の値を更新するのに使用される処理の詳細を示す。
図12に、パイプの伝送確率{Ti}の値の保管テーブル・フォーマット220を示す。具体的に言うと、パイプ番号222が、テーブルへのインデックスである。伝送確率分数自体(BATフロー制御の反復によって導出される)は、隣接するメモリ・スロット224に保管される。
フロー制御更新の周期と過剰帯域幅信号の周期に関する基本的な関係は、次の通りである。スイッチ内の各キューが、ビット単位の容量Cを有する。キューが、一時的に入力がなく、その最大の可能な速度でドレインされつつある場合に、そのキューは、理論的に、C/(最大ドレイン速度)秒で完全に満杯から完全に空になることができる。フロー制御の更新およびスイッチからIICへのB値の報告は、定数Kにこの期間を乗じたものに等しい周期Dtを有しなければならない。好ましい実施形態では、K=1/8である。
Dt=K*(キュー容量)/(最大ドレイン速度)
被乗数値K=1/8は、もちろん、好ましい値にすぎない。この値は、好ましくは、フロー制御が反応できる前のキュー占有の極端な変化を避けるために、1/2未満にしなければならない。その一方で、極端に小さい値は、計算リソースの不要な消費を引き起こすはずである。各フロー制御更新間隔Dt中に、1つのBの値が受け取られなければならない。IICの標準保守インターフェースの周期は10μ秒なので、これによって、スイッチ・キュー容量およびフロー速度に対する相対的な保守インターフェースの使用に対する制限が課せられる。
Dtの上の説明の結果は、すべてのフロー速度(最小保証速度、現在のパイプ・フロー速度など)が、輻輳が発生するリソースのドレイン速度*8の分数として扱われるということである。通常、スイッチは、入口側(複数のソース・ポートによって供給される)のストレージ・バッファと、出口側(複数のターゲット・ポートに供給する)のストレージ・バッファを有する。入口側ストレージは、入口自体での分類遅延に起因するか、それが供給するスイッチ・ファブリックの分極(polarization)に起因するオーバーフローから保護されなければならない。分極は、多数の入口パイプが複数のスイッチ・ファブリック入力に流れ込み、すべてが1つのスイッチ・ファブリック出力から流れ出る現象を指す。入口輻輳は、1つまたは複数の出口側からの輻輳信号に応答する、スイッチ・ファブリックへのパケット送出の一時的延期によっても引き起こされる可能性がある。
入口データ・ストアを保護するBATフロー制御のために、すべてのフロー速度が、入口データ・ストアの最大の可能なドレイン速度の8倍(やはり、名目上だが一貫性のある値)の分数である。ドレイン速度は、通常は、データを入口からスイッチ・ファブリックへ渡すことができる速度である。同様に、出口データ・ストアを保護するBATフロー制御のために、すべてのフロー速度が、入口データ・ストアの最大の可能なドレイン速度の8倍の分数である。このドレイン速度は、通常は、データを出口からターゲット・ポートを介して下流のネットワーク・ノードに渡すことができる速度である。これらの同一のドレイン速度が、この節の後方で定義されるMax-Minアルゴリズムの適用で使用される容量速度である。
DiffServでは、Behavior Aggregate Flow(本明細書では単にパイプと称する)によって使用されるパスが、参照によって本明細書に組み込まれるIETFRFC Reference、
RFC 2750 RSVP Extensions for PolicyControl. S. Herzog. January 2000. (Format: TXT=26379 bytes) (Updates RFC2205) (Status:PROPOSED STANDARD)
に記載のResource Reservation Protocol(RSVP)を用いてセット・アップされる。
パスは、エッジ・ツー・エッジとみなされるが、エッジの定義は柔軟である。本発明の好ましい実施形態では、パイプが確立されることと、あるIICに入るすべてのトラフィックが、DSCP値に従って編成されることが仮定される。したがって、本来、同一のDSCPを有し、集約内の不公平の危険性を有するフローの集約を合計するというタスクがある。しかし、14個の標準的なDSCP値と理論的に可能な6bの64個までの組み合わせを用いると、強いQOSを、少なくともネットワーク内の限られた数のパイプに関して強制できると思われる。
代替実施形態では、20ビットのMPLSラベルおよび3つのMPLS EXPビットを含むMPLSヘッダを使用して、異なるパイプを指定することができる。ローゼン(E. Rosen)、レクター(Y. Rekhter)、タッパン(D. Tappan)、ファリナッシ(D. Farinacci)、フェドルコウ(G.Fedorkow)、リー(T. Li)、およびコンタ(A. Conta)共著のInternet Draft "MPLS Label StackEncoding," draft-ietf-mpls-label-encaps-07.txt, IETF Network Working Group、1999年9月を参照されたい。本発明の実施形態には、そこからサービス品質情報を便利にすばやく抽出することができるさまざまな標準規格によるすべてのヘッダ・タイプの検査が含まれ、そのすべてが、データグラムを、スイッチまたはネットワークを通る比較的少数の論理パイプに集約するためである。
各パイプは、一般に、スイッチ内の多数の共用されるリソースを通る。各パイプは、ビット毎秒単位の最小帯域幅値(min)および最大帯域幅値(max)を伴うSLAを有する。パイプの提供される負荷は、そのmin未満、そのminとmaxの間、またはそのmaxを超える可能性がある。提供される負荷が、そのmin未満の場合には、伝送分数の多くとも少数の調整の後に、パイプ内のフレームが、確率1で伝送されなければならない。パイプの(IICでの)提供される負荷が、パイプのmaxを越える場合には、パイプ内のフレームの伝送される分数を、すばやく(しかし一瞬のうちにではなく)1未満に減らして、パイプ・フローをmax値まで減らさなければならない。IIC内のパイプの提供される速度が、min値とmax値の間である場合には、フロー制御を使用して、パイプの伝送分数を計算し、グローバルMax-Minアルゴリズムからそれが得る割振りを近似しなければならない。
いくつかのパイプは、min=maxであるエクスペディテッド転送(ExpeditedForwarding、EF)と称するサービスのクラスに含まれる。他のパイプは、0<min<maxのアシュアード転送(AF)と呼ばれる。さらに他のパイプは、0=min<maxの最善的(BE)と呼ばれる(上で示したRFC 2474を参照されたい)。
弱いQOSは、クラスの「カラー」の間の定性的な相対関係を与えるが、本発明の強調は、主にmin値およびmax値に関する、強い定量的な性能保証にある。DiffServも、待ち時間およびジッタの性能に関するが、BATなどの入念に設計されたフロー制御によって、キュー占有全般が、従来の直観的なフロー制御による占有よりはるかに低くなり、したがって、単に普通にキューを低い値で稼動させることによって、待ち時間およびジッタの性能の問題が回避される。
管理者の仕事は、すべてのパイプのパスを注記し、IIC内に現れる可能性があるすべてのDSCPパイプにmin値およびmax値を割り当てることである。各パイプのminの値は、ネットワーク内のすべてのパイプがそのmin速度で送出している場合に、すべてのSLAが満たされるという要件によって制限されなければならない。各パイプのmax値は、他のすべてのパイプが0速度で送出する間にそのパイプがそのmax速度でトラフィックを送出している場合にそのSLAが満たされるという要件によって制限されなければならない。推奨される実践では、max速度が、特に除去に応答しないタイプのトラフィック、たとえばユーザ・データグラム・プロトコル(UDP)トラフィックについて、min速度より過度に大きくはない。
Max-Minアルゴリズムは、いくつかのパイプがAFまたはBEである時の公平な帯域幅割振りの定義である。これは、いくつかのパイプの提供される負荷が、スイッチ(またはネットワーク)のどこかで組み合わされてネットワーク・リソースを超える時に適用することができる。
以下の段落では、ネットワーク・レベル(グローバル)のMax-Min割振りを説明する。より詳細な説明が、バーチェカス(D.Bertsekas)およびギャラガ(R. Gallager)共著、「Data Networks」、Prentice Hall刊, EnglewoodCliffs NJ、1992年に記載されており、背景情報のためのみに、参照によって本明細書に組み込まれる。Max-Minアルゴリズムでは、まず、インデックスiを有する各パイプに、その最小の指定されたminiを割り振る。Max-Minアルゴリズムでは、miniを、パイプiの提供される負荷と比較し、試験的にこれらの数の最小値をパイプiに割り振ることが教示される。最小値が、既に提供される負荷である場合には、パイプiが、「満足(sated)」と宣言され、帯域幅を割り振られるパイプの組から除去される。そうでない場合には、パイプiは、過剰帯域幅について競争するパイプの組にとどまる。残りのパイプiのそれぞれおよびそのパイプによって共用されるリソースのそれぞれについて、現在の過剰帯域幅を見つける(≧0でなければならず、そうでなければ契約が無効である)。パイプiについてリソースごとにそのような過剰帯域幅のすべての最小値が正である場合に、Max-Minでは、そのボトルネック・リソースでのその最小過剰帯域幅を、それを使用する満足されていないパイプの数で割る。その分数を、各パイプiに割り振り、そのパイプの前の割振りに追加する。その後、提供される負荷を、現在の割振りともう一度比較し、最小値を、もう一度見つける。提供される負荷が最小値である場合には、パイプiが満足と宣言され、そうでない場合には、パイプiは満足されないままである。残りの満足されていないパイプがあり、どれかがまだ正の過剰帯域幅を有する場合に、その渦状帯域幅を、もう一度探し、除算し、以下同様である。
パイプiが、minとmaxの間の現在のフローを有すると仮定する。パイプiは、他のパイプと共に、所与のIICを介してスイッチに入る。そのIICの現在のB値が1である場合には、そのIIC内の各パイプの伝送分数Ti(まだ1でない場合に)を、線形に増やすことが許可される。IICによって使用される伝送分数Tiの増加の線形速度の係数Ciは、次のように定義される。すべてのパイプがその最大の負荷を提供する場合に、Max-Minアルゴリズムは、パイプごとの帯域幅割当てPiビット毎秒を与える。上で述べたように、この速度は、各リソース(入口または出口のBATフロー制御の場所)で、そのリソースの最大ドレイン速度の8倍の分数として表される。Ciの定義は次の通りである。
あるリソースでのフロー制御でパイプiに使用されるCi=
((8*リソースのドレイン速度)の分数としてのPi)*1/16
乗数1/16はクリティカルでない。たとえば、1/32も動作する。理由は、Diの定義に続いて下で示す。
BATは、ビット毎秒単位の、パイプiのフロー速度fiの使用も必要とする。各fiは、やはり、ローカル・フロー制御のために、ローカル・リソースのドレイン速度の8倍の分数として測定される。B=0のエポック中の各IICで、Tiの指数減少が、速度−Di*fiであり、定数Diは、下で定義される。
ローカル・フロー制御のためのパイプiの最小保証帯域幅が、mini=やはりローカル・フロー制御のためにローカル・リソース・ドレイン速度の8倍の分数として測定される帯域幅として与えられるものとする。
パイプiを除くすべてのパイプが、0帯域幅を提供し、パイプiが、その最大帯域幅を提供する場合に、Max-Minアルゴリズムは、帯域幅Qiビット毎秒のパイプiへの割り当てを与える。やはり、すべてのパイプのフロー速度が、各リソース(入口または出口のBATフロー制御の場所)で、そのリソースの最大ドレイン速度の8倍の分数として表される。Diの定義は次の通りである。
Di=((8*リソースのドレイン速度)の分数として表された(Qi−mini))*4
この乗数4は、正確ではない(たとえば、2も動作する)。理由は、次の通りである。あるIICのすべてのパイプが、各パイプiについて提供される速度がその最大速度であるという点で貪欲であると仮定する。指数減少が線形増加と比較して速いかぎり、パイプiに関する経時的なフロー(最大値*Ti曲線の下の面積)は、まだCiに対して固定された比率である。Ciは、すでにMax-Minの結果なので、この割振りは、グローバルMax-Min割振りを近似したものになる。これらが、管理者によってIICに送られなければならないCiおよびDiの値である。
論理入力および論理出力
この節のコンテキストを、図9、図10、図11、図12、図13、および図14に示す。
パイプあたりの伝送確率を更新するために、各IICがある値を必要とする。
入力
定数
パイプごとのCiおよびDi
IIC測定からの入力
IIC内の各パイプのビット毎秒単位の伝送されたフロー速度fi
スイッチからの入力
IIC内のすべてのパイプによって使用されるすべてのスイッチ・リソースの輻輳状況から定義される複合過剰帯域幅信号B
N個の異なるB値を有する複数の出力ブレードからの信号の、パイプのある組から使用可能にされるTDM信号BNへの集約
前の反復から保管された値
各パイプの前の伝送確率Ti
B値の前の指数加重平均E
出力
将来の反復のためにIIC内に保管される
各パイプの現在の伝送確率Ti
B値の指数加重平均の現在値E
伝送確率テーブルの書込に使用するためにハードウェアに送られる
各パイプiのTi
定数CiおよびDiは、前の節で定義された。
Bの値は、次のように導出することができる。IICを介してスイッチに入るすべてのパイプが、異なるスイッチ・リソースを使用する。IIC内のパイプのいずれかによって使用されるスイッチ・リソースのどれもが、現在、輻輳によって除去、許容不能な待ち時間、または許容不能なジッタが引き起こされる程度まで輻輳していない場合には、Bは1である。そうでない場合には、Bは0である。同一のスイッチ・リソースが、所与のIICを介してスイッチに入らない他のパイプによって使用される可能性があることに留意されたい。輻輳は、厳密に所与のIICを通過するパイプによって、厳密に所与のIICを通過しないパイプによって、またはその組合せによって引き起こされる可能性がある。どのパイプがどのリソースを使用するかを追跡することが、初期化の前に完了されなければならない管理タスクである。
好ましい実施形態では、Tiの値が、時刻tの{Ti、B、E、fi}の値から、時刻t+Dtの値に、次のように更新される。
If fi≦mini then Ti(t+Dt)=min{1、Ti(t)+.125}
Elseif fi>maxi then Ti(t+Dt)=.875*Ti(t)
Elseif B=1 then Ti(t+Dt)=min{1、Ti(t)+Ci*E(t)}
Else Ti(t+Dt)=max{0、Ti(t)−Di*fi(t)}
他の実施形態では、B=1の時にTiの線形増加、B=0の時にTiの指数減少を用いる、関連する方法を使用することができる。
図の構造は、IICの回路の実装の例にすぎず、この図示が、本発明の範囲に対する制限と解釈されてはならないことに留意されたい。具体的に言うと、本発明を、PHY、MAC(イーサネット(R))、フレーマ(Packet over Sonet)、または他の入力インターフェース回路(IIC)の論理的に類似するコンテキストで実践することができる。
本発明は、帯域幅割振り技術(BAT)などのフロー制御を実施するのに制御理論を使用するフロー制御アルゴリズムと共に有利に展開される。BATでは、REDまたはWREDのような抽象閾値ではなく、通常の性能判断基準(最小保証帯域幅および帯域幅に対する最大制限)を使用する。BATでは、その最小帯域幅保証以下のパイプに関して100%伝送を宣言する。BATでは、提供される負荷がその保証された最小値を超えるパイプの間で帯域幅を公平に割り振る。また、BATは、機能するために低閾値と高閾値の間のどこかでキュー占有を稼動させなければならないRED機構またはWRED機構とは異なって、低レベルで普通にキュー占有を稼動させることができる。
本発明を従来技術から区別する利益は、そのような低価値であり、スイッチ処理リソースの高要求超過の一部であるデータグラムが、スイッチに入る前に除去されることである。従来のフロー制御アプローチは、しばしば、スイッチに入り、スイッチ内で処理され、ルーティングされて計算リソースを消費し、その後、スイッチを出る前に除去されるデータグラムを調べる場合がある。この利益は、所与のハードウェアでのスイッチの速度および効率を強化するか、ハードウェア・リソースを減らして同一のスイッチ機能を可能にするか、この2つの利益の組み合わせに変換することができる。
本発明を従来技術から区別するもう1つの利益が、本発明を、IICを交換することのみによって既存のスイッチに簡単に組み込めるという事実である。そのようなIICをネットワーク管理リソースに結合することが、QOSを実施する低コストで単純な方法になる。
図13に、本発明の実施形態の論理表現を示す。本発明を用いると、スイッチの上流の論理パスでの事前フロー制御が可能になる。初期化248は、管理コンソール250で使用可能にされる。管理コンソールは、パイプおよびパイプのSLAに関する情報をネットワーク・ノードに通信する。そのようなノードの入力インターフェース回路(IIC)の論理が、太線252によって区切られている。管理コンソールからの定数が、制御点(CP)254内で保持され、処理される(スイッチの物理パラメータに対して正規化されるなど)。太線252によって区切られたIICのそれぞれが、それを通る論理パイプに関係する適当な定数を保管する。これらの処理は、通常は、比較的低いデータ速度であり、図13の上側の破線によって、これらの処理が区切られる。同一の線の下に、フロー制御更新処理258がある。過剰帯域幅信号の指数加重平均Eが、保管される260。図7、図8、および図9で前に説明したように、スイッチ・キュー占有カウンタ262が、値を制御点に報告し、その値が、過剰帯域幅信号B266として通信される。Bは、Eの更新270に使用される。Bは、Eと共に、IIC内のパイプの伝送確率分数の更新にも使用される。IICカウンタ264が、パイプ内のフロー速度を記録する。パイプに関する伝送されたフロー速度{fi}268も、累算される。伝送確率分数{Ti}が、保管される274。E、B、{fi}、および{Ti}の値が、BATフロー制御アルゴリズム272によって使用されて、新しい伝送確率分数が計算される。好ましい実施形態では、フロー制御伝送分数を更新する論理を、IIC内に常駐させることができる(代替実施形態では、フロー制御伝送分数を更新する論理を、図14に示されたフロー制御データ編成ブロック内に常駐させることができる)。図13の下側の破線は、これらの処理を区切る。その線の下に、データ・フロー処理280がある。フレームが到着し、識別について検査される282。それと並列に、乱数が生成される284。フレームが到着する際に、その識別を使用して、{Ti}保管テーブルから伝送確率Ti286を選択する。その後、Tiと乱数を比較する288。伝送確率が乱数以上である場合には、伝送決定290が、伝送になる。そうでない場合には、伝送決定が、破棄になる。
スイッチ内の本発明の可能な実施形態の概要を、図14に示す。スイッチ300のデータグラムが、リンク336および338で到着する。PHY332および334が、リンクの光子データと内部電子信号の間の変換を行う。データは、その後、MACまたはフレーマ構成要素312および314に渡される。MACまたはフレーマ構成要素は、PCI(Peripheral Connection Interface)バス328および関連するワイヤ330によって、制御点326と通信する。MACまたはフレーマ構成要素は、ワイヤ324上で、フロー制御データ編成から、過剰帯域幅信号BN310も受け取る。複数のネットワーク・プロセッサ304および306を通るデータによって、キュー占有状態が生成され、それが、ワイヤ320および322によって、フロー制御データ編成308に報告される。データは、ネットワーク・プロセッサの間で、接続のマトリックスであるスイッチ・ファブリック302を介して渡される。
ローカル・エリア・ネットワークA、B、およびCを接続するコンピュータ・ネットワークを示す図である。 代表的なデータグラムのヘッダおよびペイロードの概略を示す図である。 入力インターフェース回路(IIC)を介してスイッチに出入りするデータのフローを示す図である。 光ファイバとスイッチの間の、物理インターフェース回路(PHY)内で行われるデータ・フローの光子−電子変換を示す図である。 IICへのデータグラムの進入と、フレームを伝送するか破棄するためにIIC内のBATフロー制御によって行われる決定を示す図である。 帯域幅割振り技術(BAT)フロー制御の3レベルで使用される異なる時間スケールを示す図である。 IICを通過してスイッチに入る2つのパイプの例について、過剰帯域幅信号Bの定義にキュー値を含める方法を示す図である。 ネットワーク管理初期化タスクの詳細を示す図である。 IIC1およびIIC2内のパイプ内の着信トラフィックに関する帯域幅割振りに使用するためにそれぞれIIC1およびIIC2に過剰帯域幅信号B1およびB2を周期的に報告する制御点(CP)による過剰帯域幅信号B1およびB2の測定の詳細の例を示す図である。 IIC内のパイプに関する、フレームごとの伝送/破棄決定と、フロー速度の測定および保管の詳細を示す図である。 各IIC内の伝送確率テーブルをリフレッシュするためのTi計算の詳細を示す図である。 伝送確率テーブルの計算および構造を示す図である。 3つの更新速度によってタスクが区分され、BAT+IIC内の論理タスクの概要を示す図である。 スイッチ内のリソースの全体レイアウトを示す図である。

Claims (14)

  1. ネットワーク・リンク上を伝送されるデータグラムが、入力インターフェース装置を介してスイッチに入力される、コンピュータ・ネットワークにおいて、
    個々のデータグラムに対する伝送/破棄決定を行う方法であって、
    a)パケット転送装置の上流のネットワーク・ノードの各入力インターフェース回路内で前記データグラムのあるビットをテストすることによって前記データグラムのパイプ・メンバシップを判定するステップであって、ビットの選択が、1つまたは複数のレベルのヘッダおよびペイロードを有するデータグラムの構成の標準規格に基づいて行われる、ステップと、
    b)各前記入力インターフェース回路内の所定の組のパイプのそれぞれについて伝送確率を示す値(T)のテーブルを設けるステップと、
    c)前記テーブルから前記データグラムの前記パイプ・メンバシップに一致する対応する値を選択するステップと、
    d)前記パイプ・メンバシップに一致する前記伝送確率に応答して前記データグラムを選択的に伝送または破棄するステップと、
    i)所定の時間間隔(Dt)で、パイプの保証された最小データ速度または保証された最大データ速度に対する、前記パイプのそれぞれでの実際に提供されるデータ速度に応答して、Tを変更するステップであって、
    実際に提供されるデータ速度が、
    イ)最小データ速度未満である場合には、Tが自動的に100%にされ、
    ロ)最大データ速度超である場合には、実際に提供されるデータ速度が前記最大データ速度になるまでTを減じ、
    ハ)最小データ速度以上最大データ速度以下である場合には、前記スイッチ内の輻輳の有無を示す信号(B)が、
    スイッチが輻輳していることを示す場合には(B=0)、Tを減じ、
    スイッチが輻輳していないことを示す場合には(B=1)、Tを増す、
    ステップ、
    を含む方法。
  2. 選択的に伝送する前記ステップd)が、さらに、
    e)前記入力インターフェース回路内に乱数ジェネレータを設けるステップと、
    f)前記乱数ジェネレータの現在の状態と、値の前記テーブルからとられた伝送確率(T)の前記値との比較を実行するステップと、
    g)前記乱数ジェネレータの前記現在の状態が、T以上の場合に、前記データグラムを破棄するステップと、
    h)前記乱数ジェネレータの前記現在の状態が、Tより小さい場合に、前記データグラムを伝送するステップと
    を含む、請求項1に記載の方法。
  3. スイッチ内の輻輳の有無を示す信号(B)は、パイプのすべてのデータグラムを伝送すべき状態を表す場合には1に等しく、前記乱数ジェネレータの前記現在の状態が、0と1.0との間の非負のである、請求項1又は2に記載の方法。
  4. パイプ・メンバシップ判定の前記ステップが、さらに、管理的に指定された値を、前記データグラムのパケット・ヘッダ内の選択されたフィールドの値と比較するステップを含む、請求項1〜3のいずれか1項に記載の方法。
  5. パケット・ヘッダの前記選択されたフィールドが、標準IPパケット・ヘッダ内のDifferentiated Services Code Point(DSCP)フィールドを含む、請求項4に記載の方法。
  6. パケット・ヘッダの前記選択されたフィールドが、前記データグラム内のMPLS(Multiprotocol Label Switching)ラベルまたはEXPビットもしくはこれらの組合せ、またはMPLSトンネル指定にも使用されるATM VPI/VCIフィールドを含む、請求項4に記載の方法。
  7. 値の前記テーブルが、パイプ番号に従ってインデクシングされ、各対応するテーブル項目が、関連するパイプに対応する前記伝送確率(T)を表す、請求項1〜6のいずれか1項に記載の方法。
  8. 前記スイッチ内の輻輳の有無を示す信号(B)が、該スイッチ内の複数のキュー各々における占有値と閾値との比較に基づく信号から計算される、請求項1〜7のいずれか1項に記載の方法。
  9. 前記スイッチ内の輻輳の有無を示す信号(B)の、時刻(t+Dt)における指数加重平均Eが下記式に従い計算され、
    E(t+Dt)=(1−W)*E(t)+W*B(t)
    (ここで、B(t)は、時刻tにおけるBの値であり、E(t)は、時刻tにおけるEの値であり、Wは所与の重みを表す)
    前記ステップ ハ)において時刻(t+Dt)におけるTが下記式に従い増される、
    T(t+Dt)=T(t)+C*E(t)*T(t)
    (ここで、T(t+Dt)、T(t)は、夫々、時刻(t+Dt)、tにおけるTの値であり、Cはスイッチの初期化時に判定される定数である)、請求項1〜8のいずれか1項に記載の方法。
  10. 前記入力インターフェース回路内の前記パイプが、それがデータを誘導する先の出力ポートまたは出力ポートのグループに従ってグループ化され、前記値を変更する前記ステップi)が、パイプのグループのそれぞれについて別々に実行される、請求項1〜9のいずれか1項に記載の方法。
  11. パケット転送装置の入力インターフェース回路内の装置であって、
    a)パイプ番号および関連する伝送の確率が保管されるテーブルと、
    b)フレームの少なくとも一部を保管するバッファと、
    c)乱数を周期的に出力する乱数ジェネレータと、
    d)前記テーブル、前記バッファ、および乱数ジェネレータに機能的に結合されたコントローラと
    を含み、前記コントローラが、
    前記フレームのパイプ・メンバシップ番号を検出するために、前記バッファ内の情報を解析し、
    前記テーブルから、前記検出されたパイプ・メンバシップ番号に対応する伝送(伝送分数)確率値(T)を判定し、
    前記確率値を前記乱数ジェネレータの現在値と比較し、
    前記比較の結果に基づいて前記フレームを破棄するか又は転送し、
    所定の時間間隔(Dt)で、パイプの保証された最小データ速度または保証された最大データ速度に対する前記パイプのそれぞれでの実際に提供されるデータ速度に応じて、下記イ)〜ロ)に示すアルゴリズムに従い、前記Tを変更し、
    イ)最小データ速度未満である場合には、Tを自動的に100%にし、
    ロ)最大データ速度超である場合には、実際に提供されるデータ速度が前記最大データ速度になるまでTを減じ、
    ハ)最小データ速度以上最大データ速度以下である場合には、さらに、前記パケット転送装置内の輻輳の有無を示す前記パケット転送装置からの信号(B)が、
    前記パケット転送装置が輻輳していることを示す場合には(B=0)、Tを減じ、
    前記パケット転送装置が輻輳してないことを示す場合には(B=1)、Tを増す、
    装置。
  12. 管理構成要素をさらに含み、前記管理構成要素が、前記アルゴリズムにおいて使用される定数とおよびパイプの前記保証された最小データ速度および保証された最大データ速度を初期化する、請求項11に記載の装置。
  13. 前記信号が、異なる出力ポートまたは出力ポートのグループ内の輻輳にそれぞれが対応する複数の構成要素を含み、前記入力インターフェース回路内の前記パイプが、それがデータを誘導する先の出力ポートまたは出力ポートのグループに従ってグループ化され、前記Tの前記変更が、パイプのグループのそれぞれについて別々に実行される、請求項11または12に記載の装置。
  14. 通信システムであって、
    スイッチと、
    前記スイッチに機能的に結合された輻輳監視装置であって、前記輻輳監視装置が、前記スイッチ内の伝送を監視し、前記スイッチ内の輻輳状態または無輻輳状態を示す少なくとも1つの信号を生成する、輻輳監視装置と、
    前記スイッチに機能的に結合された物理装置(PHY)であって、前記PHYが請求項11〜13のいずれか1項に記載された装置を含む、物理装置(PHY)と、
    を含む通信システム。
JP2002558683A 2001-01-18 2002-01-17 コンピュータ・ネットワークでの輻輳管理 Expired - Fee Related JP3887313B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/764,954 US6870811B2 (en) 2001-01-18 2001-01-18 Quality of service functions implemented in input interface circuit interface devices in computer network hardware
PCT/GB2002/000183 WO2002058322A1 (en) 2001-01-18 2002-01-17 Congestion management in computer networks

Publications (2)

Publication Number Publication Date
JP2004522337A JP2004522337A (ja) 2004-07-22
JP3887313B2 true JP3887313B2 (ja) 2007-02-28

Family

ID=25072259

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002558683A Expired - Fee Related JP3887313B2 (ja) 2001-01-18 2002-01-17 コンピュータ・ネットワークでの輻輳管理

Country Status (9)

Country Link
US (1) US6870811B2 (ja)
EP (1) EP1352495B1 (ja)
JP (1) JP3887313B2 (ja)
KR (1) KR100586287B1 (ja)
AT (1) ATE453974T1 (ja)
CA (1) CA2429151C (ja)
DE (1) DE60234903D1 (ja)
TW (1) TW589821B (ja)
WO (1) WO2002058322A1 (ja)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002314569A (ja) * 2001-04-17 2002-10-25 Fujitsu Ltd 転送装置および転送制御方法
US6701389B2 (en) * 2001-06-07 2004-03-02 International Business Machines Corporation Bandwidth allocation in accordance with shared queue output limit
US6958978B1 (en) * 2001-06-25 2005-10-25 Nortel Networks Limited Differentiated services in packet-switched networks
US7227841B2 (en) 2001-07-31 2007-06-05 Nishan Systems, Inc. Packet input thresholding for resource distribution in a network switch
US7107344B2 (en) * 2001-08-16 2006-09-12 International Business Machines Corporation Connection allocation technology
US7414985B1 (en) * 2002-02-01 2008-08-19 Ciena Corporation Link aggregation
US20030163593A1 (en) * 2002-02-25 2003-08-28 William March Rice University Method and system for implementing a fair, high-performance protocol for resilient packet ring networks
TW574800B (en) * 2002-03-22 2004-02-01 Via Tech Inc Control method of network transmission speed and Ethernet switch using the method
US8046404B1 (en) * 2002-03-29 2011-10-25 Graphics Properties Holdings, Inc. System and method for discarding frames of an image during transport across a network link
US7142552B2 (en) * 2002-04-08 2006-11-28 International Business Machines Corporation Method and system for priority enforcement with flow control
US7171505B2 (en) * 2002-05-02 2007-01-30 International Business Machines Corporation Universal network interface connection
US7471630B2 (en) * 2002-05-08 2008-12-30 Verizon Business Global Llc Systems and methods for performing selective flow control
US7876681B2 (en) 2002-05-24 2011-01-25 Verizon Business Global Llc Systems and methods for controlling network-bound traffic
US7430169B2 (en) * 2002-06-03 2008-09-30 International Business Machines Corporation Retro flow control for arriving traffic in computer networks
US7802008B2 (en) * 2002-08-12 2010-09-21 Matsushita Electric Industrial Co., Ltd. Quality of service management in network gateways
US7206284B2 (en) * 2002-11-27 2007-04-17 International Business Machines Corporation Method and apparatus for automatic congestion avoidance for differentiated service flows
US7274666B2 (en) * 2003-04-01 2007-09-25 International Business Machines Corporation Method and system for managing traffic within a data communication network
US7349338B2 (en) * 2003-04-15 2008-03-25 Lucent Technologies Inc Scheduler and method for scheduling transmissions in a communication network
US7317727B2 (en) * 2003-05-21 2008-01-08 International Business Machines Corporation Method and systems for controlling ATM traffic using bandwidth allocation technology
KR100520306B1 (ko) * 2003-06-30 2005-10-13 삼성전자주식회사 대역폭 제어 장치 및 방법
KR100542099B1 (ko) * 2003-06-30 2006-01-11 삼성전자주식회사 밴드폭 제어장치 및 방법
US20050060424A1 (en) * 2003-09-15 2005-03-17 Sachin Garg Congestion management in telecommunications networks
US20050060423A1 (en) * 2003-09-15 2005-03-17 Sachin Garg Congestion management in telecommunications networks
US7385985B2 (en) * 2003-12-31 2008-06-10 Alcatel Lucent Parallel data link layer controllers in a network switching device
US7453798B2 (en) * 2004-02-19 2008-11-18 Internationl Business Machines Corporation Active flow management with hysteresis
ATE519344T1 (de) * 2004-06-21 2011-08-15 Panasonic Corp Adaptive und skalierbare dienstqualitätsarchitektur für einzelträger- multicast/broadcast-dienste
US20070032345A1 (en) * 2005-08-08 2007-02-08 Ramanath Padmanabhan Methods and apparatus for monitoring quality of service for an exercise machine communication network
US7873048B1 (en) 2005-12-02 2011-01-18 Marvell International Ltd. Flexible port rate limiting
JP2007214762A (ja) * 2006-02-08 2007-08-23 Fujitsu Ltd Atmセルとイーサネットパケットの混在伝送方法及び装置
US7965638B1 (en) * 2006-05-22 2011-06-21 Atrica Israel Ltd. Policing machine incorporating randomization of rate threshold
US8437352B2 (en) * 2006-05-30 2013-05-07 Broadcom Corporation Method and system for power control based on application awareness in a packet network switch
US9003292B2 (en) 2006-07-06 2015-04-07 LiveAction, Inc. System and method for network topology and flow visualization
US8045456B1 (en) 2006-11-27 2011-10-25 Marvell International Ltd. Hierarchical port-based rate limiting
CN101272256B (zh) 2007-03-23 2011-07-06 华为技术有限公司 业务处理方法和系统、策略控制和计费规则功能实体
KR101500025B1 (ko) * 2008-04-21 2015-03-06 애플 인크. 무선 중계 프레임 구조, 프로토콜, 및 오퍼레이션을 위한 시스템 및 방법
US8315844B2 (en) * 2009-09-15 2012-11-20 At&T Intellectual Property I, Lp Method, computer program product, and apparatus for comparing traffic pattern models of a complex communication system
EP2339793B1 (en) * 2009-12-23 2012-10-17 Alcatel Lucent Method and allocation unit for allocating a communication pipe in a communication network
US8773992B2 (en) 2010-10-11 2014-07-08 At&T Intellectual Property I, L.P. Methods and apparatus for hierarchical routing in communication networks
CN102123444B (zh) * 2010-12-31 2014-04-16 华为技术有限公司 异系统之间共享传输带宽的方法及设备、系统
US10372657B2 (en) * 2016-12-26 2019-08-06 Intel Corporation Bimodal PHY for low latency in high speed interconnects
US10523392B2 (en) * 2017-01-09 2019-12-31 Mediatek Inc. Downlink reference signals for radio resource management (RRM) measurement
WO2019132974A1 (en) * 2017-12-29 2019-07-04 Nokia Technologies Oy Enhanced traffic capacity in a cell
US11132135B2 (en) * 2019-04-11 2021-09-28 International Business Machines Corporation Dynamic disk replication mode selection based on storage area network latency

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5268900A (en) * 1991-07-05 1993-12-07 Codex Corporation Device and method for implementing queueing disciplines at high speeds
FI92361C (fi) 1992-12-14 1994-10-25 Nokia Telecommunications Oy Menetelmä kehysvälitysverkon ylikuormitustilanteiden hallitsemiseksi sekä kehysvälitysverkon solmu
JP3622312B2 (ja) 1996-01-29 2005-02-23 株式会社日立製作所 パケット交換機およびセル転送制御方法
US6424624B1 (en) * 1997-10-16 2002-07-23 Cisco Technology, Inc. Method and system for implementing congestion detection and flow control in high speed digital network
AU6091400A (en) 1999-07-13 2001-01-30 Alteon Web Systems, Inc. Apparatus and method to minimize congestion in an output queuing switch
US6657960B1 (en) * 1999-11-23 2003-12-02 International Business Machines Corporation Method and system for providing differentiated services in computer networks
US6657962B1 (en) * 2000-04-10 2003-12-02 International Business Machines Corporation Method and system for managing congestion in a network

Also Published As

Publication number Publication date
US20020131365A1 (en) 2002-09-19
TW589821B (en) 2004-06-01
US6870811B2 (en) 2005-03-22
EP1352495A1 (en) 2003-10-15
DE60234903D1 (en) 2010-02-11
KR100586287B1 (ko) 2006-06-07
EP1352495B1 (en) 2009-12-30
CA2429151C (en) 2006-07-25
JP2004522337A (ja) 2004-07-22
KR20030071816A (ko) 2003-09-06
ATE453974T1 (de) 2010-01-15
CA2429151A1 (en) 2002-07-25
WO2002058322A1 (en) 2002-07-25

Similar Documents

Publication Publication Date Title
JP3887313B2 (ja) コンピュータ・ネットワークでの輻輳管理
US11784920B2 (en) Algorithms for use of load information from neighboring nodes in adaptive routing
US7107344B2 (en) Connection allocation technology
US7697430B2 (en) Apparatus and methods for scheduling packets in a broadband data stream
US7006440B2 (en) Aggregate fair queuing technique in a communications system using a class based queuing architecture
US10084716B2 (en) Flexible application of congestion control measures
US7046665B1 (en) Provisional IP-aware virtual paths over networks
JP4547341B2 (ja) 通信品質制御機能を備えるパケット中継装置
US8284789B2 (en) Methods and apparatus for providing dynamic data flow queues
US20030112756A1 (en) Conditional bandwidth subscriptions for multiprotocol label switching (MPLS) label switched paths (LSPs)
US7324442B1 (en) Active queue management toward fair bandwidth allocation
AU9084398A (en) Packet network
US7369489B1 (en) Unbiased token bucket
US6985442B1 (en) Technique for bandwidth sharing in internet and other router networks without per flow state record keeping
CN112383450A (zh) 一种网络拥塞检测方法及装置
US20060007937A1 (en) System and method for provisioning a quality of service within a switch fabric
EP1476994B1 (en) Multiplexing of managed and unmanaged traffic flows over a multi-star network
US7061919B1 (en) System and method for providing multiple classes of service in a packet switched network
AU2002219396A1 (en) Congestion management in computer networks
Domżał et al. The impact of congestion control mechanisms on network performance after failure in flow-aware networks

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060512

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060512

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20060512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060515

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20061106

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20061106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061124

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091201

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101201

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101201

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111201

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111201

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121201

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121201

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131201

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees