JPH0637797A - パケット交換網の予約リング機構 - Google Patents

パケット交換網の予約リング機構

Info

Publication number
JPH0637797A
JPH0637797A JP10817893A JP10817893A JPH0637797A JP H0637797 A JPH0637797 A JP H0637797A JP 10817893 A JP10817893 A JP 10817893A JP 10817893 A JP10817893 A JP 10817893A JP H0637797 A JPH0637797 A JP H0637797A
Authority
JP
Japan
Prior art keywords
network
cell
output
cells
copy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10817893A
Other languages
English (en)
Inventor
Joseph B Lyles
ビー ライルズ ジョセフ
Alan G Bell
ジー ベル アレン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JPH0637797A publication Critical patent/JPH0637797A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/54Store-and-forward switching systems 
    • H04L12/56Packet switching systems
    • H04L12/5601Transfer mode dependent, e.g. ATM
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/10Packet switching elements characterised by the switching fabric construction
    • H04L49/104Asynchronous transfer mode [ATM] switching fabrics
    • H04L49/105ATM switching elements
    • H04L49/107ATM switching elements using shared medium
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/15Interconnection of switching modules
    • H04L49/1553Interconnection of ATM switching modules, e.g. ATM switching fabrics
    • H04L49/1561Distribute and route fabrics, e.g. Batcher-Banyan
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/20Support for services
    • H04L49/201Multicast operation; Broadcast operation
    • H04L49/203ATM switching fabrics with multicast or broadcast capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/04Selecting arrangements for multiplex systems for time-division multiplexing
    • H04Q11/0428Integrated services digital network, i.e. systems for transmission of different types of digitised signals, e.g. speech, data, telecentral, television signals
    • H04Q11/0478Provisions for broadband connections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/54Store-and-forward switching systems 
    • H04L12/56Packet switching systems
    • H04L12/5601Transfer mode dependent, e.g. ATM
    • H04L2012/5678Traffic aspects, e.g. arbitration, load balancing, smoothing, buffer management
    • H04L2012/5679Arbitration or scheduling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/54Store-and-forward switching systems 
    • H04L12/56Packet switching systems
    • H04L12/5601Transfer mode dependent, e.g. ATM
    • H04L2012/5678Traffic aspects, e.g. arbitration, load balancing, smoothing, buffer management
    • H04L2012/5681Buffer or queue management

Abstract

(57)【要約】 【目的】 広帯域ISDN高速パケット交換機における
競合を調整する改良型予約リング機構を提供する。 【構成】 本発明に係る予約リング機構は、少なくとも
1仲裁サイクルの間にトップツウダウン順に環状に一連
のステップおよび比較動作を実行し、競合している入力
が指定された出力に対しトップツウダウン順にアクセス
するのを許可する手段を備えていて、少なくとも最大許
容数の競合者が出力について競合状態にある時はいつ
も、各仲裁サイクル中に前記数の競合者に上記出力への
アクセスを許可する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、高速広帯域通信ネット
ワーク、より詳細には、高性能ローカルエリアネットワ
ーク(LAN)に関するものである。
【0002】
【従来の技術】研究プロジェクトやシステムプロダクト
は、ほどなく既設のLANの容量を越える帯域幅、応答
性および(または)リアルタイムの諸要求をもつであろ
う。たとえば、私文書から技術文献に及ぶ文書について
紙から電子書式への移行が進行中であり、そのために進
歩した電子走査装置や印刷装置が開発された。これらの
装置は、装置の速度や解像度が増しているほか、装置の
カラーやグレースケール容量が拡大されているため、そ
の帯域幅の要求は拡大し続けるであろう。改良型LAN
に対する要求のもう1つの例は、壁サイズ表示装置をベ
ースとする会議支援装置とライブビデオリンクを使用す
るゼロックスメデアスペース(Xerox Media Space)な
ど、出現しつつあるいくつかの共同制作技術によって考
えられている高品質ビデオイメージに集中している。さ
らに、高性能コンピュータは、計算資源、高性能ファイ
ルサーバー、視覚化ワークステーション、等として使用
できるようになりつつあるが、現在使用されているLA
Nは、これらの高性能コンピュータを支援するのに必要
な容量を備えていない。
【0003】需要の多い潜在的な科学計算や視覚化アプ
リケーションは、ギガビット/秒(Gbps ) のデータ伝
送速度を必要とするが、大多数の知覚アプリケーション
には10 〜 100メガビット/秒( Mbps )の帯域幅で十
分である。しかし、リアルタイムビデオなど、一部の知
覚アプリケーションは、ネットワークに長い連続負荷を
にかけるし、また二点間(unicast )リンクのほかに、
1対多(multicast )伝送を要求するであろう。従っ
て、ごく普通のユーザー共同体を同時にサポートするた
めに、LANがほどなく 10 〜 40 Gbpsの総合帯域幅を
必要とするであろうという仮定は妥当である。異なるユ
ーザー共同体は一般に異なるニーズを有しており、また
あらゆるユーザー共同体の要求は一般に時間と共に膨ら
むので、ユーザー共同体の要求を優雅にかつ経済的に満
たすためにスケール(scale)する高性能LANが要望さ
れている。
【0004】
【発明が解決しようとする課題】既知のFDDI(Fibe
r Distributed Data Interface) ネットワークは、本発
明が考えているLANのピーク帯域幅要求も、総合帯域
幅要求も満足させることができない。また、クロスバー
交換機または高速同報通信バスをベースとする技術な
ど、最近開発された他の多くの技術は、提案されたLA
Nのマルチキャスト(muticast) 、同報通信(broadcas
t) 、および(または)余裕度(affordability) の諸要
求を満たすことができないように思われる。
【0005】
【課題を解決するための手段】本発明に従って、分類ネ
ットワークと、前記分類ネットワークの次に配置され、
複数の入力から複数の出力へパケットを経路指定する複
数の経路指定ネットワークを有する交換網は、指定され
た出力に対するアクセスを争っている入力間の対立を解
決する予約リング機構を備えている。前記予約リング機
構は、少なくとも1仲裁サイクルの間にトップツーダウ
ン順に環状に一連のステップおよび比較操作を実行し、
前記競合している入力が指定された出力に対しトップツ
ーダウン順にアクセスするのを許可する手段を備えてい
て、少なくとも最大許容数の競合者が指定された出力に
対し競合状態にある時はいつも、前記各仲裁サイクル中
に前記数の競合者に上記出力へのアクセスを許可する。
【0006】
【実施例】I.定義 以下の用語は、ここで使用する場合には以下の意味を有
する。
【0007】「チャンネルレート(channel rate) 」と
は、特定のストリーム、チャンネル、等、たとえば単一
テレビジョン伝送、ファイル転送、データベーストラン
ザクションのビットレートである。
【0008】「リンクレート(link rate)」とは、ネッ
トワークのデバイス(ホスト、ルータ、交換機)が個別
リンク(一対の電線、同軸ケーブル、光ファイバー)上
で維持することができる、または維持しなければならな
いビットレートである。このレートは、チャンネルレー
トの上限である。また、このレートはインタフェースの
ハードウェアのコストや、ネットワークプロトコルのハ
ードウェアやソフトウェアのコストに大きな影響を及ぼ
す。
【0009】「総合レート(aggregate rate)」とは、同
時に伝送することができる最大数のリンクについてリン
クレートの合計として表される最大総合ネットワーク容
量である。バスまたはリングとして具体化されたネット
ワーク、すなわち単一周波数無線同報通信を使用するネ
ットワークの場合、リンクレートは総合レートと同じで
ある。逆に、通常の電話交換システムは、どんなリンク
のレートよりもはるかに高い総合レートが得られる。
【0010】II. 基本的アーキテクチャ 本発明のATM LANは、AT&T/Bellcore によっ
て開発された形式の VLSI ベース”Batcher/banyan”ネ
ットワークを使用して具体化することができる。理解さ
れるように、このLANは、 115 Mbps のリンクレート
で動作するユニキャストおよびマルチキャストバーチャ
ル回線をサポートし、リンクレートを600 Mbpsまで増や
す用意がなされている。ここに開示する具体化において
は、各交換機は32ポートをサポートするであろう。し
かし、Batcher/banyanネットワークは、256ポートよ
り大きな交換機や、(一部には、ここに開示した進歩の
ために、)1ギカビット/秒以上のリンクレートに対し
スケールするであろうと思われる。また、より大きなユ
ーザー共同体をサポートするために、これらの交換機を
相互に接続し、より大きな階層型ネットワークを作るこ
とができる。
【0011】ATM交換の魅力の1つは、標準規格にな
るのもかなり近いことである。この形式のネットワーク
の基本的概念は、すべての通信が「セル」と呼ばれる小
さい固定サイズデータパケットの送信と交換によって行
われることである。バーチャル回線技法を使用すること
によって各パケットのオーバーヘッドが減るので、各セ
ルのヘッダーはソースと宛先間のすべての交換機によっ
てあらかじめ設定された経路を識別する。そのため、セ
ルおよびその望ましい経路指定を識別するために必要な
情報は、通常のXNSまたはTCP/IPデータグラム
の場合のヘッダー情報よりもかなり少ない。ATM標準
規格作成活動やその技術的内容に興味のある人は、CC
ITT (International Telegraph and Telphone Consu
ltativeCommittee)の Study Groups XI および XVIII
およびANSI (American National Standards Insti
tute) sub-committee T1S1により公表された上記
主題の論文を参照されたい。
【0012】明らかになりつつあるATM標準規格に従
って、セルは小さい固定サイズ(53バイト)パケット
である。そのヘッダーに宛先バーチャル回線インデック
ス(Virtual Circuit Index ;VCIと略す)として知
られる宛先アドレッシング情報が入っている。そのほか
に、バーチャルパスインデックス(Virtual Path Inde
x;VPIと略す)があるが、バーチャルパス上の交換
は本質的にバーチャル回線上の交換に等しいので、バー
チャルパスインデックスについての詳細は省略する。セ
ルが交換網に入る前に、ソースホストは、セルをそのソ
ースから宛先へ転送する「バーチャル回線(Virtual Ci
rcuit )」として知られる固定ルートを決定する。この
バーチャル回線の切り換えられた各リンク(各交換機間
リンクおよび各交換機宛先間リンク)は、交換機特定バ
ーチャル回線識別子(VCI′)によって独自に識別さ
れる。従って、1つのバーチャル回線は多数の名前を有
する。セルはバーチャル回線に沿ったどの点でも再順序
付けができないので、セルはそれらが送出された順序で
到着するはずである。
【0013】上記のことを心に留めて第1図を見ると、
階層型LAN21は、1つまたはそれ以上のソース3
1,32から1つまたはそれ以上の宛先33へセルたと
えばATMセル27を転送する複数の自己経路指定非ブ
ロッキング式交換機22〜25で構成されていることが
わかる。たとえば、LANの場合には、ソース31,3
2はワークステーションであってもよいし、宛先33は
ファイルサーバであってもよい。図示のように、LAN
21は2段階の階層を有するが、階層は、Metroporitan
Area Networks(MANs)や Wide Area Networks
(WANs)を含む、かなり長い経路を通してパケット
の移送および交換を行うように拡張できることは明らか
であろう。
【0014】次に、図2について説明する。交換機22
〜25はそれぞれのバッチャー/バンヤン(batcher/ba
nyan) ネットワーク41によって適当に構成されてい
る。図示のように、交換機22の場合は、単一nポート
バッチャー分類ネットワーク42が、ある数k(一般
に、2または3)のバイヤン経路指定ネットワーク4
3,44へセルを提供する。バンヤン経路指定ネットワ
ーク43,44は、同一セル交換サイクルの間にどのセ
ルも紛失させずに、k個のセルを同一出力ポート番号へ
経路指定できるように接続されている。この並行処理に
適応させるため、バンヤン経路指定ネットワーク43,
44から1サイクル当たり最大k個のセルを受け入れる
ように作られた比較的大きな(数千個のセル)FIFO
バッファ45が各出力ポートに設けられている。FIF
Oバッファ45は、実時間トラヒックと「最善努力」ト
ラヒックの両方を取り扱うために、2個のFIFOバッ
ファ(図示せず)、すなわちレート制限付きすなわち予
約トラヒックのための数百個のセルから成る小さいFI
FOバッファと、未予約トラヒックのための相当大きな
FIFOバッファとで構成されていることが好ましい。
小さいFIFOバッファのサイズは、レート制限付きス
トリームの周期のほぼ2倍に制限される。問題のレート
について、これは予約トラヒックのためのFIFOバッ
ファを少なくとも 200〜300 セルのサイズにすべきこと
を意味する。厳格なレート限界によって制限されない
「バースト」トラヒックの場合は、バーチャル回線はよ
り大きなFIFOバッファ(最善努力トラヒック)で待
機させられる。決められた出力ポートをアクセス中の各
入力ポートについて少なくとも1個のフルデータグラム
分のバッファリングが存在すれば、伝送制御プロトコル
(TCP)は有効に実行することが判る。従って、N個
の全ポートが1出力へ同時にTCPパケットを送るであ
ろうNポート交換機の場合は、より大きな出力FIFO
バッファ内に約4×4Kバイト分のバッファリングが必
要である。知られているように、これらのサイズのFI
FOバッファはSRAMから簡単に作られる。
【0015】理解されるように、仮に単一交換サイクル
の間にk個以上のセルが同一出力ポート番号へ送られる
ようなことがあれば、交換機は単に過剰のセルを落とす
というよりは、予想されるように実行するのに失敗する
であろう。従って、この状況は避けなければならない。
そのため、一般に認められている慣例に従って、そのよ
うな対立するセル間の競合を公平に裁くと同時に、どの
サイクルにおいても多くてもk個のセルを交換機へ与え
る予約リング46が設けられている。以下詳しく説明す
るように、この予約リング46は、短縮アレイ(systol
ic array) を作るためすべてのポートを通して配線され
た一組の回路(各ポートにつき1個の回路)で構成され
ている。
【0016】交換網41および予約リング46の入力側
に接続されているのは、n×nコピーネットワーク48
である。コピーネットワーク48は在庫または特注のク
ロスバー交換機の構成部品を使用して作ることができ
る。すべてのセルは、スイッチヘッダー内のマルチキャ
ストビットの状態によって、二地点間セルまたはマルチ
キャストセルとして特別に標識が付けられる。理解され
るように、ATMセルを交換網41を通して経路指定
し、FIFOバッファ45において適当な出力待ち行列
に入れるために、ATMセルにスイッチヘッダーが事前
に付けられている。入ってきたマルチキャストセルは、
コピーネットワークを迂回し、交換網41に通される
が、そのとき交換網41でインタセプトされ、出力回線
へ送られずに、コピーネットワーク48へ戻される。
【0017】詳しく述べると、マルチキャストセルのヘ
ッダー内の宛先バーチャル回線インデックス(VCI)
は、個々の宛先でなく、グループを識別する。従って、
交換ネットワーク41を通るマルチキャストセルの最初
のパスにより、セルはコピーネットワーク48の入力へ
送られる。コピーネットワーク48はセルのコピーをC
個(または、たぶんもう少し多い)作成することができ
る。ここで、Cはセルがアドレスされたグループのサイ
ズである。交換機22〜25のような階層形態の交換機
を取り扱う必要がある場合には、ある程度の複雑になる
が、この複雑さによってハードウェアが複雑になること
はない。セルのコピーがコピーネットワーク48から出
ていくとき(しかし、交換ネットワーク41に入る前
に)、事前にプログラムされたパーポートマッピング
(per-port mapping) ハードウェア(図示せず)が各コ
ピーを異なるグループ番号へアドレスする。これを実行
するために、コピーネットワーク48の各出力ポートに
ある別個のテーブルが、一般にグループ番号によってイ
ンデックスされる。前記テーブルにはグループ番号に対
する出力ポート番号が入っているので、コピーネットワ
ーク48の決められたどの入力ポートも、類似サイズの
多数のグループを扱うことができる。明らかに、上述の
コピーネットワーク48は、多数のマルチキャストグル
ープをサポートできるが、グループメンバー数の変動が
比較的にまれであるアプリケーションに最も適してい
る。
【0018】また、入ってくるセルと、コピーネットワ
ーク48によって与えられるセルをバッファリングする
ために、交換網41の各入力ポートにFIFOセルバッ
ファ51,52が設けられている。これらのバッファ5
1,52は、それらのセルを競合せずに交換網41を通
して経路指定することができるまで、入力ポートに届い
たセルを保持する(所望ならば、複数の優先権クラスを
サポートするために、これらのバッファ51,52の一
方または両方をサブバッファに分割することができ
る)。
【0019】交換網41を通るセルの経路指定は、交換
機に対する入力ポートにあるVCIトランスレータ53
によって制御される。これらのトランスレータ53は、
ホストプロセッサ(図示せず)によつて維持、更新され
るVCI参照用テーブル54を使用して、入力ポートア
ドレスと、入力ポートに対する待ち行列の先頭にいるセ
ルのヘッダーに含まれている宛先バーチャル回線インデ
ックス(VCI)の樹木値関数(tree valued functio
n) を計算する。すなわち、[ VCI ′, outputPORT, mut
icastFlag] ← Routing Function [i, VCI]。理解され
るように、主として各種の経路指定テーブルやマッピン
グテーブルをVCI参照用テーブル54にロードして交
換機22を制御するために、通常のマイクロプロセッサ
または同種の装置(図示せず)に対するインタフェース
が必要である。
【0020】III. 交換機の構成要素の詳細な説明 A.バーチャル回線トランスレータ アドレス・マッピングを実行するために交換網41の入
力ポートに設けられたトランスレータ53は、目標宛先
への経路上の交換網41から出力ポートを選択すること
(入力待ち行列の先頭にいるATMセルのヘッダー内の
宛先VCI/VPIアドレスに基づいて); 入力VC
I/VPIアドレスを出力リンクに適した値に書き直す
こと(VCI/VPIはエンドツウエンド有意性(end-
to-end significance)を持たないことを想起された
い);および後で詳しく説明するように、マルチキャス
ト伝送に必要なマッピングを管理すること、を含むいく
つかの機能を有する。これらのトランスレータ53は、
さらに、たとえば請求書作成やロード監視のために、バ
ーチャル回線ごとに交換されるATMセルの数のカウン
トを保持することができる。図3は、典型的なATMセ
ルの書式を示し、図4はATMセルの典型的なスイッチ
ヘッダーの書式を示す。セルヘッダー内の広域フローコ
ントロール(GFC)フィールドは通常はNULL値が
入ることに留意されたい。
【0021】B.バッチャー/バンヤン(Batcher/Bany
an) ネットワーク 交換網は、どの交換サイクルにおいてもその入力の任意
順列(arbitrary permutaton) または部分順列(partia
l permutation)を生成することができる場合には、「非
ブロッキング」であると言われる。言い換えると、非ブ
ロッキング式交換機は、考えられるすべての1対1入力
/出力マッピングを生成することができる。
【0022】交換網は、一般に単一交換機のカスケード
ネットワークすなわちステージで構成される。このよう
な交換網を通る経路は、決められた入力から決められた
出力へ交換機のステージを通る通路である。交換網は、
交換網内の各ステージごとに、そのステージに入ってく
るセルに含まれる情報すなわち局部的に入手可能な情報
だけで経路指定を決定することができる場合には、「自
己経路指定」と分類される。
【0023】バッチャー/バンヤンネットワークは、非
ブロッキング自己経路指定式交換網の知られた例であ
る。知られているように、バッチャーネットワークは、
一般に深さ log2 N(これはNlog2N個の分類要素が必
要であることを意味する)のネットワークでN個のデー
タストリームを分類する並行分類ネットワークである。
図5に示すように、各分類要素62は、2つの入力(A
およびB)を受け取り、最小値と最大値を計算すること
によって入力を分類する。従って、もし入力が始めに最
上位ビットを有する2ビット直列データストリームの形
をしていれば、分類要素は、図6に示した非常に簡単な
有限状態マシン(finite state machine)64として機
能する。4つの入力、8つの入力、それ以上の入力につ
いては、通例、これらの分類要素62を再帰的に組み合
わせて分類ネットワーク65すなわちソーターが作られ
る(図7参照)。
【0024】図8に示すように、標準バンヤン経路指定
ネットワーク71は深さ log2 Nの複数ステージのネッ
トワークである。ここで、Nはネットワークへの入力数
である。バンヤン経路指定ネットワーク71は、バッチ
ャー分類ネットワーク65と同様に、2つの入力と2つ
の出力を有する基本交換要素72を再帰的に組み合わせ
て構成される。従って、バンヤンネットワーク71に
は、O(Nlog2N)個の基本交換要素72がある。デー
タシーケンスがバンヤンネットワーク71を通って流れ
るとき、バンヤンネットワーク71の各ステージにある
基本要素72は、出力アドレスの1ビットを調べ、その
ビットの値に従って、そのデータシーケンス内のそのビ
ットおよび後続のすべてのビットを一方または他方の出
力へ経路指定する。慣例に従って、アドレスビットは各
ステージごとに変わるので、第1ステージは最上位アド
レスビットの値に基づいて経路指定を行い、第2ステー
ジは第2の上位アドレスビットの値に基づいて経路指定
を行い、N番目のステージは最下位アドレスビットの値
に基づいて経路指定を行う。N個のアドレスビットが処
理された後、シーケンスの残りの部分は交換機の出力へ
設定された経路をたどる。これは、あるシーケンスの終
端と次のシーケンスの始端を外部因子によって決定する
必要があることを意味する。従って、この例の場合、各
シーケンスは固定サイズATMセル+その固定サイズス
イッチヘッダーであることを想起されたい。
【0025】バンヤンネットワーク71のどのステージ
においても、2つの入力が同一出力を選択する可能性が
ある。もしそれが起きれば、バンヤンネットワーク71
は、「ブロックする」ので、不確定な結果が生じる。言
い換えると、バンヤンネットワーク71はその入力の任
意順列を計算することができない。しかし、バンヤンネ
ットワーク71は「非ブロッキング」であるから、順列
のクラスが存在する。これらのクラスの1つは、入力が
出力アドレスによって順序付けられるクラスである。こ
のため、非ブロッキング自己経路指定である交換網41
を得るために、図2に示すように、バッチャー分類ネッ
トワーク42はバンヤン経路指定ネットワーク43,4
4の前にある。
【0026】図2に示すように、複数のバンヤン経路指
定ネットワーク43,44(一般に、2または3個)を
使用して、出力競合(output contention)を減らすこと
が好ましい。たとえば、図示した実施例の場合は、k=
2のスピードアップ率を得るために、バッチャー分類ネ
ットワーク42の後方に2個のバンヤン経路指定ネット
ワーク43,44が存在する。各バンヤン経路指定ネッ
トワーク43,44は入力の1/kのみを使用するの
で、他の入力はふさがれる。バッチャー分類ネットワー
ク42のk番目の出力がバンヤン経路指定ネットワーク
43または44のk番目の入力に接続されるように、バ
ッチャー分類ネットワーク42の出力はバンヤン経路指
定ネットワーク43,44の入力に接続されている(こ
れは、図示のように、バンヤン経路指定ネットワーク4
3,44がバッチャー分類ネットワーク42の奇数およ
び偶数番号の出力をそれぞれ経路指定することを意味す
る)。従って、同一出力ポートへアドレスされたk個ま
での個別セルがバッチャー分類ネットワーク42の連続
するk個の出力に現れることができる。それらの個別セ
ルは、そのあとk個の別個のバンヤン経路指定ネットワ
ーク43,44を通して交換網41の目標出力ポートへ
経路指定することがきる。
【0027】C.予約リング 予約リング46(図2参照)は、単一出力へ宛てられた
セルの数がk以上のとき交換網41の出力ポートに対す
る「公正」なアクセスを実施する仲裁者である。「公
正」については多くの異なる定義がなされているが、交
換網41の競合中の入力ポートに対し総当たり(ラウン
ドロビン)サービスを提供する仲裁者が好まれる。
【0028】詳しく説明すると、予約リング46は、Ar
turo Cisneros, "Large Packet Switch and contention
Resolution Device," Proc.XII International Switch
ingSymposium,Stockholm,Sweden, May/June,1990. V3,
pp.77-83 の公表論文の教示に従って、それぞれが隣接
マシンとだけ通信する有限状態マシン76a,76
b,...76i,76(i+1)の線型短縮アレイ7
5(図9)として具体化される。線型短縮アレイたとえ
ばアレイ75を使用することの特にすぐれた利点は、す
べての通信がローカルであり、電気的負荷がアレイのサ
イズと共に増さないことである。このことがシステムの
線形スケーリングを可能にする。
【0029】上記論文の予約リング機構を修正すること
により、複数の経路指定ネットワーク43,44(すな
わち、k≧2のネットワーク)を有する交換網たとえば
交換網41に対する公正な総当たり競合解決策が得られ
ることが判った。作動中、有限状態マシン76a〜76
nは、交換網41の入力ポートに対応付けられた一組の
空間固定評価要素(spatially fixed evaluation eleme
nts)として機能し、これらの有限状態マシンすなわち評
価子76a〜76nを環状に通過するように状態情報の
ベクトルがシフトされる。これを実行するために、各評
価子76a〜76nは、内部アドレスレジスタRAi
外部シフト済アドレスレジスタSAi 、競合フラグビッ
トのための内部単一ビットレジスタFCi 、競合要求フ
ラグのための第2の内部単一ビットレジスタRCi 、ペ
ンディング競合要求フラグのための第3の内部単一ビッ
トレジスタFi 、シフト済競合フラグのための外部レジ
スタSCi 、走査ベクトルのための単一ビットレジスタ
i 、および内部(k−1)ビット log2 k mod k カ
ウンタCntri を備えている。さらに、各評価子76a〜
76nをアクティブ(InSession =0) 状態と非アクテ
ィブ(InSession =1) 状態の間で切り換えるための手
段が設けられている。
【0030】システムリセット時間に、すべての評価子
76a〜76nがリセットされ、その結果それらのアド
レスレジスタRAi ,SAi がクリヤされ、それらのカ
ウンタCntri と、フラグビットおよび状態RCi ,SC
i ,FCi ,Fi ,Ti および InSessioni が“0”す
なわち「偽」へセットされる。各仲裁サイクルの始め
に、評価子76a〜76nが交換網41の入力ポートに
対する入力待ち行列の先頭にいるアクティブセルを走査
し、これらのセルがアドレスされる出力ポートのアドレ
スを、内部アドレスレジスタRAi と外部アドレスレジ
スタSAi にロードする。もし入力ポートが非アクティ
ブであれば(すなわち、もしその入力待ち行列が空であ
れば)、評価子は非アクティブ状態(InSession =0、
i =0)へ切り換えられる。この初期化手順が終わっ
た後、一連の少なくとも(n−1)のシフトおよび比較
ステップが開始され、それによりアドレス値SAi と競
合フラグビットSCがリング内でシフトされる(すなわ
ち、ポートiの評価子におけるそれらの変数の値がポー
トi+1における評価子へシフトし、最後のポートの評
価子における変数の値が0番目のポートの評価子へシフ
トする)。Ti はシフトダウンするが、ポート0のT入
力は“1”のままである。
【0031】各シフトの後、アドレスレジスタRAi
SAi の内容が各評価子によって比較される。もしアク
ティブ評価子においてそれらが同一であると判れば、そ
の評価子は、その要求された競合フラグRCi とシフト
された競合フラグSCi とが同じ値にセットされている
かどうかを判断することによって、その同一性が正当な
仲裁セッションに由来するものかどうかを判断する。
【0032】もし評価子が正当な仲裁セッションの参加
者であれば、評価子は競合ベクトルTi の現在状態を検
査する。もしTi が依然として偽(“0”)であれば、
i番目の評価子は、交換網41のi番目の入力ポートに
あるアクティブセルと、その上の一定の入力ポートにあ
るアクティブセルとが同一出力ポートに対するアクセス
を争っていると判断する。どの交換サイクルにおいて
も、交換網41の同一出力ポートに対しk個までのセル
(しかし、k個のセルに過ぎない)を交換することがで
きるので、i番目の評価子は、交換網41内のそれより
上のどこかのポートと競合していることを発見すると、
カウンタCntri を単に増分する。しかし、もしカウンタ
Cntri がオーバーフローする前にi番目の評価子が真
(“1”)の競合ベクトル値Ti を受け取れば、i番目
の評価子は、カウンタCntri 内の現在カウント+同意信
号を入力バッファへ戻すことによって、交換網41のi
番目の入力ポートに対する入力待ち行列の先頭にいるセ
ルを解放し、要求された出力ポートへ切り換える。他
方、もし真(“1”)の競合ベクトル値Ti を受け取る
前にカウンタCntri がオーバーフローすれば、i番目の
評価子において競合フラグビットFCi とペンディング
競合フラグFi が真(“1”)状態へセットされ、要求
されたときすべての競合者に対し交換網41の要求され
た出力ポートに対するアクセスを総当たりトップダウン
順に許可するため、1つまたはそれ以上の付加交換サイ
クルの間競合セッションが延長される。
【0033】以上の説明は、次にように疑似コードでよ
り正確に要約することができる。 Constants: T0 =1 Variables per port evaluator: RA,SA:INT[ 0..NumPorts-1]; RC,SC:BOOL; FC,T,T:BOOL;(T=0=>port is above,
F=1=>arbitration is lost) InSession:BOOL; Cntr: INT[0..NumBanyans-1]; System Reset: RA←SA←0; RC←SC←FC←F←T←InSession ←0; Cntr←0; InitForArbitration: 1)if packet is newly presented for arbitraton,th
enFC←0; 2)RA←SA←RequestedPort; RC←SC←FC; F←T←0; InSession ←1; Cntr←0; 3)if this port not active this cycle,then[T←
1;InSession=0] ; ArbitrationStep: if InSession=1AND(RA=SA),then { CASE: --交換網内のより高いレベルに、同じ優先順位を有し、
同じ出力を望んでいる別のポートが存在する。
【0034】(SC=RC)AND(T=0):Cntr+
+;on overflow of Cntr,F←FC←1; --見掛けの競合者は交換網内のより低いレベルにあるポ
ートすなわち非アクディブポートにあって、同じ優先順
位を有する。 (SC=RC)AND(T=1):NULL; --見掛けの競合者はこの仲裁セッションの要素でない。 (RC=1)AND(SC=0):NULL; --このポートはこの仲裁セッションの正当な参加者でな
い。GET OUT ! (RC=0)AND(SC=1): {F←1;FC←1;InSession ←0; }; ENDCASE; }; Finalization: IfF=0 then FC←1; Send packet(Grant =1)on port Cntr if F=0.
【0035】もし所望ならば、どの正当な仲裁要求に
も、それが厳密に現在セッション中であるかどうかに関
係なく、仲裁セッションに参加することを許可するた
め、前に述べた予約リング機構46の InSession 制約
を緩和することができる。このより緩和された手法の利
点は、空交換サイクルの数が減るので、交換機の処理能
力が増すことである。この緩和バージョンの疑似コード
記述は以下の通りである。
【0036】Constants: T0 =1 Variables per port evaluator: RA,SA:INT[ 0..NumPorts-1]; RC,SC:BOOL; FC,T,T:BOOL;(T=0=>port is above,
F=1=>arbitration is lost) InSession:BOOL; Cntr: INT[0..NumBanyans-1]; System Reset: RA←SA←0; RC←SC←FC←F←T←InSession ←0; Cntr←0; InitForArbitration: 1)if packet is newly presented for arbitraton,th
enFC←0; 2)RA←SA←RequestedPort; RC←SC←FC; F←T←0; InSession ←1; Cntr←0; 3)if this port not active this cycle,then T←1 ArbitrationStep: if (RA=SA),then { CASE; --交換網内のより高いレベルに、同じ優先順位を有し、
同じ出力を望んでいる別のポートが存在する。
【0037】(SC=RC)AND(T=0):Cntr+
+;on overflow of Cntr,F←1; --見掛けの競合者は交換網内のより低いレベルにあるポ
ートすなわち非アクディブポートにあって、同じ優先順
位を有する。 (SC=RC)AND(T=1):NULL; --見掛けの競合者はこの仲裁セッションの要素でない。 (RC=1)AND(SC=0):NULL; --このポートはこの仲裁セッションの正当な参加者でな
い。GET OUT ! (RC=0)AND(SC=1): {InSession ←0; Cntr++;on overflow of Cntr,F
←1}; }; ENDCASE; Fc ←InSession &F }; Finalization: Send packet(Grant =1)on port Cntr if F=0.
【0038】D.代替仲裁処理 図10に、k個のバンヤン経路指定ネットワーク43,
44(図2)の出力ポートに対する「公正な」アクセス
を与えるもう1つの短縮アレイ手法(k≧2)を示す。
この実施において、各評価子78a〜78nは以下のよ
うに機能する。 Initialize for arbitration: counter:=0; Grant:=0; Arbitration step: lostLastTime-Out:=lostLastTime-In; resVec-Out:=resVec-In; lostThisTime-Out:=lostThisTime-In; IF couter = portRequested THEN { IF lostLastTime-In=0 OR ISetLostLastTime THEN { IF resVec-In=0 THEN { Grant:=1; ISetLostLastTime:=0 resVec-Out:=1; lostThisTime-Out:=0; }ELSE{ lostThisTime-Out :=1; ISetLostLastTime :=NOT lostThisTime-In; }; }; };
【0039】予約リング46のこの具体化において、第
1評価子78a(図示せず)は、“0”に拘束された r
esVec 入力と、予約リングの最後の要素の lostThisTim
e 出力に拘束された lostLastTime 入力を有することに
注目されたい。 resVec 入力を通してシフトされるビッ
トのストリームはベクトルを表しており、その要素は対
応する出力ポートの予約である。もし決められた出力ポ
ートに対し1以上の要求者が存在すれば、アクセスする
のに失敗した第1要求者がその対応付けられた“ ISetL
ostLastTime ”ビットを設定するので、リングの動作は
総当たり戦(ラウンドロビンフェア)である。仲裁サイ
クルが終了したとき、設定された“ ISetLostLastTime
”ビットをもつ多くの予約リング要素が存在すること
があるが、それらの各ビットは異なる出力ポートを指示
する。
【0040】理解されるように、図10のこの予約リン
グ機構は、1交換サイクルの間に複数の入力ポートに同
一出力ポートにアクセスすることを許すケースを扱える
ように拡張することができる。これは、予約ベクトル r
esVec をkビット幅にすることによって達成される。こ
こで、kは、1交換サイクル中に単一出力ポートへ送る
ことができる入力ポートの数である。そのとき、予約リ
ングは以下のように動作する。 Initialize for arbitration: counter:=0; Grant:=0; Arbitration step: lostLastTime-Out:=lostLastTime-In; resVec-Out:=resVec-In; lostThisTime-Out:=lostThisTime-In; IF couter = portRequested THEN { IF lostLastTime-In=0 OR ISetLostLastTime THEN { IF resVec-In NEQ“ all ones ”=0 THEN { Grant:=1; ISetLostLastTime:=0 resVec-Out[firstZero[resVec-In]]: =1; lostThisTime-Out:=0; }ELSE{ lostThisTime-Out :=1; ISetLostLastTime :=NOT lostThisTime-In; }; }; };
【0041】図10に示した形式のより大きな予約リン
グを2つ(またはそれ以上)のセクションに分割するこ
とが望ましいことがある。2つのリングの予約ベクトル
もやはりkビット幅である。しかし、第1セクションに
ついてはkビットの一部が“1”に初期化され、他方の
第2セクションについては対応するビットが“0”に初
期化される。残りのビットはトップが“0”に、そして
ボトムが“1”に初期化される。ロードは入力にわたっ
て均一に分散していると仮定すると、交換機は、近似的
に、あたかも唯一の予約リングが存在しているかのよう
に機能するが、2つのリングはある単一リングのクロッ
ク周波数の1/2で実行することができる。
【0042】もしトラヒックが分割された2つの半リン
グにわたって一様に分布していなければ、予約ベクトル
に対するビットの初期設定を変更することにより、どれ
か決められた出力ポートに対する帯域幅を2つの半リン
グの間でやりとりすることができる。予約リングの各半
分のトラヒックを計算する方法は、以下の2つがある
が、それらに限定されない。 1) 予約リングの各半分の最も下すなわち最後の評価
子の出力で、“1”に設定された“lostThisTime”ビッ
トの数をカウントする。 2) 予約リング要素を通してシフトされるデータスト
リームにカウンタのベクトルを加えて、各紛失(losin
g) 評価子に目標の出力ポートに対応付けられたカウン
タを増分させる。次に、最後の評価子から出るときこれ
らのカウンタの合計を求め、もしこの合計が所定のしき
い値以上であれば、分割された予約リングの間で帯域幅
を移す。
【0043】E.コピーネットワーク 図2のN×Nコピーネットワーク48は、1交換サイク
ルごとにj個までのATM入力セルIj (j≦N)を受
け取り、各セルの正確なコピーをCj 個作成する。各C
j 個のコピーはコピーグループと呼ばれる。理解される
ように、セルの複写は、「マルチキャスト操作」として
知られる操作における重要なステップである。
【0044】コピーネットワーク48に対する手法の根
底には、交換網41の使用に関する実行可能な3つの仮
定がある。第1は、各jごとに、Cj が非常にゆっくり
変わることである。第2は、すべてのコピーグループサ
イズの合計が≦Nであることである。第3は、Cj がj
のみの関数であることである。まとめると、これらの条
件は、各コピーグループによって作成されるコピーの数
が非常にゆっくり変わることを意味し、それはコピーグ
ループのメンバー数がセルの内容の関数でないことを意
味する。従って、静的ルーチング戦略によってどんなコ
ピーグループについてもjの特定値を選択することがで
きるので、コピーネットワーク48の1個の入力とCj
個の出力が各コピーグループに専用される。
【0045】標準クロスバー交換機の場合には、N個の
各入力はN個の各出力へ扇形に広がっている。これは、
1個の入力と複数個の出力の部分集合とを接続している
クロスポイントを「ON」にすれば、その入力がこれら
すべての出力へコピーされることを意味する。概念的
に、コピーネットワーク48は、コピーグループに対す
る入力として使用されるj個の入力、使用されない(N
−j)入力、および使用されるΣCj 個の出力を有する
N×Nクロスバーで構成される。しかし、実際問題とし
て、通常は、全クロスバーは必要ない。このことは、大
きなクロスバーはチップが高価であるばかりでなく、難
しいシステム実装問題を引き起こすので、幸運である。
【0046】より簡単で、しかも要求を満たすコピーネ
ットワーク48を構築する2つの手法がある。その1つ
は、コピーネットワーク48を2層のN/mクロスバー
(図示せず)として構築する。ここで、mは1チップに
実装されるクロスバーのサイズである。第1層の各クロ
スバーの少なくとも1個(たぶん、もっと多く)の出力
は、第2層の各クロスバーチップ上の入力に接続され
る。このコピーネットワーク48は完全に接続される
が、「非ブロッキング」ではない。もし以下の条件(す
なわち、コピーグループの平均サイズがgであれば、コ
ピーネットワークの第1層の各クロスバーと第2層のど
れかのクロスバーとの間に少なくともm/gの接続がな
ければならない。)が保持されれば、このことは満たさ
れる。小さいシステムの場合は、64×64までのサイ
ズのクロスバーが市販されているので、このことは問題
を引き起こさないであろう。コピーネットワーク48の
この具体化は実現可能であるが、より大きな交換網の場
合は、固有の実装問題があるので、ある程度不利であ
る。たとえば、もし1ビットより広いデータ経路を使用
してクロック速度を減らせば、背面のピンの必要数が増
えるであろう。他方、もしデータ経路が狭ければ、クロ
ックの分布に相当な注意を払わなければならない。すな
わち入力/出力回線は埋込み型クロックを備えていなけ
ればならない。
【0047】幸運なことに、図2に示すように、コピー
ネットワーク48の最も普通の使用が小コピーグループ
であるアプリケーションには、代りの案を用いることが
できる。すなわち、コピーグループとして必要な数のセ
ルコピーCj を作成するためにマルチノードスパントリ
ー(multi-node spanning tree) が必要なときは、交換
網41自身を使用して、コピーネットワーク48の複数
の「バーチャル回線層」を相互接続することが可能であ
る。コピーネットワーク48のこの好ましい実施例は、
2種類の基板(交換網41と、それぞれがp個の回線ご
とに完全な論理を有するN/p個の同一回線カード)を
使用して具体化することができるので、自然なシステム
実装を用いることと両立する。図2に示すように、回線
カードの論理は、(そのp個の回線ごとに)入力リンク
84と出力リンク85、VCIトランスレータ53、予
約リング評価子(図9および図10参照)、すべての入
力および出力バッファリング、およびp×pクロスバー
86を有する。このようなコピーネットワーク48を使
用するときは、pより大きなグループ(ここでは、p=
8)へのマルチキャスト(multicast)または同報通信(b
roardcast)は、前記グループへマルチキャストすること
によって処理されるので、セルは交換網41を通って3
つの旅をする。
【0048】F.入力および出力バッファリング−待ち
行列戦略− 交換網41は、共用待ち行列でなく、分散形待ち行列
(各入力回線および出力回線ごとの1つまたはそれ以上
の専用待ち行列)を使用する。知られているように、共
用待ち行列は、すべての回線にわたってバッファ空間を
動的再配置するのに役に立つ、すなわちバッファメモリ
をより効率的に使用するのに役に立つ手法である。しか
し、この場合はバッファの利用を最適にするよりも設計
の単純さのほうが重要であるので、交換機に公正なサー
ビス訓練を課すと同時に、入力回線と出力回線を互いに
分離するための手段が設けられている。従って、もし数
個の入力がトラヒックを運ぶ出力の能力をかなり越える
レートで伝送すれば、セルは入力回線のためのバッファ
またはその特定出力のためのバッファのどちらかにおい
て交換機によって失われるであろう。
【0049】LAN21(図1)は、簡単なフロー制御
機構を適切に使用して、保証トラフィックロードを制限
する。詳しく述べると、LANのサービスを受けるソー
ス31,32などのワークステーション、その他のコン
ピュータのネットワークインタフェースのハードウェア
/ソフトウェア(図示せず)に依存して、保証トラヒッ
クのレートを制限する。慣例に従って、事前に資源予約
を行った保証トラヒックストリームを指示するために、
VCI参照用テーブル内の resTraf ビット(スイッチ
ヘッダーへコピーされる)が使用される。従って、交換
機22〜25のそれぞれの入力ポートごとに、少なくと
も2つの入力待ち行列(保証トラヒック用と非保証トラ
ヒック用)が存在する。もし非保証トラヒック用待ち行
列が一杯であれば、非保証セルは待ち行列に入れない。
【0050】IV. システム操作 A.ユニキャスト(unicast) ユニキャスト(単数宛)伝送は、所定のバーチャル回線
アドレス(VCI)によって定義されるように、複数の
ソースから指定された単一宛先へのセルの通常の経路指
定である。任意の決められた交換機たとえば図2の交換
機22において、交換網41の1つの入力ポートのため
の入力リンク84にセルが到着すると、ユニキャスト操
作が始まる。入力リンク84内の論理(図示せず)はセ
ルヘッダーのVCIフィールドを検査し、非零値が入っ
ていること(すなわち、セルが空でないこと)を確かめ
る。もしセルがこの試験をパスすれば、決められた入力
ポートに対する入力バッファ51の状態を検査し、セル
を受け入れることができるか否かを決定する。この受入
れ/拒絶決定を行う場合は、セルのヘッダー内のセル紛
失優先権(cell loss priority; 略してCLP )ビット
の状態を考慮に入れることが好ましい。たとえば、
(1)バッファ51が一杯でなく、CLPビットがリセ
ットされた場合、あるいは(2)バッファ51が全体の
半分ほどふさがっている場合だけ、セルは入力バッファ
51へシフトされる。
【0051】交換網41の各入力ポートにあるバーチャ
ル回線トランスレータ53は、入力バッファ51とクロ
スバーバッファ52の両方からセルを取り出す。優先権
はクロスバーバッファ52に与えられる。理解されるよ
うに、トランスレータ53は、出力競合のために予約リ
ング46にブロックされたセルが存在しない場合だけア
クティブである。上記のブロッキング状態が存在しない
場合は、各交換サイクルの始めに、2個の入力FIFO
バッファ51,52が検査され、クロスバーバッファ5
2(第1の選択)または入力バッファ51(第2の選
択)の一方からセルが取り出される。これらのFIFO
バッファ51,52が共に空であれば、NULLセルす
なわち全部がゼロの空セルが生成される。
【0052】バーチャル回線トランスレータ53では、
選択されたセルのヘッダーの始めの4バイトが「4バイ
ト+10ビット」遅延バッファ(図示せず)へシフトさ
れ、セルの残り(たとえば、標準ATMセルのケースで
は、49バイトの情報)がVCI変換FIFOバッファ
(図示せず)へシフトされる。このヘッダーに含まれて
いるVCI値は、そのあとVCI変換テーブル54にイ
ンデックスすることによって、スイッチヘッダー(swit
ch header: 図4参照)を生成する情報を得るために使
用される。このスイッチヘッダーは前記遅延バッファの
始めの10ビットに書き込まれる。VCI変換テーブル
53は、さらに、新しいVPI/VCI値をセルに提供
する。この新しいVPI/VCI値を使用して、古いV
PI/VCI値に上書きされ、そのあとATMセルのヘ
ッダーのチェックサムすなわち“HEC”フィールド
(図3参照)が更新される。
【0053】スイッチヘッダーは、セルが空かどうかを
指示するアクティブフラグ(1ビット)、出力ポートア
ドレス(2個の並列32ポートバンヤンによって提供さ
れる64ポート用の6ビット)、およびストッパービッ
ト(デュアルバンヤン交換網41用の1ビット、その出
所と機能は後で詳しく説明する)を含むように適当に書
式化されている。さらに、スイッチヘッダーは、一般
に、出力ポートがセルをコピーネットワーク48へ送る
べきかどうかを指示するマルチキャストフラグ(1ビッ
ト)、コピーネットワーク上の予約トラフィックと未予
約トラフィックとを区別する予約トラヒック(RT)ビ
ット(1ビット)、オーバーロードの場合にそのセルが
脱落するのにふさわしい候補か否かを指示するセル紛失
優先権(CLP)フラグ(1ビット)(このビットは、
ATMヘッダー内のCLPビットのコピーである)、お
よびスイッチヘッダーの長さが2バイトになるようにス
イッチへッダーに詰めるための予約ビット(5ビット)
を含んでいる。
【0054】実際には、バッチャー/バンヤン交換網4
1(図2)は、既知の技法に従って、その入力ポートと
出力ポートの間に1バイト幅(8ビット幅)のデータ経
路を与えるように構成することが好ましい。スイッチヘ
ッダーの始めのバイト(すなわち、アクティブビット、
出力ポートアドレス、およびストッパービット)は上記
のデータ経路上でビット並列モードで伝送されるが、ス
イッチヘッダーの残りのバイトとATMセルの全53バ
イトは、交換網41の並列データ経路構造を活用するた
めに、バイト並列モードで伝送することが好ましい。
【0055】バーチャル回線トランスレータ53によっ
て処理されたセルは、予約リング46の仲裁制御を受け
る。その仲裁機能を実行するために、予約リング46は
交換網41への入力待ち行列の先頭にいるセルのヘッダ
ーのみを検査し、これらのセルの間に競合状態が存在す
るかどうかを判断し、もし存在すれば、それらの競合を
解決する。実際には、VCI変換バッファ(図示せず)
は制限付き深さ(bounded depth)のものである。
【0056】交換網41(図2)の決められた入力ポー
トのための評価子(図9および図10参照)が仲裁ラウ
ンドに勝った時はすぐに、その入力ポートに待機中のセ
ルが交換ファブリック41を通して送られる。図示のよ
うに、交換機の基本構造は、2個のバンヤンネットワー
ク43,44(k=2)より成り、各ネットワーク4
3,44は最終的に選択された出力ポートのための出力
バッファ45に接続している。もしセルがアクティブで
なければ(すなわち、もしセルに事前に付けられたスイ
ッチヘッダーのアクティブビットが0であれば)、セル
は出力バッファ45によって待ち行列に入れられないて
あろう。他方、もしセルがアクティブであって、そのス
イッチヘッダー内の resTrafビットが“ON”であれ
ば、セルは保証トラフィックのために予約された出力バ
ッファ45のセクションで待ち行列に入れられるであろ
う。あるいは、もしセルがアクティブであって、その r
esTrafビットが“OFF”であれば、セルは非保証(未
予約)トラフィックのために予約された出力バッファ4
5のセクションに置かれる。
【0057】任意の決められた出力バッファ45の保証
待ち行列内のセルは、常に非保証待ち行列内のセルのど
れかの前で待ち行列から出される。セルがユニキャスト
されているとき、スイッチヘッダー内のマルチキャスト
ビットは“OFF”(“0”)にされるので、ユニキャ
ストセルが待ち行列から出されるとき、対応付けられた
出力バッファ45へ送られるように、セルに標識が付け
られる。
【0058】想起されるように、スイッチヘッダーの最
初のバイトは全8ビットにわたって(すなわち、全部の
並列データ経路にわたって)複製され、他方の第2のバ
イトはバイト並列モードで伝送されるので、スイッチヘ
ッダーはセル長に9バイトを付加する。さらに、出力リ
ンクでは、53バイト長セルにフレーミング情報の2バ
イトが付加されるので(図示してない通常手段によっ
て)、出力バッファ45におけるバイトレートは、それ
が接続されている出力リンク85のバイトレートより少
なくとも(53+9)/(53+2)倍大きい。この不
釣合いを調整するために、一般に、各出力バッファ45
をその対応する出力リンク85に対し速度整合する短い
FIFOバッファ(図示せず)が設けられる。
【0059】B.マルチキャスト(multicast) 前に指摘したように、マルチキャスト(多数宛)グルー
プは、複数のネットワークの宛先をアドレッシングする
バーチャル回線である。従って、交換機の各ステージ
は、グループ内のすべての宛先へ入力セルのコピーを送
るためアクセスしなければならない交換機の出力ポート
を知っていなければならない。単一交換機たとえば交換
機22(図1)の見地から、マルチキャストグループ
は、既知の一組の宛先VCIへ経路指定すべきセルを指
定するVCI/VPIペアである。本発明の交換機の特
徴の1つは、マルチキャストセルの経路指定を2段階で
実行することである。すなわち、最初に正しい入力コピ
ーネットワーク48を通してマルチキャストセルを経路
指定することによって正しい数のコピーを作成し、次に
これらのマルチキャストセルのコピーを交換網41を通
して意図した宛先へ個別に再経路指定する。
【0060】マルチキャスト操作は、ユニキャスト操作
と同じステップで始まる。VCI変換プロセスのとき、
インデックス付きエントリVCI変換テーブル54(図
2)は、入力セルのヘッダー内のVCIがユニキャスト
アドレスを示すかマルチキャストグループアドレスを示
すかを指定するので、最初の違いが生じる。従って、マ
ルチキャストVCIを有するセルについて、スイッチヘ
ッダー内のマルチキャストビットが設定される。次に上
記セルは交換網41を通って、交換網41が名前付きマ
ルチキャストVCIを見て結び付けた出力バッファ45
の待ち行列へ行く。その待ち行列から出るとき、マルチ
キャストビットの状態は、対応付けられた出力リンク8
5へでなく、決められた出力バッファ45に接続された
コピーネットワーク48の入力を経由してコピーネット
ワーク48へセルを戻すように、ハードウェアに命令す
る。次にコピーネットワーク48は、セルの一定の数の
同一コピー、たとえばj個のコピーを作成する。次にこ
れらのコピーは決められたコピーグループに専用のコピ
ーネットワーク48のj個の出力へ個別に経路指定され
る。次にj個の各出力は受け取ったコピーを、交換網4
1の入力ポートのためのクロスバーすなわちコピーネッ
トFIFOバッファ52へ送り込む。各コピーのヘッダ
ー内のアクティブビットは空セルとアクティブセルを区
別するので、FIFOバッファ52はアクティブセルを
待ち行列に入れ、空セルを廃棄することができる。
【0061】決められたコピーグループに対応付けられ
た一組のコピーネットFIFOバッファ52において待
ち行列に入れられた後、前に述べたように、セルはバー
チャル回線トランスレータ53によって正規の順序で取
り出される。各バーチャル回線トランスレータ53はそ
れぞれ別個のVCI変換テーブル54を有しているの
で、セルのj個のコピーはj個の異なるVCI変換を受
け取る。従って、j個の各セルについて、後続の処理ス
テップは、ユニキャストセルすなわち交換網41を通る
マルチキャストセルの最初のパスと同じである。
【0062】理解されるように、交換機のどれかの交換
網41を通るマルチキャストセルの経路指定は、バーチ
ャル回線トランスレータ53中で起きるVCIの再書込
みによって決まる。たとえば、jをマルチキャストグル
ープのサイズとし、 vci、 vci′i 、および vci″i を
マルチキャスト操作のとき連続するマルチキャストセル
がとるVCI値であるとする(0<i<j)。セルが最
初に交換機22(図2)に入るとき、そのVCI値は v
ciである。従って、セルがバーチャル回線トランスレー
タ53の1つを最初に通る際に、前記値 vci に基づい
て、セルに対するスイッチヘッダーが生成され、それに
よりセルヘッダーのVCI値が vci′へ書き直される。
その結果、コピーネットワーク48を出るときには、セ
ルの正確なコピー(それぞれが vci′のVCI値を有す
る)がj個ある。そのあと、各コピーは、対応するトラ
ンスレータ53においてj個の異なるVCI変換テーブ
ル54(それぞれに、 vci′番目のエントリ用の異なる
変換が入っている)を使用して変換される。従って、コ
ピーネットワーク48から出てくるj個のセルのi番目
のコピーは、独自のスイッチヘッダーと vci″i の独自
のVCI値を受け取る。
【0063】幾つかの実例においては、交換機の複雑さ
を減らすために、コピーネットワーク48を単一基板ま
たはカード(図示せず)に実装することが望ましいこと
がある。たとえ回線カードのサイズより大きなコピーグ
ループが許されても、交換機自身を用いてコピーネット
ワーク48の連続するレイヤを相互に接続することがで
きるので、これは実行可能なオプションである。操作
上、これは、複数レベルのマルチキャストグループを許
すことによって行われる。言い換えると、トランスレー
タ53の所で、コピーネットワーク48から出てくるj
個のコピーのVCIを後続のマルチキャストグループの
ためのVCIに変換することができ、そしてこれらのコ
ピーのためのスイッチヘッダーのマルチキャストフラグ
ビットを設定することにより、交換機にコピーを再経路
指定させ、コピーネットワーク48を通して戻すことが
できる。もしこのオプションを使用すれば、上例からの
i番目のセルは、そのセルのスイッチヘッダーのマルチ
キャストビットが零に設定されたか否かに従って、ユニ
キャストセルとして残りの交換機によって処理される
か、またはマルチキャストセルとして再び処理されるで
あろう。もしコピーネットワーク48から出てくるコピ
ーが異なるマルチキャストセルであれば、交換網41を
別に通過するとき、そのセルのヘッダーの vci″、 vc
i′′′、および vci′′′′のVCI値が生成される
であろう。
【0064】手短に言うと、コピーネットワーク48の
注目すべき多くの特徴の1つは、いろいろなサイズのコ
ピーグループに適合するようにコピーネットワーク48
を簡単にプログラムできることである。このプログラミ
ングはVCI変換テーブル54に組み込まれているの
で、コピーグループのメンバー数に対する変更は、1つ
またはそれ以上の変換テーブル54を再構成する必要が
あるので、最小限にすべきである。
【0065】以上の説明から、本発明の予約リング機構
は、出力の競合を公正な総当たり(ラウンドロビン)順
方式で有効に解決すること、そして交換機の処理能力に
及ぼす影響が最小限度であることを理解されるであろ
う。
【図面の簡単な説明】
【図1】本発明に従って構成された階層型ATM LA
Nを示す略図である。
【図2】本発明に従って構成されたATM交換機を示す
略図である。
【図3】ATMセルの通常の書式を示す図である。
【図4】ATMセルのための典型的なスイッチヘッダー
を示す図である。
【図5】バッチャー分類要素を示す略図である。
【図6】バッチャー分類要素の作用を示す有限状態マシ
ンの図である。
【図7】図5に示した形式の分類要素の再帰的組合せよ
り成るバッチャー分類ネットワークを示す略図である。
【図8】バンヤン経路指定ネットワークを示す略図であ
る。
【図9】予約リング機構を示す略図である。
【図10】本発明に従って構成された予約リング機構を
示す略図である。
【符号の説明】
21 階層型LAN 22〜25 自己経路指定非ブロッキング式交換機 27 ATMセル 31,32 ソース 33 宛先 41 バッチャー/バンヤンネットワーク(交換網) 42 バッチャー分類ネットワーク 43,44 バンヤン経路指定ネットワーク 45 FIFOバッファ 46 予約リング 48 n×nコピーネットワーク 51,52 FIFOセルバッファ 53 VCIトランスレータ 54 VCI参照用テーブル(VCI変換テーブル) 62 分類要素 64 有限状態マシン 71 標準バンヤン経路指定ネットワーク 72 基本交換要素 75 線形短縮アレイ 76 有限状態マシン 84 入力リンク 85 出力リンク 86 p×pクロスバー 100 交換機 101 入力回線 102 出力回線 103 別の入力回線 104 別の出力回線 106 交換網
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.5 識別記号 庁内整理番号 FI 技術表示箇所 8529−5K H04L 11/20 102 Z (72)発明者 アレン ジー ベル アメリカ合衆国 カリフォルニア州 94301 パロ アルト エマーソン スト リート 2125

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 分類ネットワークと、前記分類ネットワ
    ークの次に配置され、複数の入力から複数の出力へパケ
    ットを経路指定する複数の経路指定ネットワークを有す
    る交換網において、指定された出力に対するアクセスを
    争っている入力間の対立を解決するための予約リング機
    構であって、 少なくとも1仲裁サイクルの間にトップツウダウン順に
    環状に一連のステップおよび比較操作を実行し、前記競
    合している入力が指定された出力に対しトップツウダウ
    ン順にアクセスするのを許可する手段を備えていて、少
    なくとも最大許容数の競合者が指定された出力について
    競合状態にある時はいつも、前記各仲裁サイクル中に前
    記数の競合者に上記出力へのアクセスを許可することを
    特徴とする予約リング機構。
JP10817893A 1992-05-20 1993-05-10 パケット交換網の予約リング機構 Withdrawn JPH0637797A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US88751892A 1992-05-20 1992-05-20
US07/887518 1992-05-20

Publications (1)

Publication Number Publication Date
JPH0637797A true JPH0637797A (ja) 1994-02-10

Family

ID=25391323

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10817893A Withdrawn JPH0637797A (ja) 1992-05-20 1993-05-10 パケット交換網の予約リング機構

Country Status (4)

Country Link
US (1) US5519698A (ja)
EP (1) EP0571166B1 (ja)
JP (1) JPH0637797A (ja)
DE (1) DE69332347T2 (ja)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5633867A (en) * 1994-07-01 1997-05-27 Digital Equipment Corporation Local memory buffers management for an ATM adapter implementing credit based flow control
US5680589A (en) * 1995-06-08 1997-10-21 Klingman; Edwin E. Ring communication system using ISDN
AU6501496A (en) * 1995-07-19 1997-02-18 Ascom Nexion Inc. Point-to-multipoint transmission using subqueues
US5907552A (en) * 1995-09-08 1999-05-25 Nextlevel Communications FTTC interface circuitry as a physical layer entity
DE19540160C2 (de) * 1995-10-27 2000-05-31 Andreas Kirstaedter Verfahren zur Koordinierung über serielle Leitungen von eingangsgepufferten ATM Vermittlungseinrichtungen zur Vermeidung von Ausgangsblockierungen
US5689508A (en) * 1995-12-21 1997-11-18 Xerox Corporation Reservation ring mechanism for providing fair queued access in a fast packet switch networks
US5813040A (en) * 1995-12-29 1998-09-22 Gte Laboratories Inc Write controller for a CAM-based switch with lineraly searchable memory utilizing hardware-encoded status tags to indicate avaliablity of each memory location for writing
US5774463A (en) * 1995-12-29 1998-06-30 Gte Laboratories Incorporated Switching matrix with contention arbitration
US5862128A (en) * 1995-12-29 1999-01-19 Gte Laboratories Inc Merged buffer signal switch
JP2000517488A (ja) 1996-01-16 2000-12-26 フジツウ ネットワーク コミュニケーションズ,インコーポレイテッド Atm網用の信頼性と柔軟性のあるマルチキャスト機構
US6148000A (en) * 1996-10-02 2000-11-14 International Business Machines Corporation Merging of data cells at network nodes
KR100208949B1 (ko) * 1996-10-14 1999-07-15 윤종용 확장된 링-베니언 네트워크 및 그 경로 제어방법
US5835491A (en) * 1996-11-21 1998-11-10 Xerox Corporation Method for supporting multicast capabilities in switching networks with a reservation ring
US5912889A (en) * 1996-11-21 1999-06-15 Xerox Corporation ATM switch with output port clustering for dynamically allocating bandwidth between ports
US5883895A (en) * 1996-11-21 1999-03-16 Xerox Corporation Arbitration ring with automatic sizing for a partially populated switching network
US5949789A (en) * 1996-11-21 1999-09-07 Xerox Corporation Arbitration ring for accessing a limited bandwidth switching network
US6094712A (en) * 1996-12-04 2000-07-25 Giganet, Inc. Computer network interface for direct mapping of data transferred between applications on different host computers from virtual addresses to physical memory addresses application data
US5978379A (en) 1997-01-23 1999-11-02 Gadzoox Networks, Inc. Fiber channel learning bridge, learning half bridge, and protocol
US6370571B1 (en) * 1997-03-05 2002-04-09 At Home Corporation System and method for delivering high-performance online multimedia services
US7529856B2 (en) * 1997-03-05 2009-05-05 At Home Corporation Delivering multimedia services
US5930256A (en) * 1997-03-28 1999-07-27 Xerox Corporation Self-arbitrating crossbar switch
US5903564A (en) * 1997-08-28 1999-05-11 Ascend Communications, Inc. Efficient multicast mapping in a network switch
US6169744B1 (en) 1998-01-07 2001-01-02 3Com Corporation Method and protocol for a medium access control layer for local area networks with multiple-priority traffic
US6246692B1 (en) * 1998-02-03 2001-06-12 Broadcom Corporation Packet switching fabric using the segmented ring with resource reservation control
US6377575B1 (en) 1998-08-05 2002-04-23 Vitesse Semiconductor Corporation High speed cross point switch routing circuit with word-synchronous serial back plane
US6654374B1 (en) 1998-11-10 2003-11-25 Extreme Networks Method and apparatus to reduce Jitter in packet switched networks
US6714517B1 (en) 1998-11-10 2004-03-30 Extreme Networks Method and apparatus for interconnection of packet switches with guaranteed bandwidth
US6970424B2 (en) 1998-11-10 2005-11-29 Extreme Networks Method and apparatus to minimize congestion in a packet switched network
US7430171B2 (en) 1998-11-19 2008-09-30 Broadcom Corporation Fibre channel arbitrated loop bufferless switch circuitry to increase bandwidth without significant increase in cost
DE19854656A1 (de) * 1998-11-26 2000-06-08 Siemens Ag Verfahren zum Abstimmen von Paketverlustprioritätsinformationen für eine Überlaststeuerung einer Datenpakete vermittelnden Kommunikationseinrichtung
WO2000052889A1 (en) * 1999-03-05 2000-09-08 Allayer Technologies Corporation Packet switching fabric having a segmented ring with token based resource control protocol and output queuing control
US6556571B1 (en) 1999-05-25 2003-04-29 Nec Usa, Inc. Fast round robin priority port scheduler for high capacity ATM switches
US7315552B2 (en) 1999-06-30 2008-01-01 Broadcom Corporation Frame forwarding in a switch fabric
US6711125B1 (en) 1999-08-02 2004-03-23 Extreme Networks Provisioning networks for reliable quality of service
US6674760B1 (en) 1999-09-28 2004-01-06 Extreme Networks, Inc. Method and system for implementing end-to-end QoS in packet-switched networks
US7046665B1 (en) 1999-10-26 2006-05-16 Extreme Networks, Inc. Provisional IP-aware virtual paths over networks
JP3475900B2 (ja) * 2000-03-29 2003-12-10 日本電気株式会社 調停方式及びそれを用いたアービタ回路
EP1307820B1 (en) * 2000-06-06 2014-07-23 Vitesse Semiconductor Corporation Crosspoint switch with switch matrix module
DE60126533T2 (de) * 2000-06-19 2007-11-22 Broadcom Corp., Irvine Vermittlungsstelle mit einer Speicherverwaltungeinheit zur Verbesserung der Flusssteurung
US6985963B1 (en) * 2000-08-23 2006-01-10 At Home Corporation Sharing IP network resources
EP1325597A2 (en) * 2000-10-04 2003-07-09 Vitesse Semiconductor Corporation A data communication network switching unit having a systolic ring structure
US7006513B1 (en) * 2001-05-11 2006-02-28 Turin Networks Method and system for pipelining packet selection
GB0116224D0 (en) * 2001-07-03 2001-08-29 Roke Manor Research Improvements to hierarchical mobility protocols
EP1294143A3 (de) * 2001-09-03 2008-04-02 Nokia Siemens Networks Gmbh & Co. Kg Gekennzeichneter Prioritätwarteschlangescheduler
JP2003124953A (ja) * 2001-10-15 2003-04-25 Fujitsu Ltd リング型ネットワークシステム
US7382734B2 (en) * 2004-05-20 2008-06-03 Hewlett-Packard Development Company, L.P. Directing a path verification request along a specific path to a mesh network switch to test operability of the specific path
US7609705B2 (en) * 2004-05-20 2009-10-27 Hewlett-Packard Development Company, L.P. Determination of a plurality of paths before selection of one path of the plurality of paths for transmission of one or more packets
US7797326B2 (en) * 2006-04-18 2010-09-14 International Business Machines Corporation Method of obtaining data samples from a data stream and of estimating the sortedness of the data stream based on the samples
KR20120084234A (ko) 2011-01-19 2012-07-27 삼성전자주식회사 Mpeg media transport(mmt)에서 mmt au를 전송하는 방법

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4761780A (en) * 1986-12-22 1988-08-02 Bell Communications Research, Inc. Enhanced efficiency Batcher-Banyan packet switch
US4797880A (en) * 1987-10-07 1989-01-10 Bell Communications Research, Inc. Non-blocking, self-routing packet switch
US4893304A (en) * 1988-09-02 1990-01-09 Bell Communications Research, Inc. Broadband packet switch with combined queuing
US4866701A (en) * 1988-09-02 1989-09-12 Bell Communications Research, Inc. Packet switch with dynamic allocation of inputs
US4891803A (en) * 1988-11-07 1990-01-02 American Telephone And Telegraph Company Packet switching network
CA2048198C (en) * 1990-08-09 1996-06-04 Kai Y. Eng Growable switch
JPH04229747A (ja) * 1990-08-17 1992-08-19 Hitachi Ltd パケット交換方法、およびパケット交換システム
US5130984A (en) * 1990-12-18 1992-07-14 Bell Communications Research, Inc. Large fault tolerant packet switch particularly suited for asynchronous transfer mode (ATM) communication
US5303078A (en) * 1990-12-18 1994-04-12 Bell Communications Research, Inc. Apparatus and method for large scale ATM switching
US5305311A (en) * 1992-05-20 1994-04-19 Xerox Corporation Copy network providing multicast capabilities in a broadband ISDN fast packet switch suitable for use in a local area network

Also Published As

Publication number Publication date
EP0571166B1 (en) 2002-10-02
DE69332347D1 (de) 2002-11-07
EP0571166A2 (en) 1993-11-24
US5519698A (en) 1996-05-21
EP0571166A3 (en) 1997-10-22
DE69332347T2 (de) 2003-02-13

Similar Documents

Publication Publication Date Title
JPH0637797A (ja) パケット交換網の予約リング機構
JPH0637796A (ja) パケット交換機の改良型マルチキャスト機構
JP3447321B2 (ja) トランクグループ入力/出力モードを備えた交換機
JPH0637800A (ja) 非ブロッキング自己経路指定式交換網を有する交換機
US6667984B1 (en) Methods and apparatus for arbitrating output port contention in a switch having virtual output queuing
US6449283B1 (en) Methods and apparatus for providing a fast ring reservation arbitration
US5689508A (en) Reservation ring mechanism for providing fair queued access in a fast packet switch networks
Turner et al. Architectural choices in large scale ATM switches
US6487213B1 (en) Methods and apparatus for fairly arbitrating contention for an output port
Duan et al. A high-performance OC-12/OC-48 queue design prototype for input-buffered ATM switches
US5511070A (en) Reservation ring mechanism for controlling contention in a broadband ISDN fast packet switch suitable for use in a local area network
Sarkies The bypass queue in fast packet switching
US6643294B1 (en) Distributed control merged buffer ATM switch
Wong et al. Design and analysis of a novel fast packet switch-pipeline banyan
Yun A terabit multiservice switch
Kim Multinet switch: Multistage ATM switch architecture with partially shared buffers
Fahmy A survey of ATM switching techniques
Wong et al. Pipeline banyan-a parallel fast packet switch architecture
JPH0637798A (ja) パケット交換機の予約リング機構
Yun A terabit multi-service switch with Quality of Service support
Turner et al. Architectural Choices in Large Scale ATM Switches
Keyvani VHDL implementation of a high-speed symmetric crossbar switch
Shipley VLSI architectures for a new class of ATM switches
Tagle et al. A multicast switching network for B-ISDN
Wu et al. Traffic management circuit for the shared buffer memory switch with multicasting

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000801