JP7307388B2 - 光コア部を有する光ネットワーク、タイムスロット化した受信を使用するノード - Google Patents
光コア部を有する光ネットワーク、タイムスロット化した受信を使用するノード Download PDFInfo
- Publication number
- JP7307388B2 JP7307388B2 JP2022502787A JP2022502787A JP7307388B2 JP 7307388 B2 JP7307388 B2 JP 7307388B2 JP 2022502787 A JP2022502787 A JP 2022502787A JP 2022502787 A JP2022502787 A JP 2022502787A JP 7307388 B2 JP7307388 B2 JP 7307388B2
- Authority
- JP
- Japan
- Prior art keywords
- nodes
- optical
- node
- network
- switching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B10/00—Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
- H04B10/27—Arrangements for networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/12—Arrangements for remote connection or disconnection of substations or of equipment thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/70—Admission control; Resource allocation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
- H04Q2011/0007—Construction
- H04Q2011/0016—Construction using wavelength multiplexing or demultiplexing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
- H04Q2011/0037—Operation
- H04Q2011/005—Arbitration and scheduling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
- H04Q2011/0052—Interconnection of switches
- H04Q2011/0058—Crossbar; Matrix
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q2213/00—Indexing scheme relating to selecting arrangements in general and for multiplex systems
- H04Q2213/1301—Optical transmission, optical switches
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/50—Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- Electromagnetism (AREA)
- Optical Communication System (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Description
本発明は、光ネットワーク、そこに使用される光ノードおよび光伝送方式に関する。
データセンターとは、コンピューター(メインフレーム、ミニコンピューター、サーバー等)やデータ通信装置等を設置・運用することに特化した施設の総称である。データセンター(DC)ネットワークは、トラフィック量の大幅な増加に対応しながら、広範囲のサービスを提供するために急速に成長してきた。しかし、このような状況に対応するために、ネットワークの基本構造は大きく変化していない。
図1は、従来技術のDCネットワークの構成を示す図である。典型的なDCネットワークは複数のレイヤから構成され、例えば図1に示すように3層DCネットワークの構成を持つ。3層DCネットワーク100は、上位層側から、スイッチ101、光リンク102、スイッチ103、光リンク104、ToR(TopOfRack)スイッチ105、サーバー106を備えている。スイッチ101、103は、それぞれ上下の電気スイッチとそれらを接続する光リンク107、108から成っている。したがって図1のDCネットワークでは、2つのToR間で8ホップを有していることになる。各電気スイッチの広い範囲で、光-電気-光(OEO:Optical-Electrical-Optical)変換が実施される。
このようなDCネットワーク100では、1以上のサーバーからなるネットワークノードを接続するリンクにおいて、データは光信号として伝送される。各ノードにおいて、光信号は電気信号に変換され、電気スイッチすなわちASIC(Application Specific Integrated Circuit)スイッチによりスイッチングされる。ASICスイッチのスイッチング容量は大幅に増加し続けており、現在では12.8 Tb/sの容量を持つものも報告されている。
White Rabbit project webpage, インターネット<URL: https://www.ohwr.org/project/white-rabbit/wikis/home > K. Clark et al., "Sub-Nanosecond Clock and Data Recovery in an Optically-Switched Data Centre Network,"2018年, post-deadline paper in ECOC 2018, Italy
White Rabbit project webpage, インターネット<URL: https://www.ohwr.org/project/white-rabbit/wikis/home > K. Clark et al., "Sub-Nanosecond Clock and Data Recovery in an Optically-Switched Data Centre Network,"2018年, post-deadline paper in ECOC 2018, Italy
しかしながら、ASICスイッチのスイッチング容量の拡大はいずれ限界に達すると考えられる。その理由は、ASICスイッチの構成単位であるCMOS(Complementary Metal Oxide Semiconductor)トランジスタのサイズをさらに縮小することがますます困難になっているからである。CMOSトランジスタをより小さくするために、ポスト平面CMOS製造プロセスが求められている。しかしながら、このようなプロセスは技術的に難しく、非常にコストが掛かり、経済的に魅力的なものになるのは難しい。
より差し迫った問題は、ASICスイッチに入出力する光信号に、非常に高いデータレートが必要となっていることである。高いデータレートに対応するため、これまでプラガブルなトランシーバが使用されてきたが、データ密度の制限という厳しい障壁に直面している。トランシーバおよびASICスイッチのコパッケージ実装が近年注目を浴びており、プラガブルなトランシーバを置き換える新しい手法と考えられているが、このような先進的なアプローチを採用しても、消費電力の問題が残っている。
上述のようなすべての問題に対する根本的な解決法は、ASICスイッチにとって不可避な光‐電気‐光(OEO)変換を回避するかまたは少なくとも低減することである。そのため、DCネットワーク構造に光スイッチングを導入することが必要となる。
本発明はこのような問題に鑑みてなされたものであって、その目的とするところは、ASICスイッチの様々な限界を解決する新しいDCネットワーク構造の提案にある。
このような目的を達成するために、1つの実施態様は、フルメッシュネットワーク構成を有する光コア部と、前記光コア部に接続された複数のノードであって、複数のグループに分割されており、1つのグループ内に最大m個のノードが含まれている、複数のノードとを備え、前記複数のノードの各々は、ソースノードが属するグループに関連付けられたタイムスロットにおいてのみ、前記ソースノードが属する前記グループ内の任意のノードによってアドレス指定される光ネットワークである。
別の実施態様の光ネットワークは、前記複数のノードの各々が、m個のアレイ導波路回折格子(AWG)であって、当該AWGの複数の入力ポートは同一のグループに属する前記最大m個のノードから対応する光信号を受信し、前記複数の入力ポートの動作波長に適合するように、前記最大m個のノードの内の1つ以上のソースノードの使用波長が設定されている、AWGと、前記AWGの出力合波ポートに接続されたm個の受信機と、前記m個の受信機からの電気信号をスイッチングして、複数のサーバーにルーティングするASICスイッチとを有することができる。
上述の光ネットワークは、光ネットワーク内のネットワークノードの発明としての側面も持っている。
本開示の光ネットワークによりノード構成を簡略化し、ASICスイッチの容量、消費電力を減らす。光ネットワークの大規模化、低消費電力化にも対応する。
以下の開示では、所望のノード対間でエンドツーエンド光伝送を実現し、光スイッチングをコア部で使用して、電気的スイッチングをネットワーク周辺部でのみ使用する新しいDCネットワーク構造を提案する。
[光ネットワークのコア部構成]
図2は、本開示による新規なDCネットワークの構成を示す図である。詳細は後述するが、DCネットワーク1は、ネットワーク全体のコア部分であるフラット光ネットワーク2と、ネットワーク全体の周辺部にあるSW部3、ToR4、サーバー5とを含む。これらの周辺部の要素は、ノードの一部を構成する。図2では、簡単のため4つのToRを含むものを1ノードとして、2つのノードが示されているが、他の多くのノードがフラット光ネットワーク2の周辺にあるものと理解されたい。既に述べたように、コア部分であるフラット光ネットワーク2で光スイッチングを利用し、電気的スイッチングはその周辺部分であるSW部3およびその周辺側でのみ利用されるネットワークを提示する。図2の光ネットワーク構造はスケーラブルであり、任意の対のノード間の高度に動的な接続をサポートする。含まれるノード数に応じて、ネットワークのコア部分は、物理的なフルメッシュネットワークとして、または、フルメッシュ様ネットワークとして実装できる。
図2に示した本開示のDCネットワークで前提とするフルメッシュネットワークまたはフルメッシュ様ネットワークは、図1の従来技術のDCネットワーク100と比べて、コア部において光スイッチングのみを利用している点で相違している。図2のフラット光ネットワーク分では、図1の各階層のSW101、103におけるOEO変換を行わずに、光スイッチングのみを利用している。
[光ネットワークのコア部構成]
図2は、本開示による新規なDCネットワークの構成を示す図である。詳細は後述するが、DCネットワーク1は、ネットワーク全体のコア部分であるフラット光ネットワーク2と、ネットワーク全体の周辺部にあるSW部3、ToR4、サーバー5とを含む。これらの周辺部の要素は、ノードの一部を構成する。図2では、簡単のため4つのToRを含むものを1ノードとして、2つのノードが示されているが、他の多くのノードがフラット光ネットワーク2の周辺にあるものと理解されたい。既に述べたように、コア部分であるフラット光ネットワーク2で光スイッチングを利用し、電気的スイッチングはその周辺部分であるSW部3およびその周辺側でのみ利用されるネットワークを提示する。図2の光ネットワーク構造はスケーラブルであり、任意の対のノード間の高度に動的な接続をサポートする。含まれるノード数に応じて、ネットワークのコア部分は、物理的なフルメッシュネットワークとして、または、フルメッシュ様ネットワークとして実装できる。
図2に示した本開示のDCネットワークで前提とするフルメッシュネットワークまたはフルメッシュ様ネットワークは、図1の従来技術のDCネットワーク100と比べて、コア部において光スイッチングのみを利用している点で相違している。図2のフラット光ネットワーク分では、図1の各階層のSW101、103におけるOEO変換を行わずに、光スイッチングのみを利用している。
以下の開示では、各ノードにおいて、新規で実用的なデータ受信機構およびその関連ハードウェアを明らかにする。これらは、これまで必要としていた多数の光受信機ユニットおよび複雑な大容量スイッチング構成の一部を置き換えるものである。本開示の光ネットワークの構成の基本的なアプローチは、ネットワークノードから同じ宛先ノードへの伝送に対して、わずかな時間領域的制限を導入することにある。具体的には、ネットワークがタイムスロット方式によって動作する点にある。また、ASICスイッチにおけるスイッチング容量の削減、消費電力の低減についても開示する。最初に、本開示の光ネットワークのベースとなるDCネットワークのノードの構成とアクセス方法について振り返る。
図3は、DCネットワークの代表的な構成とノードへのアクセス方法を比較して示した図である。図3の(a)は光回線交換(OCS:Optical Circuit Switching)を、(b)はオプティカル・フロー・スイッチング(BM-OFS:Burst Mode Optical Flow Switching)を(c)は光パケット交換(OPS:Optical Packet Switching)をそれぞれ示している。(a)のOCSネットワーク110は、最高のQoSを有し、衝突なしに長距離伝送が可能である。しかし、リソースの共有の程度は低く、波長数によってリンク数が制限され、新しいリンクの確立に時間が掛かり、動的なトラフィックの変化に対応できない等の欠点を持つ。対照的に、(c)のOPSネットワーク130では、ネットワークリソースを大きく共有できるものの、 衝突を完全に排除することはできない。
クラウドDCネットワーク内のノードの数は、数万にも達することがあるが、エンドユーザに近いエッジDCネットワークは、はるかに少ないノード数で構成される。ネットワークの光コア部分に関して、Nノードの光ネットワークで物理的なフルメッシュ接続を実現する場合、送信機、受信機、双方向光リンクの数がN×(N-1)個となるため、膨大なリソースが要求される。このようなネットワークは、例えば限られた少数のノードで構成されるエッジDCネットワークの場合に可能であるが、ノード数が増えればノードにおけるコストと実装の複雑さが増し、これらが物理的フルメッシュ接続の問題点である。
上述のように図3の(a)のOCSネットワーク110は、上述のようにフルメッシュ接続によって実現され、膨大なリソースが要求される。そこで発明者らは、図3の(b)のBM-OFSネットワーク120を提案している。詳細は説明しないが、BM-OFSネットワーク120は、トーラスネットワークトポロジにおいて、専用の波長上で光バーストモード伝送を採用したフルメッシュ様ネットワークである。BM-OFSネットワーク120では、ラベルベースのスイッチングに依存しており、実現可能な波長資源を用いて、サービス品質(QoS)を保証する動的光ネットワークを可能とする。より多くのネットワークノードで同じ波長を再利用することにより、高度にスケーラブルなDCネットワークが実現される。より詳細にはBM-OFSネットワークでは、トーラスネットワークトポロジにおいて競合のない事前定義された光パスを設計し、および、並列に接続されている光ファイバ間で波長使用をインターリーブする。これらの技術をすべて組み合わせることにより、例えばCバンドで利用可能な波長チャネルの部分的利用だけで、数千のノードを含むフルメッシュ状の光ネットワークを実現できる。
[光ネットワーク周辺部の受信の問題]
上述のようなフルメッシュネットワークまたはフルメッシュ様ネットワークでは、各ノードにおいて、大規模なスイッチング構成が必要となる。N個のノードを持つフルメッシュまたはフルメッシュ様ネットワークでは、ネットワーク内の任意の宛先ノードは、N-1個まで可能な任意の数のソースノードによって同時にアドレス指定(addressing)することができる。ここで「アドレス指定」とは、ノード間において通信リンクを設定するために、ソースノードが相手方の宛先ノードを通信先として特定し、指定することだけに限らず、実際に通信リンクを設定し、通信を実施することも含むものとする。
[光ネットワーク周辺部の受信の問題]
上述のようなフルメッシュネットワークまたはフルメッシュ様ネットワークでは、各ノードにおいて、大規模なスイッチング構成が必要となる。N個のノードを持つフルメッシュまたはフルメッシュ様ネットワークでは、ネットワーク内の任意の宛先ノードは、N-1個まで可能な任意の数のソースノードによって同時にアドレス指定(addressing)することができる。ここで「アドレス指定」とは、ノード間において通信リンクを設定するために、ソースノードが相手方の宛先ノードを通信先として特定し、指定することだけに限らず、実際に通信リンクを設定し、通信を実施することも含むものとする。
図4は、従来技術の光ネットワーク周辺部のノードにおける問題を説明する図である。図4はフルメッシュの光ネットワーク140を概念的に示しており、図2に示したフラット光ネットワーク1を、ノードの集合として示したものである。光ネットワーク140は、多数のノードが相互に接続されている。図4では、1つのノードに対して隣接する4ノードが相互接続されているように描かれているが、光ネットワーク内のすべてのノードに接続されていることをシンボル的に示している。
ここで、1つの受信ノード141に着目する。受信ノード141は、光ネットワーク側とのインタフェース部144を有しており、さらにToR145に接続されている。インタフェース部144は、同時に着信する複数の光信号142を受信する受信機143を備えている。光ネットワーク140がN個のノードで構成されていれば、同時に着信するすべてのデータ通信を処理するため、受信ノード141では多数のポートと対応する(N-1)個の受信機143が必要となる。さらにインタフェース部144は、図示していない大規模な構成の受信ASICスイッチを備えている。最初に述べたように、ASICスイッチに入出力する光信号に、非常に高いデータレートが必要となっている。図4からも、すべての受信ノードにおいて、多数の受信機と大規模なASICスイッチが必要であることが理解できる。このようにフラット光ネットワークの周辺部にあるノードには、受信機の膨大な数とASICスイッチの容量の限界の問題がある。本開示の光ネットワークでは、これらを解決するために、ネットワークノードから同じ宛先ノードへのデータ伝送に対して、わずかな時間領域の制限の導入を提案する。
[提案するネットワーク方式]
A.受信機の数の削減
図5は、本開示の光ネットワークおよび受信ノードの構成を概念的に示す図である。図4と同様に、図5はフルメッシュまたはフルメッシュ様の光ネットワーク10を概念的に示している。簡単のため光ネットワーク10は、N個(例えば36)のノードからなっており、一例として、送信元ノードすなわちソースノード11および宛先ノードすなわち受信ノート13の間のデータ伝送を考える。当然のことであるが、以後の説明において、ソースノードは受信ノードともなり得るのであって、説明する動作の機能に応じて区別しているに過ぎない。したがって、受信ノードで説明している機能・構成を、ソースノードも同様に有していることに留意されたい。
[提案するネットワーク方式]
A.受信機の数の削減
図5は、本開示の光ネットワークおよび受信ノードの構成を概念的に示す図である。図4と同様に、図5はフルメッシュまたはフルメッシュ様の光ネットワーク10を概念的に示している。簡単のため光ネットワーク10は、N個(例えば36)のノードからなっており、一例として、送信元ノードすなわちソースノード11および宛先ノードすなわち受信ノート13の間のデータ伝送を考える。当然のことであるが、以後の説明において、ソースノードは受信ノードともなり得るのであって、説明する動作の機能に応じて区別しているに過ぎない。したがって、受信ノードで説明している機能・構成を、ソースノードも同様に有していることに留意されたい。
光ネットワーク10では、ソースノードである全てのN個のネットワークノードを多数のグループ(d個)に分割し、各ソースノードが所属するグループが定義されている。図5の例では、第1のグループ(G1)~第6のグループ(G6)の6つのグループが定義されており、ソースノード11は第1のグループ12に属している。
任意のノードすなわち任意の受信ノードにおけるデータ通信の受信は、後述するように、ソースノードの属するグループ毎に、固定された持続時間Tのタイムスロットにおいて、別々に行われる。すなわち受信ノードは、ソースノードのグループに割り当てられたタイムスロットの間にのみ、そのグループに属する任意のソースノードによってアドレス指定され得る。具体的には、受信ノード13は、ソースノード11の属するG1に割り当てられたタイムスロットの間に、ソースノード11からのデータを受信する。さらにG1に属する他の5つのソースノードからも、同じタイムスロットの間にアドレス指定される。
図5において1つのグループに属するノードは、ここでは説明のために近接したものとして示しているが、一般的にはネットワーク全体に空間的に分散している。このような分散ノードが、割り当てられたタイムスロットの時間T内で、1つの宛先ノードにデータを到着させるために、後述する位相キャッシング法を用いる。受信ノードは、異なるグループからタイムスロット毎に順次連続的にデータを受信し、すべてのグループからの受信が完了するサイクルの時間は、d(分割数)×T(TS時間)である。各グループのノード数が均一であるネットワーク分割の場合、同一グループに属するノード数mは、m=N/dとなる。
上述のように、受信ノードにおけるデータ受信に時間的な制限を設けた場合、いずれの受信ノードにおいても、m個の受信機を設置することによって、起こりうる最大の同時着信トラフィックに対応する必要がある。ここで各ノードの最大発信帯域幅(BW:Bandwidth)をBoutとする。以後の説明でも使用する用語「帯域幅」とは、ノードによって受信または送信することのできる伝送帯域幅の意味であり、伝送速度(伝送レート)として理解しても良い。用語「帯域幅」は、光通信の変調方式や信号構成に応じて決定されるデータ伝送のための通信リソースの容量を意味する広い概念であることに留意されたい。
通常、ノードから発信できる帯域幅と、ノードで受信できる帯域幅は同じであって、最大発信帯域幅をBoutは最大受信帯域幅でもある。割り当てられたタイムスロットTの間では、特定の受信ノードに対して、このBoutの全帯域を投じることができる。しかしながら、あるソースノードが同じ受信ノードへ再びアドレス指定できるためには、1回の受信サイクルが経過するまで待たなければならない。十分長い観測時間に対しては、2つのノード間の実質的な帯域幅である実効BWは、Bout/dとなる。一般にネットワークにおけるノードグループの数dを増加させると、任意のノード対の間の実効BWが減少することになる。この実効BWの値を高める新しい方法は、後述される。
上述のソースノードから同じ受信ノードへのデータ伝送に対して、わずかな時間領域的制限を導入することで、図5の本開示の光ネットワークにおけるノードは、図4の従来技術のノードと比べて、受信機の数を大幅に減らすことができる。
図5を再び参照すると、受信ノード13の詳細が下側に詳細図として示されており、図4に示した従来技術による受信ノードの構成と比較して説明する。本開示の光ネットワークにおけるノード13では、受信データの入力光信号を受信するノードのフロント部において、異なる波長(d個の異なるグループ)からの光信号を合波するアレイ導波路回折格子(AWG:Arrayed Waveguide Grating)14が追加されている。N個のノードからのデータを同時に受信できるように、AWG14の各々は少なくともグループの数d個の入力ポートを有し、ノード13のフロント部では1つのグループ内のノード数m個のAWGを備える。m個のAWG14を経て、合波された受信データは、従来技術と同様のインタフェース部15に供給され、受信機16に入力される。ここでインタフェース部15における受信機16の数は、図4の従来技術の構成と比べて、1/mに大幅に減少している。
図6は、本開示の光ネットワークにおけるノードをグループに分割することで得られる受信機の削減効果を示す図である。図6はノードにおける受信機(Rxユニット)の数と全ノード数の関係を、分割数すなわちグループの数をパラメータとして示しており、(a)は縦軸の受信機数を対数表示で、(b)は受信機数を通常のリニア表示で示している。ノード数に関係なく、分割数が増えるに従って、必要な受信機数を大幅に減らすことができる。
したがって本開示の光ネットワークは、フルメッシュネットワーク構成を有する光コア部2と、前記光コア部に接続された複数のノードであって、複数のグループに分割されており、1つのグループ内に最大m個のノードが含まれている、複数のノードとを備え、前記複数のノードの各々13は、ソースノード11が属するグループに関連付けられたタイムスロットにおいてのみ、前記ソースノードが属する前記グループ内の任意のノードによってアドレス指定されるものとして実施できる。また、前記複数のノードの各々は、m個のアレイ導波路回折格子(AWG)14であって、当該AWGの複数の入力ポートは同一のグループに属する前記最大m個のノードから対応する光信号を受信し、前記複数の入力ポートの動作波長に適合するように、前記最大m個のノードの内の1つ以上のソースノードの使用波長が設定されている、AWGと、前記AWGの出力合波ポートに接続されたm個の受信機16と、前記m個の受信機からの電気信号をスイッチングして、複数のサーバー18にルーティングするASICスイッチ17とを有するものとして実施できる。
上では光ネットワークの発明として説明したが、ネットワークノードの発明としての側面も持っている点に留意されたい。例えば、フルメッシュネットワーク構成を有する光コア部に接続されたノードであって、当該ノードは、前記コア部に接続された他の複数のノードとともに複数のグループに分割されており、1つのグループ内に最大m個のノードが含まれており、前記最大m個のノードの各々は、ソースノードが属するグループに関連付けられたタイムスロットにおいてのみ、前記ソースノードが属する前記グループ内の任意のノードによってアドレス指定されるものとして実施できる。
再び図5に戻ると、受信ノード13のインタフェース部15は、従来技術の構成と同じく受信ASICスイッチ17を備えている。しかしながら後述するように、そのスイッチング容量は、従来技術よりも大幅に減らされている。受信ノードにおけるインタフェース部の構成は、従来技術と比較して、受信機の数および受信ASICスイッチの容量の点で、大幅に簡素化されている。さらに詳細な受信ノードの動作および受信ASICスイッチの帯域幅の削減について述べる。
B.受信切り替えの簡素化
前述の1つのノードの最大発信帯域幅をBoutおよび1つのグループ内のノード数mを使えば、図5の本開示のノードが任意のタイムスロットで受信する最大BWは、m×Boutとなる。この最大BWは、タイムスロットを使用しないで完全な非同期動作(例えばOPS)でデータを受信する場合のBWと比較して、約1/dに減少する。図5に示したように、受信ノードへの入力データは、所望のToRスイッチ18へ切り替える必要がある。この切り替えに、受信ASICスイッチ17が使用される。
B.受信切り替えの簡素化
前述の1つのノードの最大発信帯域幅をBoutおよび1つのグループ内のノード数mを使えば、図5の本開示のノードが任意のタイムスロットで受信する最大BWは、m×Boutとなる。この最大BWは、タイムスロットを使用しないで完全な非同期動作(例えばOPS)でデータを受信する場合のBWと比較して、約1/dに減少する。図5に示したように、受信ノードへの入力データは、所望のToRスイッチ18へ切り替える必要がある。この切り替えに、受信ASICスイッチ17が使用される。
図7は、本開示の光ネットワークにおける受信ノードのデータ受信動作を説明する図である。図7の(a)はタイムスロット構成を示しており、(b)はTS1においてデータ受信をしているときの切り替え動作を説明する図である。(b)のインタフェース部15のASICスイッチ17は、ネットワークに面している入力側にm個のポートを、もう一方の出力側にToRスイッチ18の数に相当するポート数をそれぞれ有している。ToRスイッチごとに複数のリンクを使用する場合は、その複数のリンクに応じたポート数が存在している。
図7の(a)のタイムスロット構成は、図5に示した全ノードを6つのグループに分割した場合の例を示しており、各グループに属するm個のノードは対応するタイムスロットのみで受信を行う。例えば、第1のグループに属する6つのソースノードからのデータは、(b)に示したようにTS1においてのみ各AWGの対応するポートで受信される。1つのグループ内に存在するノード数と同じ数のm個のAWG14-1~14-6において、m個の異なるソースノードからのデータが受信される。したがって、特定のタイムスロットにおいては、ASICスイッチ17のm個の入力ポートのそれぞれが、同一グループ内の異なるソースノードから受信したデータを取り込むことができる。すなわち、同一グループ内のm個の全ソースノードからの同時データ受信が可能である。
図7の(b)に示したように、異なるグループのスイッチング処理を簡単にするために、ASICスイッチ17の入力側の各ポートにAWGが接続されており、同じグループのノードは、別々のAWGに接続されている。割り当てられたタイムスロットの間、許可されたグループのノードだけがアクティブとなる一方で、他のグループのすべてのノードは、宛先ノードに送信を行わない。
例示のために、TS1においてアクティブなグループ(例えばG1)のすべてのノードによって、同じ波長λ1が使用されると仮定する。波長λ1の入力信号は、複数(m個)のAWGによってASICスイッチ17に向かって、受動的にルーティングされることになる。すなわち、同一グループ内の異なるノードと、m個のAWGの対応する波長のポートとを接続することによって、ルーティングされている。次のTS2において、次のアクティブなグループ(G2)のすべてのノードがλ2で送信しているとする。このときも、G2に属する各ノードからのλ2の入力信号は、複数(m個)のAWGによってASICスイッチ17に向かって受動的にルーティングされる。
一般に、同じグループ内のノードが同じ波長で送信する必要はない。同じAWGに接続された異なるグループのノードによって使用される複数の波長が、競合を生じないようにそれぞれ異なる波長に調整されれば良い。上述の説明の様に、同一のグループ内のすべてのノードで同一の波長を使用すれば、受信ノードにおけるAWGの構成を共通化できる。
図8は、さらに異なるグループ構成のネットワークにおける受信切り替えの動作例を示す図である。図8では、全ノード数N=512、グループ数(分割数)d=16、グループ内のノード数m=32の場合について、(a)G1からのTS1における受信の例、(b)G2からのTS2における受信の例、(c)G16からのTS16における受信の例をそれぞれ示す。各図では、AWGの入力にノード番号(1~512)を示している。本例でも、同一のグループ内の32個のノードは同一の波長を使用するものとして示したが、AWG毎に波長が異なっていても良い。受信ノードにおいて32個のAWG14-1~14-32を使用することによって、同一のタイムスロットにおいて、同一のグループに属する32個の異なるノードから、同時にデータを受信できる。この構成では、受信ノードのインタフェース部において32個のAWGに対応する32個の受信機を備えれば良い。
図9は、本開示による例示的なネットワークおよびノードの仕様を示す。16分割されたネットワークおよび対応する16のタイムスロットによる構成のパラメータの例を示している。具体的には、1タイムスロットは、400Gb/sパケットに対応する30nsおよびマージンの10nsを合わせて、40nsの長さとなる。1サイクルは、16のタイムスロットに分割され、512個のネットワークノードは16のグループに分割される。1グループ内のノード数は32個である。各タイムスロットの宛先(受信)ノードは、許可されたグループによってのみアドレス指定される。同じソースノードは、同じ宛先ノードを16タイムスロット毎にアドレス指定できる。
C.受信ASICスイッチのBWの削減
図5の説明でも言及したように、本開示の光ネットワークにおけるノードでは、従来技術と比べて、受信ASICスイッチの容量を大幅に抑える構成とした。具体的には、受信ASICスイッチの容量を、平均着信トラフィックに一致するか、または平均着信トラフィックをわずかに超える値に設定する。このスイッチング容量を超えるトラフィックを若干の遅延を伴って処理するために、受信ASICスイッチに関連付けられたメモリを備える。以下、図10および図11とともに、本開示のフラット光ネットワークのノードにおいて、受信ASICスイッチの容量を従来技術のノードよりも削減しても、実質的に十分なトラフィックを扱えることを説明する。
C.受信ASICスイッチのBWの削減
図5の説明でも言及したように、本開示の光ネットワークにおけるノードでは、従来技術と比べて、受信ASICスイッチの容量を大幅に抑える構成とした。具体的には、受信ASICスイッチの容量を、平均着信トラフィックに一致するか、または平均着信トラフィックをわずかに超える値に設定する。このスイッチング容量を超えるトラフィックを若干の遅延を伴って処理するために、受信ASICスイッチに関連付けられたメモリを備える。以下、図10および図11とともに、本開示のフラット光ネットワークのノードにおいて、受信ASICスイッチの容量を従来技術のノードよりも削減しても、実質的に十分なトラフィックを扱えることを説明する。
発明者らは、ノード内のASICスイッチのスイッチング負荷を低減するために、受信ノードに入力されるトラフィック、言い換えると受信ノードの入力帯域幅BWを、異なる要求を持つ2つのカテゴリに分類して検討した。2つのトラフィックのカテゴリは、(a)追加の遅延なしにリアルタイムでスイッチングする必要があるトラフィック、(b)接続されたサーバーの処理能力を既に超えてしまっているために、受信ASICスイッチではリアルタイムですべてスイッチングする必要がないトラフィックである。(a)のトラフィックに対しては平均受信BWが割り当てられ、(b)のトラフィックに対しては最大受信BWが割り当てられるものとする。以下では、受信ASICスイッチのスイッチング容量すなわち受信ASICスイッチの伝送帯域を、2つのカテゴリのトラフィックに対応する異なるBWにどのように配分できるかについて考える。
リアルタイム処理を要しない最大受信BWの場合に、受信ノードの受信データを部分的に記憶するための記憶媒体(メモリ)を導入することは、受信データが失われたり、再送信したりする必要がないことを保証する。記憶媒体を導入する主な利点は、余分な追加遅延を導入する犠牲を受け入れる代わりに、受信ASICスイッチのスイッチング容量を減少させることができることである。
図10は、受信ノードにおいて必要とされる受信帯域幅の異なる概念を説明する図である。図10の(a)では、グループ数(ネットワークの分割数)dをパラメータ(d=8、16、24、32)として、1つのノードが受信できる帯域幅Boutで正規化された受信BWとネットワークのノード数Nの関係を示している。ここで受信ノードの帯域幅Boutは、図5で説明したソースノードの最大発信帯域幅と同一である。512のノードを16のグループに分割したネットワークを例とすると、各受信ノードは、ノード自身で生成可能なBWの32倍である正規化した最大BWを収容するために、32(=512/16)の受信機ユニットを備えるべきである。正規化した平均受信BWを8と仮定すると、受信ASICスイッチのスイッチング容量は最大スイッチング負荷の場合と比較して8/32だけ低減される。図10の(b)は上述の2つの受信帯域幅を説明する図であり、AWGの出力が接続されるインタフェース部のフロントでは、32ノードからのすべての入力データを確実に同時に受信するために32の受信機が必要なことを示している。一方で、インタフェース部内の受信ASICスイッチは、メモリを備えることで8ノード分の平均受信BWを備えて、8ノード分のリアルタイムスイッチング処理をすれば良いことを示している。
平均受信BWはノード毎に変動し得るが、限られた数の特定のノードを除いては、通常、最大受信BWよりも平均受信BWを大幅に低く設定することができる。これは、図2に示した本開示のDCネットワークで前提とするフラット光ネットワーク2におけるトラフィックの自然なバランスによるものである。そのバランスメカニズムは、フラット光ネットワークにおけるトラフィックの性質として、次のように説明できる。
図11は、異なる平均接続数を持つ複数のノードの取り得る組み合わせを説明する図である。ここで、フラット光ネットワークにおいて前提となるトラフィックの性質について説明する。均一な接続性と100%のトラフィック負荷を持つフラット光ネットワークでは、1つのノードあたりの平均受信接続数は1となる。この状態から、ノードが平均してより多くの接続を受信するようになると、平均受信接続数が1の状態から逸脱し始める。このときフラット光ネットワークでは、あるノードによって受信されていたトラフィックは新しいビジーなノードへ向けられることを意味している。より多くのノードがビジーになると、残りのノードの平均接続数は自然に減少する。
図11ではこのアイデアを数値で解明するために、512ノードで、100%トラフィック負荷のネットワークの例についてシミュレーションを行った。一般性を失わずに計算を単純化するために、ネットワークノードを3つのカテゴリに分類した。すなわち、(a)受信した接続の平均数がQ(>1)となるビジーノード、(b)受信した接続の平均数が1となる非ビジーノード、(c)データを受信していないノードの3つである。図11の横軸には、カテゴリー(b)のトラフィックを持つ非ビジーノードの割合を%で示している。縦軸には、上述のカテゴリー(a)のトラフィックに対応し、1より大きい平均接続数Qを持つビジーノードの最大割合を%で示している。したがって図11のグラフは、カテゴリー(a)のビジーノードの平均接続数Qの値をパラメータとして、100%トラフィック負荷の条件を満たすカテゴリー(b)のノード割合とカテゴリー(a)のノード割合の関係を示していることになる。
図11に示したように、ビジーノードの平均接続数Qの値が2、4、6、8と大きくなると、そのような平均接続数Qを持つカテゴリー(a)のビジーノードの最大割合は大幅に減少する。具体的にAで示した点では、接続数1のカテゴリー(b)の非ビジーノードの割合が10%、データを受信しておらず接続数0カテゴリー(c)のノードの割合が79%という極端な条件下であっても、最大11%のノードが8の平均接続数Qを持ち得ることがわかる。このA点では、大多数のノード(79%)でデータを受信しておらず、残りのノードは、少数(10%)の非ビジーノード(Q=1)と、少数(11%)の平均接続数Q=8のトラフィックが集中したノードであるようなノード分布状態で、100%トラフィック負荷のネットワークが成立している。この例では、受信ASICスイッチの最大受信スイッチング容量の観点からは、平均着信トラフィック程度の、わずかな容量しか持たない受信ASICスイッチでも十分に使用できることが強く示されている。図11のシミュレーションは、512ノードを16グループに分割したネットワークにおいて、受信ASICスイッチの容量を、平均受信トラフィックに対応する正規化平均受信BWを8に設定しておけば、十分にトラフィックを処理できることを示している。
図10の(b)に示したように、本開示の光ネットワークにおける受信ノードでは、異なるソースノードからの受信データを受動的にルーティングする複数のAWG14およびインタフェース部15を備える。インタフェース部15のフロントには受信機および受信ASICスイッチ17を備え、さらに受信ASICスイッチ17と連動する記憶手段(メモリ)19を備える。受信ASICスイッチ17の容量を、平均受信トラフィックに一致するか、または平均受信トラフィックをわずかに超えるものとし、記憶手段19を利用して、このスイッチング容量を超えるトラフィックをわずかの遅延を伴って処理できる。
D.タイムクロッキングと同期メカニズム
図5~図8に示した本開示の光ネットワークでは、ノード間のデータ伝送はタイムスロットを用い実施されるため時間的に連続して行われず、通常はバーストモード伝送となる。受信(着信)データを正しく受信するには、このデータの生成に使用されるクロック信号も受信(宛先)ノードに存在している必要がある。入力データからデータクロック回復を実行するためにいくつかの技術が考案されており、例えば、バースト信号を受信し始める際に、CDR(Clock Data Recovery)回路に必要なブリアンブルが知られている。このようなデータクロック回復の技術は、受信のスループットに影響を与える。
D.タイムクロッキングと同期メカニズム
図5~図8に示した本開示の光ネットワークでは、ノード間のデータ伝送はタイムスロットを用い実施されるため時間的に連続して行われず、通常はバーストモード伝送となる。受信(着信)データを正しく受信するには、このデータの生成に使用されるクロック信号も受信(宛先)ノードに存在している必要がある。入力データからデータクロック回復を実行するためにいくつかの技術が考案されており、例えば、バースト信号を受信し始める際に、CDR(Clock Data Recovery)回路に必要なブリアンブルが知られている。このようなデータクロック回復の技術は、受信のスループットに影響を与える。
別のアプローチは、マスタークロック信号を生成し、すべてのネットワークノードに分配することである。このアプローチにより、受信およびスイッチングをサブナノ秒精度で行うことは、数10km離れて配置されたネットワークノードについて既に実証されている(非特許文献1を参照)。
図12は、本開示の光ネットワークで使用できる光クロックを生成・配分する構成を示す図である。図12の(a)はデータセンター施設内で使用できる光クロック生成・配分システムの構成を示し、(b)はクロックの同期動作を説明している。図12の(a)に示したように、多数の同期した波長からなる周波数コムの出力30は、マスタークロック信号によって変調される。AWG31を使用して、その変調出力を、別個の変調された光信号に空間的に分離する。AWG31で分離された信号は、1つ以上のネットワークノード(ノード1~ノード1000)に必要なクロックソースを提供するために使用される。
図12の(b)に示したように、同じタイムスロットであっても、開始タイミングは異なるノード間でわずかに変化してしまう。特定のネットワークノードに着信するデータが、割り当てられたタイムスロットに正しく収まるようにするには、ある程度の同期が必要となる。同じクロックがすべてのノード間で共有される場合、一般に、1つのノードから別のノードへの何らかの位相不整合が存在し得る。
位相キャッシング技術が、ネットワークの大規模で非現実的な同期を要求することなく、任意の2つのノード間の位相不整合を別々に補正するために使用できる。ソースノードが宛先ノードに実際のデータを送信する前に、まず、2つのノード間で位相調整を行い、送信されたデータを所望のタイムスロットに適合させる。その後、位相調整を行うために使用された値は保存すなわちキャッシュされ、この対のノード間で伝送が行われるたびに使用される。実際のDCネットワーク環境においては、数時間も追加位相補正が不要な位相キャッシング技術が実験的に実証されている(非特許文献2)。位相キャッシング技術は、任意のノード対間の光経路が決定論的であること、すなわち、任意のノード対間で確率的に決定されるような複数の経路を持たないことを要求する。上述の本開示の光ネットワークの構造は、この条件を満足している。
したがって、本開示の光ネットワークのノードは、データの送受信に先立って、2つのノードにおいて前記タイムスロットの位相調整のための調整値を求め、当該調整値を保持することで、前記関連付けられたタイムスロットに受信タイミングを適合させる位相キャッシング部を備えることができる。
[ネットワークノード間の実効帯域幅の増加]
これまで説明したように、本開示の光ネットワークは、受信ノードにおけるデータ受信に制限を加えるため、ソースノードから同じ宛先ノードへの伝送に対してタイムスロット方式によって動作している。したがって、ソースノードは、同じ宛先ノードを再びアドレス指定できるようになるまでに、一周分の受信サイクルが経過するまで待たなければならない。データ受信の制限によって、実質的な伝送レートが低下することになり、ノード対間のデータ伝送の実効BWが劣化することになる。
[ネットワークノード間の実効帯域幅の増加]
これまで説明したように、本開示の光ネットワークは、受信ノードにおけるデータ受信に制限を加えるため、ソースノードから同じ宛先ノードへの伝送に対してタイムスロット方式によって動作している。したがって、ソースノードは、同じ宛先ノードを再びアドレス指定できるようになるまでに、一周分の受信サイクルが経過するまで待たなければならない。データ受信の制限によって、実質的な伝送レートが低下することになり、ノード対間のデータ伝送の実効BWが劣化することになる。
図13は、ネットワークの分割による任意のノード対間の実効BWの劣化を説明する図である。横軸にはネットワークの分割数(グループ数)dを、縦軸には受信ノードにおける最大発信BWのBoutで正規化した受信BWを示す。図13に示すように、ネットワーク分割数dの増加とともに受信BWは低下し、例えば、分割数dが8から32に増加すると12.5%から3.12%に低下する。このような実効BWの低下を補うようなメカニズムが必要となる。以下、実効BWの低下の問題を解決する2つの異なる解決法を提示する。
第1の解決法は、ソースノードが1つ以上のタイムスロットにおいて所望の宛先ノードに到達することを可能にするものである。例えば図8の各図に示したように、あるソースノードからのデータは、ソースノードの属するグループに割り当てられた1つのタイムスロットでしか受信できなかったものを、他のタイムスロットにおいても受信できるようにする。第1の解決法の仕組みは、送信側のノードすなわちソースノードに新しい構成を加えることで実施できるものである点に留意されたい。
図14は、割り当てタイムスロット以外でデータ受信する基本的な仕組みを説明する図である。図14の(a)は、これまで説明してきた本開示の光ネットワークにおける基本的な受信動作を説明している。(a)のTS1~TS3のそれぞれの説明図において、左側に示したソースノードNiがアドレス指定できる宛先ノードを、右側に示している。2つのノード間のボックス41は、2つのノード間の経路を概念的に示している。これまで説明したように、タイムスロット1(TS1)では、ソースノードNiは接続矢印で表示された特定のノードのみをアドレス指定することができ、次のTS2、TS3では、アドレス指定可能なノードがNj、Nj+1、Nj+2と変化してゆく。データの送受信方向を逆にして考えれば、3つの受信ノードNj、Nj+1、Nj+2は異なるTSでデータ受信をしているので、異なるグループに属していることが理解できるだろう。
図14の(b)は、提案する第1の解決法を実現するソースノードの構成を示しており、複数のソースノード間で使用タイムスロットを調整する小規模の追加スイッチング部42を付加している。追加スイッチング部42によって、タイムスロットTS1において、異なるネットワークグループに属する隣接するソースノードNi~Ni+2は、異なるノードNj~Nj+2をアドレス指定することができる。
図15は、実効BWの低下を補うソースノードにおける追加スイッチについて説明する図である。図15におけるネットワーク40において、各々が6つのノードを含む4つのグループ(G1~G4)が示されている。異なるグループに属する3つのノードNi43、ノードNi+144、ノードNi+245を考える。3つのノード43、44、45は、異なるタームスロットを共有するローカルグループ46を構成し、データセンター内で物理的に隣接して配置されている必要がある。これら3つのノードは異なるグループに属しており、上述の追加スイッチング部42が、これら3つのノードの間で、各ノードからのデータが使用するタイムスロットを空間的および時間的に調整することができる。このようにしてノードNi43、ノードNi+144、ノードNi+245からの送信データのタイムスロットをコーディネートする小規模のスイッチング部42を付加することにより、専用タイムスロットの間だけでなく、3つの異なるタイムスロットで、3つのソースノードのいずれも、受信ノードNj~Nj+2に到達できるようになる。
したがって、本開示の光ネットワークは、前記複数のノードの内で、お互いに異なる前記グループに属する複数のソースノード43、44、45の各々が、当該ソースノードに関連付けられたタイムスロットとは異なるタイムスロットを使用できるように調整する追加のスイッチング部42を有し、前記関連付けられたタイムスロットおよび前記異なるタイムスロットを使用して、受信ノードへデータを送信するものとして実施できる。
図15のソースノードのローカルグループ46は、3つの異なるグループからのノード間でタイムスロットを共有しているが、これに限られずに2つのグループ間で共有しても、4以上のグループ間で共有しても良い。追加スイッチング部42の構成と制御を複雑化させない範囲で、タイムスロットを共有するグループの数は限定されない。所属するグループの異なっている隣接する複数のソースノード間だけの共有に限定されるものの、タイムスロットを2つ使用できれば、図13で示した実効BWを単純に2倍にできる。異なるソースノード間で追加スイッチング部42を備えることは、異なるノード間で送信ASICスイッチを一部共有していることに他ならない。すなわち、上述の追加スイッチング部42を備えるのと同じアプローチに従って、2つの隣接するソースノード間で、一方のノードで余剰となったスイッチング容量を他方のノードに追加する場合について、より詳細に考察する。
図16は、2つのソースノードにおける送信BWの共有を説明する図である。図16の(a)は後述するように、送信ASICスイッチの共有によるノード-ノード間の実効BWの改善効果を説明する図である。図16の(b)は、ソースノードにおける送信SCICスイッチのBW共有の概念図である。従来技術の共有なしの独立したノードの場合、ソースノードからデータ送信をする際は、送信ASICスイッチを使用して、対象ノードにのみ接続されているToRからのトラフィックを処理する。この送信ASICスイッチを送信機スイッチと呼ぶ。図16の(b)に示したように、2つのソースノード51、52の間で、一方の送信ASICスイッチ53で余剰しているスイッチをもう一方のノード52の送信ASICスイッチ54と共有することができる。このスイッチングリソースの共有は、「BW共有」 というラベルの付いた双方向の矢印で示されている。
図16の(a)は、2つのソースノード間での送信ASICスイッチの共用の割合をパラメータとして、横軸にネットワークの分割数(グループ数)を、縦軸に最大発信BWのBoutで正規化した送信BW(BWNode
to
Node)を示している。共有レベルを0から1.0まで変えることで、実効的な送信BWを改善することができる。完全な共有の場合は、実効送信BWを2倍にできる。以上に述べた追加スイッチング部によるタイムスロットの共有も含めて、送信ASICスイッチのBWを共有する第1の解決法は、ASICチップのスイッチング容量を増加させることが必要となり、より多くの電力消費を伴うことになる。この消費電力の増加に対する対処については、後述する。
実効BWの低下に対する第2の解決法は、任意のノード対間に光回線(Optical Circuit)を設定して、実効BWを高める方法である。以下説明するように、第2の解決法において回線を設定するために集中制御を行う部分は必要なく、光ネットワークを介して、制御信号となるシグナリングメッセージをノード間で直接交換することができる。
図17は、タイムスロットによる伝送を中断させること無しに、並行して設定された回線でトラフィックを処理する仕組みを説明する図である。図17の受信ノード60は、図5で示した本開示の光ネットワークにおける受信ノードの構成において、1つのAWG63に沿った経路のみを示している。図17のソースノード60は、ソースノード側から、受信機および受信ASICスイッチを含むインタフェース部61に向けて、1つのノードグループ内に属するノードと同じ数mの図示しない複数のAWGが存在している。以下説明する、並行した回線設定のための構成がそれぞれのAWGに付随している。
主AWG63からインタフェース部61、複数のToR62までを含む図17の受信ノード60は、図5、図7および図10などで示した受信ノードの基本構成と同じである。ノード対間の実効BWを改善する受信ノード60では、主AWG63へ入力する光伝送路の各々に、光伝送路から補助AWG65へトラフィックをバイパスする光結合手段64を有している。光結合手段64は、これに限定されないが光共振器構造とすることができ、例えばリング型光共振器、1×2光スイッチなどを利用できる。光結合手段64は、主AWG63から補助AWG65へのトラフィックをバイパスするための回線を設定する時にオンとなる。
図17の受信ノード60では、主AWG63を経由してこれまで説明した割り当てられたタイムスロットの期間中だけにデータ受信を行うのに加え、未使用タイムスロットの期間中に、補助AWG65を経由して回線交換に準じて設定され回線を介して新たなデータ受信を行う。主AWG63とインタフェース部61までのデータ伝送は、通常データ66で示しており、回線交換に準じた新しい回線によるデータ伝送は、回線交換データ67で示している。
図17の受信ノード60において、回線交換に準じた新しい回線によるデータ伝送は、ソースノードに割り当てられたタイムスロットを超えた時間で行われる。例えば、主AWG63の第1入力ポートでタイムスロット1においてソースノードからデータ受信が許可されているとする。この場合、補助AWG65の対応する入力ポートを経由して、タイムスロット1を除いた他のタイムスロットの期間において、同じソースノードから準回線交換データ67を受信できる。図17の受信ノード60の構成によれば、設定された回線で既に実行中のあるソースノードからのデータによる干渉を受けることなく、他のソースノードからの通常データ66をそれぞれの割り当てられたタイムスロットで受信することを可能とする。割り当てられた特定のタイムスロットに制限したデータ伝送と、回線交換に準じたデータ伝送の仕組みを並行して備えることで、柔軟な光ネットワーク構成が実現できる。光ネットワークにおいて使用する波長リソースに対して、波長毎に用途を決めたり、ネットワークの混雑状況に応じて、回線交換に準じたデータ受信のための回線を設定したりできる。
したがって本開示の光ネットワークは、前記m個のAWG63の前記入力ポートへの光伝送路から、光信号の一部を光結合する手段64と、同一の前記グループに属する前記最大m個のノードからの対応する光回線交換に準じた光信号67を、前記光結合する手段を介して受信する複数の入力ポートを有する補助AWG65を備え、前記最大m個のノードの各々の関連付けられたタイムスロットを除いた期間に、前記光結合する手段を動作させ、前記光回線交換に準じた前記光信号65を前記ASICスイッチ61に供給するものとしても実施できる。
図18は、回線交換に準じたデータ伝送を併せて備えた場合のノード構成および実効BWの向上を説明する図である。図18(a)は、ネットワーク分割数とノード対間の実効BWの向上を、追加する回線の数をパラメータとして示している。図17で説明をしたように、ノード対間を接続する1つのリンクをいくつかの波長チャネルで構成すると仮定する。例えば回線交換に準じた回線のために8つの波長を使用できる場合、より多くの波長チャネルを追加していくことにより回線の粒度を調整できる。図18の(a)に示したように、設定される光回線のために予約されていない残りの波長チャネルを使用して、他の宛先ノードをアドレス指定できる。8つの波長を利用できる場合には、図17の受信ノード構成で利用する波長の数を1つずつ増やすことで、1/8すなわち12.5%の粒度で回線による実効BWを調整できる。異なる粒度レベルの光回線によって、実効BWの相対的な向上も示されている。
図18の(b)は、2次元ネットワークの1つの節点において、トラフィックを様々な伝送方式によって伝送できることを示している。例えば図18の(b)において、1つの節点からネットワークに対して、図面左向きの伝送路においては同時送信が可能なパケット(OPS)を伝送可能とする。一方で、図面右向きの伝送路においては、本開示の光ネットワークのようにパケットの同時送信を禁じ、特定の割り当てられたタイムスロットのみで伝送可能なように構成できる。さらに右向きの伝送路の一部の伝送路(リンク)においては、図17に示したような回線交換に準じた回線を設定して、割り当てられたタイムスロット以外の時間で伝送可能とする。図18の(b)に示したように、本開示の光ネットワークおよびノード構成によって、柔軟なデータ伝送が可能となる。
[ASICスイッチにおける消費電力の削減]
フラット光ネットワークにおけるトラフィック受信の自然なバランスに関する上述の議論に続いて、個々のASICスイッチの消費電力を適応的に調整することで、以下のようにネットワーク全体の消費電力も削減できる。受信ノードへの入力データの平均BWは時間によって変化するので、受信ASICスイッチは常に同じスイッチング容量で動作する必要はない。ASICスイッチの容量は、一般的な需要の増減に対応するために随時調整される必要がある。ASICスイッチは、低BWの状態を扱うことができるよう、その構成を設定できる(Configurable)ので、物理的に動作電力消費を低減が可能となる。
[ASICスイッチにおける消費電力の削減]
フラット光ネットワークにおけるトラフィック受信の自然なバランスに関する上述の議論に続いて、個々のASICスイッチの消費電力を適応的に調整することで、以下のようにネットワーク全体の消費電力も削減できる。受信ノードへの入力データの平均BWは時間によって変化するので、受信ASICスイッチは常に同じスイッチング容量で動作する必要はない。ASICスイッチの容量は、一般的な需要の増減に対応するために随時調整される必要がある。ASICスイッチは、低BWの状態を扱うことができるよう、その構成を設定できる(Configurable)ので、物理的に動作電力消費を低減が可能となる。
図19は、ネットワーク全体のスイッチング電力の削減の例を説明する図である。図19の(a)は、様々な平均接続数を持つノードの組み合わせA1~A4、B1~B4、C1~C4のノード数分布を示している。図19の(b)は、上述のノード数分布の組み合わせについて、ネットワーク全体でのASICスイッチ消費電力の削減量を示している。
図20は、図19に示したA1~A4、B1~B4、C1~C4のノード分布における接続数およびそれらの組み合わせ条件を示した。いずれの条件も、ネットワーク全体では100%の負荷を持つものであって、平均接続数の組み合わせが異なるものである。様々な負荷分布のネットワーク状態を想定したものである。A1~A4、B1~B4、C1~C4の各ノード数分布では、完全に異なる平均接続数を持つビジーノードおよび非ビジーノードの割合が大きく異なっていることがわかる。
図19の(b)は、個々のノードの各受信ASICスイッチの消費電力を-20%および-40%にそれぞれ設定した場合の、ネットワーク全体での消費電力の削減量を示している。例えば消費電力を-20%とした場合、A1の平均接続数およびノード数分布であれば、ネットワーク全体でも19%近くの削減量を確認できる。A4の接続数およびノード数分布でも15%程度の削減量が可能であり、ビジーノードおよび非ビジーノードの分布の大きな変動の下でも、ネットワーク全体でかなりの省電力が達成可能である。従って、オンデマンドでリアルタイムに受信ASICスイッチのスイッチング容量を変更することにより、複数の段階(レベル)を持つ省電力モードでスイッチを動作させることができる。これは、ネットワーク全体の電力消費を低減するための適切な手段となり得る。
上述の説明のように本開示の光ネットワークでは、ノードにおける受信ASICスイッチと送信ASICスイッチに対して、それぞれ別のアプローチでASICスイッチの課題に対処している。ノードのインタフェース部における電気スイッチを双方向動作のものとせずに、データ送信および受信の特性に応じた別個の構成としている点でも、従来技術のすべてのトラフィックを処理すると電気スイッチの動作と異なっている。
以上、詳細に述べてきたように、本開示の光ネットワークにより、DCネットワークの周辺部におけるノードの構成を簡略化し、消費電力を減らすことができる。ASICスイッチの抱えていた問題を解決または少なくとも軽減し、光ネットワークの大規模化、低消費電力化にも対応できる。
本発明は、一般的に光通信システムに利用することができる。
1、10、40、100 DCネットワーク
2 フラット光ネットワーク
3、101、103 スイッチ
4、18、62、105、145 ToR
5、106 サーバー
11、43~45、51、52 ソースノード
13、60、141 受信ノード
14、14-1~14-32、31、63、65 AWG
15、61、144 インタフェース部
16 受信機
17 受信ASICスイッチ
19 メモリ
30 周波数コムソース
42 スイッチング部
53、54 送信ASICスイッチ
64 光結合手段
102、104、107、108 光リンク
2 フラット光ネットワーク
3、101、103 スイッチ
4、18、62、105、145 ToR
5、106 サーバー
11、43~45、51、52 ソースノード
13、60、141 受信ノード
14、14-1~14-32、31、63、65 AWG
15、61、144 インタフェース部
16 受信機
17 受信ASICスイッチ
19 メモリ
30 周波数コムソース
42 スイッチング部
53、54 送信ASICスイッチ
64 光結合手段
102、104、107、108 光リンク
Claims (9)
- フルメッシュネットワーク構成を有する光コア部と、
前記光コア部に接続された複数のノードであって、複数のグループに分割されており、1つのグループ内に最大m個のノードが含まれている、複数のノードと
を備え、
前記複数のノードの各々は、ソースノードが属するグループに関連付けられたタイムスロットにおいてのみ、前記ソースノードが属する前記グループ内の任意のノードによってアドレス指定されることを特徴とする光ネットワーク。 - 前記複数のノードの各々は、
m個のアレイ導波路回折格子(AWG)であって、当該AWGの複数の入力ポートは同一のグループに属する前記最大m個のノードから対応する光信号を受信し、前記複数の入力ポートの動作波長に適合するように、前記最大m個のノードの内の1つ以上のソースノードの使用波長が設定されている、AWGと、
前記AWGの出力合波ポートに接続されたm個の受信機と、
前記m個の受信機からの電気信号をスイッチングして、複数のサーバーにルーティングするASICスイッチと
を有することを特徴とする請求項1の光ネットワーク。 - 前記ASICスイッチは、
前記複数のノードの平均着信トラフィックに対応するスイッチング容量を有し、
前記スイッチング容量を超えるトラフィックを記憶して処理する記憶媒体を備えていることを特徴とする請求項2に記載の光ネットワーク。 - 前記複数のノードの各々へ、マスタークロックによって変調された光コムを分配して得られる同期用信号を供給する同期手段をさらに備えたことを特徴とする請求項2または3の光ネットワーク。
- 前記複数のノードの内のソースノードおよび受信ノードは、
データの送受信に先立って、それぞれ、前記タイムスロットの位相調整のための調整値を求め、当該調整値を保持することで、前記関連付けられたタイムスロットに
受信タイミングを適合させることを特徴とする請求項4の光ネットワーク。 - 前記複数のノードの内で、
お互いに異なる前記グループに属する複数のソースノードの各々が、当該ソースノードに関連付けられたタイムスロットとは異なるタイムスロットを使用できるように調整する追加のスイッチング部を有し、
前記関連付けられたタイムスロットおよび前記異なるタイムスロットを使用して、受信ノードへデータを送信することを特徴とする請求項2乃至5いずれかの光ネットワーク。 - 前記m個のAWGの前記入力ポートへの光伝送路から、光信号の一部を光結合する手段と、
同一の前記グループに属する前記最大m個のノードからの対応する光回線交換に準じた光信号を、前記光結合する手段を介して受信する複数の入力ポートを有する補助AWGを備え、
前記最大m個のノードの各々の関連付けられたタイムスロットを除いた期間に、前記光結合する手段を動作させ、前記光回線交換に準じた前記光信号を前記ASICスイッチに供給することを特徴とする請求項2乃至5いずれかの光ネットワーク。 - 前記ASICスイッチは、リアルタイムにスイッチング容量をオンデマンドで構成されることを特徴とする請求項2乃至7いずれかの光ネットワーク。
- 前記光コア部は、物理的フルメッシュネットワーク、または、電気-光-電気変換を伴わない物理的フルメッシュ様ネットワークであることを特徴とする請求項1乃至8いずれかの光ネットワーク。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/008366 WO2021171569A1 (ja) | 2020-02-28 | 2020-02-28 | 光コア部を有する光ネットワーク、タイムスロット化した受信を使用するノード |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021171569A1 JPWO2021171569A1 (ja) | 2021-09-02 |
JP7307388B2 true JP7307388B2 (ja) | 2023-07-12 |
Family
ID=77491190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022502787A Active JP7307388B2 (ja) | 2020-02-28 | 2020-02-28 | 光コア部を有する光ネットワーク、タイムスロット化した受信を使用するノード |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230104943A1 (ja) |
JP (1) | JP7307388B2 (ja) |
WO (1) | WO2021171569A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7243364B2 (ja) * | 2019-03-26 | 2023-03-22 | 日本電信電話株式会社 | 光分岐挿入装置及び光分岐挿入装置を使用した光伝送システム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009124248A (ja) | 2007-11-12 | 2009-06-04 | Oki Electric Ind Co Ltd | 光通信装置、ノード及び光通信ネットワーク |
JP2015522984A (ja) | 2012-05-16 | 2015-08-06 | アルカテル−ルーセント | 光データ伝送システム |
JP2016527737A (ja) | 2013-05-10 | 2016-09-08 | 華為技術有限公司Huawei Technologies Co.,Ltd. | フォトニックスイッチのためのシステムおよび方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08251230A (ja) * | 1995-03-13 | 1996-09-27 | Oki Electric Ind Co Ltd | ネットワークシステム及びノード |
CN104427412B (zh) * | 2013-08-20 | 2019-06-18 | 中兴通讯股份有限公司 | 一种带宽地图更新的方法及装置 |
US10264334B2 (en) * | 2015-04-24 | 2019-04-16 | The Regents Of The University Of California | End-to-end scheduling for all-optical data centers |
CN106254968B (zh) * | 2016-07-28 | 2019-11-08 | 上海交通大学 | 一种基于阵列波导光栅的无阻塞组播交换网络 |
US10516710B2 (en) * | 2017-02-12 | 2019-12-24 | Mellanox Technologies, Ltd. | Direct packet placement |
US11368768B2 (en) * | 2019-12-05 | 2022-06-21 | Mellanox Technologies, Ltd. | Optical network system |
-
2020
- 2020-02-28 WO PCT/JP2020/008366 patent/WO2021171569A1/ja active Application Filing
- 2020-02-28 US US17/800,735 patent/US20230104943A1/en active Pending
- 2020-02-28 JP JP2022502787A patent/JP7307388B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009124248A (ja) | 2007-11-12 | 2009-06-04 | Oki Electric Ind Co Ltd | 光通信装置、ノード及び光通信ネットワーク |
JP2015522984A (ja) | 2012-05-16 | 2015-08-06 | アルカテル−ルーセント | 光データ伝送システム |
JP2016527737A (ja) | 2013-05-10 | 2016-09-08 | 華為技術有限公司Huawei Technologies Co.,Ltd. | フォトニックスイッチのためのシステムおよび方法 |
Non-Patent Citations (1)
Title |
---|
Geaoge Porter et al.,Integrating Microsecond Circuit Switching into the Data Center,ACM SIGCOMM Computer Communication Review,2013年08月,P.447-458 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2021171569A1 (ja) | 2021-09-02 |
WO2021171569A1 (ja) | 2021-09-02 |
US20230104943A1 (en) | 2023-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10498450B2 (en) | Passive optical-based data center networks | |
US7751713B2 (en) | Communication network with skew path monitoring and adjustment | |
US6535313B1 (en) | Dynamically assignable optical signal access control apparatus | |
US9848254B2 (en) | Efficient transport network architecture for content delivery network | |
US8200088B2 (en) | Optical communication system, and optical communication method and communication unit therefor | |
Kamchevska et al. | Experimental demonstration of multidimensional switching nodes for all-optical data center networks | |
JP2007028642A (ja) | 光ネットワークで光トレイルを割り当てるための方法及びソフトウエア | |
Caponio et al. | Single‐Layer Optical Platform Based on WDM/TDM Multiple Access for Large‐Scale “Switchless” Networks | |
CN103716721B (zh) | 向分组光网络的目的地节点提供外部光数据分组的方法和系统 | |
US9698930B2 (en) | Bandwidth map update method and device | |
JP7307388B2 (ja) | 光コア部を有する光ネットワーク、タイムスロット化した受信を使用するノード | |
US8358932B2 (en) | All-optical data center network | |
JP5378899B2 (ja) | 光通信システム及び光通信方法 | |
KR100629501B1 (ko) | 광 버스트 스위칭 네트워크에서 채널 할당 방법 | |
CA2691021C (en) | Maintaining correlated virtual data streams through a network | |
KR101607473B1 (ko) | 광 네트워크에서 대역폭을 할당하는 방법 | |
Cazzaniga et al. | A new perspective on burst-switched optical networks | |
WO2016091153A1 (zh) | 一种光突发传送网的传输方法和系统 | |
JP2012204863A (ja) | ネットワークシステム、通信制御ノード、被通信制御ノード、及び帯域制御方法 | |
CN107295429B (zh) | 一种以波长为地址标签的光交换节点装置 | |
Funnell et al. | Reconfigurable optical star network architecture for multicast media production data centres | |
WO2022176172A1 (ja) | タイムスロット化した受信を使用する光ネットワークおよびノード | |
Puche et al. | Routing and Allocation of Wavelengths in Elastic Optical Networks: A Survey | |
Baziana | Optical Control Connectivity and Access Technique Study for a Software-Defined Intra-Rack Data Center Network | |
Drainakis et al. | Optical Intra-and Inter-Rack Switching Architecture for Scalable, Low-Latency Data Center Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220608 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230530 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230612 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7307388 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |