JP7315271B2 - 通信制御方法及び通信制御装置 - Google Patents

通信制御方法及び通信制御装置 Download PDF

Info

Publication number
JP7315271B2
JP7315271B2 JP2022501781A JP2022501781A JP7315271B2 JP 7315271 B2 JP7315271 B2 JP 7315271B2 JP 2022501781 A JP2022501781 A JP 2022501781A JP 2022501781 A JP2022501781 A JP 2022501781A JP 7315271 B2 JP7315271 B2 JP 7315271B2
Authority
JP
Japan
Prior art keywords
switch
electrical
network
blocking
electrical switch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022501781A
Other languages
English (en)
Other versions
JPWO2021166665A1 (ja
Inventor
怜典 松本
健一 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST filed Critical National Institute of Advanced Industrial Science and Technology AIST
Publication of JPWO2021166665A1 publication Critical patent/JPWO2021166665A1/ja
Application granted granted Critical
Publication of JP7315271B2 publication Critical patent/JP7315271B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • H04L49/557Error correction, e.g. fault recovery or fault tolerance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • H04B10/075Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal
    • H04B10/077Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal using a supervisory or additional signal
    • H04B10/0771Fault location on the transmission path
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • H04B10/075Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • H04B10/075Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal
    • H04B10/079Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal using measurements of the data signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2854Wide area networks, e.g. public data networks
    • H04L12/2856Access arrangements, e.g. Internet access
    • H04L12/2869Operational details of access network equipments
    • H04L12/2878Access multiplexer, e.g. DSLAM
    • H04L12/2879Access multiplexer, e.g. DSLAM characterised by the network type on the uplink side, i.e. towards the service provider network
    • H04L12/2885Arrangements interfacing with optical systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/10Packet switching elements characterised by the switching fabric construction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0005Switch and router aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0062Network aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0062Network aspects
    • H04Q11/0066Provisions for optical burst or packet networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0005Switch and router aspects
    • H04Q2011/0037Operation
    • H04Q2011/005Arbitration and scheduling

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、電気光ハイブリッドスイッチネットワークの通信を制御する通信制御技術に関する。
第五世代移動通信システム(5G)やインターネット・オブ・シングス(IoT:Internet of Things)の登場は、データセンター内における通信トラフィックの増加に拍車をかけつつある。例えば、全世界のデータセンターのIPトラフィックは、2021年に20.6ゼタバイトまで及び、その内の約75%がデータセンター内で処理されると予想されている。一方、現状のデータセンター内ネットワークは複数階層の電気スイッチにより構築されており(例えば非特許文献1)、大規模データセンターの消費電力は数万~数十万kWに達する。さらに大容量且つ大量の通信トラフィックを処理するためには、データセンター内ネットワークの通信帯域を高めると共に消費電力を下げることが好ましい。
現状のデータセンター内ネットワークにおいて電気スイッチ/ルータ構成は階層構造となっており、サーバコンピュータやストレージなどを集約するためのトップ・オブ・ラック(ToR:Top of Rack)スイッチが下位に位置する。例えば、特許文献1において、現状の電気スイッチ/ルータに基づくデータセンター内ネットワークの構成や制御方法に関する例が開示されている。
こうしたデータセンターの需要に対して、電気スイッチと光スイッチを併用する電気光ハイブリッドスイッチネットワークが提案されている(例えば非特許文献2)。非特許文献2に記載の技術では、サーバコンピュータやストレージからToRスイッチを経由し、ToRスイッチと上位に位置する電気スイッチ及び光スイッチを相互に接続する。また、ToRスイッチを経由するトラフィックフロー或いは個々のサーバコンピュータやストレージから発生するトラフィックフローは監視され、フローの大きさに応じて電気スイッチもしくは光スイッチによる経路が選択される。例えば、15Mb/s以下の小容量のフローをMiceフロー、それを超える大容量のフローをElephantフローと分類し、Miceフローを電気スイッチ、Elephantフローを光スイッチで処理する。このように大規模なフローを光回線で交換することにより、電気光ハイブリッドスイッチネットワークは現状のデータセンター内ネットワーク(すなわち複数階層の電気スイッチ構成)と比較して、より大容量な通信トラフィックを低い消費電力で処理できる。また、大規模データセンターに対応可能な電気光ハイブリッドスイッチネットワークでは千ポート規模の光回線交換スイッチを用いており、その構成方法なども提案されている(例えば非特許文献3)。
しかし、電気光ハイブリッドスイッチネットワークでは、送受信ToRスイッチ間に光回線を設定できない場合にはブロッキングが発生し、データ転送に失敗するという問題がある。この影響を最小限にするために、トラフィックフロー情報に加えてネットワーク全体の接続情報や使用状況を管理すると、制御機構が複雑化すると共に処理遅延が増加するという問題が生じる。ブロッキングが発生した場合に、使用していない他のToRスイッチを経由して目的の受信側ToRスイッチまでデータを送信するマルチホップ転送も考えられるが、この場合も複雑化する制御機構や増加する処理遅延が問題となる。
米国特許8483096号
Arjun Singh,et.al.,"Jupiter Rising: A Decade of Clos Topologies and Centralized Control in Google's Datacenter Network",Proc.ACM SIGCOMM 2015 Conference (SIGCOMM '15),pp.88-97,London,United Kingdom,Aug.2015 Nathan Farrington,et.al.,"Helios: A Hybrid Electrical/Optical Switch Architecture for Modular Data Centers",Proc.ACM SIGCOMM 2010 Conference (SIGCOMM '10),pp.339-350,New Delhi,India,Aug.2010 Ken-ichi Sato,"Realization and Application of Large-Scale Fast Optical Circuit Switch for Data Center Networking",IEEE/OSA Journal of Lightwave Technology,Vol.36,No.7,pp.1411-1419,Apr.2018
よって、本発明の目的は、一側面として、低遅延でデータを転送可能な電気光ハイブリッドスイッチネットワークを実現するための通信制御技術を提供することである。
本発明に係る通信制御方法は、各々光ネットワークを介して且つ電気ネットワークを介して接続され、且つ、各々1又は複数の装置を担当する、第1の電気スイッチと第2の電気スイッチとの間の通信を制御する通信制御方法である。この通信制御方法は、(A)第1の電気スイッチから第2の電気スイッチへの光回線の第1の設定要求に関連してブロッキングの有無を判定し、(B)ブロッキングがある場合には、第1の電気スイッチから、第1の電気スイッチから第2の電気スイッチへの光回線の第2の設定要求を送信する第1の処理と、第1の電気スイッチから、電気ネットワークを介して第1の設定要求に係るパケット又はパケットフローを送信する第2の処理とのうち少なくともいずれかの処理を実行する処理を含む。
本発明に係る通信制御装置は、各々光ネットワークを介して且つ電気ネットワークを介して接続され、且つ、各々1又は複数の装置を担当する、第1の電気スイッチと第2の電気スイッチとの間の通信を制御する通信制御装置である。そして、この通信制御装置は、第1の電気スイッチから第2の電気スイッチへの光回線の第1の設定要求に関連してブロッキングの有無を判定し、ブロッキングがある場合には、第1の設定要求の再送要求を第1の電気スイッチへ送信する第1の処理と、第1の電気スイッチから第2の電気スイッチへの電気ネットワークを介した通信を開始させるための第2の処理とのいずれかを実行する。
図1は、本発明の実施の形態に係る電気光ハイブリッドスイッチネットワークの構成を示す図である。 図2は、電気スイッチ部の構成例を示す図である。 図3は、光スイッチ部の構成例を示す図である。 図4は、スイッチ制御部の機能構成例を示す図である。 図5は、スイッチ制御部の機能構成の詳細例を示す図である。 図6は、光回線交換スイッチの入出力ポートを管理するためのテーブルの一例を示す図である。 図7は、本発明の実施の形態に係る電気光ハイブリッドスイッチネットワークの処理シーケンス例を示す図である。 図8は、本発明の実施の形態に係る電気光ハイブリッドスイッチネットワークの処理シーケンス例を示す図である。 図9は、本発明の実施の形態に係る電気光ハイブリッドスイッチネットワークの処理シーケンス例を示す図である。 図10は、本発明の実施の形態に係る電気光ハイブリッドスイッチネットワークの処理シーケンス例を示す図である。 図11は、本発明の実施の形態に係る電気光ハイブリッドスイッチネットワークのブロッキング率を計算する際に使用したネットワークモデルを示す図である。 ネットワークモデルに基づき計算された光回線交換スイッチとしてのブロッキング特性を示す図である。 図13は、本発明の第2の実施の形態に係る電気光ハイブリッドスイッチネットワークの構成を示す図である。 図14は、ラック構成の他の例を示す図である。 図15は、ラック構成のさらに他の例を示す図である。 図16は、ネットワーク制御部であるコンピュータ装置のブロック構成図である。
[実施の形態1]
図1に、本発明の実施に形態に係る電気光ハイブリッドスイッチネットワークの構成例を示す。図1に示す電気光ハイブリッドスイッチネットワークは、ラック部1、ToRスイッチ部2、電気スイッチ部3、光スイッチ部4、スイッチ制御部5、ケーブル配線部6、電気スイッチ部3のための制御回線7、光スイッチ部4のための制御回線8、ToRスイッチ部2のための制御回線9を有する。この電気光ハイブリッドスイッチネットワークは、下位にToRスイッチ部2、上位に電気スイッチ部3と光スイッチ部4を有する複数階層スイッチネットワークである。以下では、下位階層を分散層、上位階層を集約層と呼ぶ。なお、光スイッチ部4は、光ネットワークの一例であり、電気スイッチ部3は、電気ネットワークの一例である。また、スイッチ制御部5は、通信制御装置の一例である。
ラック部1は、ラック1-1乃至1-nを含み、ToRスイッチ部2はToRスイッチ2-1乃至2-nを含む。ToRスイッチ部2の各ToRスイッチと電気スイッチ部3とは、電気または光ケーブル配線部61によって接続される。ToRスイッチ部2の各ToRスイッチと光スイッチ部4とは、光ケーブル配線部62によって接続される。例えば、非特許文献1のデータセンターでは、ToRスイッチ部2は約千個以上のToRスイッチを含む場合があり、その場合、約数万から数十万のサーバが収容される。サーバは、情報処理装置の一例であり、サーバ及びストレージ装置を含めて、ToRスイッチが担当する装置である。
図2に、図1に示した電気スイッチ部3の構成例を示す。電気スイッチ部3は単一又は複数階層の電気ルータもしくは電気パケットスイッチを含む。これらは電気通信機器の一例である。例えば、分散層のToRスイッチ部2に接続されるh個の電気通信機器311~31hは、i個の電気通信機器321~32iによって、電気スイッチ部3の最上位段kに位置するj個の電気通信機器3k1~3kjへ各々接続される。電気スイッチ部3の段数kおよび電気スイッチ部3の最下位に位置する電気通信機器の並列数hは1以上の数値をとる。また、より上位に位置する電気通信機器の並列数i、jは0以上の数値をとる。
図3に、図1に示した光スイッチ部4の構成例を示す。光スイッチ部4は単一又は複数の光回線交換スイッチを含む。光回線交換スイッチは光通信機器の一例である。なお、光通信機器と電気通信機器を総称して通信機器と呼ぶものとする。例えば、光回線交換スイッチ411~41mは、分散層のToRスイッチ部2における各ToRスイッチと接続される。なお、光回線交換スイッチの並列数mは1以上の数値をとる。非特許文献1のデータセンターに対処するためには、千ポート数規模の光回線交換スイッチが用いられる。例えば、大規模光スイッチの構成方法の例は、非特許文献2に開示されている。
図4に、図1に示したスイッチ制御部5の構成例を示す。スイッチ制御部5は、電気スイッチ制御部51、光スイッチ制御部52、及びToRスイッチ制御部53を含む。電気スイッチ制御部51は、電気スイッチ部3のための制御回線7を介して電気スイッチ部3と接続される。光スイッチ制御部52は、光スイッチ部4のための制御回線8を介して光スイッチ部4と接続される。ToRスイッチ制御部53は、ToRスイッチ部3のための制御回線9を介してToRスイッチ部2と接続される。なお、スイッチ制御部5において、電気スイッチ制御部51とToRスイッチ制御部53が出力する制御信号、光スイッチ制御部52とToRスイッチ制御部53が出力する制御信号は互いに共有される場合がある。
図5に、図4に示した電気スイッチ制御部51、光スイッチ制御部52及びToRスイッチ制御部53の詳細な構成例を示す。電気スイッチ制御部51は、第1接続管理部511と電気スイッチ切替部512と第1負荷率計測部513とを有する。光スイッチ制御部52は、第2接続管理部521とブロッキング検出部522と光スイッチ切替部523と第2負荷率計測部524とを有する。ToRスイッチ制御部53は、第3接続管理部531とToRスイッチ切替部532とを有する。
第1接続管理部511は、電気スイッチ部3のための制御回線7、および第1負荷率計測部513を介して、電気スイッチ部3の接続情報(接続状態に関する情報)を収集し、電気スイッチ部3の切替に関する制御信号を電気スイッチ切替部512へ出力する。電気スイッチ切替部512は、制御信号に従って電気スイッチ部3内の電気通信機器に対する設定を行う。
第2接続管理部521は、光スイッチ部4のための制御回線8、および第2負荷率計測部524を介して、光スイッチ部4の接続情報(接続状態に関する情報)を収集し、光スイッチ4の切替に関する制御信号をブロッキング検出部522に出力する。第2接続管理部521とブロッキング検出部522は、光スイッチ部4の切替に関する制御信号を共有する。ブロッキング検出部522は、第2接続管理部521からの、光スイッチ部4の切替に関する制御信号を、光スイッチ切替部523へ出力する。光スイッチ切替部523は、制御信号に従って光スイッチ部4内の光回線交換スイッチに対する設定を行う。
第3接続管理部531は、ToRスイッチ部2のための制御回線9を介してToRスイッチ部2の接続情報(接続状態に関する情報)を収集し、ToRスイッチ部2の切替に関する制御信号をToRスイッチ切替部532に出力する。ToRスイッチ切替部532は、制御信号に従ってToRスイッチ部2内のToRスイッチに対する設定を行う。
なお、第1接続管理部511と第3接続管理部531はそれらの制御信号を、第2接続管理部521と第3接続管理部531はそれらの制御信号を共有する場合がある。また、第1負荷率計測部513は、電気スイッチ部2に流入及び電気スイッチ部2から流出する電気パケットもしくはパケットフローの量から負荷率を計測する。第2負荷率計算部524は、光スイッチ部4に流入及び光スイッチ部4から流出するパケットもしくはパケットフローの量から負荷率を計測する。ここで負荷率は,電気または光ケーブル配線部61各々のケーブルを流れるパケットもしくはパケットフローの量或いは複数のケーブルに関するパケットもしくはパケットフローの量などから計算する。例えば、1本の10Gbpsのケーブルに、1Gbps相当のパケットもしくはパケットフローが存在すれば、負荷率は0.1となる。また、3本の10Gbpsのケーブルについて、それぞれ1Gbps、2Gbps、3Gbps相当のパケットもしくはパケットフローが存在すれば、負荷率は0.2(=(1+2+3)/30)となる。負荷率の尺度はこれに留まらず、各種方法が想定される。
次に本実施の形態に係る電気光ハイブリッドスイッチネットワークの動作について説明する。一例として、二つの異なるラックに含まれるサーバあるいは当該2つの異なるラックが光スイッチ部4を経由して情報を伝達する場合を想定する。なお、ここでは送信側のToRスイッチをToRスイッチ#A、受信側のToRスイッチをToRスイッチ#Bと呼ぶものとする。
ToRスイッチ#Aは、ToRスイッチ#Bまでの光回線設定要求をToRスイッチ部3のための第3接続管理部531に送信する。これに応じて、第3接続管理部531は、ToRスイッチ#AとToRスイッチ#Bの間の接続要求に関する情報を、光スイッチ部4のための第2接続管理部521へ伝達する。これに応じて、第2接続管理部521は、ブロッキング検出部522に、ToRスイッチ#AとToRスイッチ#Bの間に光回線を設定する命令を出力する。この時、ブロッキング検出部522は、要求されたToRスイッチ#AとToRスイッチ#Bの間に光回線が設定可能かどうか、つまりブロッキングの発生有無を確認する。
ブロッキングの検出方法として、ToRスイッチ部2からの光回線設定要求を満たす光回線交換スイッチの入出力ポートがすでに使用されていればブロッキングが発生したと判定する方法などが考えられる。例えば、第2接続管理部521は、図6に示すようなテーブルで接続状態を管理しておく。図6では、入力ポート数P及び出力ポート数Qである光回線交換スイッチの接続状態を示している。なお、接続状態とは、入出力ポートの組み合わせ毎に接続可能または接続不可を表すものである。
図6の例では、各行が入力ポート、各列が出力ポートに対応し、接続可能な入出力ポートの組を丸印(○)、接続済み又は除外のため接続不可の入出力ポートの組をバツ印(×)又はマイナス印(-)で示す。なお、ここでは、同じ番号の入出力ポートの組については除外(-)とされる。この例では、入力ポート2と出力ポート1、および入力ポートPと出力ポート3が接続済みとしており、それらの入出力ポートに関連する組は接続済みのバツ印(×)又はマイナス印(-)となっている。このように、本実施の形態ではネットワーク全体の接続状態を管理することなく、図6のようなテーブルを管理してこれを参照するのみで、光スイッチ部4の接続状態を確認できる。上で述べた特許文献1や非特許文献2に示す従来技術は、電気光ハイブリッドスイッチネットワークに接続される全ての電気スイッチおよび光スイッチの使用可否を確認し、ブロッキングの有無や回線設定の可否を判定する。よって、本実施の形態は、従来技術と比較して低遅延かつ簡易な制御が可能となる。
光回線が設定可能な場合は、第2接続管理部521からの命令を受けた光スイッチ切替部523は、光スイッチ部4を介したToRスイッチ#AとToRスイッチ#Bの間に光回線を設定する。光回線が設定不能な場合は、ブロッキング検出部522は、ブロッキングが発生したと判断し、第2接続管理部521を経由して、ToRスイッチ部2のための第3接続管理部531へブロッキング情報を通知する。
ブロッキング情報の通知を受けた第3接続管理部531は、第1の例として、ToRスイッチ#Aにおいて当初光回線により伝達することを想定していたパケットおよびパケットフローを直ちに電気スイッチ部3へ転送するため、第1接続管理部511に、ToRスイッチ#AとToRスイッチ#Bの間の接続要求に関する情報を出力する。これに応じて、第1接続管理部511は、電気スイッチ部3の設定を、電気スイッチ切替部512を介して行わせる。
また、第2の例として、まず光回線による転送を再度試みるものの、ある条件を満たした場合にはToRスイッチ#AからToRスイッチ#Bへ電気スイッチ部3を経由してパケット又はパケットフローを転送する。このため、ブロッキング情報の通知を受けた第3接続管理部531は、再送要求を、光回線設定要求の送信元であるToRスイッチ#Aに送信する。これに応じて、ToRスイッチ#Aは、再度光回線設定要求を、スイッチ制御部5に送信する。
上で述べたある条件は、例えば、ブロッキングに基づく光回線設定要求の再送が一定回数に達するという条件である。この条件が満たされると、ToRスイッチ#Aにおいて光回線により転送することを想定していたパケット又はパケットフローを電気スイッチ部3へ転送するため、第3接続管理部531は、第1接続管理部511に、ToRスイッチ#AとToRスイッチ#Bの間の接続要求に関する情報を出力する。これに応じて、第1接続管理部511は、電気スイッチ部3の設定を、電気スイッチ切替部512を介して行わせる。
上で述べたある条件は、光回線設定要求に対する最初のブロッキング発生検出からの、光回線設定要求送信の継続時間が、予め設定された一定時間を経過したという条件であってもよい。
さらに、第3の例としては、ブロッキング検出部522と電気スイッチ部3のための第1負荷率計測部513の情報等を利用する方法がある。例えば、ブロッキング情報の通知を受けた、ToRスイッチ部2のための第3接続管理部531は、電気スイッチ部2のための第1接続管理部511を経由して、電気スイッチ部3の使用率又は負荷率、あるいはToRスイッチ#Aと電気スイッチ部3とを接続するケーブル(リンクとも呼ぶ)の使用率の情報を取得する。なお、第1接続管理部511は、電気スイッチ部3に含まれる電気通信機器の登録情報及び入出力ポートの占有度合いや使用可否を管理している。この登録情報は、電気通信機器の個体を識別するための情報であり、例えばMACアドレスやIPアドレスなどである。電気スイッチ部3における各電気通信機器は定期的に入出力ポートの占有度合いを通知するので、第1接続管理部511は、当該占有度合いや当該占有度合いに基づく入出力ポートの使用可否を管理する。ここで電気スイッチ部3の使用率としては、電気スイッチ部3に属する個々の電気スイッチ或いはルータにおけるパケット廃棄率或いは遅延の値を用いる方法や、電気スイッチ部3全体におけるパケット廃棄率や遅延の値に基づくものなど種々のものが適用可能である。また、ToRスイッチ#Aと電気スイッチ部3とを接続するケーブルの使用率として、電気または光ケーブル配線部61各々のケーブルを流れるパケットもしくはパケットフローの量或いは複数のケーブルに関するパケットもしくはパケットフローの量などから計算する。例えば、1本の10Gbpsのケーブルに、1Gbps相当のパケットもしくはパケットフローが存在すれば、使用率は0.1となる。また、3本の10Gbpsのケーブルについて、それぞれ1Gbps、2Gbps、3Gbps相当のパケットもしくはパケットフローが存在すれば、使用率は0.2(=(1+2+3)/30)となる。使用率の尺度はこれに留まらず、各種方法が想定される。
第3接続管理部531は、電気スイッチ部3の使用率又は負荷率、あるいはToRスイッチ#Aと電気スイッチ部3とを接続するケーブルの使用率が予め設定された基準値以上であるか否かを判断する。使用率などが基準値以上である場合に、ToRスイッチ#Aにおいて当初光回線により転送することを想定していたパケット又はパケットフローを再度光回線で転送することを試みるために、第3接続管理部531は、再送要求を、光回線設定要求の送信元であるToRスイッチ#Aに送信する。これに応じて、ToRスイッチ#Aは、再度光回線設定要求を、スイッチ制御部5に送信する。
一方、電気スイッチ部3の使用率又は負荷率、あるいはToRスイッチ#Aと電気スイッチ部3とを接続するケーブルの使用率が予め設定された基準値未満の場合には、ToRスイッチ#Aにおいて当初光回線により転送することを想定していたパケット又はパケットフローを電気スイッチ部3を経由して転送する。このため、第3接続管理部531は、第1接続管理部511に、ToRスイッチ#AとToRスイッチ#Bの間の接続要求に関する情報を出力する。これに応じて、第1接続管理部511は、電気スイッチ部3の設定を、電気スイッチ切替部512を介して行わせる。
次に、図7乃至図10を用いて、本実施の形態に係る電気光ハイブリッドスイッチネットワークの詳細な処理シーケンスを説明する。以下、ToRスイッチ#A(2-o)が光回線によりパケット又はパケットフローをToRスイッチ#B(2-p)へ転送する場合について説明する。図7の例では、ブロッキングが発生していない場面について説明する。また、本実施の形態では、各場面において、接続設定、データ転送、接続解除の三つのフェーズを含む。
接続設定フェーズでは、まずToRスイッチ#A(2-o)がスイッチ制御部5へ光回線設定要求を送信する(S1)。光回線設定要求を受信したスイッチ制御部5は、光スイッチ部4へ光回線接続要求を送信する(S2)。これによって光スイッチ部4は、ToRスイッチ#A(2-o)からToRスイッチ#B(2-p)への光回線の設定を行う。また、スイッチ制御部5は、ToRスイッチ#B(2-p)へ光回線による接続設定要求を送信する(S3)。さらに、スイッチ制御部5は、ToRスイッチ#A(2-o)へ送信接続要求を送信する(S4)。これに対して、ToRスイッチ#A(2-o)は、送信許可通知をスイッチ制御部5へ送信する(S5)。また、ToRスイッチ#B(2-p)は、通信可能であれば、受信許可通知をスイッチ制御部5へ送信する(S6)。一方、光回線の設定の後、光スイッチ部4は、光回線接続許可をスイッチ制御部5へ送信する(S7)。このように、ToRスイッチ#A(2-o)、ToRスイッチ#B(2-p)及び光スイッチ部4から肯定的な応答を受信すると、スイッチ制御部5は、ToRスイッチ#A(2-o)へ送信命令を送信する(S8)。
データ転送フェーズでは、送信命令を受信したToRスイッチ#A(2-o)は、ToRスイッチ#B(2-p)へパケット又はパケットフローを送信する(S15)。パケット又はパケットフローの転送が終了したとき、ToRスイッチ#A(2-o)は、ToRスイッチ#B(2-p)へデータ送信完了を通知する(S16)。
接続解除フェーズでは、ToRスイッチ#A(2-o)は、光回線解放要求をスイッチ制御部5へ送信する(S21)。これに対してスイッチ制御部5は、光スイッチ部4へ光回線接続解除要求を送信する(S22)。光スイッチ部4は、今回用いていた光回線を解放するための設定を行う。また、スイッチ制御部5は、ToRスイッチ#B(2-p)へ接続解除要求を送信する(S23)。さらに、スイッチ制御部5は、ToRスイッチ#A(2-o)へ送信器解放要求を送信する(S24)。これに対して、ToRスイッチ#A(2-o)は、送信器解放通知をスイッチ制御部5へ送信する(S25)。また、ToRスイッチ#B(2-p)は、接続解除通知をスイッチ制御部5へ送信する(S26)。さらに、光スイッチ部4は、光回線解放通知をスイッチ制御部5へ送信する(S27)。
このような一連の処理を通じて、ToRスイッチ間における通信が光スイッチ部4における光回線を介して行われるようになる。なお、本シーケンスにおける処理に関して、送信許可や受信許可などの一部のステップを省略することで処理の高速化を図るようにしても良い。また、一連の処理においては、異常事象に対する処理は記されていないが、必要に応じて対応する処理を追加しても良い。
次に、図8を用いて、ブロッキングが検出されて、ToRスイッチ#A(2-o)が電気スイッチ部3を介してデータを転送する場合の処理シーケンスの一例を説明する。接続設定フェーズでは、まずToRスイッチ#A(2-o)がスイッチ制御部5へ光回線設定要求を送信する(S31)。ここで、スイッチ制御部5のブロッキング検出部522は、ブロッキングの発生を検出する(S32)。そうすると、上で述べた第1の例では、スイッチ制御部5は、直ちに電気回線接続要求を電気スイッチ部3に送信する(S33)。一方、上で述べた第3の例では、スイッチ制御部5は、電気スイッチ部3の使用率又は負荷率、あるいはToRスイッチ#A(2-o)と電気スイッチ部3とを接続するケーブルの使用率が予め設定された基準値以上であるか否かをさらに判断する。そして、この条件を満たさない場合に、スイッチ制御部5は、電気回線接続要求を電気スイッチ部3に送信する(S33)。このように、電気スイッチ部3を経由した転送が許容される条件を満たしている(上記使用率などが基準値未満である)場合であれば、当初光回線経由の転送を想定していても電気回線経由で転送する。
そして、スイッチ制御部5は、ToRスイッチ#B(2-p)へ電気スイッチ部3経由の接続設定要求を送信する(S34)。さらに、スイッチ制御部5は、ToRスイッチ#A(2-o)へ電気スイッチ部3経由での送信接続要求を送信する(S35)。これに対して、ToRスイッチ#A(2-o)は、送信許可通知をスイッチ制御部5へ送信する(S36)。また、ToRスイッチ#B(2-p)は、通信可能であれば、受信許可通知をスイッチ制御部5へ送信する(S37)。一方、電気スイッチ部3の設定の後、電気スイッチ部3は、電気回線接続許可をスイッチ制御部5へ送信する(S38)。このように、ToRスイッチ#A(2-o)、ToRスイッチ#B(2-p)及び電気スイッチ部3から肯定的な応答を受信すると、スイッチ制御部5は、ToRスイッチ#A(2-o)へ送信命令を送信する(S39)。
データ転送フェーズでは、送信命令を受信したToRスイッチ#A(2-o)は、ToRスイッチ#B(2-p)へ電気スイッチ部3を経由してパケット又はパケットフローを送信する(S15)。パケット又はパケットフローの転送が終了したとき、ToRスイッチ#A(2-o)は、ToRスイッチ#B(2-p)へデータ送信完了を通知する(S46)。
接続解除フェーズでは、ToRスイッチ#A(2-o)は、電気回線解放要求をスイッチ制御部5へ送信する(S51)。これに対してスイッチ制御部5は、電気スイッチ部3へ電気回線接続解除要求を送信する(S52)。電気スイッチ部3は、今回用いていた電気回線を解放するための設定を行う。また、スイッチ制御部5は、ToRスイッチ#B(2-p)へ接続解除要求を送信する(S53)。さらに、スイッチ制御部5は、ToRスイッチ#A(2-o)へ送信器解放要求を送信する(S54)。これに対して、ToRスイッチ#A(2-o)は、送信器解放通知をスイッチ制御部5へ送信する(S55)。また、ToRスイッチ#B(2-p)は、接続解除通知をスイッチ制御部5へ送信する(S56)。さらに、電気スイッチ部3は、電気回線解放通知をスイッチ制御部5へ送信する(S57)。
このような一連の処理を通じて、ToRスイッチ間における通信が電気スイッチ部3における電気回線を介して行われるようになる。なお、本シーケンスにおける処理に関して、送信許可や受信許可などの一部のステップを省略することで処理の高速化を図るようにしても良い。また、一連の処理においては、異常事象に対する処理は記されていないが、必要に応じて対応する処理を追加しても良い。
次に、図9を用いて、ブロッキングが検出されても、上で述べた第3の例においてToRスイッチが電気スイッチ部3を介してデータを転送するのが不適切なケースの処理シーケンスの一例を説明する。接続設定フェーズでは、まずToRスイッチ#A(2-o)がスイッチ制御部5へ光回線設定要求を送信する(S61)。ここで、スイッチ制御部5のブロッキング検出部522は、ブロッキングの発生の有無を判断する(S62)。ここではブロッキングの発生を検出するものとする。そうすると、上で述べた第3の例では、スイッチ制御部5は、電気スイッチ部3の使用率又は負荷率、あるいはToRスイッチ#A(2-o)と電気スイッチ部3とを接続するケーブルの使用率を取得して、電気スイッチ部3の使用率又は負荷率、あるいはToRスイッチ#A(2-o)と電気スイッチ部3とを接続するケーブルの使用率が予め設定された基準値以上であるか否かをさらに判断する。ここでは、この条件が満たされているものとする。この条件が満たされているにもかかわらず電気スイッチ3を経由した転送を行うと、電気スイッチ部3の負荷率又は使用率がさらに上昇して転送効率が低下する可能性があるためである。
そうすると、スイッチ制御部5は、再送要求をToRスイッチ#A(2-o)に送信する(S63)。ToRスイッチ#A(2-o)は、再送要求に応じて、再度光回線設定要求をスイッチ制御部5に送信する(S64)。これに対して、スイッチ制御部5は、再度ブロッキングの発生の有無を判断する(S65)。ここでブロッキングの発生がないことが確認されると、以降の処理シーケンスは、図6に示したS2以降のシーケンスを実行することになる。よって説明は省略する。なお、ステップS65でもブロッキングの発生が再度確認されて、さらに、電気スイッチ部3の使用率又は負荷率、あるいはToRスイッチ#Aと電気スイッチ部3とを接続するケーブルの使用率が予め設定された基準値以上であると判断されると、ステップS63に戻って再送要求を、ToRスイッチ#A(2-o)に送信する。
このように、当初光回線経由での転送を想定していてブロッキングが発生すると、電気回線経由での転送も検討した上で、適切な転送経路が選択される。
次に、図10を用いて、上で述べた第2の例に関する処理シーケンスの例を説明する。接続設定フェーズでは、まずToRスイッチ#A(2-o)がスイッチ制御部5へ光回線設定要求を送信する(S71)。ここで、スイッチ制御部5のブロッキング検出部522は、ブロッキングの発生の有無を判断する(S72)。ここではブロッキングの発生を検出するものとする。そうすると、上で述べた第2の例では、スイッチ制御部5は、再送要求をToRスイッチ#A(2-o)に送信する(S73)。ToRスイッチ#A(2-o)は、再送要求に応じて、再度光回線設定要求をスイッチ制御部5に送信する(S74)。再送回数ベースで判断する場合には、ここで1回目が計数される。継続時間ベースであれば、ステップS72から継続時間を計測し始める。そして再度ステップS72を実行し、まだブロッキングの発生状態であれば、再度ステップS73及びS74を実行する。
その後、ToRスイッチ#A(2-o)が、再送要求を送信して(S75)、これに対してスイッチ制御部5が、ブロッキングの発生の有無を判断する。これでもブロッキングの発生が確認されると、スイッチ制御部5は、さらに、再送回数が一定回数以上となったか否か又は継続時間が一定時間以上となったか否かを判断する(S77)。この条件を満たしたと判断された場合には、電気スイッチ部3経由でデータ転送を行うことになるので、スイッチ制御部5は、電気回線接続要求を電気スイッチ部3に送信する(S33)。以降は、図8のステップS34以降と同じになるので、説明は省略する。
このような処理を行うことで、基本的に光回線経由でデータ転送を行うことを試みるが、なかなかブロッキングが解消されない場合には、電気スイッチ部3経由でデータ転送を行うように経路を切り替えることができるようになる。
次に、本実施の形態に係る電気光ハイブリッドスイッチネットワークのブロッキング特性について説明する。図11はブロッキング率を計算する際に使用したネットワークモデルの一例を示している。図11に示す例では、送信側ToRスイッチ部2-1と受信側ToRスイッチ部2-n(個々のToRスイッチは、送信部と受信部が含まれる)が光スイッチ部4を経由して通信する場合を考える。送信側ToRスイッチ部2-1は、q個の電気スイッチ211~21qを含む。光スイッチ部4はm個の光回線交換スイッチ411~41mを含む。受信側ToRスイッチ部2-nは、r個の電気スイッチ2n1~2nrを含む。
ここで、説明の便宜上、送受信側のToRスイッチ部に配置される電気スイッチの個数が等しい場合、つまりq=rを考える。このとき、各電気スイッチと光スイッチ部4の相互接続は、それぞれm個の入出力ポートを介して行われる。ToRスイッチ制御部53および光スイッチ制御部52では、ToRスイッチ部2と光スイッチ部4の接続状態が管理される。
図12は、図11のモデル図に基づき計算された光回線交換スイッチとしてのブロッキング特性を示す図である。縦軸はブロッキング率を示している。横軸は光回線交換スイッチの並列数(この場合m)であり、各ToRに配置された電気スイッチの複数のポート(m)を用いて接続される。簡単化のためq=r=1000とすると、例えば光回線交換スイッチの並列数mが64のとき、光スイッチ部4の各光回線交換スイッチの入出力ポート数は片方向当たり1000、光スイッチ部4の入出力ポート総数は片方向当たり64000(=1000*64)となる。また、各系列(1)-(4)は負荷率ρの違いを表している。系列(1)、(2)、(3)、(4)は、それぞれ負荷率ρ=0.2、ρ=0.4、ρ=0.6、ρ=0.8に対応する。
m=64以上の並列数を得る場合、負荷率を0.6以下に設定することで、ブロッキング率を10-5以下に抑えることができる。ブロッキングが発生した後に光回線設定要求の再送を行った場合のブロッキング率を考える。例えば、ブロッキング率10-6の品質でブロッキングが発生した場合、当初光回線により転送することを想定していたパケット又はパケットフローを再度光回線で転送することを試みる。このとき、各送信事象が独立とすると、2回続けてブロッキングされるブロッキング率は10-6×10-6=10-12となる。10-12のブロッキング率は小さな値であり、この様に再送した光回線設定要求が再度ブロッキングになる確率は非常に低くなるため、本実施の形態に記載するような再送処理は極めて有効である。
一方、1回の光回線設定による処理遅延が100μsの確定値とすると、遅延時間は再送を行った場合でも200μsの確定値となる。この値は、現状のデータセンターの遅延時間に比べて小さい。他の例として、ブロッキングが発生した場合に、当初光回線により伝送することを想定していたパケット又はパケットフローを電気スイッチ部3へ転送する場合を考える。各々のToRスイッチにおいて、光スイッチ部4と電気スイッチ部3が扱うトラフィックの割合がそれぞれ0.9、0.1とすると、ブロッキング率10-6の品質でブロッキングが発生した場合、0.9×10-6≒10-6のトラフィック量が電気スイッチ部3へ転送されることとなる。電気スイッチ部3が扱う当該ToRスイッチからのトラフィックは0.1なので、10-6のトラフィック量を受け付けた場合において当該ToRスイッチの電気スイッチ部3へのリンクの使用率の増加は10-6/0.1=10-5(0.001%)となる。0.001%の使用率の増加は、電気スイッチ部3の遅延時間にほとんど影響を与えない値である。
一方、ToRスイッチの電気スイッチ部へのリンクの利用率を1%上昇させるブロッキング率は10-3であり、光スイッチ部4のブロッキング率をその値以下に下げておく(10-4以下など)ことで、ブロッキングが電気スイッチ部3へ与える影響を小さくすることできる。これにより、電気スイッチ部3と光スイッチ部4の制御機構を独立に扱うことができ、単純なソフトウエアもしくはハードウェア構成で経路選択制御が実現でき、これにより効率的な電気光ハイブリッドスイッチを用いてデータセンター内ネットワークを高性能化できる。
以上のように、本実施の形態はブロッキング発生後に電気スイッチ部3もしくは光スイッチ部4を通過する経路を選択し、送信側ToRスイッチのパケット又はパケットフローをその経路で転送することで、データの転送に失敗する可能性を下げることができる。また、適切なmの値を設定することで、再度光回線設定要求を送信する場合における光スイッチ部4のブロッキング率や電気スイッチ部の使用率上昇値は非常に小さく、転送成功に対する遅延時間分布の期待値を下げることができる。さらに、ネットワーク全体を含めた動的なネットワーク制御を行わないため、単純なソフトウエアもしくはハードウェア構成でネットワークを制御できる。これにより、スイッチ制御部5で生じる処理遅延が小さくなり、高速なデータ転送が可能となる。
[実施の形態2]
図13は、本発明の第2の実施の形態に係る電気光ハイブリッドスイッチネットワークの構成を示す。図13に示す電気光ハイブリッドスイッチネットワークは、ラック部1000、ToRスイッチ部2000、電気スイッチ部3000、光スイッチ部4000、制御信号転送用のネットワーク5000、ケーブル配線部6000、電気スイッチ部3000のための制御回線7000、光スイッチ部4000のための制御回線8000を含む。ラック部1000は、ラック1000-1乃至1000-nを含み、ToRスイッチ部2000は、ToRスイッチ2000-1乃至2000-nを含む。ToRスイッチ部2000の各ToRスイッチと電気スイッチ部3000とは、電気または光ケーブルによって接続される。ToRスイッチ部2000の各ToRスイッチと光スイッチ部4000とは、光ケーブルによって接続される。
制御信号転送用のネットワーク5000は、光スイッチ部4000のための制御回線8000、必要に応じて電気スイッチ部3000のための制御回線7000を経由して光スイッチ部4000、また必要に応じて電気スイッチ部3000と制御信号を共有する。なお、制御信号転送用のネットワーク5000は制御信号を伝達し、ToRスイッチ部2000と光スイッチ部4000および必要に応じて電気スイッチ部3000とを結ぶネットワークは情報を伝達する役割を持ち、ToRスイッチ同士の信号を転送する光スイッチ部3000あるいは電気スイッチ部4000と機能的には独立なネットワークである。
次に図13に示す電気光ハイブリッドスイッチネットワークの動作について説明する。例えば、二つの異なるラックが光スイッチ部4000を経由して情報を伝達する場合を考える。なお、ここでは送信側のToRスイッチをToRスイッチ#Cと呼び、受信側のToRスイッチをToRスイッチ#Dと呼ぶ。ToRスイッチ#Cは、ToRスイッチ#Dまでの光回線設定要求を制御信号転送用のネットワーク5000を介してスイッチ制御部に通知する。ToRスイッチ制御部53は、この光回線設定要求に応じて、ToRスイッチ#CとToRスイッチ#Dとの間の接続要求に関する情報を、光スイッチ部のための第2接続管理部521へ伝達する。光回線が設定不能な場合は、ブロッキングが発生したと判断する。このような場合には、第1の実施の形態と同様に、ToRスイッチ#CからToRスイッチ#Dまでの光回線設定要求の再送を試みる。
このように、光スイッチ部4000、電気スイッチ部3000と独立した制御信号転送用のネットワーク5000を別途構築することにより、データセンター内ネットワーク負荷の大きさに左右されず、安定した高品質の制御信号転送が可能となる。なお、ブロッキングを検出した場合、ToRスイッチ#Cにおいて当初光回線により伝達することを想定していたパケット又はパケットフローを、制御信号転送用のネットワーク5000を経由してToRスイッチ#Dへ転送することに利用することも可能である。制御信号転送用のネットワーク5000は単一もしくは複数階層の電気ルータもしくは電気パケットスイッチから構成され、電気スイッチ部3と類似の構成を有する。そのため、本実施の形態に係る電気光ハイブリッドスイッチネットワークも、高信頼且つ低遅延にデータ転送することが可能となる。
[その他の実施の形態]
上で述べた実施の形態では、図1に示すように各ラックにToRスイッチを設置する構成を前提に説明した。しかしながら、本発明はこれに限定されるものではない。例えば、図14に示すように、各々1又は複数のサーバやメモリなどが配置されたラック1-1乃至1-nと並列に、ToRスイッチと等価な機能を有する電気スイッチ20-1乃至20-nを含むラック1-xをラック1-1乃至1-nの端に設ける場合もある。ラック1-1乃至1-nは電気リンク或いは光リンク11を介して電気スイッチ20-1乃至20-nに接続する。これは、End of row構成と呼ばれる。また、図15に示すように、ラック1-xをラック1-1乃至1-nの中程に配置するような、Middle of row構成を採用するようにしても良い。いずれの場合も、電気スイッチ20-1がラック1-1を担当し、電気スイッチ20-2がラック1-2を担当する、といったような一対一関係であっても良いし、1又は複数のラックを1つの電気スイッチ20が担当するようにしても良い。さらに、ラックとは無関係に各電気スイッチ20が担当するサーバやメモリなどが設定されている場合もある。
すなわち、ToRスイッチと等価な機能を有する電気スイッチ20-1乃至20-nについても、スイッチ制御部5と協働して、上で述べた低遅延なデータ転送を可能にする電気光ハイブリッドスイッチネットワークを実現することが出来る。
以上、本発明の実施の形態について説明したが、本発明はこれに限定されるものではない。例えば、ネットワーク制御部5の機能構成例は一例であり、プログラムモジュール構成とは対応しない場合もある。また、動作シーケンスについても、処理結果が変わらない限り、ステップの順番を入れ替えたり、複数ステップを並列に実行するようにしてもよい。
また、実施の形態の組み合わせや、各実施の形態における任意の技術的特徴の組み合わせは、その目的に応じて随時なされるものである。
なお、上で述べたスイッチ制御部5は、例えばコンピュータ装置であって、図16に示すように、メモリ2501とCPU(Central Processing Unit)2503とハードディスク・ドライブ(HDD:Hard Disk Drive)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517と周辺機器(イメージセンサ100、減衰機構300、冷却機構400などを含む)と接続するための周辺機器接続部2521とがバス2519で接続されている。なお、HDDはソリッドステート・ドライブ(SSD:Solid State Drive)などの記憶装置でもよい。オペレーティング・システム(OS:Operating System)及び本発明の実施の形態における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。CPU2503は、アプリケーション・プログラムの処理内容に応じて表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、所定の動作を行わせる。また、処理途中のデータについては、主としてメモリ2501に格納されるが、HDD2505に格納されるようにしてもよい。例えば、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータ装置は、上で述べたCPU2503、メモリ2501などのハードウエアとOS及びアプリケーション・プログラムなどのプログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
スイッチ制御部5は、1台の装置に実装される場合だけではなく、複数台の装置にその機能が分散実装される場合もある。また、CPUは、GPU(Graphics Processing Unit)或いはFPGA(Field-Programmable Gate Array)などの場合もある。
以上述べた実施の形態をまとめると以下のようになる。
本実施の形態に係る、各々光ネットワーク(例えば光スイッチ部4)を介して且つ電気ネットワーク(例えば電気スイッチ部3)を介して接続され、且つ、各々1又は複数の装置(例えばサーバなどの情報処理装置やストレージ装置など)を担当する、第1の電気スイッチ(例えばToRスイッチまたはToRスイッチと同様の機能を有する第2の電気スイッチ)との間の通信を制御する通信制御方法は、(A)第1の電気スイッチから第2の電気スイッチへの光回線の第1の設定要求に関連してブロッキングの有無を判定し、(B)ブロッキングがある場合には、第1の電気スイッチから、第1の電気スイッチから第2の電気スイッチへの光回線の第2の設定要求を送信する第1の処理と、第1の電気スイッチから、電気ネットワークを介して第1の設定要求に係るパケット又はパケットフローを送信する第2の処理とのうち少なくともいずれかの処理を実行する処理を含む。
このように、ブロッキングの発生に応じて、第1の処理、すなわち光回線の設定要求の再送と、第2の処理、すなわち電気ネットワーク経由でのデータ転送への切り替えとのうち少なくともいずれかを実施することで、低遅延でデータを転送可能となる。
なお、上で述べた判定する処理が、(a1)光ネットワークと電気ネットワークとに含まれる通信機器の制御を行う制御部(例えばスイッチ制御部5)が、第1の設定要求により用いられることとなる、光ネットワーク内の光回線交換スイッチの入出力ポートが既に使用されているか否かによりブロッキングの有無を判定する処理を含むようにしても良い。簡易な方法でブロッキングが検出できる。
また、(b1)上で述べた第2の処理を、ブロッキングがある場合に速やかに(すなわち光回線の設定要求の再送無く直ちに)実行するようにしても良い。転送の遅延を短くするためである。
さらに、(b2)ブロッキングがある場合であって、電気ネットワークの使用率又は負荷率、もしくは第1の電気スイッチと電気ネットワークを接続するリンクの使用率が、所定の基準値以上である場合に、第1の処理を実行するようにしても良い。電気ネットワークの使用率などが増加して他の通信への影響が発生しないようにするためである。
さらに、(b3)ブロッキングがある場合であって、電気ネットワークの使用率又は負荷率、もしくは第1の電気スイッチと電気ネットワークを接続するリンクの使用率が、所定の基準値未満である場合に、第2の処理を実行するようにしても良い。電気ネットワークの使用率などからして問題が無い場合には、転送の遅延を短くするために電気ネットワークを使用するものである。
さらに、(b4)ブロッキングがある場合に第1の処理を所定回数実行した後に、第2の処理を実行するようにしても良い。一方、(b5)ブロッキングがある場合に第1の処理を複数回実行して最初のブロッキング検知から所定時間経過した後、第2の処理を実行するようにしても良い。ブロッキングの発生が連続する確率は低いが、ブロッキング検出が続く場合には、電気ネットワーク経由でのデータ転送に切り替えるものである。
なお、上で述べた制御部(例えばスイッチ制御部5)が、光回線交換スイッチの入力ポートと出力ポートとの組み合わせについて少なくとも接続可能と接続不能とを管理するテーブルを管理するようにしても良い。これによって高速にブロッキングの発生を確認できるようになる。
また、第1の電気スイッチと第2の電気スイッチとの間に、さらに光ネットワークと電気ネットワークとに含まれる通信機器の制御を行う制御部が制御信号を送信するための第3のネットワークが接続されている構成であっても良い。この場合、上で述べた少なくともいずれかの処理を実行する処理が、第1の処理と、第2の処理と、第1の電気スイッチから、第3のネットワークを介して第1の設定要求に係るパケット又はパケットフローを送信する第3の処理とのうち少なくともいずれかの処理を実行する処理である場合もある。第3のネットワークを有効活用するものである。
本実施の形態に係る、各々光ネットワークを介して且つ電気ネットワークを介して接続され、且つ、各々1又は複数の装置を担当する、第1の電気スイッチと第2の電気スイッチとの間の通信を制御する通信制御装置(例えばスイッチ制御部)は、第1の電気スイッチから第2の電気スイッチへの光回線の第1の設定要求に関連してブロッキングの有無を判定し、ブロッキングがある場合には、第1の設定要求の再送要求を第1の電気スイッチへ送信する第1の処理と、第1の電気スイッチから第2の電気スイッチへの電気ネットワークを介した通信を開始させるための第2の処理とのいずれかを実行する。
上記通信制御方法を行う上で通信制御装置がこのような処理を行うことで、電気光ハイブリッドスイッチネットワークにおいて低遅延でデータを転送可能となる。なお、ブロッキングの検出には、光回線交換スイッチの入力ポートと出力ポートとの組み合わせについて少なくとも接続可能と接続不能とを管理するテーブルを用いる場合もある。
なお、上で述べたブロッキングがある場合に、上記第2の処理を速やかに実行するようにしても良い。また、ブロッキングがある場合であって、電気ネットワークの使用率又は負荷率、もしくは第1の電気スイッチと電気ネットワークを接続するリンクの使用率が、所定の基準値以上である場合に、第1の処理を実行し、電気ネットワークの使用率又は負荷率、もしくは第1の電気スイッチと電気ネットワークを接続するリンクの使用率が、所定の基準値未満である場合に、第2の処理を実行するようにしても良い。
さらに、ブロッキングがある場合に第1の処理を所定回数実行した後に、又は、ブロッキングがある場合に第1の処理を複数回実行して最初のブロッキング検知から所定時間経過した後、第2の処理を実行するようにしても良い。
以上述べた通信制御装置の処理をプロセッサに実行させるためのプログラムを作成することができて、そのプログラムは、様々な記憶媒体に記憶される。

Claims (14)

  1. 各々光ネットワークを介して且つ電気ネットワークを介して接続され、且つ、各々1又は複数の装置を担当する、第1の電気スイッチと第2の電気スイッチとの間の通信を制御する通信制御方法であって、
    前記第1の電気スイッチから前記第2の電気スイッチへの光回線の第1の設定要求に関連してブロッキングの有無を判定し、
    前記ブロッキングがある場合には、前記第1の電気スイッチから、前記第1の電気スイッチから前記第2の電気スイッチへの光回線の第2の設定要求を送信する第1の処理と、前記第1の電気スイッチから、前記電気ネットワークを介して前記第1の設定要求に係るパケット又はパケットフローを送信する第2の処理とのうち少なくともいずれかの処理を実行する
    処理を含む通信制御方法。
  2. 前記判定する処理が、
    前記光ネットワークと前記電気ネットワークとに含まれる通信機器の制御を行う制御部が、前記第1の設定要求により用いられることとなる、前記光ネットワーク内の光回線交換スイッチの入出力ポートが既に使用されているか否かにより前記ブロッキングの有無を判定する
    処理を含む請求項1の通信制御方法。
  3. 前記第2の処理を、前記ブロッキングがある場合に速やかに実行することを特徴とする
    請求項1又は2記載の通信制御方法。
  4. 前記ブロッキングがある場合であって、前記電気ネットワークの使用率又は負荷率、もしくは前記第1の電気スイッチと前記電気ネットワークを接続するリンクの使用率が、所定の基準値以上である場合に、前記第1の処理を実行する
    請求項1又は2記載の通信制御方法。
  5. 前記ブロッキングがある場合であって、前記電気ネットワークの使用率又は負荷率、もしくは前記第1の電気スイッチと前記電気ネットワークを接続するリンクの使用率が、所定の基準値未満である場合に、前記第2の処理を実行する
    請求項4記載の通信制御方法。
  6. 前記ブロッキングがある場合に前記第1の処理を所定回数実行した後に、前記第2の処理を実行する
    請求項1又は2記載の通信制御方法。
  7. 前記ブロッキングがある場合に前記第1の処理を複数回実行して最初のブロッキング検知から所定時間経過した後、前記第2の処理を実行する
    請求項1又は2記載の通信制御方法。
  8. 前記制御部が、
    前記光回線交換スイッチの入力ポートと出力ポートとの組み合わせについて少なくとも接続可能と接続不能とを管理するテーブルを管理する
    請求項2記載の通信制御方法。
  9. 前記第1の電気スイッチと前記第2の電気スイッチとの間に、さらに前記光ネットワークと前記電気ネットワークとに含まれる通信機器の制御を行う制御部が制御信号を送信するための第3のネットワークが接続されており、
    前記少なくともいずれかの処理を実行する処理が、
    前記第1の処理と、前記第2の処理と、前記第1の電気スイッチから、前記第3のネットワークを介して前記第1の設定要求に係るパケット又はパケットフローを送信する第3の処理とのうち少なくともいずれかの処理を実行する処理
    である請求項1又は2記載の通信制御方法。
  10. 各々光ネットワークを介して且つ電気ネットワークを介して接続され、且つ、各々1又は複数の装置を担当する、第1の電気スイッチと第2の電気スイッチとの間の通信を制御する通信制御装置であって、
    前記第1の電気スイッチから前記第2の電気スイッチへの光回線の第1の設定要求に関連してブロッキングの有無を判定し、
    前記ブロッキングがある場合には、前記第1の設定要求の再送要求を前記第1の電気スイッチへ送信する第1の処理と、前記第1の電気スイッチから前記第2の電気スイッチへの前記電気ネットワークを介した通信を開始させるための第2の処理とのいずれかを実行する
    通信制御装置。
  11. 前記ブロッキングがある場合に、前記第2の処理を速やかに実行する
    請求項10記載の通信制御装置。
  12. 前記ブロッキングがある場合であって、前記電気ネットワークの使用率又は負荷率、もしくは前記第1の電気スイッチと前記電気ネットワークを接続するリンクの使用率が、所定の基準値以上である場合に、前記第1の処理を実行し、
    前記電気ネットワークの使用率又は負荷率、もしくは前記第1の電気スイッチと前記電気ネットワークを接続するリンクの使用率が、前記所定の基準値未満である場合に、前記第2の処理を実行する、
    請求項10記載の通信制御装置。
  13. 前記ブロッキングがある場合に前記第1の処理を所定回数実行した後に、又は、前記ブロッキングがある場合に前記第1の処理を複数回実行して最初のブロッキング検知から所定時間経過した後、前記第2の処理を実行する
    請求項10記載の通信制御装置。
  14. 各々光ネットワークを介して且つ電気ネットワークを介して接続され、且つ、各々1又は複数の装置を担当する、第1の電気スイッチと第2の電気スイッチとの間の通信を制御する通信制御装置のプロセッサに、
    前記第1の電気スイッチから前記第2の電気スイッチへの光回線の第1の設定要求に関連してブロッキングの有無を判定し、
    前記ブロッキングがある場合には、前記第1の設定要求の再送要求を前記第1の電気スイッチへ送信する第1の処理と、前記第1の電気スイッチから前記第2の電気スイッチへの前記電気ネットワークを介した通信を開始させるための第2の処理とのいずれかを実行する
    処理を実行させるためのプログラム。
JP2022501781A 2020-02-17 2021-02-04 通信制御方法及び通信制御装置 Active JP7315271B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2020024329 2020-02-17
JP2020024329 2020-02-17
PCT/JP2021/004139 WO2021166665A1 (ja) 2020-02-17 2021-02-04 通信制御方法及び通信制御装置

Publications (2)

Publication Number Publication Date
JPWO2021166665A1 JPWO2021166665A1 (ja) 2021-08-26
JP7315271B2 true JP7315271B2 (ja) 2023-07-26

Family

ID=77391954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022501781A Active JP7315271B2 (ja) 2020-02-17 2021-02-04 通信制御方法及び通信制御装置

Country Status (4)

Country Link
US (1) US12047114B2 (ja)
JP (1) JP7315271B2 (ja)
CN (1) CN115053502B (ja)
WO (1) WO2021166665A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2023042596A1 (ja) * 2021-09-17 2023-03-23

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014217002A (ja) 2013-04-30 2014-11-17 富士通株式会社 伝送装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6058227A (en) 1998-01-29 2000-05-02 Trw Inc. Method and apparatus for an opto-electronic circuit switch
US8483096B2 (en) * 2008-07-22 2013-07-09 The Regents Of The University Of California Scalable commodity data center network architecture
CN102868624B (zh) 2011-07-07 2015-10-07 株式会社日立制作所 光电复合型网络节点的控制装置、控制系统及控制方法
WO2013026499A1 (en) 2011-08-25 2013-02-28 Telefonaktiebolaget L M Ericsson (Publ) Apparatus and method for an optical network
US8867915B1 (en) * 2012-01-03 2014-10-21 Google Inc. Dynamic data center network with optical circuit switch
CN104104616B (zh) * 2013-04-03 2019-04-19 华为技术有限公司 数据调度和交换的方法、装置及系统
US9654852B2 (en) * 2013-12-24 2017-05-16 Nec Corporation Scalable hybrid packet/circuit switching network architecture
US9781059B2 (en) 2014-09-30 2017-10-03 Rockley Photonics Limited Optoelectronic switch
WO2016187813A1 (zh) 2015-05-26 2016-12-01 华为技术有限公司 一种光电混合网络的数据传输方法及装置
WO2017164908A1 (en) * 2016-03-23 2017-09-28 Intel IP Corporation Radio link failure handling in high-frequency band networks
CN106851442B (zh) 2017-01-19 2019-05-21 西安电子科技大学 一种超级计算机中的光互连网络系统及通信方法
CN109510690B (zh) 2017-09-14 2020-07-28 华为技术有限公司 传输报文的方法、网络组件和计算机可读存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014217002A (ja) 2013-04-30 2014-11-17 富士通株式会社 伝送装置

Also Published As

Publication number Publication date
WO2021166665A1 (ja) 2021-08-26
US20230055239A1 (en) 2023-02-23
CN115053502A (zh) 2022-09-13
JPWO2021166665A1 (ja) 2021-08-26
CN115053502B (zh) 2024-03-15
US12047114B2 (en) 2024-07-23

Similar Documents

Publication Publication Date Title
US11777839B2 (en) Data center network with packet spraying
US11469922B2 (en) Data center network with multiplexed communication of data packets across servers
US11601359B2 (en) Resilient network communication using selective multipath packet flow spraying
CN102668472B (zh) 用于链路聚合组上的驱动式多播业务分布的方法
US20170085463A1 (en) Network Topology of Hierarchical Ring with Recursive Shortcuts
US20090296572A1 (en) Tunnel establishing method, network node device and network system
Muthumanikandan et al. Link failure recovery using shortest path fast rerouting technique in SDN
JP2017506462A (ja) 分離した制御デバイスおよび転送デバイスを備えるネットワークでの制御デバイス検出
Cui et al. Difs: Distributed flow scheduling for adaptive routing in hierarchical data center networks
CA2344047A1 (en) Load distribution failure recovery system and method
CN102984057A (zh) 一种多业务一体化双冗余网络系统
WO2019105360A1 (zh) 数据传输方法、相关装置及网络
Wang et al. SprintNet: A high performance server-centric network architecture for data centers
Liu et al. Subways: A case for redundant, inexpensive data center edge links
JP7315271B2 (ja) 通信制御方法及び通信制御装置
CN113472646A (zh) 一种数据传输方法、节点、网络管理器及系统
Oljira et al. Mdtcp: Towards a practical multipath transport protocol for telco cloud datacenters
Hsieh et al. A Simulated Annealing-based Efficient Failover Mechanism for Hierarchical SDN Controllers
WO2023042596A1 (ja) 通信制御方法、通信制御装置及びプログラム
EP2939382B1 (en) Distributed data processing system
Cao et al. Network Load Balancing with Parallel Flowlets for AI Training Clusters
Guo et al. Dynamic TCP congestion window adjustment for effective topology reconstruction in optical DCN
CN115589386A (zh) 一种数据分流方法及相关设备
CN115955619A (zh) 基于波长选择开关的全光互连数据中心架构及其构建方法
CN116938693A (zh) 用户迁移的方法、装置、系统及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220615

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220907

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230627

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230706

R150 Certificate of patent or registration of utility model

Ref document number: 7315271

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150