JP6885237B2 - ノード間通信装置、並列処理装置及びノード間通信経路制御方法 - Google Patents

ノード間通信装置、並列処理装置及びノード間通信経路制御方法 Download PDF

Info

Publication number
JP6885237B2
JP6885237B2 JP2017135479A JP2017135479A JP6885237B2 JP 6885237 B2 JP6885237 B2 JP 6885237B2 JP 2017135479 A JP2017135479 A JP 2017135479A JP 2017135479 A JP2017135479 A JP 2017135479A JP 6885237 B2 JP6885237 B2 JP 6885237B2
Authority
JP
Japan
Prior art keywords
signal transmission
unit
transmission path
link
lane
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017135479A
Other languages
English (en)
Other versions
JP2019021957A (ja
Inventor
貴範 稲垣
貴範 稲垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2017135479A priority Critical patent/JP6885237B2/ja
Priority to US16/026,248 priority patent/US10771149B2/en
Publication of JP2019021957A publication Critical patent/JP2019021957A/ja
Application granted granted Critical
Publication of JP6885237B2 publication Critical patent/JP6885237B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/03Arrangements for fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • H04B10/075Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal
    • H04B10/079Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal using measurements of the data signal
    • H04B10/0791Fault location on the transmission path
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/03Arrangements for fault recovery
    • H04B10/032Arrangements for fault recovery using working and protection systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery

Landscapes

  • Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、ノード間通信装置、並列処理装置及びノード間通信経路制御方法に関する。
一般にスーパーコンピュータは、多数のノードと呼ばれる計算機をインターコネクトと呼ばれるネットワークにより相互に接続した構成をとる。インターコネクトを介した通信は、ノード内のインターコネクト制御用のユニットによって制御される。インターコネクト制御用のユニットは、ICC(Inter Connect Controller)と呼ばれることがある。
近年、CPU(Central Processing Unit)の高性能化により計算機の処理が著しく向上しており、これに伴いCPU間で受け渡すデータ量は増加し、インターコネクトに求められる帯域も増加傾向にある。そのため、金属配線を用いた電気通信では望む帯域を確保することが困難であり、帯域の大きな光通信を用いることがインターコネクトの主流となりつつある。光通信は、光モジュールと呼ばれる光と電気とを交換する交換素子を使用することにより実現される。光モジュールは、インターコネクト制御用のユニットと電気信号のやり取りを行う回路部分と、光信号と電気信号の変換を行う光素子部分との2つの部分に大きく分けることができる。
ノード同士を接続する経路はリンクと呼ばれる。一般に1つのリンクは、信号の送受信を行うための通信経路であるレーンを複数有する。そして、インターコネクト制御用のユニットには、リンクの数分のポートが用意されており、それぞれのポートは別々のノードに接続される。
ここで、インターコネクト制御用のユニットは、動的レーン縮退と呼ばれる機能を有する。動的レーン縮退は、あるリンクで障害が検出された際に、リンクの中で問題のあるレーンを切り離し、動作可能なレーンを用いて通信動作を継続させる機能である。例えば、特定のリンクが使用する受光素子が故障した場合で説明する。この場合、インターコネクト制御用のユニットにより、特定のリンクにおいてパケット再送回数の規定値超過などのエラーが検出される。このような通信継続が困難と判断されるエラーが検出されると、インターコネクト制御用のユニットは、特定のリンクに対してレーン縮退を実行する。レーン縮退を実行する際に、インターコネクト制御用のユニットは、レーンごとに用意されたエラーカウンタを用いて切り離すレーンを決定する。具体的には、インターコネクト制御用のユニットは、各レーンのカウント値とエラーカウンタの値を比較し、より多くのエラーが検出されたレーンを切り離し対象とする。そして、ある特定のレーンを切り離す場合、インターコネクト制御用のユニットは、例えば、切り離し対象のレーン以外のレーンを有効化するようにリンクの再初期化を実行する。
さらに、例えば、特定のリンクが2つのレーンを有する場合、既に1つのレーンが縮退されている状態で、残りのレーンにおいて通信継続が困難と判断されるエラーが検出されると、特定のリンク内には使用可能なレーンが無くなる。この場合、インターコネクト制御用のユニットは、その特定のリンク自体の無効化処理を行い、システム内計算資源からその特定のリンクを切り離す。
また、光通信は電気通信と比較して研究開発の歴史が浅く、光モジュールは、電気信号を処理し光信号を扱わない他のデバイスに比べて故障率が高い傾向にある。例えば、光モジュールには発光素子の発光が突然停止する頓死と呼ばれる特有の故障モードが存在する。さらに、近年インターコネクトの伝送容量拡大要求に応えるかたちで光モジュールの小型化及び高密度化が進んでおり、通信速度の高速化と相まって光モジュールの発熱量は増加傾向にある。発熱はデバイスの故障を加速することが知られており、故障率増加の要因となる。このような理由から、光モジュールは、他のデバイスに比べて故障しやすい傾向にあり、インターコネクトにおけるレーン縮退及びリンク無効化を引き起こす大きな要因に挙げられる。
このようなリンク又はレーンなどの通信障害に関する技術として以下のような技術が提案されている。例えば、縮退可能な論理レーン番号及びレーン幅に制限がある場合に、物理レーンと論理レーンの再割り当てを行うことで、リンク無効化を回避する従来技術がある。また、未使用の物理レーンを利用してレーン縮退状態を解消する従来技術がある。また、パスを部分パスに分割し、部分パス毎に障害検出を行って、障害が発生した部分パスを迂回する経路に切り替える従来技術がある。また、パスに与えられた優先度情報に基づいて、パスのリソースを流用する従来技術がある。また、故障個所を判定する技術として、光パスの特定の区間を指定して光信号を用いて指定区間の導通試験を行う従来技術がある。さらに、スイッチが故障した場合にバイパススイッチを経由して通信を行えるように多段結合網を形成する従来技術がある。
特開2005−182485号公報 特開2013−200616号公報 特開2003−258851号公報 国際公開第2008/044646号 特開平11−191754号公報 特開平05−111065号公報
しかしながら、リンク無効化が実施されると、当該リンクは、システム運用から切り離されハードウェアの交換待ちの状態となる。しかし、交換部品及び交換人員が即座に手配できるとは限らず、交換までの期間、システムは計算資源が制限された状態となる。システムに投入されるジョブには使用するノード数に加えてノードの接続形状が限定されるものもあり、リンクの無効化は、そのようなジョブの実行を阻害する。このように、リンク無効化が発生した場合、通信動作の継続性を維持することは困難となる。そのため、システムの可用性を維持するためには、リンク無効化を回避することが好ましい。そのため、リンク無効化を引き起こす大きな要因である光モジュールの故障への対処が重要となる。
そこで、リンク無効化又はそれによる悪影響を回避する方法として、物理レーンを冗長に用意する方法や、リンク内で使用する物理レーンを切り替える方法が考えられる。他にも、他のノードを経由した迂回経路に切り替えることで、故障リンクで接続される2ノード間の通信を継続する方法が考えらえる。
しかし、年々システムは大規模化する傾向にあり、ノード同士を接続するインターコネクトのリンクは莫大な数となりつつある。そのため、冗長なレーンを用意する方法は、コストが増大するおそれがあり実現困難である。また、単一リンク内で切り替えを行う方法では、リンク内に障害未検出のレーンがあることが前提となるが、それが無ければリンクの回復は困難であり、通信動作の継続性を維持することは困難となる。
さらに、他のノードを介する迂回路を用いる方法では、通信レイテンシの増大を招くおそれがある。加えて、この方法では、他の複数のリンクと帯域を共有することになる。例えば、4つのノードを巡回するようにリンクが設置された場合、1つのリンクで故障が発生すると、他の3つのリンクにおいて帯域を共有することになり、それら他の3つのリンクを使用する通信に対して悪影響をおよぼす恐れがある。このため、他のノードを介する迂回路を用いる方法は、スーパーコンピュータなどのHPC(High Performance Computing)の分野に用いることは、大きな性能低下を引き起こすおそれが大きいため適用困難である。
この点、物理レーンと論理レーンの再割り当てを行う従来技術は、単一リンク内のレーンに関して経路切替えを行う技術であり、リンク内の全レーンが故障した場合にはリンク無効化が発生し、通信動作の継続性を維持することは困難である。また、未使用の物理レーンを利用してレーン縮退状態を解消する従来技術では、未使用の物理レーンが存在することが前提であり、未使用レーンが存在しない場合には通信動作の継続性を維持することは困難である。また、障害が発生した部分パスを迂回する経路に切り替える従来技術を用いても、1つのリンクで結ばれたノード同士でリンク無効化が発生した場合、通信動作の継続性を維持することは困難である。また、優先度情報に基づいてパスのリソースを流用する従来技術を用いても、リンクの全てのレーンに障害が発生した場合、流用するリソースが無く、リンク無効化は発生してしまい、通信動作の継続性を維持することは困難である。光信号を用いて指定区間の導通試験を行う従来技術では、故障区間の特定は可能であるが、故障区間への対応は提供されず、通信動作の継続性を維持することは困難である。さらに、バイパススイッチにより多段結合網を形成する従来技術は、1つのリンク内に実現することは困難であり、通信動作の継続性を維持することは困難である。
開示の技術は、上記に鑑みてなされたものであって、通信動作の継続性を維持するノード間通信装置、並列処理装置及びノード間通信経路制御方法を提供することを目的とする。
本願の開示するノード間通信装置、並列処理装置及びノード間通信経路制御方法の一つの態様において、第1信号伝送経路は、第1演算処理装置と複数の第2演算処理装置それぞれとを結ぶ複数のリンクに含まれる複数のレーン毎の一部にあたる。第2信号伝送経路は、複数の前記レーン毎の他の一部にあたる。試験部は、各前記第1信号伝送経路の導通試験及び各前記第2信号伝送経路の導通試験を行う。接続切替部は、前記試験部により特定のリンクが有する前記レーンの全てで前記第1信号伝送経路又は前記第2信号伝送経路の故障が発生したことが検出された場合、他のリンクが有する前記レーンに含まれる前記第1信号伝送経路又は前記第2信号伝送経路を経由させることで前記第1信号伝送経路及び前記第2信号伝送経路を迂回させて、前記第1演算処理装置と前記第2演算処理装置との接続を維持するように、前記第1演算処理装置、前記第1信号伝送経路、前記第2信号伝送経路及び前記第2演算処理装置の接続を切り替える。

1つの側面では、本発明は、通信動作の継続性を維持することができる。
図1は、光モジュールを介した通信システムの概略構成図である。 図2は、ノード及びノード間通信装置のハードウェア構成図である。 図3は、ノード間通信装置のブロック図である。 図4は、送信テスト実施時の状態を表す図である。 図5は、資源管理情報の一例を表す図である。 図6は、資源割当情報の一例を表す図である。 図7は、単一リンク内でのレーンの再構成を表す図である。 図8は、単一リンク内での再構成を行った場合の資源管理情報及び資源割当情報を表す図である。 図9は、リンク間に跨るレーンの再構成を表す図である。 図10は、リンク間に跨るレーンの再構成を行った場合の資源管理情報及び資源割当情報を表す図である。 図11は、経路切替部の構成図である。 図12は、実施例に係るノード間通信装置による故障個所の特定処理のフローチャートである。 図13は、実施例に係るノード間通信装置による資源の再割り当て処理のフローチャートである。 図14は、実施例に係るノード間通信装置によるリンク間に跨る資源の再割り当て処理のフローチャートである。
以下に、本願の開示するノード間通信装置、並列処理装置及びノード間通信経路制御方法の実施例を図面に基づいて詳細に説明する。なお、以下の実施例により本願の開示するノード間通信装置、並列処理装置及びノード間通信経路制御方法が限定されるものではない。
図1は、光モジュールを介した通信システムの概略構成図である。図1に示すように、図1における通信システムは、2台のノード1を有する。ノード1は、それぞれ、光モジュール11及びインターコネクト制御回路12を有する。
光モジュール11は、互いにファイバーケーブル110で接続される。光モジュール11は、通信先のノード1へ送信する電気信号の入力をインターコネクト制御回路12から受ける。そして、光モジュール11は、電気信号を光信号に変換する。そして、光モジュール11は、光信号に変換した信号をファイバーケーブル110を経由させて、送信先のノード1の光モジュール11へ送信する。
また、光モジュール11は、送信元のノード1の光モジュール11からファイバーケーブル110を介して光信号を受信する。そして、光モジュール11は、受信した光信号を電気信号に変換してインターコネクト制御回路12へ出力する。
インターコネクト制御回路12は、他のノード1から受信した信号におけるタイミング調整や送信経路の選択などの送受の制御を行う。ここで、図1では、ノード1が1対1で接続される場合を図示したが、実際にはノード1はそれぞれに複数の他のノード1が接続されるので、インターコネクト制御回路12は、これらの複数のノード1との間の通信の制御を行う。
次に、図2を参照して、ノード間通信の制御の機能について説明する。図2は、ノード及びノード間通信装置のハードウェア構成図である。ここでは、1つのシステムボード100に、複数のノード1及びノード間通信装置2が搭載された場合を例に説明する。ただし、ノード1は、異なるシステムボード100に配置され互いに通信する構成でもよい。このシステムボード100及びそれを搭載した情報処理装置、並びに、図1に示したファイバーケーブル110で接続されたノード1が、「並列処理装置」の一例にあたる。
ノード1は、CPU10、光モジュール11及びメモリ13を有する。そして、CPU10は、インターコネクト制御回路12を有する。各ノード1の光モジュール11は、図1で示したように互いにファイバーケーブル110で接続されるが、図2では、説明を分かり易くするため、ファイバーケーブル110は省略されている。
CPU10は、メモリ13を用いて演算処理を行う。また、CPU10は、光モジュール11を用いて他のノード1のCPU10と通信を行う。このCPU10が、「第1演算処理装置」及び「第2演算処理装置」の一例にあたる。
インターコネクト制御回路12は、自己が搭載されたCPU10と他のノード1に搭載されたCPU10との間の通信を制御する。他のノード1との間を結ぶレーンに異常が発生していない場合、インターコネクト制御回路12は、予め決められた初期状態で各ノード1との間を結ぶリンクにレーンを割り当て通信を行う。
また、インターコネクト制御回路12は、他のノード1との通信に異常が発生した場合、異常が発生した故障レーンを特定しサービスプロセッサ21に通知する。その後、インターコネクト制御回路12は、停止指示及び再初期化指示をサービスプロセッサ21からを受ける。この再初期化指示には、故障個所を迂回するように新たに設定された各リンクに対する各レーンの割り当て情報が含まれる。そして、インターコネクト制御回路12は、自己が有する各ポートを初期化後、取得した割り当て情報を用いて各ポートの設定を行う。その後、インターコネクト制御回路12は、新たに設定したポートを用いて他のノード1との通信を行う。
他のノード1との間の通信における異常発生時に、光モジュール11は、テスト用の経路の切り替え指示及び信号の折り返し指示をサービスプロセッサ21から受ける。そして、光モジュール11は、指示にしたがいテスト用に経路を設定する。
その後、光モジュール11は、ノード間通信装置2に搭載されたテスト回路22が有するテストパターン生成回路221からテスト信号の入力を受ける。そして、光モジュール11は、テスト用に設定した経路に取得したテスト信号を流し、各経路を通過した信号をノード間通信装置2に搭載されたテスト回路22が有するエラーチェック回路222へ出力する。
その後、光モジュール11は、故障個所を迂回するための経路設定の入力をサービスプロセッサ21から受ける。そして、光モジュール11は、サービスプロセッサ21からの指定にしたがい経路を切り替えて経路設定を行う。
ノード間通信装置2は、ノード1同士の間の通信で故障が発生したことを検出し、故障個所を迂回させて通信を継続させる。ノード間通信装置2は、サービスプロセッサ21及びテスト回路22を有する。
サービスプロセッサ21は、光モジュール11及びインターコネクト制御回路12とI2C(Inter Integrated Circuit)(登録商標)の規格のバスで接続される。サービスプロセッサ21は、故障レーンの通知をインターコネクト制御回路12から受ける。次に、サービスプロセッサ21は、テスト用の経路の切り替え指示及び信号の折り返し指示をインターコネクト制御回路12に通知する。
そして、サービスプロセッサ21は、テスト回路22のテストパターン生成回路221に対してテストの実行指示を送信する。その後、サービスプロセッサ21は、テスト回路22のエラーカウンタレジスタ223に格納された各レーンのエラーのカウント数を取得し故障レーンにおける故障個所を特定する。
その後、サービスプロセッサ21は、各ノード1との通信が継続するように特定した故障個所を迂回する経路を決定する。そして、サービスプロセッサ21は、決定した経路への切り替えを光モジュール11に指示する。さらに、サービスプロセッサ21は、再設定を行うリンクの停止指示及び再初期化指示をインターコネクト制御回路12へ送信する。この再初期化指示により、サービスプロセッサ21は、故障個所を迂回するように新たに設定された各リンクに対する各レーンの割り当てをインターコネクト制御回路12に指示する。
テスト回路22は、論理回路の組み合わせで実現される組み込み回路などで実現される。テスト回路22は、テストパターン生成回路221、エラーチェック回路222及びエラーカウンタレジスタ223を有する。
テストパターン生成回路221は、テストの実行指示をサービスプロセッサ21から受ける。そして、テストパターン生成回路221は、予め決められたテストパターンを有するテスト信号を生成する。そして、テストパターン生成回路221は、生成したテスト信号を光モジュール11に入力する。
エラーカウンタレジスタ223は、テスト対象となるレーンのテスト箇所毎に対応するカウンタを有する。
エラーチェック回路222は、光モジュール11が有するテスト用に設定された経路を経由して出力されたテスト信号を取得する。そして、エラーチェック回路222は、予め決められたテストパターンと取得したテスト信号のパターンを比較してエラーが発生しているか否かを判定する。エラーが発生している場合、エラーチェック回路222は、そのテスト信号が経由した故障個所に対応するエラーカウンタレジスタ223が有するカウンタを1つインクリメントする。
次に、図3を参照して、ノード間通信装置2の通信経路切替処理及び光モジュールの動作について詳細に説明する。図3は、ノード間通信装置のブロック図である。
ここでは、以下の環境の場合の通信経路切替処理について説明する。インターコネクト制御回路12は、2つのポート121及びポート122を有する。そして、ポート121は、リンク##0で他のノード1と接続される。また、ポート122は、リンク##1で他のノード1と接続される。
さらに、リンク##0は、レーン301及び302を有する。また、リンク##1は、レーン311及び312を有する。ここで、本実施例では、レーン301、302、311及び312は、ポート121における接続点及びノード1と外部との接続点により規定される。図3では、ポート121の接続点及びノード1と外部との接続点に符号を付して各レーン301、302、311及び312を表した。例えば、レーン301は、ポート121における接続点及びノード1と外部との接続点が同一であれば、光モジュール11内の経路が異なっても同じレーン301である。
また、光モジュール11は、テスト信号切替部111、経路切替部112、電気信号処理部113、経路折返部114、テスト信号切替部115、経路切替部116、電気光変換部117、経路折返部118及び経路切替部119を有する。
テスト信号切替部111は、ポート121におけるレーン301及び302の接続点及びポート122におけるレーン311及び312の接続点と4本の通信経路で接続される。さらに、テスト信号切替部111とは、4本の通信経路であるチャネル#A0〜#A3で経路切替部112と接続される。図3では、チャネル#A0〜#A3を、「Ch#A0〜#A3」として表した。
また、経路切替部112は、4本の通信経路であるチャネル#B0〜#B3で電気信号処理部113と接続される。図3では、チャネル#B0〜#B3を、「Ch#B0〜#B3」として表した。電気信号処理部113は、4本の通信経路であるチャネル#C0〜#C3で経路折返部114と接続される。図3では、チャネル#C0〜#C3を、「Ch#C0〜#C3」と表した。
また、経路折返部114は、4本の通信経路でテスト信号切替部115と接続される。また、テスト信号切替部115は、4本の通信経路で経路切替部116と接続される。
また、経路切替部116は、4本の通信経路であるチャネル#D0〜#D3で電気光変換部117と接続される。図3では、チャネル#D0〜#D3を、「Ch#D0〜#D3」として表した。電気光変換部117は、4本の通信経路であるチャネル#E0〜#E3で経路折返部118と接続される。図3では、チャネル#E0〜#E3を、「Ch#E0〜#E3」と表した。
また、経路折返部118は、4本の通信経路で経路切替部119と接続される。さらに、経路切替部119は、4本の通信経路であるチャネル#F0〜#F3でレーン301、302、311及び312における外部との接続点と接続される。
さらに、テスト信号切替部111は、ノード間通信装置2の送信テスト実施部201から延びる4本のテスト信号の通信経路が接続される。そして、テスト信号切替部111は、チャネル#A0〜#A3のそれぞれぞれの接続元を、ポート121及び122から延びる通信経路と送信テスト実施部201から延びるテスト信号の通信経路とのいずれかに選択的に切り替えることができる。
また、経路切替部112は、チャネル#A0〜#A3とチャネル#B0〜#B3との接続を切り替えることができる。
また、経路折返部114は、チャネル#C0〜#C3をテスト信号切替部115に繋がる4本の通信経路に接続するか折り返すかを選択的に切り替えることができる。ここで、チャネル#C0〜#C3とテスト信号切替部115に繋がる4本の通信経路とを接続する場合の接続経路は固定である。図3では、経路折返部114は、チャネル#C0〜#C3を、縦方向に同じラインに位置する通信経路に接続する。
また、テスト信号切替部115は、ノード間通信装置2の送信テスト実施部201から延びる4本のテスト信号の通信経路が接続される。そして、テスト信号切替部115は、経路切替部116に接続する4本の通信経路のそれぞれぞれの接続元を、経路折返部114から延びる通信経路と送信テスト実施部201から延びるテスト信号の通信経路とのいずれかに選択的に切り替えることができる。
また、経路切替部116は、テスト信号切替部115から延びる4本の通信経路とチャネル#D0〜#D3との接続を切り替えることができる。
また、経路折返部118は、チャネル#E0〜#E3を経路切替部119に繋がる4本の通信経路に接続するか折り返すかを選択的に切り替えることができる。ここで、チャネル#E0〜#E3を経路切替部119に繋がる4本の通信経路に接続する場合の接続経路は固定である。図3では、経路折返部118は、チャネル#E0〜#E3を、縦方向に同じラインに位置する通信経路に接続する。
また、経路切替部119は、経路折返部118から延びる4本の通信経路とチャネル#F0〜#F3との接続を切り替えることができる。
電気信号処理部113は、AD(Analog Digital)変換、DA(Digital Analog)変換及びシリアルパラレル変換を行う。以下では、電気信号処理部113における、チャネル#B0〜#B3とチャネル#C0〜#C3のそれぞれを結ぶ経路を、#B0−#C0〜#B3−#C3と表す場合がある。この#B0−#C0〜#B3−#C3が、「第1信号伝送経路」の一例にあたる。
電気光変換部117は、インターコネクト制御回路12から他のノード1へ向かって送出された信号を電気信号から光信号に変換する。また、電気光変換部117は、他のノード1から受信した信号を光信号から電気信号に変換する。図3において、チャネル#D0〜#D3とチャネル#E0〜#E3のそれぞれを結ぶ経路上に配置された各部材は、電気光変換モジュールである。以下では、電気光変換部117における、チャネル#D0〜#D3とチャネル#E0〜#E3のそれぞれを結ぶ経路を、#D0−#E0〜#D3−#E3と表す場合がある。この#D0−#E0〜#D3−#E3が、「第2信号伝送経路」の一例にあたる。
電気信号処理部113の通信経路である#B0−#C0〜#B3−#C3及び電気光変換部117の通信経路である#D0−#E0〜#D3−#E3は、レーン301、302、311及び312に割り当てられることで、ノード1間の通信経路として使用される。以下では、レーン301、302、311及び312に割り当てられる電気信号処理部113及び電気光変換部117における通信経路である#B0−#C0〜#B3−#C3のことを、「資源」と呼ぶ場合がある。
また、ここでは、光モジュール11において#D0−#E0〜#D3−#E3又は電気光変換部117の経路のいずれかもしくは双方で故障が発生した場合について説明する。なお、図3に示した構成では、レーン301及び302の両方で通信が不通になった場合、リンク##0は使用できなくなる。したがって、レーン301及び302の双方に異常が発生した場合、リンク##1の無効化を回避するために、レーン301及び302のいずれかの通信を維持することが望ましい。これは、リンク##1も同様である。
次に、ノード間通信装置2について説明する。ノード間通信装置2は、送信テスト実施部201、送信テスト制御部202、経路切替制御部203及び資源管理部204を有する。
送信テスト制御部202は、図2に例示したサービスプロセッサ21が自己に組み込まれたファームウェアを実行することで実現される。送信テスト制御部202は、故障レーンの通知をインターコネクト制御回路12から受ける。ここでは、レーン312が故障レーンの場合を説明する。送信テスト制御部202は、故障レーンであるレーン312に割り当てられた電気信号処理部113及び電気光変換部117の資源をテスト対象の資源の情報を資源管理部204から取得する。ここでは、送信テスト制御部202は、テスト対象の資源の情報として#B3−#C3及び#D3−#E3を取得する。
次に、送信テスト制御部202は、図4に示すように電気信号処理部113のチャネル#C3から出力された信号が折り返されてチャネル#C3へ入力されるように経路折返部114を設定する。図4は、送信テスト実施時の状態を表す図である。また、送信テスト制御部202は、図4に示すように、電気光変換部117のチャネル#E3から出力された信号が折り返されてチャネル#E3へ入力されるように経路折返部118を設定する。
さらに、送信テスト制御部202は、図4に示すように#B3−#C3へ繋がるチャネル#A3が送信テスト実施部201から延びるテスト信号の通信経路に接続するようにテスト信号切替部111の経路を切り替える。また、送信テスト制御部202は、図4に示すように#D3−#E3へ繋がる通信経路が送信テスト実施部201から延びるテスト信号の通信経路に接続するようにテスト信号切替部115の経路を切り替える。
これにより、送信テスト実施部201から出力されたテスト信号は、故障レーンであるレーン312に割り当てられたチャネル#A3及び#B3−#C3を経由した後、折り返して#B3−#C3及びチャネル#A3を経由して送信テスト実施部201に戻る。また、送信テスト実施部201から出力されたテスト信号は、故障レーンであるレーン312に割り当てられた#D3−#E3を経由した後、折り返して#D3−#E3を経由して送信テスト実施部201に戻る。
そして、送信テスト制御部202は、テスト対象の資源である#B3−#C3及び#D3−#E3に対するテスト実施を送信テスト実施部201に指示する。その後、送信テスト制御部202は、#B3−#C3及び#D3−#E3のいずれが故障個所であるか、又は両方が故障個所であるとの通知を送信テスト実施部201から受信する。
そして、送信テスト制御部202は、故障個所を資源管理部204へ通知する。その後、送信テスト制御部202は、テスト信号切替部111及び115をノード1間を繋ぐ経路に戻し、さらに、経路折返部114及び118を信号を通過させる経路に戻す。
送信テスト実施部201は、図2に例示したサービスプロセッサ21及びテスト回路22によって実現される。送信テスト実施部201は、テスト対象の資源である#B3−#C3及び#D3−#E3に対するテスト実施の指示を送信テスト制御部202から受ける。そして、送信テスト実施部201は、予め決められたテストパターンを有するテスト信号を生成する。
次に、送信テスト実施部201は、故障レーンであるレーン312に割り当てられた#B3−#C3及び#D3−#E3のそれぞれに向けて生成したテスト信号を送出し、#B3−#C3及び#D3−#E3のそれぞれから返ってきた信号を取得する。そして、送信テスト実施部201は、帰ってきた信号に含まれるデータのパターンとテストパターンとが異なっていればエラーが発生したと判定する。そして、送信テスト実施部201は、エラーが発生したと判定した#B3−#C3又は#D3−#E3のいずれかもしくは双方に対応するエラーカウンタを1つインクリメントする。送信テスト実施部201は、以上のテストを複数回繰り返す。
その後、送信テスト実施部201は、テスト信号の送信回数及び各エラーカウンタの値を用いて、テスト対象の資源である#B3−#C3及び#D3−#E3のそれぞれのビットの誤り率(BER:Bit Error Rate)を算出する。その後、送信テスト実施部201は、算出したテスト対象の資源である#B3−#C3及び#D3−#E3のそれぞれのビットの誤り率が予め決められた閾値を超えたか否かを判定する。これにより、送信テスト実施部201は、各#B3−#C3及び#D3−#E3において故障が発生しているか否かを判定し、#B3−#C3及び#D3−#E3のいずれか又は双方を故障個所として特定する。そして、送信テスト実施部201は、故障個所の情報を送信テスト制御部202へ送信する。この送信テスト実施部201及び送信テスト制御部202が、「試験部」の一例にあたる。
資源管理部204は、図2に例示したサービスプロセッサ21が自己に組み込まれたファームウェアを実行することで実現される。資源管理部204は、図5に示す資源管理情報410及び図6に示す資源割当情報420を有する。図5は、資源管理情報の一例を表す図である。また、図6は、資源割当情報の一例を表す図である。
図5に示すように、資源管理情報410は、電気信号処理部用テーブル411及び電気光変換部用テーブル412を含む。電気信号処理部用テーブル411は、リンク##0及び##1で用いられる電気信号処理部113内の通信経路及びその状態が登録される。また、電気信号処理部用テーブル411は、リンク##0及び##1のそれぞれに含まれる電気信号処理部113内の通信経路の使用可能な数を表す。
また、電気光変換部用テーブル412は、リンク##0及び##1で用いられる電気光変換部117内の通信経路及びその状態が登録される。また、電気光処理部用テーブル412は、リンク##0及び##1に割り当てられた電気光変換部117内の通信経路の使用可能な数を表す。
また、図6に示すように、資源割当情報420は、リンク##0及び##1毎に含まれる各レーン301、302、311及び312のレーン名、縮退の状態、割り当てられた資源が登録される。
資源管理部204は、ノード1の起動時などの故障が発生していない初期状態の場合、図3における縦方向の同じラインに位置する通信経路を接続するように経路設定を決定する。そして、資源管理部204は、電気信号処理部用テーブル411及び電気光変換部用テーブル412のそれぞれに、決定した経路設定にしたがってリンク##0及び##1毎に資源名、障害有無、割当状態及び使用可能数を登録する。例えば、初期状態の場合、資源管理部204は、電気信号処理部113の資源のうち#B0−#C0及び#B1−#C1をリンク##0のレーン301及び302の資源として割り当てる。そこで、資源管理部204は、電気信号処理部用テーブル411のリンク##0のテーブルに資源名として#B0−#C0及び#B1−#C1を登録し、それぞれ障害を「無」とし、さらに、割当状態を「済」にする。加えて、資源管理部204は、#B0−#C0及び#B1−#C1の双方が使用可能であるので、使用可能数を2とする。そして、資源管理部204は、決定した経路設定を経路切替制御部203に通知する。
また、故障レーンの発生後、資源管理部204は、故障個所の通知を送信テスト実施部201から受ける。そして、資源管理部204は、資源管理情報410のうち故障個所の障害有無を「有」に変更する。さらに、資源管理部204は、故障個所を含むテーブルにおける使用可能数を1つ減らす。例えば、故障レーンがレーン312であり#B3−#C3が故障した場合、資源管理部204は、電気信号処理部用テーブル411のレーン312を含むリンク##1のテーブルにおける、#B3−#C3の障害有無を「有」に変更する。さらに、資源管理部204は、電気信号処理部用テーブル411のレーン312を含むリンク##1のテーブルにおける、使用可能数を1に変更する。
次に、資源管理部204は、故障レーンを含むリンク##0又は##1に対する資源の再割り当てを行う。以下では、故障レーンを含むリンク##0又は##1を、「障害リンク」という。具体的には、資源管理部204は、故障個所を迂回させて各ノード1間の通信を継続させるように故障レーンに対する資源の再割り当てを行う。
ここで、本実施例では、なるべく多くの通信経路を確保するために、故障が発生する度に、資源管理部204による資源の再割当処理が行われるように説明した。ただし、故障レーンを含むリンク##0及び##1を用いた通信が可能であれば、資源管理部204は、資源の再割当処理を行わなくてもよい。例えば、リンク##0がさらにレーン303を有する場合に、レーン301において電気信号処理部113の資源が故障し、レーン302において電気光変換部117の資源が故障した場合について説明する。この場合、リンク##0の通信は可能であるが、そのままではレーン301及び302が使用できない。これに対して、以下に説明する再割当処理を実行すれば、レーン301及び302のいずれかが使用できなくなるだけで済む。
以下に、資源管理部204による資源の再割り当てによるレーン301、302、311及び312の再構成の詳細について説明する。資源管理部204は、電気信号処理部用テーブル411及び電気光変換部用テーブル412の障害リンクにおける資源の使用可能数が0になったか否かを確認する。使用可能数が0になっていない場合、資源管理部204は、障害リンク内での資源の再割り当てを実行する。
ここで、障害リンク内での資源の再割り当ての実行について、リンク##1のレーン311に割り当てられた#B2−#C2及びレーン312に割り当てられた#D3−#E3が故障した場合で説明する。図7は、単一リンク内でのレーンの再構成を表す図である。また、図8は、単一リンク内での再構成を行った場合の資源管理情報及び資源割当情報を表す図である。
資源管理部204は、資源管理情報410の電気信号処理部用テーブル411及び電気光変換部用テーブル412及び資源割当情報420におけるリンク##1を初期化する。具体的には、資源管理部204は、資源管理情報410の電気信号処理部用テーブル411及び電気光変換部用テーブル412におけるリンク##1の全ての資源の割当状態を「未」に設定する。また、資源管理部204は、資源割当情報420におけるリンク##1の全てのレーン311及び312の縮退を「有」に設定し、さらに、割当資源を全てクリアする。
次に、資源管理部204は、レーン311及び312から資源の割り当ての対象とする割当対象レーンとしてレーン311を選択する。そして、資源管理部204は、資源管理情報410の電気信号処理部用テーブル411におけるリンク##1に障害が無く且つ未割り当ての資源があるか否かを判定する。この場合、障害が無く且つ未割り当ての資源として#B3−#C3があるので、資源管理部204は、割当対象レーンであるレーン311に#B3−#C3を割り当てることを決定する。そして、資源管理部204は、図8に示すように、資源割当情報420のリンク##1におけるレーン311の電気信号処理部113の割当資源として#B3−#C3を登録する。さらに、資源管理部204は、資源管理情報410の電気信号処理部用テーブル411のリンク##1における#B3−#C3の割当状態を「済」に変更する。
次に、資源管理部204は、資源管理情報410の電気光変換部用テーブル412におけるリンク##1に障害が無く且つ未割り当ての資源があるか否かを判定する。この場合、障害が無く且つ未割り当ての資源として#D2−#E2があるので、資源管理部204は、割当対象レーンであるレーン311に#D3−#E3を割り当てることを決定する。そして、資源管理部204は、図8に示すように、資源割当情報420のリンク##1におけるレーン311の電気光変換部117の割当資源として#D2−#E2を登録する。さらに、資源管理部204は、資源割当情報420のリンク##1におけるレーン311の縮退を「無」に設定する。また、資源管理部204は、資源管理情報410の電気光変換部用テーブル412のリンク##1における#D2−#E2の割当状態を「済」に変更する。
次に、資源管理部204は、レーン311及び312から資源の割り当ての対象とする割当対象レーンとしてレーン312を選択する。そして、資源管理部204は、資源管理情報410の電気信号処理部用テーブル411におけるリンク##1に障害が無く且つ未割り当ての資源があるか否かを判定する。この場合、#B2−#C2は故障しており、#B3−#C3は割り当て済みである。そこで、資源管理部204は、障害リンク内での資源の再割り当ての処理を終了する。これにより、光モジュール11におけるレーン311の経路は図7の点線に挟まれた経路に決定される。また、レーン312は、縮退される。この場合、資源管理情報410及び資源割当情報420は、図8に示すような状態となる。
これに対して、電気信号処理部用テーブル411及び電気光変換部用テーブル412の障害リンクにおける資源の使用可能数が0になった場合、資源管理部204は、リンク間に跨る資源の再割り当てを実行する。
ここで、リンク間に跨る資源の再割り当ての実行について、リンク##1のレーン311に割り当てられた#B2−#C2及び#D2−#E2、並びに、レーン312に割り当てられた#D3−#E3が故障した場合で説明する。図9は、リンク間に跨るレーンの再構成を表す図である。また、図10は、リンク間に跨るレーンの再構成を行った場合の資源管理情報及び資源割当情報を表す図である。
資源管理部204は、リンク##1との間で資源を共有する共有リンクを特定する。ここでは、リンク##0及び##1の2つであるので、資源管理部204は、リンク##0を共有リンクとする。
ただし、例えば、リンク##1〜##nがある場合、資源管理部204は、以下の手順で共有リンクの特定を行う。資源管理部204は、障害リンク以外のリンク##0及び##2〜##n毎の電気信号処理部113の資源の使用可能数及び電気光変換部117の資源の使用可能数を資源管理情報410から取得する。そして、資源管理部204は、取得した両方の使用可能数のうち小さい方の数を、各リンク##0及び##2〜##nの構成可能なレーン数とする。次に、資源管理部204は、リンク##0及び##2〜##nの中に構成可能なレーン数が2以上のものが存在するか否かを判定する。構成可能なレーン数が2以上の物がある場合、資源管理部204は、リンク##0及び##2〜##nのうち構成可能レーン数が最大のものを共有リンクとする。
資源管理部204は、資源管理情報410の電気信号処理部用テーブル411及び電気光変換部用テーブル412及び資源割当情報420における障害リンクであるリンク##1及び共有リンクであるリンク##0の情報を初期化する。具体的には、資源管理部204は、資源管理情報410の電気信号処理部用テーブル411及び電気光変換部用テーブル412におけるリンク##0及び##1の全ての資源の割当状態を「未」に設定する。また、資源管理部204は、資源割当情報420におけるリンク##0及び##1の全てのレーン311及び312の縮退を「有」に設定し、さらに、割当資源を全てクリアする。
次に、資源管理部204は、障害リンクであるリンク##1及び共有リンクであるリンク##0のいずれか一方を割当対象リンクとして選択する。例えば、資源管理部204は、リンク##0を割り当て対象リンクとして選択する。
次に、資源管理部204は、割当対象リンクとして選択したリンク##0が有するレーン301及び302の中から資源の割り当ての対象とする割当対象レーンを1つ選択する。例えば、資源管理部204は、レーン301を選択する。そして、資源管理部204は、資源管理情報410の電気信号処理部用テーブル411におけるリンク##0又はリンク##1に障害が無く且つ未割り当ての資源があるか否かを判定する。この場合、障害が無く且つ未割り当ての資源として#B0−#C0があるので、資源管理部204は、割当対象レーンであるレーン301に#B0−#C0を割り当てることを決定する。そして、資源管理部204は、図10に示すように、資源割当情報420のリンク##0におけるレーン301の電気信号処理部113の割当資源として#B0−#C0を登録する。さらに、資源管理部204は、資源管理情報410の電気信号処理部用テーブル411のリンク##0における#B0−#C0の割当状態を「済」に変更する。
次に、資源管理部204は、資源管理情報410の電気光変換部用テーブル412におけるリンク##0又は##1に障害が無く且つ未割り当ての資源があるか否かを判定する。この場合、障害が無く且つ未割り当ての資源として#D0−#E0があるので、資源管理部204は、割当対象レーンであるレーン301に#D0−#E0を割り当てることを決定する。そして、資源管理部204は、図10に示すように、資源割当情報420のリンク##0におけるレーン301の電気光変換部117の割当資源として#D0−#E0を登録する。さらに、資源管理部204は、資源割当情報420のリンク##0におけるレーン301の縮退を「無」に設定する。また、資源管理部204は、資源管理情報410の電気光変換部用テーブル412のリンク##0における#D0−#E0の割当状態を「済」に変更する。
次に、資源管理部204は、障害リンク及び共有リンクのうち割当対象リンクとして選択したリンク##0とは反対のリンク##1を割当対象リンクとして選択する。そして、資源管理部204は、割当対象リンクとして選択したリンク##1が有するレーン311及び312の中から資源の割り当ての対象とする割当対象レーンを1つ選択する。例えば、資源管理部204は、レーン311を選択する。そして、資源管理部204は、資源管理情報410の電気信号処理部用テーブル411におけるリンク##0又はリンク##1に障害が無く且つ未割り当ての資源があるか否かを判定する。この場合、障害が無く且つ未割り当ての資源として#B1−#C1があるので、資源管理部204は、割当対象レーンであるレーン311に#B1−#C1を割り当てることを決定する。そして、資源管理部204は、図10に示すように、資源割当情報420のリンク##1におけるレーン311の電気信号処理部113の割当資源として#B1−#C1を登録する。さらに、資源管理部204は、資源管理情報410の電気信号処理部用テーブル411のリンク##0における#B1−#C1の割当状態を「済」に変更する。
ここで、資源管理部204は、本実施例では、レーン301及びレーン302の両方に対して、電気信号処理部用テーブル411におけるリンク##0の資源から選択したが、一方の資源をリンク##1の資源から選択してもよい。
次に、資源管理部204は、資源管理情報410の電気光変換部用テーブル412におけるリンク##0又は##1に障害が無く且つ未割り当ての資源があるか否かを判定する。この場合、障害が無く且つ未割り当ての資源として#D1−#E1があるので、資源管理部204は、割当対象レーンであるレーン311に#D1−#E1を割り当てることを決定する。そして、資源管理部204は、図10に示すように、資源割当情報420のリンク##1におけるレーン311の電気光変換部117の割当資源として#D1−#E1を登録する。さらに、資源管理部204は、資源割当情報420のリンク##1におけるレーン311の縮退を「無」に設定する。また、資源管理部204は、資源管理情報410の電気光変換部用テーブル412のリンク##0における#D1−#E1の割当状態を「済」に変更する。
次に、資源管理部204は、障害リンク及び共有リンクのうち割当対象リンクとして選択したリンク##1とは反対のリンク##0を割当対象リンクとして選択する。そして、資源管理部204は、割当対象リンクとして選択したリンク##0が有する残りのレーン312を割当対象レーンとして選択する。そして、資源管理部204は、資源管理情報410の電気信号処理部用テーブル411におけるリンク##0又はリンク##1に障害が無く且つ未割り当ての資源があるか否かを判定する。この場合、障害が無く且つ未割り当ての資源として#B3−#C3があるので、資源管理部204は、割当対象レーンであるレーン311に#B3−#C3を割り当てることを決定する。そして、資源管理部204は、図10に示すように、資源割当情報420のリンク##1におけるレーン311の電気信号処理部113の割当資源として#B3−#C3を登録する。さらに、資源管理部204は、資源管理情報410の電気信号処理部用テーブル411のリンク##0における#B3−#C3の割当状態を「済」に変更する。
次に、資源管理部204は、資源管理情報410の電気光変換部用テーブル412におけるリンク##0又は##1に障害が無く且つ未割り当ての資源があるか否かを判定する。この場合、#D0−#E0及び#D1−#D1は割り当て済みであり、#D2−#E2及び#D3−#D3は故障している。そこで、資源管理部204は、リンク間に跨る資源の再割り当ての処理を終了する。これにより、光モジュール11におけるレーン301及び311の経路は図9の点線に挟まれた経路に決定される。また、レーン302及び312は、縮退される。この場合、資源管理情報410及び資源割当情報420は、図10に示すような状態となる。
ここで、本実施例では、資源管理部204は、リンク##1又は##0に割り当てられた電気信号処理部113又は電気光変換部117の資源の使用可能数が0になったときに、リンク間に跨る資源の再割り当てを行った。ただし、資源管理部204は、資源の使用可能数が残っている状態でもリンク間に跨る資源の再割り当てを行う構成にすることもできる。例えば、資源管理部204は、レーンの再割り当てを行う場合には常にリンク間に跨る資源の再割り当てを行ってもよい。このように、資源の使用可能数が0でない場合でも、リンク間に跨る資源の再割り当てを行うことで、資源管理部204は、通信帯域のバランスを維持することができる。
図3に戻って説明を続ける。資源管理部204は、資源の再割り当てによるレーン301、302、311及び312の再構成を行った後、資源割当情報420に登録された各資源の割り当てを取得する。そして、資源管理部204は、資源割当情報420に登録された各資源の割り当ての情報を経路切替制御部203へ出力する。
経路切替制御部203は、図2に例示したサービスプロセッサ21が自己に組み込まれたファームウェアを実行することで実現される。経路切替制御部203は、資源割当情報420に登録された各資源の割り当ての情報の入力を資源管理部204から受ける。そして、経路切替制御部203は、各資源の割り当てにしたがった経路切替部112及び経路切替部116の経路設定を決定する。この決定された経路設定は、故障個所を迂回するための経路設定となる。そして、経路切替制御部203は、決定した経路設定にしたがって経路切替部112及び経路切替部116を切り替える。ここで、単一リンク内での資源の再割り当ての場合、障害リンクは既に無効とされているので、経路切替制御部203は、経路の切り替えに際して障害リンクの停止時を行わなくてもよい。これに対して、リンク間に跨る資源の再割り当ての場合、共有リンクは動作中である。そこで、リンク間に跨る資源の再割り当ての場合、経路切替制御部203は、共有リンクの停止指示をインターコネクト制御回路12へ出力した後に切替処理を行う。
ここで、図11を参照して、経路切替部112及び経路切替部116の経路の切り替えの詳細について説明する。図11は、経路切替部の構成図である。ここでは、経路切替部112を例に説明する。
経路切替部112は、クロスバスイッチ51及び割当情報保存部52を有する。経路切替制御部203は、決定された経路設定の情報を割当情報保存部52に格納する。例えば、経路切替制御部203は、経路設定の情報として図11の割当情報保存部52に示すように、接続されるチャネル#A0〜#A2とチャネル#B0、#B1及び#B3の組み合わせを登録する。クロスバスイッチ51は、割当情報保存部52に格納された経路設定の情報にしたがいチャネル#A0〜#A3とチャネル#B0〜#B3とを接続する。図11では、チャネル#A3及びチャネル#B2の情報は割当情報保存部52に格納されていないので、クロスバスイッチ51は、チャネル#A3及びチャネル#B2の接続は行わない。
そして、経路切替部112及び経路切替部116の経路の切り替え後、経路切替制御部203は、障害リンク、又は、障害リンク及び共有リンクの再初期化指示をインターコネクト制御回路12に送信する。この経路切替制御部203及び資源管理部204が、「接続切替部」の一例にあたる。
次に、図12を参照して、本実施例に係るノード間通信装置2による故障個所の特定処理の流れについて説明する。図12は、実施例に係るノード間通信装置による故障個所の特定処理のフローチャートである。
インターコネクト制御回路12は、故障レーンを送信テスト制御部202に通知する(ステップS1)。
送信テスト制御部202は、故障レーンの通知をインターコネクト制御回路12から受ける。そして、送信テスト制御部202は、通知を受けた故障レーンをテスト対象レーンとする。次に、資源管理部204が有する資源割当情報420から故障レーンへ割り当てられた割当資源を特定する(ステップS2)。
次に、送信テスト制御部202は、テスト対象レーンにおいて信号を折り返す信号を折り返すように、経路折返部114及び118を設定する(ステップS3)。
次に、送信テスト制御部202は、テスト対象レーンにおいて信号が送信テスト実施部201から送られるように、テスト信号切替部111及び115を設定する(ステップS4)。
そして、送信テスト制御部202は、設定完了を送信テスト実施部201に通知し(ステップS5)、テスト対象レーンのテストの実行を送信テスト実施部201に指示する。
送信テスト実施部201は、設定完了の通知及びテスト対象レーンのテストの実行の指示を送信テスト制御部202から受ける。そして、送信テスト実施部201は、テストレーンに対してテストパターンを有する信号を送出する。その後、送信テスト実施部201は、返ってきた信号を用いてBERチェックを実行して、故障レーンにおける故障個所を特定する(ステップS6)。
その後、送信テスト実施部201は、特定した故障個所の情報を送信テスト制御部202に通知する。送信テスト制御部202は、送信テスト実施部201から取得した故障個所の情報を資源管理部204に通知する(ステップS7)。
資源管理部204は、資源管理情報410における故障個所の情報を更新する(ステップS8)。具体的には、送信テスト制御部202は、資源管理情報410の電気信号処理部用テーブル411及び電気光変換部用テーブル412における故障個所の障害有無の欄を「有」に変更し、故障個所に対応する使用可能数を1つ減らす。
次に、図13を参照して、本実施例に係るノード間通信装置2による資源の再割り当て処理の流れについて説明する。図13は、実施例に係るノード間通信装置による資源の再割り当て処理のフローチャートである。ここでは、レーン301、302、311及び312、並びに、それ以外にもレーンが存在する場合の他のレーンを区別せずに、「レーン300」という。
資源管理部204は、資源管理情報410の電気信号処理部用テーブル411及び電気光変換部用テーブル412を参照して、いずれかで故障レーンを含む障害リンクの資源の使用可能数が0か否かを判定する(ステップS101)。
資源の使用可能数が0の場合(ステップS101:肯定)、資源管理部204は、リンク間に跨る資源の再割り当て処理を実行する(ステップS102)。その後、資源管理部204は、資源の再割り当て処理を終了する。
これに対して、資源の使用可能数が0でない場合(ステップS101:否定)、資源管理部204は、単一リンク内の資源の再割り当て処理を開始する。まず、資源管理部204は、資源管理情報410及び資源割当情報420における障害リンクの情報を初期化する(ステップS103)。
そして、資源管理部204は、障害リンクが有するレーン300の中から資源の割り当てを行う割当対象レーンを1つ選択する(ステップS104)。
次に、資源管理部204は、障害リンクに関する資源管理情報410における電気信号処理部113の情報、すなわち電気信号処理部用テーブル411における障害リンクの資源の情報を資源管理情報410から取得する(ステップS105)。
次に、資源管理部204は、電気信号処理部113に障害リンクの資源で障害が発生しておらず且つ未割り当てである割り当て可能な資源が有るか否かを判定する(ステップS106)。未割り当ての資源が無い場合(ステップS106:否定)、資源管理部204は、資源の再割り当て処理を終了する。
これに対して、未割り当ての資源が有る場合(ステップS106:肯定)、資源管理部204は、電気信号処理部113の資源を割当対象レーンに割り当てる(ステップS107)。
次に、資源管理部204は、資源割当情報420における割当対象レーンに割り当てた電気信号処理部113の資源名及び資源管理情報410における割り当てた電気信号処理部113の資源の割当状態を登録する(ステップS108)。
次に、資源管理部204は、障害リンクに関する資源管理情報410における電気光変換部117の情報、すなわち電気光変換部用テーブル412における障害リンクの資源の情報を資源管理情報410から取得する(ステップS109)。
次に、資源管理部204は、電気光変換部117に障害リンクの資源で障害が発生しておらず且つ未割り当てである割り当て可能な資源が有るか否かを判定する(ステップS110)。未割り当ての資源が無い場合(ステップS110:否定)、資源管理部204は、資源の再割り当て処理を終了する。
これに対して、未割り当ての資源が有る場合(ステップS110:肯定)、資源管理部204は、電気光変換部117の資源を割当対象レーンに割り当てる(ステップS111)。
次に、資源管理部204は、資源割当情報420における割当対象レーンに割り当てた電気光変換部117の資源名及び資源管理情報410における割り当てた電気光変換部117の資源の割当状態を登録する(ステップS112)。
次に、資源管理部204は、資源割当情報420における割当対象レーンの縮退の情報を「無」に設定する(ステップS113)。
その後、資源管理部204は、資源未割り当てのレーン300が障害リンクに有るか否かを判定する(ステップS114)。資源未割り当てのレーン300が存在する場合(ステップS114:肯定)、資源管理部204は、ステップS104へ戻る。
これに対して、資源未割り当てのレーン300が存在しない場合(ステップS114:否定)、資源管理部204は、資源の再割り当て処理を終了する。
次に、図14を参照して、本実施例に係るノード間通信装置2によるリンク間に跨る資源の再割り当て処理の流れについて説明する。図14は、実施例に係るノード間通信装置によるリンク間に跨る資源の再割り当て処理のフローチャートである。ここでは、リンク##0及び##1、並びに、それ以外にもリンクが存在する場合の他のリンクを区別せずに、「リンク##n」という。また、レーン301、302、311及び312、並びに、それ以外にもレーンが存在する場合のレーンを区別せずに、「レーン300」という。
資源管理部204は、資源管理情報410を用いて、故障リンク以外の他のリンク##n毎の構成可能なレーン数を算出する(ステップS201)。
次に、資源管理部204は、構成可能なレーン数が2以上のリンク##nが存在するか否かを判定する(ステップS202)。構成可能なレーン数が2以上のリンク##nが存在しない場合(ステップS202:否定)、資源管理部204は、資源の再割り当て処理を終了する。
これに対して、構成可能なレーン数が2以上のリンク##nが存在する場合(ステップS202:肯定)、資源管理部204は、構成可能なレーン数が2以上のリンク##nの中から構成可能なレーン数が最大のリンク##nを共有リンクとして特定する(ステップS203)。
次に、資源管理部204は、資源管理情報410及び資源割当情報420における障害リンク及び共有リンクの情報を初期化する(ステップS204)。
そして、資源管理部204は、障害リンク又は共有リンクのうち割当対象リンクを1つ選択する(ステップS205)。
そして、資源管理部204は、障害リンク又は共有リンクが有するレーン300の中から資源の割り当てを行う割当対象レーンを1つ選択する(ステップS206)。
次に、資源管理部204は、障害リンク及び共有リンクに関する資源管理情報410における電気信号処理部113の情報を取得する(ステップS207)。すなわち、資源管理部204は、電気信号処理部用テーブル411における障害リンク及び共有リンクの資源の情報を資源管理情報410から取得する。
次に、資源管理部204は、電気信号処理部113に障害リンク又は共有リンクの資源で障害が発生しておらず且つ未割り当てである割り当て可能な資源が有るか否かを判定する(ステップS208)。未割り当ての資源が無い場合(ステップS208:否定)、資源管理部204は、資源の再割り当て処理を終了する。
これに対して、未割り当ての資源が有る場合(ステップS208:肯定)、資源管理部204は、電気信号処理部113の資源を割当対象レーンに割り当てる(ステップS209)。
次に、資源管理部204は、資源割当情報420における割当対象レーンに割り当てた電気信号処理部113の資源名及び資源管理情報410における割り当てた電気信号処理部113の資源の割当状態を登録する(ステップS210)。
次に、資源管理部204は、障害リンク及び供給リンクに関する資源管理情報410における電気光変換部117の情報を取得する(ステップS211)。すなわち、資源管理部204は、電気光変換部用テーブル412における障害リンク及び共有リンクの資源の情報を資源管理情報410から取得する。
次に、資源管理部204は、電気光変換部117に障害リンク又は共有リンクの資源で障害が発生しておらず且つ未割り当てである割り当て可能な資源が有るか否かを判定する(ステップS212)。未割り当ての資源が無い場合(ステップS212:否定)、資源管理部204は、資源の再割り当て処理を終了する。
これに対して、未割り当ての資源が有る場合(ステップS212:肯定)、資源管理部204は、電気光変換部117の資源を割当対象レーンに割り当てる(ステップS213)。
次に、資源管理部204は、資源割当情報420における割当対象レーンに割り当てた電気光変換部117の資源名及び資源管理情報410における割り当てた電気光変換部117の資源の割当状態を登録する(ステップS214)。
次に、資源管理部204は、資源割当情報420における割当対象レーンの縮退の情報を「無」に設定する(ステップS215)。
その後、資源管理部204は、資源未割り当てのレーン300が障害リンク又は共有リンクに有るか否かを判定する(ステップS216)。資源未割り当てのレーン300が存在する場合(ステップS216:肯定)、資源管理部204は、割り当て対象リンクとして選択中のリンク##nとは逆のリンク##nを割り当て対象リンクとして選択する(ステップS217)。その後、資源管理部204は、ステップS206へ戻る。
これに対して、資源未割り当てのレーン300が存在しない場合(ステップS216:否定)、資源管理部204は、資源の再割り当て処理を終了する。
以上に説明したように、本実施例に係るノード間通信装置は、障害リンクに割り当てられた資源でノード間を結ぶレーンが形成できる場合、障害リンク内の資源を用いてノード間を結ぶレーンを再構成する。また、障害リンクに割り当てられた資源でノード間を結ぶレーンが形成困難な場合、ノード間通信装置は、他のリンクが使用する資源を用いて障害リンク及び他のリンクにおけるノード間を結ぶレーンを再構成する。これにより、リンク内の全レーンで光モジュールの故障が検出された場合であっても、リンクの無効化を回避し、ノード間の通信を継続することができる。これにより、ノード形状が所定の形に指定されたジョブの実行が阻害されることを回避し、システムの可用性を向上させることができる。
1 ノード
2 ノード間通信装置
10 CPU
11 光モジュール
12 インターコネクト制御回路
13 メモリ
21 サービスプロセッサ
22 テスト回路
111 テスト信号切替部
112 経路切替部
113 電気信号処理部
114 経路折返部
115 テスト信号切替部
116 経路切替部
117 電気光変換部
118 経路折返部
119 経路切替部
121,122 ポート
201 送信テスト実施部
202 送信テスト制御部
203 経路切替制御部
204 資源管理部
221 テストパターン生成回路
222 エラーチェック回路
223 エラーカウンタレジスタ
300,301,302,311,312 レーン
410 資源管理情報
411 電気信号処理部用テーブル
412 電気光変換部用テーブル
420 資源割当情報
##0〜##n リンク

Claims (7)

  1. 第1演算処理装置と複数の第2演算処理装置それぞれとを結ぶ複数のリンクに含まれる複数のレーン毎の一部にあたる第1信号伝送経路と、
    複数の前記レーン毎の他の一部にあたる第2信号伝送経路と、
    各前記第1信号伝送経路の導通試験及び各前記第2信号伝送経路の導通試験を行う試験部と、
    前記試験部により特定のリンクが有する前記レーンの全てで前記第1信号伝送経路又は前記第2信号伝送経路の故障が発生したことが検出された場合、他のリンクが有する前記レーンに含まれる前記第1信号伝送経路又は前記第2信号伝送経路を経由させることで前記第1信号伝送経路及び前記第2信号伝送経路を迂回させて、前記第1演算処理装置と前記第2演算処理装置との接続を維持するように、前記第1演算処理装置、前記第1信号伝送経路、前記第2信号伝送経路及び前記第2演算処理装置の接続を切り替える接続切替部と
    を備えたことを特徴とするノード間通信装置。
  2. 前記接続切替部は、前記第1演算処理装置と前記第1信号伝送経路との接続、前記第1信号伝送経路と前記第2信号伝送経路との接続、及び、前記第2信号伝送経路と前記第2演算処理装置との接続を切り替えることを特徴とする請求項1に記載のノード間通信装置。
  3. 前記接続切替部は、特定のレーンで障害が発生した場合に、前記特定のレーンにおける前記第1演算処理装置の接続点と前記第2演算処理装置の接続点とを結ぶように、前記第1演算処理装置と前記第1信号伝送経路との接続、前記第1信号伝送経路と前記第2信号伝送経路との接続、及び、前記第2信号伝送経路と前記第2演算処理装置との接続を切り替えることを特徴とする請求項1又は2に記載のノード間通信装置。
  4. 前記試験部は、各前記第1信号伝送経路の一方から信号を入力し、各前記第1信号伝送経路の他方からの出力信号を折り返し、各前記第1信号伝送経路の前記一方からの出力信号を取得して導通試験を行い、且つ、各前記第2信号伝送経路の一方から信号を入力し、各前記第2信号伝送経路の他方からの出力信号を折り返し、各前記第2信号伝送経路の前記一方からの出力信号を取得して導通試験を行うことを特徴とする請求項1〜のいずれか一つに記載のノード間通信装置。
  5. 前記第1信号伝送経路を複数有し、各前記第1信号伝送経路において電気信号を処理する電気信号処理部と、
    前記第2信号伝送経路を複数有し、各前記第2信号伝送経路において電気信号と光信号との変換を行う電気光変換部と
    をさらに備えたことを特徴とする請求項1〜のいずれか一つに記載のノード間通信装置。
  6. 第1演算処理装置及び複数の第2演算処理装置と、
    前記第1演算処理装置と複数の前記第2演算処理装置それぞれとを結ぶ複数のリンクに含まれる複数のレーン毎の一部にあたる第1信号伝送経路と、
    複数の前記レーン毎の他の一部にあたる第2信号伝送経路と、
    各前記第1信号伝送経路の導通試験及び各前記第2信号伝送経路の導通試験を行う試験部と、
    前記試験部により特定のリンクが有する前記レーンの全てで前記第1信号伝送経路又は前記第2信号伝送経路の故障が発生したことが検出された場合、他のリンクが有する前記レーンに含まれる前記第1信号伝送経路又は前記第2信号伝送経路を経由させることで前記第1信号伝送経路及び前記第2信号伝送経路を迂回させて、前記第1演算処理装置と前記第2演算処理装置との接続を維持するように、前記第1演算処理装置、前記第1信号伝送経路、前記第2信号伝送経路及び前記第2演算処理装置の接続を切り替える接続切替部と
    を備えたことを特徴とする並列処理装置。
  7. 第1演算処理装置と複数の第2演算処理装置それぞれとを結ぶ複数のリンクに含まれる複数のレーン毎の一部にあたる第1信号伝送経路のそれぞれの導通試験を行い、
    複数の前記レーン毎の他の一部にあたる第2信号伝送経路のそれぞれの導通試験を行い、
    特定のリンクが有する前記レーンの全てで前記第1信号伝送経路又は前記第2信号伝送経路の故障が発生したことが検出された場合、他のリンクが有する前記レーンに含まれる前記第1信号伝送経路又は前記第2信号伝送経路を経由させることで前記第1信号伝送経路及び故障が検出された前記第2信号伝送経路を迂回させて、前記レーンによる前記第1演算処理装置と前記第2演算処理装置との接続を維持するように、前記第1演算処理装置、前記第1信号伝送経路、前記第2信号伝送経路及び前記第2演算処理装置の接続を切り替える
    ことを特徴とするノード間通信経路制御方法。
JP2017135479A 2017-07-11 2017-07-11 ノード間通信装置、並列処理装置及びノード間通信経路制御方法 Active JP6885237B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017135479A JP6885237B2 (ja) 2017-07-11 2017-07-11 ノード間通信装置、並列処理装置及びノード間通信経路制御方法
US16/026,248 US10771149B2 (en) 2017-07-11 2018-07-03 Communication bypass apparatus, method and non-transitory computer readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017135479A JP6885237B2 (ja) 2017-07-11 2017-07-11 ノード間通信装置、並列処理装置及びノード間通信経路制御方法

Publications (2)

Publication Number Publication Date
JP2019021957A JP2019021957A (ja) 2019-02-07
JP6885237B2 true JP6885237B2 (ja) 2021-06-09

Family

ID=65000294

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017135479A Active JP6885237B2 (ja) 2017-07-11 2017-07-11 ノード間通信装置、並列処理装置及びノード間通信経路制御方法

Country Status (2)

Country Link
US (1) US10771149B2 (ja)
JP (1) JP6885237B2 (ja)

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5287491A (en) * 1989-04-10 1994-02-15 International Business Machines Corporation Network rearrangement method and system
US5161156A (en) * 1990-02-02 1992-11-03 International Business Machines Corporation Multiprocessing packet switching connection system having provision for error correction and recovery
US5321813A (en) * 1991-05-01 1994-06-14 Teradata Corporation Reconfigurable, fault tolerant, multistage interconnect network and protocol
JPH05111065A (ja) 1991-10-16 1993-04-30 Fujitsu Ltd 多段結合網
US5914798A (en) * 1995-12-29 1999-06-22 Mci Communications Corporation Restoration systems for an optical telecommunications network
JPH11191754A (ja) 1997-12-25 1999-07-13 Fujitsu Ltd 波長多重光ネットワーク
JP3625450B2 (ja) 2002-02-27 2005-03-02 株式会社日立コミュニケーションテクノロジー 光通信網、ノード装置及び光通信網管理装置
JP4322659B2 (ja) 2003-12-19 2009-09-02 エヌイーシーコンピュータテクノ株式会社 シリアル伝送制御装置、コンピュータシステム、および、シリアル伝送制御方法
JP4621086B2 (ja) * 2005-07-25 2011-01-26 株式会社日立製作所 光通信網、ノード装置および経路故障救済方法
JP4700738B2 (ja) 2006-10-06 2011-06-15 日本電信電話株式会社 通信ノード装置、通信システム、パスリソース割当方法、及びプログラム
JP5545212B2 (ja) * 2008-05-26 2014-07-09 日本電気株式会社 波長パス通信ノード装置、波長パス通信制御方法、プログラム、および記録媒体
JP2013200616A (ja) 2012-03-23 2013-10-03 Nec Corp 情報処理装置及び情報処理装置の復旧回路
JP6007983B2 (ja) * 2012-07-02 2016-10-19 日本電気株式会社 光分岐装置及び光分岐方法
US9645811B2 (en) * 2013-04-01 2017-05-09 Oc Acquisition Llc Fault tolerance for a distributed computing system
US11567818B2 (en) * 2016-04-26 2023-01-31 Akimbo Technologies Inc. Method of detecting faults in a fault tolerant distributed computing network system
JP6859672B2 (ja) * 2016-11-16 2021-04-14 富士通株式会社 情報処理装置および情報処理装置の障害検出方法

Also Published As

Publication number Publication date
JP2019021957A (ja) 2019-02-07
US20190020408A1 (en) 2019-01-17
US10771149B2 (en) 2020-09-08

Similar Documents

Publication Publication Date Title
CN107769956B (zh) 计算系统和冗余资源连接结构
JP5285690B2 (ja) 並列コンピュータ・システム、並列コンピュータ・システム上のノード・トラフィックを動的に再経路指定するためのコンピュータ実装方法、コンピュータ可読記録媒体及びコンピュータ・プログラム
US8947999B2 (en) Shared protection method and apparatus for reconfigurable optical add-drop multiplexer (roadm) based mesh networks
KR101091360B1 (ko) 토러스 네트워크를 가지는 병렬 컴퓨터 시스템 상의 오류 복구
US20120144230A1 (en) Cable redundancy and failover for multi-lane pci express io interconnections
WO2014159856A1 (en) Configurable vertical integration
CN112188325B (zh) 使用具有一对多光交换机的光网络的可重新配置的计算平台
US11537443B2 (en) Reconfigurable computing pods using optical networks
US20220350767A1 (en) Flexible high-availability computing with parallel configurable fabrics
JP2003330626A (ja) 常時稼働コントローラ相互接続を介してのコントローラ通信
US20060221818A1 (en) Method, system and storage medium for redundant input/output access
EP1890439B1 (en) Data processing management apparatus, mode management apparatus and mode management method
JP6885237B2 (ja) ノード間通信装置、並列処理装置及びノード間通信経路制御方法
CN110708254B (zh) 一种业务处理方法、控制设备及存储介质
US11411861B2 (en) Routing messages in an integrated circuit chip device using a crosslinked tree structure
US7836335B2 (en) Cost-reduced redundant service processor configuration
US7187674B2 (en) Method and apparatus for using adaptive switches for providing connections to point-to-point interconnection fabrics
US11176006B2 (en) Reconfiguring an addressing mechanism for a system on chip to bypass a defective branch unit
US11429459B2 (en) Broadcasting event messages in a System on Chip using a crosslinked tree structure
JP4564278B2 (ja) ソフト構成を用いたデータ交換

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200409

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210413

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210426

R150 Certificate of patent or registration of utility model

Ref document number: 6885237

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150