JP2015192360A - 情報処理装置、並列計算機システムおよび並列計算機システムの制御方法 - Google Patents

情報処理装置、並列計算機システムおよび並列計算機システムの制御方法 Download PDF

Info

Publication number
JP2015192360A
JP2015192360A JP2014069111A JP2014069111A JP2015192360A JP 2015192360 A JP2015192360 A JP 2015192360A JP 2014069111 A JP2014069111 A JP 2014069111A JP 2014069111 A JP2014069111 A JP 2014069111A JP 2015192360 A JP2015192360 A JP 2015192360A
Authority
JP
Japan
Prior art keywords
lane
physical layer
unit
information
lanes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014069111A
Other languages
English (en)
Other versions
JP6331574B2 (ja
Inventor
誠裕 前田
Masahiro Maeda
誠裕 前田
智宏 井上
Tomohiro Inoue
智宏 井上
新哉 平本
Shinya Hiramoto
新哉 平本
俊 安藤
Takashi Ando
俊 安藤
広治 細江
Koji Hosoe
広治 細江
雄一郎 安島
Yuichiro Yasujima
雄一郎 安島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014069111A priority Critical patent/JP6331574B2/ja
Priority to US14/629,881 priority patent/US9619347B2/en
Priority to EP15156826.8A priority patent/EP2924583B1/en
Publication of JP2015192360A publication Critical patent/JP2015192360A/ja
Application granted granted Critical
Publication of JP6331574B2 publication Critical patent/JP6331574B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • G06F13/4282Bus transfer protocol, e.g. handshake; Synchronisation on a serial bus, e.g. I2C bus, SPI bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/20Arrangements for detecting or preventing errors in the information received using signal quality detector
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0062Network aspects
    • H04Q11/0066Provisions for optical burst or packet networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/85Active fault masking without idle spares
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0062Network aspects
    • H04Q2011/0079Operation or maintenance aspects
    • H04Q2011/0081Fault tolerance; Redundancy; Recovery; Reconfigurability

Abstract

【課題】 故障したレーンを特定する機能を含まない物理層を使用する場合においても、縮退するレーンを特定する。【解決手段】 情報処理装置は、データを複数の第1レーンに分配し、所定の数の第1レーンをまとめた複数の第2レーンを用いて外部の装置とのデータ転送を実行する物理層と、演算処理装置から受信したデータを物理層に転送し、物理層から受信したデータを演算処理装置に転送する転送回路とを有し、転送回路は、データを受信したことを示す各第1レーンの検出情報と、データに誤りがあることを示す各第1レーンのエラー情報とのいずれかを、物理層から受信する情報取得部と、レーン故障が発生した場合、縮退対象の第2レーンをエラー情報および検出情報のいずれかに基づいて特定し、特定した第2レーンを除く第2レーンからデータ転送に使用する第2レーンを選択する選択部とを有する。【選択図】 図1

Description

本発明は、情報処理装置、並列計算機システムおよび並列計算機システムの制御方法に関する。
並列計算機システムは、例えば、データを処理する複数の情報処理装置(以下、ノードとも称する)を有する。並列計算機システムの複数の情報処理装置は、伝送路(以下、レーンとも称する)を介して接続される。例えば、IEEE802.3ba規格で標準化された100Gbpsのイーサネット(登録商標)を使用した情報処理装置は、複数のレーンを用いてデータを通信先の情報処理装置に転送する。以下、100Gbpsのイーサネットを100Gbイーサネットとも称する。例えば、100Gbイーサネットでは、複数のレーンでリンクを実現する。
なお、例えば、並列計算機システムのノード間を複数のレーンにより接続するリンクに光伝送が適用される場合、電気信号を光信号に変換する発光素子、光信号を電気信号に変換する受光素子等を含む光モジュールが使用される。発光素子等の光モジュールの故障率は、電気部品に比べて高い。例えば、光モジュールの故障等により複数のレーンのうちの1つでも故障した場合、ノード間のリンクが切断される。この場合、故障部品(例えば、故障した光モジュール)を含むノードを使用した並列計算等の処理は実行できない。このため、並列計算機システムの信頼性は、レーンの故障率の増加に伴い低下する。
換言すれば、故障したレーン(以下、故障レーンとも称する)を縮退させてリンクの接続を維持できれば、並列計算機システムの信頼性は向上する。なお、IEEE802.3ba規格の物理層(以下、物理層PHY(physical layer)とも称する)には、故障したレーンを特定する機能およびレーンを縮退させる機能は用意されていない。
このため、一部のレーンで発生した障害を回避してリンクを維持可能な物理層アーキテクチャが提案されている(例えば、非特許文献1)。例えば、レーン縮退を実現するために、100Gbイーサネット標準仕様のアライメントマーカ挿抜プロトコル中に、レーン切り替え制御情報を埋め込む機能が追加される。なお、各レーンの障害は、例えば、64B/66B符号ブロックのヘッダ2ビットを監視することにより、検出される。
また、複数の伝送路から障害状態の伝送路を特定する方法として、障害が発生しているレーンを特定するための固定データパターンを生成し、生成した固定データパターンを接続先の装置に送信する方法が提案されている(例えば、特許文献1)。例えば、固定データパターンを受信した装置は、受信した固定データパターンから障害状態の伝送路を特定する。
特開2006−186527号公報
神戸章宏、光野正志、豊田英弘、「100ギガビットイーサネット対応レーン縮退技術の研究」、信学技報 CS2010-39、pp.13-18、2010年11月
IEEE802.3ba規格に準拠した物理層を使用することを前提とした情報処理装置では、故障したレーンを特定する機能を含まない物理層を使用するため、故障レーンの特定は、困難である。なお、アライメントマーカ挿抜プロトコル中にレーン切り替え制御情報を埋め込む機能等を追加する方式では、物理層プロトコルを改良するため、IEEE802.3ba規格の物理層からの変更量が大きくなるおそれがある。標準規格からの変更量が大きくなると、汎用性が低下するおそれがある。
1つの側面では、本件開示の情報処理装置、並列計算機システムおよび並列計算機システムの制御方法は、故障したレーンを特定する機能を含まない物理層を使用する場合においても、縮退するレーンを特定することを目的とする。
一観点によれば、情報処理装置は、OSI参照モデルの物理層に相当するデバイスであり、データを複数の第1レーンに分配し、所定の数の第1レーンをまとめた複数の第2レーンを用いて外部の装置とのデータ転送を実行する物理層デバイスと、物理層より上位の層に相当するデバイスであり、演算処理を実行する演算処理装置から受信したデータを物理層デバイスに転送し、物理層デバイスから受信したデータを演算処理装置に転送する転送回路とを有し、転送回路は、物理層デバイスが外部の装置からデータを受信したことを示す各第1レーンの検出情報と、外部の装置から物理層デバイスに転送されたデータに誤りがあることを示す各第1レーンのエラー情報とのいずれかを、物理層デバイスから受信する情報取得部と、複数の第1レーンおよび複数の第2レーンのいずれかに故障が発生した場合、縮退対象の第2レーンをエラー情報および検出情報のいずれかに基づいて特定し、特定した第2レーンを除く第2レーンから外部の装置とのデータ転送に使用する第2レーンを選択する選択部とを有する。
別の観点によれば、伝送路を介して接続される複数の情報処理装置を有する並列計算機システムでは、情報処理装置は、OSI参照モデルの物理層に相当するデバイスであり、データを複数の第1レーンに分配し、所定の数の第1レーンをまとめた複数の第2レーンを用いて通信先の情報処理装置とのデータ転送を実行する物理層デバイスと、物理層より上位の層に相当するデバイスであり、演算処理を実行する演算処理装置から受信したデータを物理層デバイスに転送し、物理層デバイスから受信したデータを演算処理装置に転送する転送回路とを有し、転送回路は、物理層デバイスが通信先の情報処理装置からデータを受信したことを示す各第1レーンの検出情報と、通信先の情報処理装置から物理層デバイスに転送されたデータに誤りがあることを示す各第1レーンのエラー情報とのいずれかを、物理層デバイスから受信する情報取得部と、複数の第1レーンおよび複数の第2レーンのいずれかに故障が発生した場合、縮退対象の第2レーンをエラー情報および検出情報のいずれかに基づいて特定し、特定した第2レーンを除く第2レーンから通信先の情報処理装置とのデータ転送に使用する第2レーンを選択する選択部とを有する。
別の観点によれば、伝送路を介して接続される複数の情報処理装置を有し、情報処理装置が、OSI参照モデルの物理層に相当するデバイスであり、データを複数の第1レーンに分配し、所定の数の第1レーンをまとめた複数の第2レーンを用いて通信先の情報処理装置とのデータ転送を実行する物理層デバイスと、物理層より上位の層に相当するデバイスであり、演算処理を実行する演算処理装置から受信したデータを物理層デバイスに転送し、物理層デバイスから受信したデータを演算処理装置に転送する転送回路とを有する並列計算機システムの制御方法では、転送回路は、物理層デバイスが通信先の情報処理装置からデータを受信したことを示す各第1レーンの検出情報と、通信先の情報処理装置から物理層デバイスに転送されたデータに誤りがあることを示す各第1レーンのエラー情報とのいずれかを、物理層デバイスから受信し、転送回路は、複数の第1レーンおよび複数の第2レーンのいずれかに故障が発生した場合、縮退対象の第2レーンをエラー情報および検出情報のいずれかに基づいて特定し、特定した第2レーンを除く第2レーンから通信先の情報処理装置とのデータ転送に使用する第2レーンを選択する。
本件開示の情報処理装置、並列計算機システムおよび並列計算機システムの制御方法は、故障したレーンを特定する機能を含まない物理層を使用する場合においても、縮退するレーンを特定できる。
情報処理装置、並列計算機システムおよび並列計算機システムの制御方法の一実施形態を示す図である。 図1に示した物理層の一例を示す図である。 図1に示したフレーム転送回路の一例を示す図である。 図3に示したリンク制御部の一例を示す図である。 図4に示したエラーカウンタの一例を示す図である。 レーン縮退の契機の一例を示す図である。 図1に示した情報処理装置のリンクアップ前の動作の一例を示す図である。 縮退するレーンの特定方法の一例を示す図である。 縮退するレーンの特定方法の別の例を示す図である。 図1に示した情報処理装置のリンクアップ後の動作の一例を示す図である。 図1に示した情報処理装置のリンクアップ後の動作の別の例を示す図である。 図1に示した情報処理装置のリンクアップ後の動作の別の例を示す図である。 図1に示した情報処理装置のリンクアップ後の動作の別の例を示す図である。
以下、実施形態を図面を用いて説明する。
図1は、情報処理装置、並列計算機システムおよび並列計算機システムの制御方法の一実施形態を示す。この実施形態の並列計算機システムSYSは、伝送路PHL(以下、物理レーンPHLとも称する)を介して接続される複数の情報処理装置PDEV(PDEV1、PDEV2)を有する。例えば、情報処理装置PDEVは、複数の物理レーンPHLを用いて、データを通信先の情報処理装置PDEVに転送する。これにより、並列計算機システムSYSは、情報処理装置PDEV間の高速伝送を実現する。
例えば、情報処理装置PDEV1から見た場合、情報処理装置PDEV2は、通信先の情報処理装置PDEVであり、外部の装置に対応する。また、例えば、情報処理装置PDEV2から見た場合、情報処理装置PDEV1は、通信先の情報処理装置PDEVであり、外部の装置に対応する。
各情報処理装置PDEVは、並列計算機システムSYSの各ノードに対応する。以下、情報処理装置PDEVをノードとも称する。例えば、並列計算機システムSYSのノード間を接続するリンクには、光伝送が適用される。なお、並列計算機システムSYSのノード間を接続するリンクに、電気伝送が用いられてもよい。情報処理装置PDEVは、例えば、物理層PHY(physical layer)、フレーム転送回路FTRおよびCPU(Central Processing Unit)を有する。
物理層PHYは、OSI参照モデルの物理層に相当する物理層デバイスの一例である。例えば、物理層PHYは、IEEE802.3ba規格のLayer1(物理層)に準拠した機能を有する。物理層PHYは、例えば、物理層に含まれるPCS(Physical Coding Sublayer)内の伝送路に対応する複数のPCSレーンにデータを分配する。また、物理層PHYは、所定の数のPCSレーンをまとめた複数の物理レーンPHLを用いて、外部の装置(例えば、通信先の情報処理装置PDEV)とのデータ転送を実行する。
例えば、物理層PHYは、起動や停止を指示する指示通知SINFおよび有効な物理レーンPHLを示すイネーブル信号LENをフレーム転送回路FTRから受信する。物理層PHYは、例えば、起動を指示する指示通知SINFをフレーム転送回路FTRから受信した場合、通信先の情報処理装置PDEVの物理層PHYとのリンクアップ等の起動処理を実行する。そして、物理層PHYは、起動が完了した場合、起動完了を示す起動完了通知CINFをフレーム転送回路FTRに出力する。また、例えば、物理層PHYは、停止を指示する指示通知SINFをフレーム転送回路FTRから受信した場合、物理層PHYを停止するための停止処理を実行する。
さらに、物理層PHYは、各PCSレーンのアライメントマーカ検出情報AINFおよび各PCSレーンのエラー情報EINFをフレーム転送回路FTRに出力する。以下、アライメントマーカ検出情報をAM(Alignment Marker)検出情報とも称する。なお、アライメントマーカは、例えば、通信先の情報処理装置PDEVのPCSレーンとの対応を示す情報である。
また、AM検出情報AINFは、物理層PHYが外部の装置(例えば、通信先の情報処理装置PDEV)からデータを受信したことを示す各PCSレーンの検出情報の一例である。また、エラー情報EINFは、物理層PHYが外部の装置から受信したデータに誤りがあることを示す各PCSレーンのエラー情報の一例である。
例えば、物理層PHYは、通信先の情報処理装置PDEVから物理層PHYの各PCSレーンに転送されたデータからアライメントマーカを検出する。そして、物理層PHYは、アライメントマーカを検出したことを示す各PCSレーンのAM検出情報AINFを、フレーム転送回路FTRに出力する。
また、例えば、物理層PHYは、通信先の情報処理装置PDEVから物理層PHYの各PCSレーンに転送されたデータに対して、BIP(Bit Interleaved Parity)を用いた符号誤り検出を実行する。そして、物理層PHYは、符号誤り検出の結果を示す各PCSレーンのエラー情報EINFを、フレーム転送回路FTRに出力する。
フレーム転送回路FTRは、CPUや物理層PHYにデータを転送する転送回路の一例である。フレーム転送回路FTRは、例えば、物理層より上位の層(例えば、データリンク層)に相当するデバイスである。例えば、フレーム転送回路FTRは、CPUから受信したデータSDATAを含むフレームデータSFRAMを生成し、生成したフレームデータSFRAMを物理層PHYに転送する。また、フレーム転送回路FTRは、例えば、物理層PHYから受信したフレームデータRFRAMに含まれるデータRDATAを、CPUに転送する。
このように、フレーム転送回路FTRは、CPUから受信したデータを物理層PHYに転送し、物理層PHYから受信したデータをCPUに転送する。さらに、フレーム転送回路FTRは、情報取得部ACQおよび選択部SELを有する。例えば、フレーム転送回路FTRは、図3等に示すように、情報取得部ACQおよび選択部SELを含むリンク制御部LCLTを有する。情報取得部ACQは、AM検出情報AINFおよびエラー情報EINFのいずれかを、物理層PHYから受信する情報取得部の一例である。
例えば、情報取得部ACQは、通信先の情報処理装置PDEVのPCSレーンとの対応を示すアライメントマーカを検出したことを示すAM検出情報AINFを、PCSレーン毎に物理層PHYから受信する。また、情報取得部ACQは、例えば、通信先の情報処理装置PDEVから物理層PHYに転送されたデータに対する符号誤り検出の結果を示すエラー情報EINFを、PCSレーン毎に物理層PHYから受信する。
選択部SELは、縮退対象の物理レーンPHLを、AM検出情報AINFおよびエラー情報EINFのいずれかに基づいて特定する選択部の一例である。縮退対象の物理レーンPHLは、例えば、故障したPCSレーンを使用する物理レーンPHL、故障した物理レーンPHL等である。以下、縮退対象の物理レーンPHLを、故障レーンPHLや縮退するレーンPHLとも称する。
例えば、選択部SELは、物理層PHYのリンクアップ前に、PCSレーンおよび物理レーンPHLのいずれかに故障が発生した場合、縮退対象の物理レーンPHL(縮退するレーンPHL)を、AM検出情報AINFに基づいて特定する。そして、選択部SELは、特定した物理レーンPHL(縮退するレーンPHL)を除く物理レーンPHLから通信先の情報処理装置PDEVとのデータ転送に使用する物理レーンPHLを選択する。
また、例えば、選択部SELは、物理層PHYのリンクアップ後に、PCSレーンおよび物理レーンPHLのいずれかに故障が発生した場合、縮退対象の物理レーンPHL(縮退するレーンPHL)を、エラー情報EINFに基づいて特定する。そして、選択部SELは、特定した物理レーンPHL(縮退するレーンPHL)を除く物理レーンPHLから通信先の情報処理装置PDEVとのデータ転送に使用する物理レーンPHLを選択する。
CPUは、演算処理を実行する演算処理装置の一例である。例えば、CPUは、フレーム転送回路FTRからデータRDATAを受信する。そして、CPUは、データRDATAを用いた演算を実行する。また、CPUは、例えば、演算結果等に対応するデータSDATAをフレーム転送回路FTRに出力する。
このように、情報処理装置PDEVでは、物理層より上位の層に相当するフレーム転送回路FTRが、縮退するレーンPHLを特定する。これにより、この実施形態では、故障したレーンを特定する機能(以下、故障レーン特定機能とも称する)を含まない物理層PHYを使用する場合においても、縮退するレーンPHLを特定できる。この結果、この実施形態では、故障レーン特定機能を含まない物理層PHYを使用する場合においても、特定した物理レーンPHL(縮退するレーンPHL)を使用しないように設定することにより、故障レーンPHLを縮退できる。
したがって、並列計算機システムSYSは、例えば、複数の物理レーンPHLのうちの1つが故障した場合でも、故障レーンPHLを縮退してリンクを維持できる。このため、並列計算機システムSYSは、故障レーンPHLを含むノード(情報処理装置PDEV)を使用した並列計算等の処理を実行できる。このように、並列計算機システムSYSの信頼性は、複数の物理レーンPHLのうちの1つでも故障した場合にノード間のリンクが切断される構成に比べて、向上する。
なお、情報処理装置PDEVおよび並列計算機システムSYSの構成は、この例に限定されない。例えば、情報処理装置PDEVは、物理層PHYとフレーム転送回路FTRとの組を1つのCPUに対して複数有してもよい。また、例えば、並列計算機システムSYSは、3つ以上の情報処理装置PDEVを有してもよい。
図2は、図1に示した物理層PHYの一例を示す。図2の例では、PCSレーンPLs0−PLs4は、物理レーンPHLs0に集約され、PCSレーンPLr0−PLr4は、物理レーンPHLr0に集約される。PCSレーンPLs5−PLs9は、物理レーンPHLs1に集約され、PCSレーンPLr5−PLr9は、物理レーンPHLr1に集約される。PCSレーンPLs10−PLs14は、物理レーンPHLs2に集約され、PCSレーンPLr10−PLr14は、物理レーンPHLr2に集約される。PCSレーンPLs15−PLs19は、物理レーンPHLs3に集約され、PCSレーンPLr15−PLr19は、物理レーンPHLr3に集約される。
物理層PHYは、例えば、PCSおよびPMA(Physical Medium Attachment)を有する。PCSは、例えば、データ分割部DIVS、DIVR、AM挿入部AINS、BIP挿入部BINS、データ集約部AGGS、AGGR、AM検出部ADET、BIP検出部BDET、エラー通知部EREPおよび起動制御部SUCLTを有する。また、PMAは、パラレルシリアル変換部PSおよびシリアルパラレル変換部SPを有する。
データ分割部DIVSは、有効な物理レーンPHL(PHLs、PHLr)を示すイネーブル信号LENをフレーム転送回路FTRから受信する。これにより、データ分割部DIVSは、例えば、複数のPCSレーンPLs(PLs0−PLs19)から有効なPCSレーンPLsを選択できる。有効なPCSレーンPLsは、例えば、イネーブル信号LENにより有効と指示された物理レーンPHLsに対応するPCSレーンPLsである。
また、データ分割部DIVSは、フレーム転送回路FTRからフレームデータSFRAMを順次受信する。そして、データ分割部DIVSは、受信したフレームデータSFRAMを有効なPCSレーンPLsに分配して、AM挿入部AINSに出力する。例えば、データ分割部DIVSは、64ビットのデータを66ビットのデータに符号化する64B/66B符号化を実行する。
そして、データ分割部DIVSは、64B/66B符号化後のブロック単位で、データを有効なPCSレーンPLsに振り分ける。これにより、ブロック(66ビットのブロック)単位のデータが有効なPCSレーンPLsに対応するAM挿入部AINSに転送される。このように、データ分割部DIVSは、例えば、1個のレーンを20個のPCSレーンPLsに分割する。
AM挿入部AINS(AINS0−AINS19)は、例えば、PCSレーンPLs0−PLs19に対応して設けられる。各AM挿入部AINSは、データ分割部DIVSから受信したデータにアライメントマーカを挿入し、アライメントマーカを挿入したデータを各BIP挿入部BINS(BINS0−BINS19)に出力する。例えば、各AM挿入部AINSは、16384ブロック毎にアライメントマーカを挿入する。
BIP挿入部BINS(BINS0−BINS19)は、例えば、PCSレーンPLs0−PLs19に対応して設けられる。各BIP挿入部BINSは、各AM挿入部AINSから受信したデータにBIPを挿入し、BIPを挿入したデータをデータ集約部AGGSに出力する。例えば、各BIP挿入部BINSは、16384ブロック毎にBIPを挿入する。
データ集約部AGGSは、各BIP挿入部BINSから各PCSレーンPLsを介して受信したデータを集約して、PMAのパラレルシリアル変換部PSに出力する。例えば、データ集約部AGGSは、20個のPCSレーンPLsを4個のレーンに集約する。
PMAのパラレルシリアル変換部PSは、例えば、データ集約部AGGSからパラレルに受信したデータをシリアルに変換する。例えば、データ集約部AGGSとパラレルシリアル変換部PSとを接続するレーンのそれぞれのバス幅が32ビットの場合、パラレルシリアル変換部PSは、32ビットのパラレルデータを1ビットのシリアルデータに変換する。そして、パラレルシリアル変換部PSは、シリアルに変換したデータを、物理レーンPHLs0−PHLs4等を介して、通信先の情報処理装置PDEVの物理層PHYに転送する。
PMAのシリアルパラレル変換部SPは、例えば、物理レーンPHLr0−PHLr4等を介して、通信先の情報処理装置PDEVの物理層PHYからシリアルデータを受信する。そして、シリアルパラレル変換部SPは、シリアルデータをパラレルデータに変換して、PCSのデータ分割部DIVRに出力する。例えば、シリアルパラレル変換部SPとデータ分割部DIVRとを接続するレーンのそれぞれのバス幅が32ビットの場合、シリアルパラレル変換部SPは、1ビットのシリアルデータを32ビットのパラレルデータに変換する。
データ分割部DIVRは、PMAのシリアルパラレル変換部SPからデータを順次受信する。そして、データ分割部DIVRは、受信したデータを複数のPCSレーンPLr(PLr0−PLr19)に分配して、AM検出部ADET(ADET0−ADET19)に出力する。このように、データ分割部DIVRは、例えば、4個のレーンを20個のPCSレーンPLrに分割する。
AM検出部ADET(ADET0−ADET19)は、例えば、PCSレーンPLr0−PLr19に対応して設けられる。各AM検出部ADETは、データ分割部DIVRから転送されたデータからアライメントマーカを検出する。そして、各AM検出部ADETは、アライメントマーカを検出した場合、アライメントマーカを検出したことを示すAM検出情報AINFを、起動制御部SUCLTに出力する。また、各AM検出部ADETは、データ分割部DIVRから転送されたデータを各BIP検出部BDET(BDET0−BDET19)に出力する。
BIP検出部BDET(BDET0−BDET19)は、例えば、PCSレーンPLr0−PLr19に対応して設けられる。各BIP検出部BDETは、各AM検出部ADETから転送されたデータに対して、BIPを用いた符号誤り検出を実行する。そして、各BIP検出部BDETは、符号誤り検出の結果をエラー情報EINFとして、エラー通知部EREPに出力する。また、各BIP検出部BDETは、各AM検出部ADETから転送されたデータをデータ集約部AGGRに出力する。
データ集約部AGGRは、有効な物理レーンPHL(PHLs、PHLr)を示すイネーブル信号LENをフレーム転送回路FTRから受信する。これにより、データ集約部AGGRは、例えば、複数のPCSレーンPLr(PLr0−PLr19)から有効なPCSレーンPLrを選択できる。有効なPCSレーンPLrは、例えば、イネーブル信号LENにより有効と指示された物理レーンPHLrに対応するPCSレーンPLrである。
また、データ集約部AGGRは、例えば、20個のPCSレーンPLrを1個のレーンに集約する。例えば、データ集約部AGGRは、64B/66B符号化されたデータを有効なPCSレーンPLr毎に復号する。そして、データ集約部AGGRは、各PCSレーンPLsのデータ(復号したデータ)を集約して、フレームデータRFRAMを生成する。
このように、データ集約部AGGRは、有効なPCSレーンPLrに対応するBIP検出部BDETから受信したデータを集約して、フレームデータRFRAMを生成する。そして、データ集約部AGGRは、フレームデータRFRAMをフレーム転送回路FTRに出力する。
起動制御部SUCLTは、例えば、起動や停止の指示を示す指示通知SINFおよびイネーブル信号LENをフレーム転送回路FTRから受信する。例えば、起動制御部SUCLTは、起動指示を示す指示通知SINFをフレーム転送回路FTRから受信した場合、物理層PHYを起動させる処理を実行する。そして、起動制御部SUCLTは、例えば、有効なPCSレーンPLrの全てで、アライメントマーカが検出された場合、起動完了を示す起動完了通知CINFをフレーム転送回路FTRに出力する。
また、起動制御部SUCLTは、各AM検出部ADETから受信した各PCSレーンPLrのAM検出情報AINFを、フレーム転送回路FTRの情報取得部ACQに出力する。例えば、起動制御部SUCLTは、各AM検出部ADETから受信したAM検出情報AINFを保持するレジスタ等を有する。
エラー通知部EREPは、各BIP検出部BDETから受信した各PCSレーンPLrのエラー情報EINFを、フレーム転送回路FTRの情報取得部ACQに出力する。例えば、エラー通知部EREPは、各BIP検出部BDETから受信したエラー情報EINFを保持するレジスタ等を有する。このように、物理層PHYは、AM検出情報AINFおよびエラー情報EINFをフレーム転送回路FTRに出力する。これにより、フレーム転送回路FTRは、物理レーンPHL等の故障を検出でき、さらに、縮退するレーンPHLを特定できる。
なお、物理層PHYの構成は、この例に限定されない。例えば、各AM検出部ADETは、AM検出情報AINFを、起動制御部SUCLTおよびフレーム転送回路FTRの情報取得部ACQに出力してもよい。また、例えば、各BIP検出部BDETは、エラー情報EINFを、エラー通知部EREPおよびフレーム転送回路FTRの情報取得部ACQに出力してもよい。また、PCSレーンPL(PLs、PLr)の数、物理レーンPHL(PHLs、PHLr)の数等も、この例に限定されない。
図3は、図1に示したフレーム転送回路FTRの一例を示す。フレーム転送回路FTRは、フレーム生成部FGEN、フレーム送信部FSEN、再送制御部RTCLT、フレーム受信部FREC、バッファ部RBUF、フロー制御部FCLTおよびリンク制御部LCLTを有する。なお、図1に示した情報取得部ACQおよび選択部SELは、例えば、リンク制御部LCLTに含まれる。
フレーム生成部FGENは、CPUからデータSDATAを受信し、受信したデータSDATAをフレームの形式に変換する。これにより、フレームデータSFRAMが生成される。そして、フレーム生成部FGENは、フレームの形式に変換したフレームデータSFRAMをフレーム送信部FSENおよび再送制御部RTCLTに出力する。また、フレーム生成部FGENは、例えば、フレームデータSFRAMのデータ長を示す情報をフロー制御部FCLTに出力する。
フレーム送信部FSENは、物理層PHYにフレームデータSFRAMを送信するためのインターフェース回路である。例えば、フレーム送信部FSENは、物理層PHYとの非同期クロックの乗り換え等を実行する。また、フレーム送信部FSENは、再送制御部RTCLTから受信したフレームデータSFRAMとフレーム生成部FGENから受信したフレームデータSFRAMとのいずれかを出力データとして選択するデータパス選択機能を有する。
再送制御部RTCLTは、フレーム生成部FGENから受信したフレームデータSFRAMを内部のバッファ等に記憶する。また、再送制御部RTCLTは、例えば、肯定応答信号ACK、否定応答信号NACK等を、フレーム受信部FRECから受信する。例えば、肯定応答信号ACKは、データの受信が通信先の情報処理装置PDEVで正常に完了したことを示す信号であり、通信先の情報処理装置PDEVのフレーム転送回路FTRから送信される。また、例えば、否定応答信号NACKは、通信先の情報処理装置PDEVがデータを正常に受信できなかったことを示す信号であり、通信先の情報処理装置PDEVのフレーム転送回路FTRから送信される。
例えば、再送制御部RTCLTは、否定応答信号NACKを受信した場合、再送制御部RTCLT内のバッファ等に記憶したフレームデータSFRAM(フレーム生成部FGENから受信したフレームデータSFRAM)を、フレーム送信部FSENに出力する。これにより、フレームデータSFRAMの再送信が実行される。
また、再送制御部RTCLTは、異常検出部FDETを有する。異常検出部FDETは、外部の装置(例えば、通信先の情報処理装置PDEV)に物理層PHYを介して転送したフレームデータSFRAMの再送信に関する処理での異常を検出する第1検出部の一例である。例えば、異常検出部FDETは、ビットエラーレートの悪化、リトライアウト等を検出した場合、再送信に関する処理で異常が発生したと判定する。ビットエラーレートの悪化は、例えば、所定時間内の再送回数が閾値を超えた場合に検出される。また、例えば、リトライアウトは、送信したフレームデータSFRAMに対する応答(肯定応答信号ACK、否定応答信号NACK)がない場合や連続した再送の回数が閾値を超えた場合に検出される。
異常検出部FDETは、再送信に関する処理での異常を検出した場合、再送信に関する処理で異常が発生したことを示す再送信エラー通知RERRをリンク制御部LCLTに出力する。
フレーム受信部FRECは、物理層PHYからフレームデータRFRAMを受信するためのインターフェース回路である。物理層PHYからフレーム受信部FRECに転送されるフレームデータRFRAMは、通信先の情報処理装置PDEVのフレーム転送回路FTRから送信されるフレームデータSFRAMに対応する。
フレーム受信部FRECは、物理層PHYとの非同期クロックの乗り換え等を実行し、物理層PHYから受信したフレームデータRFRAMをバッファ部RBUFに出力する。また、フレーム受信部FRECは、制御用DLLP(Data Link Layer Packet)の検出機能を有する。
例えば、フレーム受信部FRECは、フロー制御に関するフロー制御情報FINF(フロー制御フレーム)を検出した場合、検出したフロー制御情報FINFをフロー制御部FCLTに出力する。例えば、通信先の情報処理装置PDEVのバッファ部RBUFの空き状態等を示すクレジット解放通知は、フロー制御情報FINFに含まれる。
また、例えば、フレーム受信部FRECは、データリンク層のリンクアップ/リンクダウン、物理レーンPHLの縮退に関する縮退情報DINFR等を示すリンク制御情報を検出した場合、検出したリンク制御情報をリンク制御部LCLTに出力する。例えば、フレーム受信部FRECは、物理レーンPHLの縮退に関する縮退情報DINFRを検出した場合、検出した縮退情報DINFRをリンク制御部LCLTに出力する。縮退情報DINFRは、通信先の情報処理装置PDEVのリンク制御部LCLTから送信される縮退情報DINFSに対応する。以下、縮退情報DINFRを縮退情報DINFSと読み替えて説明する場合もある。
また、例えば、フレーム受信部FRECは、肯定応答信号ACK、否定応答信号NACK等の応答信号を検出した場合、検出した応答信号(肯定応答信号ACK、否定応答信号NACK)を再送制御部RTCLTに出力する。
バッファ部RBUFは、フレーム受信部FRECから受信したフレームデータRFRAMを順次記憶し、記憶したフレームデータRFRAMをデータRDATAとしてCPUに順次出力する。
フロー制御部FCLTは、通信先の情報処理装置PDEVにフレームデータSFRAMを転送するためのフロー制御を実行する。例えば、フロー制御部FCLTは、通信先の情報処理装置PDEVのバッファ部RBUFの空き状態およびフレームデータSFRAMのデータ長に基づいて、フレーム生成部FGENを制御する。これにより、フレームデータSFRAMの送信が制御され、通信先の情報処理装置PDEVのバッファ部RBUFの空き状態が管理される。
例えば、フロー制御部FCLTは、通信先の情報処理装置PDEVのバッファ部RBUFに空きがないことを示すフロー制御情報FINFを受信した場合、フレームデータSFRAMの送信を抑制するようにフレーム生成部FGENを制御する。
また、フロー制御部FCLTは、バッファ部RBUFの空き状態等を示す情報をバッファ部RBUFから定期的に受信する。そして、フロー制御部FCLTは、バッファ部RBUFの状態を示す情報をフレーム生成部FGENに定期的に出力する。これにより、バッファ部RBUFの状態を示すフロー制御情報FINFが通信先の情報処理装置PDEVのフロー制御部FCLTに定期的に通知される。すなわち、フロー制御部FCLTは、通信先の情報処理装置PDEVのバッファ部RBUFの状態を示すフロー制御情報FINFを定期的に受信する。
さらに、フロー制御部FCLTは、エラー検出部EDETを有する。エラー検出部EDETは、外部の装置(例えば、通信先の情報処理装置PDEV)にフレームデータSFRAMを転送するためのフロー制御での異常を検出する第2検出部の一例である。例えば、フロー制御での異常は、フロー制御フレーム(フロー制御情報FINF)を受信していない期間の長さが閾値を超えた場合に検出される。例えば、エラー検出部EDETは、フロー制御情報FINFを受信してから所定時間が経過するまでに次のフロー制御情報FINFを受信しなかった場合、フロー制御で異常が発生したと判定する。以下、フロー制御での異常を、フロー制御プロトコルエラーとも称する。
エラー検出部EDETは、フロー制御での異常を検出した場合、フロー制御で異常が発生したことを示すフロー制御プロトコルエラー通知FERRをリンク制御部LCLTに出力する。以下、フロー制御プロトコルエラー通知FERRを、FCPE(Flow Control Protocol Error)通知FERRとも称する。
リンク制御部LCLTは、物理層PHYの制御、リンクの制御、物理レーンPHLの縮退等を実行する。例えば、物理層PHYの制御では、リンク制御部LCLTは、物理層PHYに対して起動を指示する場合、起動を指示する指示通知SINFを物理層PHYに出力する。そして、リンク制御部LCLTは、例えば、物理層PHYの起動が完了した場合、起動完了通知CINFを物理層PHYから受信する。また、例えば、リンク制御部LCLTは、物理層PHYに対して停止を指示する場合、停止を指示する指示通知SINFを物理層PHYに出力する。
リンクの制御では、例えば、リンク制御部LCLTは、各モジュールからのエラー通知に基づいてリンクを切断する処理、各モジュールにリンクの状態を通知する処理等を実行する。また、例えば、物理レーンPHLの縮退は、リンク制御部LCLTに含まれる情報取得部ACQおよび選択部SEL等により実行される。例えば、情報取得部ACQは、AM検出情報AINFおよびエラー情報EINFを物理層PHYから受信する。また、選択部SELは、物理レーンPHLのイネーブル信号LENおよび縮退情報DINFSを物理層PHYおよびフレーム生成部FGENにそれぞれ出力する。
図4は、図3に示したリンク制御部LCLTの一例を示す。リンク制御部LCLTは、起動指示部SCLT、情報取得部ACQおよび選択部SELを有する。情報取得部ACQは、エラー情報受信部ERECおよびAM検出情報受信部ARECを有する。また、選択部SELは、タイマTM、タイムアウト判定部TJG、エラーカウンタECT、故障判定部BJG、縮退指示部DCLT、レーン選択部LSELおよび縮退情報生成部DGENを有する。
起動指示部SCLTは、例えば、ユーザ指示OPINFを受信する。例えば、起動指示部SCLTは、ユーザが情報処理装置PDEVの操作部等を操作して物理層PHYの起動を指示した場合、起動を指示するユーザ指示OPINFを受信する。そして、起動指示部SCLTは、起動を指示する指示通知SINFを物理層PHYに出力する。さらに、起動指示部SCLTは、初回の起動指示に応じて、タイマTMを起動する。
物理層PHYの起動が完了した場合、起動指示部SCLTは、起動完了を示す起動完了通知CINFを物理層PHYから受信する。また、例えば、起動指示部SCLTは、ユーザが情報処理装置PDEVの操作部等を操作して物理層PHYの停止を指示した場合、停止を指示するユーザ指示OPINFを受信する。そして、起動指示部SCLTは、停止を指示する指示通知SINFを物理層PHYに出力する。
また、起動指示部SCLTは、物理層PHYの再起動を指示する通知を縮退指示部DCLTから受信する。この場合、起動指示部SCLTは、例えば、停止を指示する指示通知SINFを物理層PHYに出力した後、起動を指示する指示通知SINFを物理層PHYに出力する。なお、再起動時では、例えば、起動指示部SCLTは、タイマTMを有効にしない。
AM検出情報受信部ARECは、各PCSレーンPLrのAM検出情報AINFを物理層PHYから受信する。そして、AM検出情報受信部ARECは、例えば、アライメントマーカを検出したことを示すAM検出情報AINFを1つ以上受信したとき、タイマTMに計測の開始を指示する。例えば、AM検出情報受信部ARECは、アライメントマーカを検出したことを示すAM検出情報AINFを1つ以上受信したとき、開始指示信号をタイマTMに出力する。
また、AM検出情報受信部ARECは、各PCSレーンPLrのAM検出情報AINFをレーン選択部LSELに出力する。なお、AM検出情報受信部ARECは、例えば、IEEE802.3ba規格で規定されているアライメント検出情報通知機能を用いて、定期的にAM検出情報AINFを物理層PHYから読み出してもよい。
タイマTMは、例えば、AM検出情報受信部ARECからの開始指示信号を受信したとき、所定時間(例えば、4ミリ秒)の計測を開始する。また、タイマTMは、起動完了通知CINFを物理層PHYから受信する。そして、タイマTMは、起動完了通知CINFの受信に応じて、計測を停止する。また、タイマTMは、所定時間の計測が終了したとき、所定時間が経過したことを示す情報をタイムアウト判定部TJGに出力する。
タイムアウト判定部TJGは、起動完了通知CINFを物理層PHYから受信する。そして、タイムアウト判定部TJGは、所定時間が経過するまでに起動完了通知CINFを物理層PHYから受信しなかった場合、レーン故障が発生していると判定する。この場合、タイムアウト判定部TJGは、レーン故障が発生していることを示す情報を、縮退指示部DCLTに出力する。
エラー情報受信部ERECは、各PCSレーンPLrのエラー情報EINFを物理層PHYから受信する。そして、エラー情報受信部ERECは、各PCSレーンPLrのエラー情報EINFをレーン選択部LSELおよびエラーカウンタECTに出力する。なお、エラー情報受信部ERECは、例えば、IEEE802.3ba規格で規定されているBIPエラー数通知機能を用いて、BIPエラー数を物理層PHYから定期的に読み出してもよい。
エラーカウンタECTは、所定期間に発生した誤りの数(例えば、BIPエラー数)をエラー情報EINFに基づいて物理レーンPHL毎に計測する計測部の一例である。例えば、エラーカウンタECTは、エラー情報受信部ERECから受信した各PCSレーンPLrのエラー情報EINFに基づいて、所定期間(例えば、80ミリ秒)内のBIPエラー数を物理レーンPHL毎に計算する。そして、エラーカウンタECTは、各物理レーンPHLのBIPエラー数を示す情報を、故障判定部BJGおよびレーン選択部LSELに出力する。
故障判定部BJGは、所定期間内の各物理レーンPHLのBIPエラー数を示す情報に基づいて、物理レーンPHLに故障が発生しているか否かを判定する。これにより、レーン故障が発生しているか否かが判定される。例えば、故障判定部BJGは、レーン故障が発生していると判定した場合、レーン故障が発生していることを示す情報を、縮退指示部DCLTに出力する。
縮退指示部DCLTは、縮退情報DINFR、再送信エラー通知RERRおよびFCPE通知FERRを、フレーム受信部FREC、再送制御部RTCLTの異常検出部FDETおよびフロー制御部FCLTのエラー検出部EDETからそれぞれ受信する。また、縮退指示部DCLTは、レーン故障が発生していることを示す情報を、タイムアウト判定部TJGおよび故障判定部BJGから受信する。そして、縮退指示部DCLTは、例えば、レーン縮退を実行するか否かを示す情報等を、レーン選択部LSELに出力する。また、例えば、縮退指示部DCLTは、通信先の情報処理装置PDEVに送付する縮退情報DINFSを生成するための情報を、縮退情報生成部DGENに出力する。
レーン選択部LSELは、縮退指示部DCLT、AM検出情報受信部AREC、エラー情報受信部ERECおよびエラーカウンタECTから受信するそれぞれの情報に基づいて、通信先の情報処理装置PDEVとのデータ転送に使用する物理レーンPHLを選択する。例えば、レーン選択部LSELは、通信先の情報処理装置PDEVとのデータ転送に使用する物理レーンPHLを有効にするイネーブル信号LENを物理層PHYに出力する。
縮退情報生成部DGENは、縮退指示部DCLTから受信した情報に基づいて、縮退情報DINFSを生成する。そして、縮退情報生成部DGENは、縮退情報DINFSをフレーム生成部FGENに出力する。これにより、縮退情報DINFSは、通信先の情報処理装置PDEVに縮退情報DINFRとして転送される。
なお、リンク制御部LCLTの構成は、この例に限定されない。例えば、起動指示部SCLTは、再起動時にも、タイマTMを有効にしてもよい。
図5は、図4に示したエラーカウンタECTの一例を示す。エラーカウンタECTは、例えば、エラーカウンタECT0、ECT1、ECT2、ECT3を有する。エラーカウンタECT0−ECT3は、例えば、物理レーンPHLr0−PHLr4の所定期間内のBIPエラーをそれぞれ計数する。なお、図5のエラー情報EINFの符号の末尾の括弧内の数字は、例えば、図2に示したPCSレーンPHLr0−PHLr19の符号の末尾の数字に対応する。
エラーカウンタECT1−ECT3の構成および動作は、エラーカウンタECT1と同一または同様である。このため、図5では、エラーカウンタECT0について説明する。エラーカウンタECT0は、例えば、約80ミリ秒の間に発生した物理レーンPHLr0のBIPエラーの数を計測する。例えば、エラーカウンタECT0は、物理層PHYのリンクアップを契機に計測を開始し、計測値(約80ミリ秒の間に発生したBIPエラーの数)を約20ミリ秒毎に更新する。
エラーカウンタECT0は、例えば、カウンタCUNT、レジスタREG1、REG2、REG3および加算部ADDを有する。カウンタCUNT、レジスタREG1、REG2は、例えば、保持している値を後段のレジスタREG1、REG2、REG3に約20ミリ秒毎にリレーする。
例えば、100Gbpsの転送レートでは、64B/66B符号ブロックを物理層PHYが16384個受信するまでの時間が約210マイクロ秒である。この場合、例えば、カウンタCUNTは、物理レーンPHLr0のBIPエラーの総数(PCSレーンPHLr0−PHLr4のBIPエラー数)を約210マイクロ秒毎に加算する。そして、カウンタCUNTは、加算値(約20ミリ秒の間に発生した物理レーンPHLr0のBIPエラー数)を、約20ミリ秒毎に後段のレジスタREG1に転送する。このとき、レジスタREG1、REG2も、保持している値を後段のレジスタREG2、REG3に転送する。
また、カウンタCUNT、レジスタREG1、REG2、REG3は、例えば、カウンタCUNTが加算値をレジスタREG1に転送するタイミングで、保持している値を加算部ADDに出力する。例えば、カウンタCUNTは、現時点から約20ミリ秒前までの約20ミリ秒間に発生した物理レーンPHLr0のBIPエラー数を加算部ADDに出力する。また、レジスタREG1は、約20ミリ秒前から約40ミリ秒前までの約20ミリ秒間に発生した物理レーンPHLr0のBIPエラー数を加算部ADDに出力する。レジスタREG2は、約40ミリ秒前から約60ミリ秒前までの約20ミリ秒間に発生した物理レーンPHLr0のBIPエラー数を加算部ADDに出力する。レジスタREG3は、約60ミリ秒前から約80ミリ秒前までの約20ミリ秒間に発生した物理レーンPHLr0のBIPエラー数を加算部ADDに出力する。
加算部ADDは、カウンタCUNT、レジスタREG1、REG2、REG3から受信した値を加算する。これにより、約80ミリ秒の間に発生した物理レーンPHLr0のBIPエラー数が算出される。そして、加算部ADDは、加算結果(約80ミリ秒の間に発生した物理レーンPHLr0のBIPエラー数)を故障判定部BJGに出力する。なお、加算部ADDから出力される加算結果は、例えば、約20ミリ秒毎に更新される。したがって、故障判定部BJGは、物理レーンPHLに故障が発生しているか否かを約20ミリ秒毎に判定する。
なお、エラーカウンタECTの構成および所定期間等の数値例は、この例に限定されない。例えば、約40ミリ秒の間に発生した物理レーンPHLrのBIPエラー数を判定に使用する場合等では、レジスタREG2、REG3は、省かれてもよい。
図6は、レーン縮退の契機の一例を示す。物理層PHYのリンクアップ前では、リンク制御部LCLTは、PCSレーンPLや物理レーンPHLの故障の検出を契機に、レーン縮退を実行する。物理層PHYのリンクアップ後では、リンク制御部LCLTは、ビットエラーレートの悪化、リトライアウトの検出、フロー制御プロトコルエラーの検出、所定期間内のBIPエラー数の閾値超えのいずれかを契機に、レーン縮退を実行する。
ビットエラーレートの悪化は、例えば、所定時間内の再送回数が閾値を超えた場合に検出される。例えば、異常検出部FDETは、24秒間に255回以上の再送要求が発生した場合、ビットエラーレートの悪化と判定する。
リトライアウトは、例えば、送信したフレームデータSFRAMに対する応答(肯定応答信号ACK、否定応答信号NACK)がない場合や連続した再送の回数が閾値を超えた場合に検出される。例えば、異常検出部FDETは、フレームデータSFRAMが送信されてから所定時間(例えば、12.62ミリ秒)が経過するまでに、肯定応答信号ACKあるいは否定応答信号NACKを受信しなかった場合、リトライアウトと判定する。また、例えば、異常検出部FDETは、連続した再送の回数が閾値(例えば、255回)を超えた場合、リトライアウトと判定する。
フロー制御プロトコルエラーは、フロー制御フレーム(フロー制御情報FINF)を受信していない期間の長さが閾値(例えば、200マイクロ秒)を超えた場合に検出される。このように、フレーム転送回路FTRは、物理層PHYより上位の通信プロトコルのエラー検出情報に基づいて、レーン縮退の契機を検出する。また、リンク制御部LCLTは、複数種類のエラーのうちのいずれかが検出された場合にレーン縮退を実行するため、故障レーンPHLの使用を適切に回避できる。
図7は、図1に示した情報処理装置PDEVのリンクアップ前の動作の一例を示す。すなわち、図7は、並列計算機システムの制御方法の一形態を示す。なお、図7は、物理層PHYのリンクアップ前のレーン縮退に関するリンク制御部LCLTの動作の一例を示す。図7の動作は、ハードウエアのみで実現されてもよく、ハードウエアをソフトウエアにより制御することにより実現されてもよい。例えば、制御プログラム等のソフトウエアは、図7の動作をコンピュータに実行させてもよい。すなわち、コンピュータは、制御プログラムを記録した記憶媒体を読み取り、図7の動作を実行してもよい。
ステップS100では、起動指示部SCLTは、例えば、ユーザからの起動指示に応じて、物理層PHYに対して起動を指示する。
ステップS110では、AM検出情報受信部ARECは、アライメントマーカを検出したことを示すAM検出情報AINFを、1つ以上受信したか否かを判定する。すなわち、AM検出情報受信部ARECは、1個以上のPCSレーンPLでAM検出情報AINFが観測されたか否かを判定する。
AM検出情報AINFを1つ以上受信した場合(ステップS110のYes)、リンク制御部LCLTの動作は、ステップS120に移る。一方、AM検出情報AINFを1つも受信していない場合(ステップS110のNo)、リンク制御部LCLTの動作は、ステップS110に戻る。すなわち、ステップS120以降の処理は、例えば、通信先の情報処理装置PDEVから転送されたデータ(アライメントマーカを含むデータ)が1個以上のPCSレーンPLで観測された場合に実行される。
ステップS120では、タイマTMは、所定時間(例えば、4ミリ秒)の計測を開始する。すなわち、タイマTMは、アライメントマーカを含むデータが1個以上のPCSレーンPLで観測されてから所定時間の計測を開始する。
ステップS130では、タイムアウト判定部TJGは、ステップS120で計測が開始されてから所定時間が経過するまでに起動完了通知CINFを物理層PHYから受信したか否かを判定する。すなわち、タイムアウト判定部TJGは、アライメントマーカが最初に検出されてから所定時間が経過するまでに全てのPCSレーンPLでアライメントマーカが検出されたか否かを判定する。
所定時間が経過するまでに起動完了通知CINFを受信した場合(ステップS130のYes)、リンク制御部LCLTの動作は、ステップS140に移る。一方、所定時間が経過するまでに起動完了通知CINFを受信していない場合(ステップS130のNo)、リンク制御部LCLTの動作は、ステップS150に移る。
ステップS140では、リンク制御部LCLTは、故障レーンなしと判定する。すなわち、リンク制御部LCLTは、所定時間が経過するまでに起動完了通知CINFを受信した場合、レーン縮退を実行することなく、レーン縮退に関する処理(以下、レーン縮退処理とも称する)を終了する。
ステップS150では、レーン選択部LSELは、AM検出情報AINFを観測したPCSレーンPLの数が少ない物理レーンPHLを、縮退するレーンと特定する。
ステップS160では、レーン選択部LSELは、ステップS150で特定した物理レーンPHL(縮退するレーンPHL)を使用しないように、レーン縮退を実行する。例えば、レーン選択部LSELは、ステップS150で特定した物理レーンPHL(縮退するレーンPHL)を除く物理レーンPHLから、通信先の情報処理装置PDEVとのデータ転送に使用する物理レーンPHLを選択し、選択した物理レーンPHLをイネーブルに設定する。なお、初期状態では、例えば、全ての物理レーンPHLがイネーブルに設定される。
また、縮退指示部DCLTは、物理層PHYの再起動を指示する通知を起動指示部SCLTに出力する。そして、起動指示部SCLTは、例えば、縮退指示部DCLTからの再起動指示に応じて、物理層PHYに対して再起動を指示する。また、縮退情報生成部DGENは、通信先の情報処理装置PDEVにレーン縮退を要求する縮退情報DINFSを、フレーム生成部FGENに出力する。これにより、通信先の情報処理装置PDEVは、レーン縮退を要求する縮退情報DINFSを含む縮退要求DLLPを受信する。この結果、通信先の情報処理装置PDEVは、データ転送に使用する物理レーンPHL等を選択できる。
なお、レーン縮退により実行される物理層PHYの再起動では、物理レーンPHLのイネーブルの設定は、ステップS160で設定した内容が引き継がれる。また、レーン縮退により実行される物理層PHYの再起動では、レーン縮退が既に実行されているため、図7のレーン縮退処理は、実行されない。
このように、レーン選択部LSELは、起動指示部SCLTが物理層PHYに対して起動を指示してから起動完了の通知を物理層PHYから受信するまでの期間では、所定時間以内に起動完了通知CINFを受信しなかった場合、ステップS150、S160の処理を実行する。すなわち、レーン選択部LSELは、AM検出情報AINFがPCSレーンPLのいずれかで検出されてから所定時間経過するまでに、起動完了通知CINFを物理層PHYから受信しなかった場合、縮退するレーンPHLをAM検出情報に基づいて特定する。
したがって、フレーム転送回路FTRは、故障レーン特定機能を含まない物理層PHYを使用する場合においても、AM検出情報AINF等を参照することにより、縮退するレーンをリンクアップ前に特定できる。なお、情報処理装置PDEVのリンクアップ前の動作は、この例に限定されない。例えば、情報処理装置PDEVは、物理層PHYの再起動時にも、レーン縮退処理を実行してもよい。
図8は、縮退するレーンPHLの特定方法の一例を示す。なお、図8は、物理層PHYのリンクアップ前の縮退するレーンPHLの特定方法の一例を示す。
物理レーンPHLr0では、PCSレーンPLr0−PLr4でアライメントマーカが検出されたため、アライメントマーカが検出されたPCSレーンPLrの数は、5である。物理レーンPHLr1では、PCSレーンPLr5−PLr9でアライメントマーカが検出されたため、アライメントマーカが検出されたPCSレーンPLrの数は、5である。物理レーンPHLr2では、PCSレーンPLr10−PLr14でアライメントマーカが検出されたため、アライメントマーカが検出されたPCSレーンPLrの数は、5である。
物理レーンPHLr3では、PCSレーンPLr15、PLr17−PLr19でアライメントマーカが検出され、PCSレーンPLr16でアライメントマーカが検出されないため、アライメントマーカが検出されたPCSレーンPLrの数は、4である。このため、例えば、図7に示したステップS150において、レーン選択部LSELは、アライメントマーカが検出されたPCSレーンPLrの数が最も少ない物理レーンPHLr3を、縮退するレーンと特定する。したがって、物理レーンPHLr0−PHLr2は、正常な物理レーンPHLrと判定される。このように、レーン選択部LSELは、縮退するレーンPHLをAM検出情報AINFに基づいて特定する。
なお、レーン選択部LSELは、例えば、アライメントマーカが検出されなかったPCSレーンPLrを含む物理レーンPHLrが複数存在する場合、複数の物理レーンPHLrを、縮退するレーンと判定してもよい。
図9は、縮退するレーンPHLの特定方法の別の例を示す。なお、図9は、物理層PHYのリンクアップ後の縮退するレーンPHLの特定方法の一例を示す。図9のBIPエラーの有無は、所定期間(例えば、80ミリ秒)のうちの一部のタイミングを抜粋した場合のBIPエラーの検出結果の一例を示す。また、縮退するレーンか否かの閾値は、例えば、3である。
物理レーンPHLr0では、過去80ミリ秒の間に検出されたPCSレーンPLr0−PLr4のBIPエラーの総数は、4である。物理レーンPHLr1では、過去80ミリ秒の間に検出されたPCSレーンPLr5−PLr9のBIPエラーの総数は、1である。物理レーンPHLr2では、過去80ミリ秒の間に検出されたPCSレーンPLr10−PLr14のBIPエラーの総数は、2である。物理レーンPHLr3では、過去80ミリ秒の間に検出されたPCSレーンPLr15−PLr19のBIPエラーの総数は、0である。
このため、例えば、図10に示すステップS300において、レーン選択部LSELは、所定期間でのBIPエラーの数が閾値(図9では、3)を超えた物理レーンPHLr0を、縮退するレーンと特定する。あるいは、図11に示すステップS314や図13に示すステップS334において、レーン選択部LSELは、所定期間でのBIPエラーが最も多い物理レーンPHLr0を、縮退するレーンと特定する。したがって、物理レーンPHLr1−PHLr3は、正常な物理レーンPHLrと判定される。このように、レーン選択部LSELは、通信先の情報処理装置PDEVから物理層PHYに転送されたデータに誤りがあることを示すエラー情報EINFに基づいて、縮退するレーンPHLを特定する。
図10は、図1に示した情報処理装置PDEVのリンクアップ後の動作の一例を示す。すなわち、図10は、並列計算機システムの制御方法の一形態を示す。なお、図10は、物理層PHYのリンクアップ後のレーン縮退に関するリンク制御部LCLTの動作の一例を示す。例えば、図10の動作では、レーン縮退の契機は、所定期間内のBIPエラー数が閾値を超えた場合(例えば、図6に示した所定期間内のBIPエラー数の閾値超え)である。図10の例では、各物理レーンPHLのBIPエラー数を計測する際の所定期間は、80ミリ秒である。
図10の動作は、ハードウエアのみで実現されてもよく、ハードウエアをソフトウエアにより制御することにより実現されてもよい。例えば、制御プログラム等のソフトウエアは、図10の動作をコンピュータに実行させてもよい。すなわち、コンピュータは、制御プログラムを記録した記憶媒体を読み取り、図10の動作を実行してもよい。
ステップS200では、エラー情報受信部ERECは、例えば、各PCSレーンPLのエラー情報EINFを物理層PHYから受信する。
ステップS202では、エラーカウンタECTは、過去80ミリ秒のBIPエラー数を物理レーンPHL毎に計測する。例えば、エラーカウンタECTは、過去80ミリ秒の間に発生した各物理レーンPHLのBIPエラーを計数し、計数値を約20ミリ秒毎に更新する。
ステップS204では、故障判定部BJGは、ステップS202で算出されたBIPエラー数が閾値(例えば、255)を超えた物理レーンPHLが存在するか否かを判定する。BIPエラー数が閾値を超えた物理レーンPHLが存在する場合(ステップS204のYes)、リンク制御部LCLTの動作は、ステップS300に移る。すなわち、レーン縮退の契機が検出された場合、リンク制御部LCLTの動作は、ステップS300に移る。ステップS200−S204は、レーン縮退の契機の検出処理に対応する。
一方、BIPエラー数が閾値を超えた物理レーンPHLが存在しない場合(ステップS204のNo)、リンク制御部LCLTの動作は、ステップS200に戻る。すなわち、過去80ミリ秒間のBIPエラー数が全ての物理レーンPHLで閾値以下の場合、リンク制御部LCLTの動作は、ステップS200に戻る。
ステップS300では、レーン選択部LSELは、過去80ミリ秒間のBIPエラー数が閾値を超えた物理レーンPHLを、縮退するレーンと特定する。例えば、故障判定部BJGは、縮退するレーンが存在することを縮退指示部DCLTに通知する。これにより、縮退指示部DCLTは、例えば、BIPエラー数が閾値を超えた物理レーンPHLを縮退するように、レーン選択部LSELに指示する。
そして、レーン選択部LSELは、例えば、ステップS202で算出されたBIPエラー数に基づいて、過去80ミリ秒間のBIPエラー数が閾値を超えた物理レーンPHL(縮退するレーン)を検出する。なお、レーン選択部LSELは、過去80ミリ秒間のBIPエラー数が閾値を超えた物理レーンPHLを示す情報を、故障判定部BJGから受信してもよい。
ステップS400では、リンク制御部LCLTは、レーン縮退を実行し、物理層PHYの再起動を指示する。例えば、レーン選択部LSELは、ステップS300で特定した物理レーンPHL(縮退するレーンPHL)を除く物理レーンPHLから、通信先の情報処理装置PDEVとのデータ転送に使用する物理レーンPHLを選択し、選択した物理レーンPHLをイネーブルに設定する。このように、レーン選択部LSELは、ステップS300で特定した物理レーンPHL(縮退するレーンPHL)を使用しないように、レーン縮退を実行する。
なお、例えば、図10の動作がレーン縮退後に実行された場合、図10の動作が実行される前にディセーブルに設定された物理レーンPHLは、選択対象の物理レーンPHLに含まれない。この場合、例えば、選択対象の物理レーンPHLは、図10の動作が実行される前にイネーブルに設定された物理レーンPHLからステップS300で特定した物理レーンPHL(縮退するレーンPHL)を除いた物理レーンPHLである。
また、縮退指示部DCLTは、物理層PHYの再起動を指示する通知を起動指示部SCLTに出力する。そして、起動指示部SCLTは、例えば、縮退指示部DCLTからの再起動指示に応じて、物理層PHYに対して再起動を指示する。
また、縮退情報生成部DGENは、通信先の情報処理装置PDEVにレーン縮退を要求する縮退情報DINFSを、フレーム生成部FGENに出力する。これにより、通信先の情報処理装置PDEVは、レーン縮退を要求する縮退情報DINFSを含む縮退要求DLLPを受信する。この結果、通信先の情報処理装置PDEVは、データ転送に使用する物理レーンPHL等を選択できる。
なお、レーン縮退により実行される物理層PHYの再起動では、物理レーンPHLのイネーブルの設定は、ステップS400で設定した内容が引き継がれる。また、レーン縮退により実行される物理層PHYの再起動では、レーン縮退が既に実行されているため、図7で説明した物理層PHYのリンクアップ前のレーン縮退処理は、実行されない。
このように、図10の動作では、レーン選択部LSELは、通信先の情報処理装置PDEVから物理層PHYに転送されたデータに誤りがあることを示すエラー情報EINFに基づいて、縮退するレーンPHLを特定する。したがって、フレーム転送回路FTRは、故障レーン特定機能を含まない物理層PHYを使用する場合においても、エラー情報EINF等を参照することにより、縮退するレーンをリンクアップ後に特定できる。なお、情報処理装置PDEVのリンクアップ後の動作は、この例に限定されない。
図11は、図1に示した情報処理装置PDEVのリンクアップ後の動作の別の例を示す。すなわち、図11は、並列計算機システムの制御方法の一形態を示す。なお、図11は、物理層PHYのリンクアップ後のレーン縮退に関するリンク制御部LCLTおよび異常検出部FDETの動作の一例を示す。例えば、ステップS210、S212は、レーン縮退の契機の検出処理に対応し、異常検出部FDETにより実行される。また、ステップS310−S318、S400は、リンク制御部LCLTより実行される。
なお、図11の動作では、例えば、レーン縮退の契機は、再送処理での異常の検出(例えば、図6に示したビットエラーレートの悪化、リトライアウトの検出)である。図11の動作は、ハードウエアのみで実現されてもよく、ハードウエアをソフトウエアにより制御することにより実現されてもよい。例えば、制御プログラム等のソフトウエアは、図11の動作をコンピュータに実行させてもよい。すなわち、コンピュータは、制御プログラムを記録した記憶媒体を読み取り、図11の動作を実行してもよい。
ステップS210では、異常検出部FDETは、再送信に関する処理(再送処理)で異常が発生したか否かを判定する。例えば、異常検出部FDETは、再送処理での異常を検出する処理を実行する。そして、異常検出部FDETは、例えば、ビットエラーレートの悪化やリトライアウトを検出した場合、再送処理で異常が発生したと判定する。
例えば、異常検出部FDETは、所定時間(例えば、24秒間)に閾値(例えば、255回)以上の再送要求が発生した場合、ビットエラーレートの悪化と判定する。また、例えば、異常検出部FDETは、フレームデータSFRAMが送信されてから所定時間(例えば、12.62ミリ秒)が経過するまでに、肯定応答信号ACKあるいは否定応答信号NACKを受信しなかった場合、リトライアウトと判定する。あるいは、異常検出部FDETは、連続した再送の回数が閾値(例えば、255回)を超えた場合、リトライアウトと判定する。
再送処理で異常が発生した場合(ステップS210のYes)、異常検出部FDETの動作は、ステップS212に移る。一方、再送処理で異常が発生していない場合(ステップS210のNo)、異常検出部FDETの動作は、ステップS210に戻る。すなわち、異常検出部FDETは、再送処理で異常が発生していない場合、再送処理での異常を検出する処理を継続する。
ステップS212では、異常検出部FDETは、再送処理で異常が発生したことを示す再送信エラー通知RERRをリンク制御部LCLTに出力する。これにより、リンク制御部LCLTは、ステップS310において、再送信エラー通知RERRを受信する。
ステップS310では、リンク制御部LCLTの縮退指示部DCLTは、再送信エラー通知RERRを異常検出部FDETから受信する。これにより、リンク制御部LCLTは、再送処理で異常が発生した場合のレーン縮退処理を開始する。
ステップS312では、故障判定部BJGは、通信先の情報処理装置PDEVから物理層PHYに転送されたデータの所定期間(例えば、80ミリ秒)内のBIPエラー数が閾値(例えば、255)を超えた物理レーンPHLが存在するか否かを判定する。なお、リンク制御部LCLTは、例えば、図11の動作と並列して、所定期間内のBIPエラー数を物理レーンPHL毎にエラーカウンタECTを用いて計測する。例えば、所定期間内の各物理レーンPHLのBIPエラー数は、図10のステップS202で算出される。
BIPエラー数が閾値を超えた物理レーンPHLが存在する場合(ステップS312のYes)、リンク制御部LCLTの動作は、ステップS314に移る。すなわち、通信先の情報処理装置PDEVから自身の物理層PHYの方向にデータを伝送するレーンに故障が存在する可能性が高い場合、リンク制御部LCLTの動作は、ステップS314に移る。
一方、BIPエラー数が閾値を超えた物理レーンPHLが存在しない場合(ステップS312のNo)、リンク制御部LCLTの動作は、ステップS316に移る。すなわち、自身の物理層PHYから通信先の情報処理装置PDEVの方向にデータを伝送するレーンに故障が存在する可能性が高い場合、リンク制御部LCLTの動作は、ステップS316に移る。なお、ステップS312の閾値は、図10のステップS204の閾値と同じ値でもよいし、異なる値でもよい。
ステップS314では、レーン選択部LSELは、所定期間内のBIPエラー数が最も多い物理レーンPHLを、縮退するレーンと特定する。例えば、レーン選択部LSELは、故障したレーンとして縮退する物理レーンを、所定期間内(例えば、過去80ミリ秒の間)のBIPエラー数に基づいて特定する。この場合、レーン選択部LSELは、縮退するレーンを再送処理での異常が検出された直前のBIPエラーのみに基づいて特定する場合に比べて、故障したレーンとして縮退する物理レーンを精度よく特定できる。以下、故障したレーンとして縮退する物理レーンを特定する際の特定精度を、縮退するレーンの特定精度とも称する。
例えば、縮退するレーンを再送処理での異常が検出された直前のBIPエラーのみに基づいて特定する方法では、ノイズ等によるBIPエラーが故障レーン以外で検出された直後に再送処理での異常が検出された場合、縮退するレーンの特定精度が低下するおそれがある。
このように、レーン選択部LSELは、再送信に関する処理での異常が検出された場合、縮退するレーンPHLを、所定期間内のBIPエラー数に基づいて特定する。すなわち、レーン選択部LSELは、再送信に関する処理での異常が検出された場合、縮退するレーンPHLを、所定期間分のエラー情報EINFに基づいて特定する。
ステップS316では、リンク制御部LCLTは、自身の物理層PHYから通信先の情報処理装置PDEVの方向にデータを伝送するレーンに故障が存在する可能性が高いため、通信先の情報処理装置PDEVのリンク制御部LCLTにレーン縮退処理を依頼する。例えば、縮退情報生成部DGENは、縮退するレーンの特定およびレーン縮退処理の実行を通信先の情報処理装置PDEVに依頼するための縮退情報DINFSを、フレーム生成部FGENに出力する。
これにより、通信先の情報処理装置PDEVは、縮退するレーンの特定およびレーン縮退処理の依頼を示す縮退情報DINFSを含む縮退依頼DLLPを受信し、縮退するレーンの特定およびレーン縮退処理を実行する。また、通信先の情報処理装置PDEVは、データ転送に使用する物理レーンPHL等示す縮退情報DINFSを含む縮退要求DLLPを、レーン縮退処理の依頼元の情報処理装置PDEV(縮退依頼DLLPを送信した情報処理装置PDEV)に出力する。これにより、例えば、フレーム受信部FRECは、縮退依頼DLLPに対する応答である縮退要求DLLPを、通信先の情報処理装置PDEVから受信する。
ステップS318では、縮退指示部DCLTは、ステップS316で通信先の情報処理装置PDEVに依頼したレーン縮退処理の結果として、縮退を要求する縮退情報DINFS(縮退要求)を受信する。これにより、レーン選択部LSELは、データ転送に使用する物理レーンPHL等を選択できる。
ステップS400では、リンク制御部LCLTは、レーン縮退を実行し、物理層PHYの再起動を指示する。例えば、レーン選択部LSELは、ステップS314で特定した物理レーンPHL(縮退するレーンPHL)を除く物理レーンPHLから、通信先の情報処理装置PDEVとのデータ転送に使用する物理レーンPHLを選択し、選択した物理レーンPHLをイネーブルに設定する。あるいは、レーン選択部LSELは、データ転送に使用する物理レーンPHLをステップS318で受信した縮退情報DINFSに基づいて選択し、選択した物理レーンPHLをイネーブルに設定する。
なお、例えば、図11の動作がレーン縮退後に実行された場合、図11の動作が実行される前にディセーブルに設定された物理レーンPHLは、選択対象の物理レーンPHLに含まれない。
また、縮退指示部DCLTは、物理層PHYの再起動を指示する通知を起動指示部SCLTに出力する。そして、起動指示部SCLTは、例えば、縮退指示部DCLTからの再起動指示に応じて、物理層PHYに対して再起動を指示する。
なお、縮退情報生成部DGENは、縮退するレーンを自身のリンク制御部LCLTで特定した場合(ステップS314を実行した場合)、通信先の情報処理装置PDEVにレーン縮退を要求する縮退情報DINFSを、フレーム生成部FGENに出力する。これにより、通信先の情報処理装置PDEVは、レーン縮退を要求する縮退情報DINFSを含む縮退要求DLLPを受信する。この結果、通信先の情報処理装置PDEVは、データ転送に使用する物理レーンPHL等を選択できる。このように、例えば、レーン選択部LSELは、再送信に関する処理での異常が検出された場合、外部の装置とのデータ転送に使用する物理レーンPHLを、所定期間分のエラー情報EINFに基づいて選択する。
なお、レーン縮退により実行される物理層PHYの再起動では、物理レーンPHLのイネーブルの設定は、ステップS400で設定した内容が引き継がれる。また、レーン縮退により実行される物理層PHYの再起動では、レーン縮退が既に実行されているため、図7で説明した物理層PHYのリンクアップ前のレーン縮退処理は、実行されない。
このように、図11の動作では、レーン選択部LSELは、通信先の情報処理装置PDEVから物理層PHYに転送されたデータに誤りがあることを示すエラー情報EINFに基づいて、縮退するレーンPHLを特定する。したがって、フレーム転送回路FTRは、故障レーン特定機能を含まない物理層PHYを使用する場合においても、再送処理での異常を検出した場合に、エラー情報EINF等を参照することにより、縮退するレーンをリンクアップ後に特定できる。
なお、情報処理装置PDEVのリンクアップ後の動作は、この例に限定されない。例えば、レーン選択部LSELは、再送処理での異常が検出された時点、直前または直後のBIPエラー数に基づいて、縮退するレーンを特定してもよい。
図12は、図1に示した情報処理装置PDEVのリンクアップ後の動作の別の例を示す。すなわち、図12は、並列計算機システムの制御方法の一形態を示す。なお、図12は、物理層PHYのリンクアップ後のレーン縮退に関するリンク制御部LCLTおよびエラー検出部EDETの動作の一例を示す。例えば、ステップS220、S222は、レーン縮退の契機の検出処理に対応し、エラー検出部EDETにより実行される。また、ステップS320−S326、S400は、リンク制御部LCLTより実行される。
なお、図12の動作では、例えば、レーン縮退の契機は、通信先の情報処理装置PDEVにデータを転送するためのフロー制御での異常の検出(例えば、図6に示したフロー制御プロトコルエラーの検出)である。図12の動作は、ハードウエアのみで実現されてもよく、ハードウエアをソフトウエアにより制御することにより実現されてもよい。例えば、制御プログラム等のソフトウエアは、図12の動作をコンピュータに実行させてもよい。すなわち、コンピュータは、制御プログラムを記録した記憶媒体を読み取り、図12の動作を実行してもよい。
ステップS220では、エラー検出部EDETは、FCPEを検出したか否かを判定する。例えば、エラー検出部EDETは、通信先の情報処理装置PDEVにデータを転送するためのフロー制御での異常(FCPE)を検出する処理を実行する。例えば、エラー検出部EDETは、フロー制御フレーム(フロー制御情報FINF)を受信していない期間の長さが閾値(例えば、200マイクロ秒)を超えた場合、FCPEと判定する。
FCPEが検出された場合(ステップS220のYes)、エラー検出部EDETの動作は、ステップS222に移る。一方、FCPEが検出されない場合(ステップS220のNo)、エラー検出部EDETの動作は、ステップS220に戻る。すなわち、エラー検出部EDETは、フロー制御で異常が発生していない場合、フロー制御での異常を検出する処理を継続する。
ステップS222では、エラー検出部EDETは、フロー制御で異常が発生したことを示すFCPE通知FERRをリンク制御部LCLTに出力する。これにより、リンク制御部LCLTは、ステップS320において、FCPE通知FERRを受信する。
ステップS320では、リンク制御部LCLTの縮退指示部DCLTは、FCPE通知FERRをエラー検出部EDETから受信する。これにより、リンク制御部LCLTは、フロー制御で異常が発生した場合のレーン縮退処理を開始する。
ステップS322では、例えば、レーン選択部LSELは、通信先の情報処理装置PDEVから物理層PHYに転送されたデータにBIPエラーが存在するか否かを判定する。例えば、レーン選択部LSELは、FCPEが検出された時点、直前または直後のエラー情報EINFに基づいて、BIPエラーが存在するか否かを判定する。
ここで、例えば、FCPEの検出時間間隔(例えば、4.5マイクロ秒)は、BIPエラーの検出時間間隔(例えば、210マイクロ秒)に比べて短い。このため、固定故障によりFCPEが検出された場合、BIPエラーの履歴(所定期間内のBIPエラー数)は、FCPEの検出に至るまでの状況を十分に反映していないおそれがある。したがって、縮退するレーンをBIPエラーの履歴に基づいて特定した場合、縮退するレーンの特定精度が低下するおそれがある。このため、レーン選択部LSELは、例えば、ステップS322、S324の処理を実行する際に、FCPEが検出された時点、直前または直後のBIPエラーの検出情報(エラー情報EINF)を参照する。
BIPエラーが存在する場合(ステップS322のYes)、リンク制御部LCLTの動作は、ステップS324に移る。一方、BIPエラーが存在しない場合(ステップS322のNo)、リンク制御部LCLTの動作は、ステップS326に移る。
ステップS324では、レーン選択部LSELは、FCPEが検出された時点、直前または直後のエラー情報EINFを参照し、BIPエラーが最も多い物理レーンPHLを、縮退するレーンと特定する。このように、レーン選択部LSELは、フロー制御での異常が検出された場合、縮退するレーンPHLを、エラー情報EINFに基づいて特定する。
ステップS326では、レーン選択部LSELは、特定の物理レーンPHLを、縮退するレーンと特定する。例えば、レーン選択部LSELは、予め決められた物理レーンPHLを、縮退するレーンと特定する。これにより、FCPEが検出されたにも拘わらず、BIPエラーが検出されない場合でも、レーン縮退が実行される。
ステップS400では、レーン選択部LSELは、ステップS324あるいはステップS326で特定した物理レーンPHL(縮退するレーンPHL)を使用しないように、レーン縮退を実行する。例えば、レーン選択部LSELは、ステップS324を実行した場合、ステップS324で特定した物理レーンPHL(縮退するレーンPHL)を除く物理レーンPHLから、通信先の情報処理装置PDEVとのデータ転送に使用する物理レーンPHLを選択する。そして、レーン選択部LSELは、選択した物理レーンPHLをイネーブルに設定する。
あるいは、レーン選択部LSELは、ステップS326を実行した場合、ステップS326で特定した物理レーンPHL(縮退するレーンPHL)を除く物理レーンPHLから、通信先の情報処理装置PDEVとのデータ転送に使用する物理レーンPHLを選択する。そして、レーン選択部LSELは、選択した物理レーンPHLをイネーブルに設定する。
なお、例えば、図12の動作がレーン縮退後に実行された場合、図12の動作が実行される前にディセーブルに設定された物理レーンPHLは、選択対象の物理レーンPHLに含まれない。この場合、例えば、選択対象の物理レーンPHLは、図12の動作が実行される前にイネーブルに設定された物理レーンPHLから、ステップS324あるいはステップS326で特定した物理レーンPHL(縮退するレーンPHL)を除いた物理レーンPHLである。
また、縮退指示部DCLTは、物理層PHYの再起動を指示する通知を起動指示部SCLTに出力する。そして、起動指示部SCLTは、例えば、縮退指示部DCLTからの再起動指示に応じて、物理層PHYに対して再起動を指示する。
また、縮退情報生成部DGENは、通信先の情報処理装置PDEVにレーン縮退を要求する縮退情報DINFSを、フレーム生成部FGENに出力する。これにより、通信先の情報処理装置PDEVは、レーン縮退を要求する縮退情報DINFSを含む縮退要求DLLPを受信する。この結果、通信先の情報処理装置PDEVは、データ転送に使用する物理レーンPHL等を選択できる。このように、例えば、レーン選択部LSELは、フロー制御での異常が検出された場合、外部の装置とのデータ転送に使用する物理レーンPHLを、エラー情報EINFに基づいて選択する。
なお、レーン縮退により実行される物理層PHYの再起動では、物理レーンPHLのイネーブルの設定は、ステップS400で設定した内容が引き継がれる。また、レーン縮退により実行される物理層PHYの再起動では、レーン縮退が既に実行されているため、図7で説明した物理層PHYのリンクアップ前のレーン縮退処理は、実行されない。
このように、図12の動作では、レーン選択部LSELは、通信先の情報処理装置PDEVから物理層PHYに転送されたデータに誤りがあることを示すエラー情報EINFに基づいて、縮退するレーンPHLを特定する。したがって、フレーム転送回路FTRは、故障レーン特定機能を含まない物理層PHYを使用する場合においても、フロー制御での異常を検出した場合に、エラー情報EINF等を参照することにより、縮退するレーンをリンクアップ後に特定できる。
なお、情報処理装置PDEVのリンクアップ後の動作は、この例に限定されない。例えば、ステップS326の処理は、省かれてもよい。この場合、例えば、ステップS322は、BIPエラーが検出されるまで繰り返されてもよい。
図13は、図1に示した情報処理装置PDEVのリンクアップ後の動作の別の例を示す。すなわち、図13は、並列計算機システムの制御方法の一形態を示す。なお、図13は、通信先の情報処理装置PDEVでレーン縮退の契機が検出された場合のレーン縮退に関するリンク制御部LCLTおよびフレーム受信部FRECの動作の一例を示す。例えば、ステップS230、S232は、レーン縮退の契機の検出処理に対応し、フレーム受信部FRECにより実行される。また、ステップS330−S336、S400は、リンク制御部LCLTより実行される。
図13の動作は、ハードウエアのみで実現されてもよく、ハードウエアをソフトウエアにより制御することにより実現されてもよい。例えば、制御プログラム等のソフトウエアは、図13の動作をコンピュータに実行させてもよい。すなわち、コンピュータは、制御プログラムを記録した記憶媒体を読み取り、図13の動作を実行してもよい。
ステップS230では、フレーム受信部FRECは、縮退情報DINFRを含む制御用DLLP(縮退要求DLLPまたは縮退依頼DLLP)を受信したか否かを判定する。縮退情報DINFRを含む制御用DLLP(縮退要求DLLPまたは縮退依頼DLLP)を受信した場合(ステップS230のYes)、フレーム受信部FRECの動作は、ステップS232に移る。一方、縮退情報DINFRを含む制御用DLLP(縮退要求DLLPまたは縮退依頼DLLP)を受信していない場合(ステップS230のNo)、フレーム受信部FRECの動作は、ステップS230に戻る。
ステップS232では、フレーム受信部FRECは、ステップS230で受信した制御用DLLP(縮退要求DLLPまたは縮退依頼DLLP)に含まれる縮退情報DINFRを、リンク制御部LCLTに出力する。これにより、リンク制御部LCLTは、ステップS330において、縮退情報DINFRを受信する。
ステップS330では、リンク制御部LCLTの縮退指示部DCLTは、縮退情報DINFRをフレーム受信部FRECから受信する。これにより、リンク制御部LCLTは、通信先の情報処理装置PDEVでレーン縮退の契機が検出された場合のレーン縮退処理を開始する。
ステップS331では、縮退指示部DCLTは、ステップS330で受信した縮退情報DINFRがレーン縮退依頼か否かを判定する。縮退情報DINFRがレーン縮退依頼の場合(ステップS331のYes)、リンク制御部LCLTの動作は、ステップS332に移る。一方、縮退情報DINFRがレーン縮退依頼でない場合(ステップS331のNo)、リンク制御部LCLTの動作は、ステップS400に移る。すなわち、縮退情報DINFRがレーン縮退要求の場合、リンク制御部LCLTの動作は、ステップS400に移る。
ステップS332では、故障判定部BJGは、通信先の情報処理装置PDEVから物理層PHYに転送されたデータの所定期間(例えば、80ミリ秒)内のBIPエラー数が閾値(例えば、255)を超えた物理レーンPHLが存在するか否かを判定する。なお、リンク制御部LCLTは、例えば、図13の動作と並列して、所定期間内のBIPエラー数を物理レーンPHL毎にエラーカウンタECTを用いて計測する。例えば、所定期間内の各物理レーンPHLのBIPエラー数は、図10のステップS202で算出される。
BIPエラー数が閾値を超えた物理レーンPHLが存在する場合(ステップS332のYes)、リンク制御部LCLTの動作は、ステップS334に移る。一方、BIPエラー数が閾値を超えた物理レーンPHLが存在しない場合(ステップS332のNo)、リンク制御部LCLTの動作は、ステップS336に移る。なお、ステップS332の閾値は、図10のステップS204の閾値と同じ値でもよいし、異なる値でもよい。
ステップS334では、レーン選択部LSELは、所定期間内のBIPエラー数が最も多い物理レーンPHLを、縮退するレーンと特定する。このように、レーン選択部LSELは、縮退するレーンPHLを所定期間内のBIPエラー数に基づいて特定する。
ステップS336では、レーン選択部LSELは、特定の物理レーンPHLを、縮退するレーンと特定する。例えば、レーン選択部LSELは、予め決められた物理レーンPHLを、縮退するレーンと特定する。これにより、リンク制御部LCLTは、レーン縮退依頼を示す縮退情報DINFRを受信したにも拘わらず、BIPエラーが検出されない場合でも、レーン縮退を実行できる。なお、レーン選択部LSELは、所定期間内のBIPエラー数が1以上で閾値以下の場合、所定期間内のBIPエラー数が最も多い物理レーンPHLを、縮退するレーンと特定してもよい。
ステップS400では、リンク制御部LCLTは、レーン縮退を実行し、物理層PHYの再起動を指示する。例えば、レーン選択部LSELは、ステップS334またはステップS336で特定した物理レーンPHL(縮退するレーンPHL)を除く物理レーンPHLから、通信先の情報処理装置PDEVとのデータ転送に使用する物理レーンPHLを選択する。そして、レーン選択部LSELは、選択した物理レーンPHLをイネーブルに設定する。
あるいは、レーン選択部LSELは、ステップS330で受信した縮退情報DINFRがレーン縮退要求の場合、データ転送に使用する物理レーンPHLをステップS330で受信した縮退情報DINFSに基づいて選択する。そして、レーン選択部LSELは、選択した物理レーンPHLをイネーブルに設定する。
なお、例えば、図13の動作がレーン縮退後に実行された場合、図13の動作が実行される前にディセーブルに設定された物理レーンPHLは、選択対象の物理レーンPHLに含まれない。
また、縮退指示部DCLTは、物理層PHYの再起動を指示する通知を起動指示部SCLTに出力する。そして、起動指示部SCLTは、例えば、縮退指示部DCLTからの再起動指示に応じて、物理層PHYに対して再起動を指示する。
なお、縮退情報生成部DGENは、ステップS330で受信した縮退情報DINFRがレーン縮退依頼の場合、データ転送に使用する物理レーンPHL等示す縮退情報DINFS(レーン縮退を要求する縮退情報DINFS)をフレーム生成部FGENに出力する。これにより、通信先の情報処理装置PDEVは、レーン縮退を要求する縮退情報DINFSを含む縮退要求DLLPを受信する。この結果、通信先の情報処理装置PDEVは、データ転送に使用する物理レーンPHL等を選択できる。
このように、例えば、レーン選択部LSELは、通信先の情報処理装置PDEVからレーンの縮退を依頼された場合、通信先の情報処理装置PDEVとのデータ転送に使用する物理レーンPHLを、所定期間分のエラー情報EINFに基づいて選択する。
なお、レーン縮退により実行される物理層PHYの再起動では、物理レーンPHLのイネーブルの設定は、ステップS400で設定した内容が引き継がれる。また、レーン縮退により実行される物理層PHYの再起動では、レーン縮退が既に実行されているため、図7で説明した物理層PHYのリンクアップ前のレーン縮退処理は、実行されない。なお、情報処理装置PDEVのリンクアップ後の動作は、この例に限定されない。また、通信先の情報処理装置PDEVでレーン縮退の契機が検出された場合のリンクアップ前のレーン縮退に関する動作は、図13の動作と同様である。
図10から図13に示したように、レーン選択部LSELは、通信先の情報処理装置PDEVから物理層PHYに転送されたデータに誤りがあることを示すエラー情報EINFに基づいて、縮退するレーンPHLを特定する。したがって、フレーム転送回路FTRは、故障レーン特定機能を含まない物理層PHYを使用する場合においても、レーン縮退の契機を検出した場合に、エラー情報EINF等を参照することにより、縮退するレーンをリンクアップ後に特定できる。
例えば、フレーム転送回路FTRは、図10のステップS200−S204、図11のステップS210−S212、図12のステップS220−S222、図13のステップS230−S232等のレーン縮退の契機の検出処理を、並列に実行する。この場合、フレーム転送回路FTRは、縮退するレーンPHLを複数のレーン縮退の契機のうちのいずれかを検出した場合に特定するため、縮退するレーンPHLの特定を効率よく実行できる。
なお、フレーム転送回路FTRは、図10から図13に示したレーン縮退の契機の検出処理の一部を実行してもよい。例えば、フレーム転送回路FTRは、図6に示した所定期間内のBIPエラー数の閾値超えをレーン縮退の契機から省いてもよい。この場合、例えば、図10から図13に示した動作のうち、図10のステップS204、S300、S400が省かれる。
また、例えば、図6に示したビットエラーの悪化、リトライアウトの検出、所定期間内のBIPエラー数の閾値超えがレーン縮退の契機から省かれた場合、フレーム転送回路FTRは、図10、図11および図13の動作を実行しなくてもよい。この場合、図4に示したエラーカウンタECTおよび故障判定部BJGは、選択部SELから省かれてもよい。
以上、図1から図13に示した実施形態の情報処理装置、並列計算機システムおよび並列計算機システムの制御方法では、縮退対象の物理レーンPHL(縮退するレーンPHL)をエラー情報EINFおよびAM検出情報AINFのいずれかに基づいて特定する。
例えば、AM検出情報受信部ARECは、物理層PHYが通信先の情報処理装置PDEVからデータを受信したことを示すAM検出情報AINFを、PCSレーンPL毎に受信する。そして、選択部SELは、物理レーンPHL等に故障が発生したことをリンクアップ前に検出した場合、縮退するレーンPHLをAM検出情報AINFに基づいて特定する。これにより、フレーム転送回路FTRは、故障レーン特定機能を含まない物理層PHYを使用する場合においても、AM検出情報AINF等を参照することにより、縮退するレーンをリンクアップ前に特定できる。
また、例えば、エラー情報受信部ERECは、通信先の情報処理装置PDEVから物理層PHYに転送されたデータに誤りがあることを示すエラー情報EINFを、PCSレーンPL毎に受信する。そして、選択部SELは、物理レーンPHL等に故障が発生したことをリンクアップ後に検出した場合、縮退するレーンPHLをエラー情報EINFに基づいて特定する。これにより、フレーム転送回路FTRは、故障レーン特定機能を含まない物理層PHYを使用する場合においても、エラー情報EINF等を参照することにより、縮退するレーンをリンクアップ後に特定できる。
このように、この実施形態では、物理層より上位の層に相当するフレーム転送回路FTRがエラー情報EINFおよびAM検出情報AINFのいずれかに基づいて、縮退するレーンPHLを特定する。したがって、この実施形態では、故障レーン特定機能を含まない物理層PHYを使用する場合においても、縮退するレーンPHLを特定できる。例えば、この実施形態では、故障レーン特定機能を含まない物理層PHYに、エラー情報EINF、AM検出情報AINF等を出力する機能を追加する。これにより、この実施形態では、故障レーン特定機能を含まない物理層PHYを使用する場合においても、特定した物理レーンPHL(縮退するレーンPHL)を使用しないように設定することにより、故障レーンPHLを縮退できる。この結果、この実施形態では、故障レーンPHLを縮退させてリンクの接続を維持できるため、並列計算機システムの信頼性を向上できる。
以上の実施形態において説明した発明を整理して、付記として開示する。
(付記1)
OSI参照モデルの物理層に相当するデバイスであり、データを複数の第1レーンに分配し、所定の数の前記第1レーンをまとめた複数の第2レーンを用いて外部の装置とのデータ転送を実行する物理層デバイスと、
前記物理層より上位の層に相当するデバイスであり、演算処理を実行する演算処理装置から受信したデータを前記物理層デバイスに転送し、前記物理層デバイスから受信したデータを前記演算処理装置に転送する転送回路とを有し、
前記転送回路は、
前記物理層デバイスが前記外部の装置からデータを受信したことを示す前記各第1レーンの検出情報と、前記外部の装置から前記物理層デバイスに転送されたデータに誤りがあることを示す前記各第1レーンのエラー情報とのいずれかを、前記物理層デバイスから受信する情報取得部と、
複数の前記第1レーンおよび複数の前記第2レーンのいずれかに故障が発生した場合、縮退対象の前記第2レーンを前記エラー情報および前記検出情報のいずれかに基づいて特定し、特定した前記第2レーンを除く前記第2レーンから前記外部の装置とのデータ転送に使用する前記第2レーンを選択する選択部とを有することを特徴とする情報処理装置。
(付記2)
付記1に記載の情報処理装置において、
前記選択部は、所定期間に発生した前記誤りの数を前記エラー情報に基づいて前記第2レーン毎に計測する計測部を有し、複数の前記第1レーンおよび複数の前記第2レーンのいずれかに故障が発生した場合、前記縮退対象の前記第2レーンを前記所定期間内の前記誤りの数に基づいて特定する
ことを特徴とする情報処理装置。
(付記3)
付記2に記載の情報処理装置において、
前記転送回路は、前記外部の装置に前記物理層デバイスを介して転送したデータの再送信に関する処理での異常を検出する第1検出部を有し、
前記選択部は、前記再送信に関する処理での異常が検出された場合、前記縮退対象の前記第2レーンを前記所定期間内の前記誤りの数に基づいて特定する
ことを特徴とする情報処理装置。
(付記4)
付記2または付記3に記載の情報処理装置において、
前記選択部は、前記所定期間内の前記誤りの数が閾値を超えた前記第2レーンを検出した場合、前記所定期間内の前記誤りの数が前記閾値を超えた前記第2レーンを、前記縮退対象の前記第2レーンと特定する
ことを特徴とする情報処理装置。
(付記5)
付記1ないし付記4のいずれか1項に記載の情報処理装置において、
前記転送回路は、前記外部の装置に前記物理層デバイスを介してデータを転送するためのフロー制御での異常を検出する第2検出部を有し、
前記選択部は、前記フロー制御での異常が検出された場合、前記縮退対象の前記第2レーンを前記エラー情報に基づいて特定する
ことを特徴とする情報処理装置。
(付記6)
付記1ないし付記5のいずれか1項に記載の情報処理装置において、
前記選択部は、前記転送回路が前記物理層デバイスに対して起動を指示してから起動完了の通知を前記物理層デバイスから受信するまでの期間では、前記第1レーンのいずれかの前記検出情報を前記情報取得部が受信してから所定時間経過するまでに、前記起動完了の通知を前記転送回路が受信しなかった場合、前記縮退対象の前記第2レーンを前記検出情報に基づいて特定する
ことを特徴とする情報処理装置。
(付記7)
伝送路を介して接続される複数の情報処理装置を有する並列計算機システムにおいて、
前記情報処理装置は、
OSI参照モデルの物理層に相当するデバイスであり、データを複数の第1レーンに分配し、所定の数の前記第1レーンをまとめた複数の第2レーンを用いて通信先の前記情報処理装置とのデータ転送を実行する物理層デバイスと、
前記物理層より上位の層に相当するデバイスであり、演算処理を実行する演算処理装置から受信したデータを前記物理層デバイスに転送し、前記物理層デバイスから受信したデータを前記演算処理装置に転送する転送回路とを有し、
前記転送回路は、
前記物理層デバイスが前記通信先の情報処理装置からデータを受信したことを示す前記各第1レーンの検出情報と、前記通信先の情報処理装置から前記物理層デバイスに転送されたデータに誤りがあることを示す前記各第1レーンのエラー情報とのいずれかを、前記物理層デバイスから受信する情報取得部と、
複数の前記第1レーンおよび複数の前記第2レーンのいずれかに故障が発生した場合、縮退対象の前記第2レーンを前記エラー情報および前記検出情報のいずれかに基づいて特定し、特定した前記第2レーンを除く前記第2レーンから前記通信先の情報処理装置とのデータ転送に使用する前記第2レーンを選択する選択部とを有することを特徴とする並列計算機システム。
(付記8)
付記7に記載の並列計算機システムにおいて、
前記選択部は、所定期間に発生した前記誤りの数を前記エラー情報に基づいて前記第2レーン毎に計測する計測部を有し、複数の前記第1レーンおよび複数の前記第2レーンのいずれかに故障が発生した場合、前記縮退対象の前記第2レーンを前記所定期間内の前記誤りの数に基づいて特定する
ことを特徴とする並列計算機システム。
(付記9)
付記8に記載の並列計算機システムにおいて、
前記転送回路は、前記通信先の情報処理装置に前記物理層デバイスを介して転送したデータの再送信に関する処理での異常を検出する第1検出部を有し、
前記選択部は、前記再送信に関する処理での異常が検出された場合、前記縮退対象の前記第2レーンを前記所定期間内の前記誤りの数に基づいて特定する
ことを特徴とする並列計算機システム。
(付記10)
付記8または付記9に記載の並列計算機システムにおいて、
前記選択部は、前記所定期間内の前記誤りの数が閾値を超えた前記第2レーンを検出した場合、前記所定期間内の前記誤りの数が前記閾値を超えた前記第2レーンを、前記縮退対象の前記第2レーンと特定する
ことを特徴とする並列計算機システム。
(付記11)
付記7ないし付記10のいずれか1項に記載の並列計算機システムにおいて、
前記転送回路は、前記通信先の情報処理装置に前記物理層デバイスを介してデータを転送するためのフロー制御での異常を検出する第2検出部を有し、
前記選択部は、前記フロー制御での異常が検出された場合、前記縮退対象の前記第2レーンを前記エラー情報に基づいて特定する
ことを特徴とする並列計算機システム。
(付記12)
付記7ないし付記11のいずれか1項に記載の並列計算機システムにおいて、
前記選択部は、前記転送回路が前記物理層デバイスに対して起動を指示してから起動完了の通知を前記物理層デバイスから受信するまでの期間では、前記第1レーンのいずれかの前記検出情報を前記情報取得部が受信してから所定時間経過するまでに、前記起動完了の通知を前記転送回路が受信しなかった場合、前記縮退対象の前記第2レーンを前記検出情報に基づいて特定する
ことを特徴とする並列計算機システム。
(付記13)
伝送路を介して接続される複数の情報処理装置を有し、前記情報処理装置が、OSI参照モデルの物理層に相当するデバイスであり、データを複数の第1レーンに分配し、所定の数の前記第1レーンをまとめた複数の第2レーンを用いて通信先の前記情報処理装置とのデータ転送を実行する物理層デバイスと、前記物理層より上位の層に相当するデバイスであり、演算処理を実行する演算処理装置から受信したデータを前記物理層デバイスに転送し、前記物理層デバイスから受信したデータを前記演算処理装置に転送する転送回路とを有する並列計算機システムの制御方法において、
前記転送回路は、前記物理層デバイスが前記通信先の情報処理装置からデータを受信したことを示す前記各第1レーンの検出情報と、前記通信先の情報処理装置から前記物理層デバイスに転送されたデータに誤りがあることを示す前記各第1レーンのエラー情報とのいずれかを、前記物理層デバイスから受信し、
前記転送回路は、複数の前記第1レーンおよび複数の前記第2レーンのいずれかに故障が発生した場合、縮退対象の前記第2レーンを前記エラー情報および前記検出情報のいずれかに基づいて特定し、特定した前記第2レーンを除く前記第2レーンから前記通信先の情報処理装置とのデータ転送に使用する前記第2レーンを選択することを特徴とする並列計算機システムの制御方法。
(付記14)
付記13に記載の並列計算機システムの制御方法において、
前記転送回路は、所定期間に発生した前記誤りの数を前記エラー情報に基づいて前記第2レーン毎に計測し、複数の前記第1レーンおよび複数の前記第2レーンのいずれかに故障が発生した場合、前記縮退対象の前記第2レーンを前記所定期間内の前記誤りの数に基づいて特定する
ことを特徴とする並列計算機システムの制御方法。
(付記15)
付記14に記載の並列計算機システムの制御方法において、
前記転送回路は、前記通信先の情報処理装置に前記物理層デバイスを介して転送したデータの再送信に関する処理での異常を検出する処理を実行し、
前記転送回路は、前記再送信に関する処理での異常を検出した場合、前記縮退対象の前記第2レーンを前記所定期間内の前記誤りの数に基づいて特定する
ことを特徴とする並列計算機システムの制御方法。
(付記16)
付記14または付記15に記載の並列計算機システムの制御方法において、
前記転送回路は、前記所定期間内の前記誤りの数が閾値を超えた前記第2レーンを検出した場合、前記所定期間内の前記誤りの数が前記閾値を超えた前記第2レーンを、前記縮退対象の前記第2レーンと特定する
ことを特徴とする並列計算機システムの制御方法。
(付記17)
付記13ないし付記16のいずれか1項に記載の並列計算機システムの制御方法において、
前記転送回路は、前記通信先の情報処理装置に前記物理層デバイスを介してデータを転送するためのフロー制御での異常を検出する処理を実行し、
前記転送回路は、前記フロー制御での異常を検出した場合、前記縮退対象の前記第2レーンを前記エラー情報に基づいて特定する
ことを特徴とする並列計算機システムの制御方法。
(付記18)
付記13ないし付記17のいずれか1項に記載の並列計算機システムの制御方法において、
前記転送回路は、前記物理層デバイスに対して起動を指示してから起動完了の通知を前記物理層デバイスから受信するまでの期間では、前記第1レーンのいずれかの前記検出情報を受信してから所定時間経過するまでに、前記起動完了の通知を受信しなかった場合、前記縮退対象の前記第2レーンを前記検出情報に基づいて特定する
ことを特徴とする並列計算機システムの制御方法。
以上の詳細な説明により、実施形態の特徴点および利点は明らかになるであろう。これは、特許請求の範囲がその精神および権利範囲を逸脱しない範囲で前述のような実施形態の特徴点および利点にまで及ぶことを意図するものである。また、当該技術分野において通常の知識を有する者であれば、あらゆる改良および変更に容易に想到できるはずである。したがって、発明性を有する実施形態の範囲を前述したものに限定する意図はなく、実施形態に開示された範囲に含まれる適当な改良物および均等物に拠ることも可能である。
ACQ‥情報取得部;ADD‥加算部;ADET‥AM検出部;AGGR、AGGS‥データ集約部;AINS‥AM挿入部;AREC‥AM検出情報受信部;BDET‥BIP検出部;BINS‥BIP挿入部;BJG‥故障判定部;CUNT‥カウンタ;DCLT‥縮退指示部;DGEN‥縮退情報生成部;DIVR、DIVS‥データ分割部;ECT、ECT0、ECT1、ECT2、ECT3‥エラーカウンタ;EDET‥エラー検出部;EREC‥エラー情報受信部;EREP‥エラー通知部;FCLT‥フロー制御部;FDET‥異常検出部;FGEN‥フレーム生成部;FREC‥フレーム受信部;FSEN‥フレーム送信部;FTR‥フレーム転送回路;LCLT‥リンク制御部;LSEL‥レーン選択部;PDEV1、PDEV2‥情報処理装置;PHL、PHLr0−PHLr3、PHLs0−PHLs3‥物理レーン;PLr0−PLr19、PLs0−PLs19‥PCSレーン;PS‥パラレルシリアル変換部;RBUF‥バッファ部;REG1、REG2、REG3‥レジスタ;RTCLT‥再送制御部;SCLT‥起動指示部;SEL‥選択部;SP‥シリアルパラレル変換部;SUCLT‥起動制御部;SYS‥並列計算機システム;TJG‥タイムアウト判定部;TM‥タイマ
一観点によれば、情報処理装置は、データを複数の第1レーンに分配し、所定の数の第1レーンをまとめた複数の第2レーンを用いて外部の装置とのデータ転送を実行する第1転送部、演算処理を実行する演算処理装置から受信したデータを第1転送部に転送し、第1転送部から受信したデータを演算処理装置に転送する第2転送部とを有し、第2転送部は、第1転送部が外部の装置からデータを受信したことを示す各第1レーンの検出情報と、外部の装置から第1転送部に転送されたデータに誤りがあることを示す各第1レーンのエラー情報とのいずれかを、第1転送部から受信する情報取得部と、複数の第1レーンおよび複数の第2レーンのいずれかに故障が発生した場合、縮退対象の第2レーンをエラー情報および検出情報のいずれかに基づいて特定し、特定した第2レーンを除く第2レーンから外部の装置とのデータ転送に使用する第2レーンを選択する選択部とを有する。
別の観点によれば、伝送路を介して接続される複数の情報処理装置を有する並列計算機システムでは、情報処理装置は、データを複数の第1レーンに分配し、所定の数の第1レーンをまとめた複数の第2レーンを用いて通信先の情報処理装置とのデータ転送を実行する第1転送部、演算処理を実行する演算処理装置から受信したデータを第1転送部に転送し、第1転送部から受信したデータを演算処理装置に転送する第2転送部とを有し、第2転送部は、第1転送部が通信先の情報処理装置からデータを受信したことを示す各第1レーンの検出情報と、通信先の情報処理装置から第1転送部に転送されたデータに誤りがあることを示す各第1レーンのエラー情報とのいずれかを、第1転送部から受信する情報取得部と、複数の第1レーンおよび複数の第2レーンのいずれかに故障が発生した場合、縮退対象の第2レーンをエラー情報および検出情報のいずれかに基づいて特定し、特定した第2レーンを除く第2レーンから通信先の情報処理装置とのデータ転送に使用する第2レーンを選択する選択部とを有する。
別の観点によれば、伝送路を介して接続される複数の情報処理装置を有し、情報処理装置が、データを複数の第1レーンに分配し、所定の数の第1レーンをまとめた複数の第2レーンを用いて通信先の情報処理装置とのデータ転送を実行する第1転送部、演算処理を実行する演算処理装置から受信したデータを第1転送部に転送し、第1転送部から受信したデータを演算処理装置に転送する第2転送部とを有する並列計算機システムの制御方法では、第2転送部は、第1転送部が通信先の情報処理装置からデータを受信したことを示す各第1レーンの検出情報と、通信先の情報処理装置から第1転送部に転送されたデータに誤りがあることを示す各第1レーンのエラー情報とのいずれかを、第1転送部から受信し、第2転送部は、複数の第1レーンおよび複数の第2レーンのいずれかに故障が発生した場合、縮退対象の第2レーンをエラー情報および検出情報のいずれかに基づいて特定し、特定した第2レーンを除く第2レーンから通信先の情報処理装置とのデータ転送に使用する第2レーンを選択する。
以上の実施形態において説明した発明を整理して、付記として開示する。
(付記1)
ータを複数の第1レーンに分配し、所定の数の前記第1レーンをまとめた複数の第2レーンを用いて外部の装置とのデータ転送を実行する第1転送部と、
算処理を実行する演算処理装置から受信したデータを前記第1転送部に転送し、前記第1転送部から受信したデータを前記演算処理装置に転送する第2転送部とを有し、
前記第2転送部は、
前記第1転送部が前記外部の装置からデータを受信したことを示す前記各第1レーンの検出情報と、前記外部の装置から前記第1転送部に転送されたデータに誤りがあることを示す前記各第1レーンのエラー情報とのいずれかを、前記第1転送部から受信する情報取得部と、
複数の前記第1レーンおよび複数の前記第2レーンのいずれかに故障が発生した場合、縮退対象の前記第2レーンを前記エラー情報および前記検出情報のいずれかに基づいて特定し、特定した前記第2レーンを除く前記第2レーンから前記外部の装置とのデータ転送に使用する前記第2レーンを選択する選択部とを有することを特徴とする情報処理装置。
(付記2)
付記1に記載の情報処理装置において、
前記選択部は、所定期間に発生した前記誤りの数を前記エラー情報に基づいて前記第2レーン毎に計測する計測部を有し、複数の前記第1レーンおよび複数の前記第2レーンのいずれかに故障が発生した場合、前記縮退対象の前記第2レーンを前記所定期間内の前記誤りの数に基づいて特定する
ことを特徴とする情報処理装置。
(付記3)
付記2に記載の情報処理装置において、
前記第2転送部は、前記外部の装置に前記第1転送部を介して転送したデータの再送信に関する処理での異常を検出する第1検出部を有し、
前記選択部は、前記再送信に関する処理での異常が検出された場合、前記縮退対象の前記第2レーンを前記所定期間内の前記誤りの数に基づいて特定する
ことを特徴とする情報処理装置。
(付記4)
付記2または付記3に記載の情報処理装置において、
前記選択部は、前記所定期間内の前記誤りの数が閾値を超えた前記第2レーンを検出した場合、前記所定期間内の前記誤りの数が前記閾値を超えた前記第2レーンを、前記縮退対象の前記第2レーンと特定する
ことを特徴とする情報処理装置。
(付記5)
付記1ないし付記4のいずれか1項に記載の情報処理装置において、
前記第2転送部は、前記外部の装置に前記第1転送部を介してデータを転送するためのフロー制御での異常を検出する第2検出部を有し、
前記選択部は、前記フロー制御での異常が検出された場合、前記縮退対象の前記第2レーンを前記エラー情報に基づいて特定する
ことを特徴とする情報処理装置。
(付記6)
付記1ないし付記5のいずれか1項に記載の情報処理装置において、
前記選択部は、前記第2転送部が前記第1転送部に対して起動を指示してから起動完了の通知を前記第1転送部から受信するまでの期間では、前記第1レーンのいずれかの前記検出情報を前記情報取得部が受信してから所定時間経過するまでに、前記起動完了の通知を前記第2転送部が受信しなかった場合、前記縮退対象の前記第2レーンを前記検出情報に基づいて特定する
ことを特徴とする情報処理装置。
(付記7)
伝送路を介して接続される複数の情報処理装置を有する並列計算機システムにおいて、
前記情報処理装置は、
ータを複数の第1レーンに分配し、所定の数の前記第1レーンをまとめた複数の第2レーンを用いて通信先の前記情報処理装置とのデータ転送を実行する第1転送部と、
算処理を実行する演算処理装置から受信したデータを前記第1転送部に転送し、前記第1転送部から受信したデータを前記演算処理装置に転送する第2転送部とを有し、
前記第2転送部は、
前記第1転送部が前記通信先の情報処理装置からデータを受信したことを示す前記各第1レーンの検出情報と、前記通信先の情報処理装置から前記第1転送部に転送されたデータに誤りがあることを示す前記各第1レーンのエラー情報とのいずれかを、前記第1転送部から受信する情報取得部と、
複数の前記第1レーンおよび複数の前記第2レーンのいずれかに故障が発生した場合、縮退対象の前記第2レーンを前記エラー情報および前記検出情報のいずれかに基づいて特定し、特定した前記第2レーンを除く前記第2レーンから前記通信先の情報処理装置とのデータ転送に使用する前記第2レーンを選択する選択部とを有することを特徴とする並列計算機システム。
(付記8)
付記7に記載の並列計算機システムにおいて、
前記選択部は、所定期間に発生した前記誤りの数を前記エラー情報に基づいて前記第2レーン毎に計測する計測部を有し、複数の前記第1レーンおよび複数の前記第2レーンのいずれかに故障が発生した場合、前記縮退対象の前記第2レーンを前記所定期間内の前記誤りの数に基づいて特定する
ことを特徴とする並列計算機システム。
(付記9)
付記8に記載の並列計算機システムにおいて、
前記第2転送部は、前記通信先の情報処理装置に前記第1転送部を介して転送したデータの再送信に関する処理での異常を検出する第1検出部を有し、
前記選択部は、前記再送信に関する処理での異常が検出された場合、前記縮退対象の前記第2レーンを前記所定期間内の前記誤りの数に基づいて特定する
ことを特徴とする並列計算機システム。
(付記10)
付記8または付記9に記載の並列計算機システムにおいて、
前記選択部は、前記所定期間内の前記誤りの数が閾値を超えた前記第2レーンを検出した場合、前記所定期間内の前記誤りの数が前記閾値を超えた前記第2レーンを、前記縮退対象の前記第2レーンと特定する
ことを特徴とする並列計算機システム。
(付記11)
付記7ないし付記10のいずれか1項に記載の並列計算機システムにおいて、
前記第2転送部は、前記通信先の情報処理装置に前記第1転送部を介してデータを転送するためのフロー制御での異常を検出する第2検出部を有し、
前記選択部は、前記フロー制御での異常が検出された場合、前記縮退対象の前記第2レーンを前記エラー情報に基づいて特定する
ことを特徴とする並列計算機システム。
(付記12)
付記7ないし付記11のいずれか1項に記載の並列計算機システムにおいて、
前記選択部は、前記第2転送部が前記第1転送部に対して起動を指示してから起動完了の通知を前記第1転送部から受信するまでの期間では、前記第1レーンのいずれかの前記検出情報を前記情報取得部が受信してから所定時間経過するまでに、前記起動完了の通知を前記第2転送部が受信しなかった場合、前記縮退対象の前記第2レーンを前記検出情報に基づいて特定する
ことを特徴とする並列計算機システム。
(付記13)
伝送路を介して接続される複数の情報処理装置を有し、前記情報処理装置が、データを複数の第1レーンに分配し、所定の数の前記第1レーンをまとめた複数の第2レーンを用いて通信先の前記情報処理装置とのデータ転送を実行する第1転送部、演算処理を実行する演算処理装置から受信したデータを前記第1転送部に転送し、前記第1転送部から受信したデータを前記演算処理装置に転送する第2転送部とを有する並列計算機システムの制御方法において、
前記第2転送部は、前記第1転送部が前記通信先の情報処理装置からデータを受信したことを示す前記各第1レーンの検出情報と、前記通信先の情報処理装置から前記第1転送部に転送されたデータに誤りがあることを示す前記各第1レーンのエラー情報とのいずれかを、前記第1転送部から受信し、
前記第2転送部は、複数の前記第1レーンおよび複数の前記第2レーンのいずれかに故障が発生した場合、縮退対象の前記第2レーンを前記エラー情報および前記検出情報のいずれかに基づいて特定し、特定した前記第2レーンを除く前記第2レーンから前記通信先の情報処理装置とのデータ転送に使用する前記第2レーンを選択することを特徴とする並列計算機システムの制御方法。
(付記14)
付記13に記載の並列計算機システムの制御方法において、
前記第2転送部は、所定期間に発生した前記誤りの数を前記エラー情報に基づいて前記第2レーン毎に計測し、複数の前記第1レーンおよび複数の前記第2レーンのいずれかに故障が発生した場合、前記縮退対象の前記第2レーンを前記所定期間内の前記誤りの数に基づいて特定する
ことを特徴とする並列計算機システムの制御方法。
(付記15)
付記14に記載の並列計算機システムの制御方法において、
前記第2転送部は、前記通信先の情報処理装置に前記第1転送部を介して転送したデータの再送信に関する処理での異常を検出する処理を実行し、
前記第2転送部は、前記再送信に関する処理での異常を検出した場合、前記縮退対象の前記第2レーンを前記所定期間内の前記誤りの数に基づいて特定する
ことを特徴とする並列計算機システムの制御方法。
(付記16)
付記14または付記15に記載の並列計算機システムの制御方法において、
前記第2転送部は、前記所定期間内の前記誤りの数が閾値を超えた前記第2レーンを検出した場合、前記所定期間内の前記誤りの数が前記閾値を超えた前記第2レーンを、前記縮退対象の前記第2レーンと特定する
ことを特徴とする並列計算機システムの制御方法。
(付記17)
付記13ないし付記16のいずれか1項に記載の並列計算機システムの制御方法において、
前記第2転送部は、前記通信先の情報処理装置に前記第1転送部を介してデータを転送するためのフロー制御での異常を検出する処理を実行し、
前記第2転送部は、前記フロー制御での異常を検出した場合、前記縮退対象の前記第2レーンを前記エラー情報に基づいて特定する
ことを特徴とする並列計算機システムの制御方法。
(付記18)
付記13ないし付記17のいずれか1項に記載の並列計算機システムの制御方法において、
前記第2転送部は、前記第1転送部に対して起動を指示してから起動完了の通知を前記第1転送部から受信するまでの期間では、前記第1レーンのいずれかの前記検出情報を受信してから所定時間経過するまでに、前記起動完了の通知を受信しなかった場合、前記縮退対象の前記第2レーンを前記検出情報に基づいて特定する
ことを特徴とする並列計算機システムの制御方法。

Claims (8)

  1. OSI参照モデルの物理層に相当するデバイスであり、データを複数の第1レーンに分配し、所定の数の前記第1レーンをまとめた複数の第2レーンを用いて外部の装置とのデータ転送を実行する物理層デバイスと、
    前記物理層より上位の層に相当するデバイスであり、演算処理を実行する演算処理装置から受信したデータを前記物理層デバイスに転送し、前記物理層デバイスから受信したデータを前記演算処理装置に転送する転送回路とを有し、
    前記転送回路は、
    前記物理層デバイスが前記外部の装置からデータを受信したことを示す前記各第1レーンの検出情報と、前記外部の装置から前記物理層デバイスに転送されたデータに誤りがあることを示す前記各第1レーンのエラー情報とのいずれかを、前記物理層デバイスから受信する情報取得部と、
    複数の前記第1レーンおよび複数の前記第2レーンのいずれかに故障が発生した場合、縮退対象の前記第2レーンを前記エラー情報および前記検出情報のいずれかに基づいて特定し、特定した前記第2レーンを除く前記第2レーンから前記外部の装置とのデータ転送に使用する前記第2レーンを選択する選択部とを有することを特徴とする情報処理装置。
  2. 請求項1に記載の情報処理装置において、
    前記選択部は、所定期間に発生した前記誤りの数を前記エラー情報に基づいて前記第2レーン毎に計測する計測部を有し、複数の前記第1レーンおよび複数の前記第2レーンのいずれかに故障が発生した場合、前記縮退対象の前記第2レーンを前記所定期間内の前記誤りの数に基づいて特定する
    ことを特徴とする情報処理装置。
  3. 請求項2に記載の情報処理装置において、
    前記転送回路は、前記外部の装置に前記物理層デバイスを介して転送したデータの再送信に関する処理での異常を検出する第1検出部を有し、
    前記選択部は、前記再送信に関する処理での異常が検出された場合、前記縮退対象の前記第2レーンを前記所定期間内の前記誤りの数に基づいて特定する
    ことを特徴とする情報処理装置。
  4. 請求項2または請求項3に記載の情報処理装置において、
    前記選択部は、前記所定期間内の前記誤りの数が閾値を超えた前記第2レーンを検出した場合、前記所定期間内の前記誤りの数が前記閾値を超えた前記第2レーンを、前記縮退対象の前記第2レーンと特定する
    ことを特徴とする情報処理装置。
  5. 請求項1ないし請求項4のいずれか1項に記載の情報処理装置において、
    前記転送回路は、前記外部の装置に前記物理層デバイスを介してデータを転送するためのフロー制御での異常を検出する第2検出部を有し、
    前記選択部は、前記フロー制御での異常が検出された場合、前記縮退対象の前記第2レーンを前記エラー情報に基づいて特定する
    ことを特徴とする情報処理装置。
  6. 請求項1ないし請求項5のいずれか1項に記載の情報処理装置において、
    前記選択部は、前記転送回路が前記物理層デバイスに対して起動を指示してから起動完了の通知を前記物理層デバイスから受信するまでの期間では、前記第1レーンのいずれかの前記検出情報を前記情報取得部が受信してから所定時間経過するまでに、前記起動完了の通知を前記転送回路が受信しなかった場合、前記縮退対象の前記第2レーンを前記検出情報に基づいて特定する
    ことを特徴とする情報処理装置。
  7. 伝送路を介して接続される複数の情報処理装置を有する並列計算機システムにおいて、
    前記情報処理装置は、
    OSI参照モデルの物理層に相当するデバイスであり、データを複数の第1レーンに分配し、所定の数の前記第1レーンをまとめた複数の第2レーンを用いて通信先の前記情報処理装置とのデータ転送を実行する物理層デバイスと、
    前記物理層より上位の層に相当するデバイスであり、演算処理を実行する演算処理装置から受信したデータを前記物理層デバイスに転送し、前記物理層デバイスから受信したデータを前記演算処理装置に転送する転送回路とを有し、
    前記転送回路は、
    前記物理層デバイスが前記通信先の情報処理装置からデータを受信したことを示す前記各第1レーンの検出情報と、前記通信先の情報処理装置から前記物理層デバイスに転送されたデータに誤りがあることを示す前記各第1レーンのエラー情報とのいずれかを、前記物理層デバイスから受信する情報取得部と、
    複数の前記第1レーンおよび複数の前記第2レーンのいずれかに故障が発生した場合、縮退対象の前記第2レーンを前記エラー情報および前記検出情報のいずれかに基づいて特定し、特定した前記第2レーンを除く前記第2レーンから前記通信先の情報処理装置とのデータ転送に使用する前記第2レーンを選択する選択部とを有することを特徴とする並列計算機システム。
  8. 伝送路を介して接続される複数の情報処理装置を有し、前記情報処理装置が、OSI参照モデルの物理層に相当するデバイスであり、データを複数の第1レーンに分配し、所定の数の前記第1レーンをまとめた複数の第2レーンを用いて通信先の前記情報処理装置とのデータ転送を実行する物理層デバイスと、前記物理層より上位の層に相当するデバイスであり、演算処理を実行する演算処理装置から受信したデータを前記物理層デバイスに転送し、前記物理層デバイスから受信したデータを前記演算処理装置に転送する転送回路とを有する並列計算機システムの制御方法において、
    前記転送回路は、前記物理層デバイスが前記通信先の情報処理装置からデータを受信したことを示す前記各第1レーンの検出情報と、前記通信先の情報処理装置から前記物理層デバイスに転送されたデータに誤りがあることを示す前記各第1レーンのエラー情報とのいずれかを、前記物理層デバイスから受信し、
    前記転送回路は、複数の前記第1レーンおよび複数の前記第2レーンのいずれかに故障が発生した場合、縮退対象の前記第2レーンを前記エラー情報および前記検出情報のいずれかに基づいて特定し、特定した前記第2レーンを除く前記第2レーンから前記通信先の情報処理装置とのデータ転送に使用する前記第2レーンを選択することを特徴とする並列計算機システムの制御方法。
JP2014069111A 2014-03-28 2014-03-28 情報処理装置、並列計算機システムおよび並列計算機システムの制御方法 Active JP6331574B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2014069111A JP6331574B2 (ja) 2014-03-28 2014-03-28 情報処理装置、並列計算機システムおよび並列計算機システムの制御方法
US14/629,881 US9619347B2 (en) 2014-03-28 2015-02-24 Systems and methods of fault management in electronic communications
EP15156826.8A EP2924583B1 (en) 2014-03-28 2015-02-26 Information processing apparatus, parallel computer system, and method of controlling parallel computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014069111A JP6331574B2 (ja) 2014-03-28 2014-03-28 情報処理装置、並列計算機システムおよび並列計算機システムの制御方法

Publications (2)

Publication Number Publication Date
JP2015192360A true JP2015192360A (ja) 2015-11-02
JP6331574B2 JP6331574B2 (ja) 2018-05-30

Family

ID=52669444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014069111A Active JP6331574B2 (ja) 2014-03-28 2014-03-28 情報処理装置、並列計算機システムおよび並列計算機システムの制御方法

Country Status (3)

Country Link
US (1) US9619347B2 (ja)
EP (1) EP2924583B1 (ja)
JP (1) JP6331574B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6442974B2 (ja) * 2014-10-20 2018-12-26 富士通株式会社 情報処理装置および情報処理システム
JP2017175243A (ja) * 2016-03-22 2017-09-28 富士ゼロックス株式会社 通信装置
US11520653B2 (en) * 2020-10-15 2022-12-06 Nxp Usa, Inc. System and method for controlling faults in system-on-chip

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007159063A (ja) * 2005-12-08 2007-06-21 Nec Corp ネットワークコントローラの障害処理装置、リンク障害時パケット転送システムおよび方法
US20100162033A1 (en) * 2008-12-22 2010-06-24 Kye-Hyun Ahn Ethernet apparatus capable of lane fault recovery and methods for transmitting and receiving data
US20110320881A1 (en) * 2010-06-24 2011-12-29 International Business Machines Corporation Isolation of faulty links in a transmission medium
WO2013125621A1 (ja) * 2012-02-22 2013-08-29 日本電信電話株式会社 マルチレーン伝送装置及びマルチレーン伝送方法
WO2013145240A1 (ja) * 2012-03-29 2013-10-03 富士通株式会社 情報処理装置及び情報処理装置制御方法
US20140078894A1 (en) * 2012-09-17 2014-03-20 Electronics And Telecommunications Research Institute Lane fault recovery apparatus and method

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2503888B2 (ja) 1993-06-30 1996-06-05 日本電気株式会社 移動無線通信におけるデ―タ伝送方式
JP4079940B2 (ja) 2004-12-27 2008-04-23 エヌイーシーコンピュータテクノ株式会社 データ伝送方式及び方法
US8332729B2 (en) 2008-09-29 2012-12-11 Oracle International Corporation System and method for automatic communication lane failover in a serial link
US8677176B2 (en) 2010-12-03 2014-03-18 International Business Machines Corporation Cable redundancy and failover for multi-lane PCI express IO interconnections
US9077624B2 (en) * 2012-03-07 2015-07-07 International Business Machines Corporation Diagnostics in a distributed fabric system
JP6069897B2 (ja) 2012-06-05 2017-02-01 富士通株式会社 データ伝送装置、およびデータ伝送方法
US9325449B2 (en) * 2013-12-06 2016-04-26 Intel Corporation Lane error detection and lane removal mechanism to reduce the probability of data corruption

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007159063A (ja) * 2005-12-08 2007-06-21 Nec Corp ネットワークコントローラの障害処理装置、リンク障害時パケット転送システムおよび方法
US20100162033A1 (en) * 2008-12-22 2010-06-24 Kye-Hyun Ahn Ethernet apparatus capable of lane fault recovery and methods for transmitting and receiving data
US20110320881A1 (en) * 2010-06-24 2011-12-29 International Business Machines Corporation Isolation of faulty links in a transmission medium
WO2013125621A1 (ja) * 2012-02-22 2013-08-29 日本電信電話株式会社 マルチレーン伝送装置及びマルチレーン伝送方法
WO2013145240A1 (ja) * 2012-03-29 2013-10-03 富士通株式会社 情報処理装置及び情報処理装置制御方法
US20140078894A1 (en) * 2012-09-17 2014-03-20 Electronics And Telecommunications Research Institute Lane fault recovery apparatus and method

Also Published As

Publication number Publication date
JP6331574B2 (ja) 2018-05-30
US9619347B2 (en) 2017-04-11
EP2924583B1 (en) 2017-01-25
EP2924583A1 (en) 2015-09-30
US20150278043A1 (en) 2015-10-01

Similar Documents

Publication Publication Date Title
US11620175B2 (en) Method and apparatus for disconnecting link between PCIe device and host
WO2019056899A1 (zh) Oam消息传输方法、传输设备及存储介质
US10348616B2 (en) Packet transmission method and apparatus, and interconnect interface
CN104620542A (zh) 具有灵活数据速率的控制器局域网
JP5977437B2 (ja) バスシステムの加入者局、及び、バスシステムの加入者間でメッセージを伝送する方法
US10419035B2 (en) Use of multiple cyclic redundancy codes for optimized fail isolation
US20130003751A1 (en) Method and system for exponential back-off on retransmission
JP6331574B2 (ja) 情報処理装置、並列計算機システムおよび並列計算機システムの制御方法
WO2007002892A1 (en) Data packet reconstruction in link-based interconnects with retransmission
US20140108878A1 (en) Method, Apparatus, and System for Retransmitting Data Packet in Quick Path Interconnect System
EP2157723B1 (en) Data retransmission method and system
EP2391042B1 (en) Efficient error handling on a link using ARQ and multiple NACKs associated with multiple error thresholds
WO2014091663A1 (en) Detecting and isolating dropped or out-of-order packets in communication networks
JP2013009045A (ja) 伝送システム、伝送装置および伝送装置の制御方法
JP6458494B2 (ja) 情報処理装置、情報処理システムおよび通信装置
TW201512832A (zh) 快照訊息技術
CN109039761B (zh) 集群控制通道中故障链路处理方法和装置
CN107332697B (zh) 一种故障检测方法及装置
JP2012085244A (ja) シリアル伝送装置、情報処理装置、及びシリアル伝送方法
KR100995621B1 (ko) 에러 제어 장치
WO2017000737A1 (zh) 一种传输校验方法、节点、系统与计算机存储介质
US9755888B2 (en) Information processing device, information processing system, and communication device
US20100208581A1 (en) Data transfer system, data transmitting device, data receiving device and data transfer method
JP2016052074A (ja) 通信装置
JP2021144614A (ja) インタフェース制御装置、情報処理システムおよびインタフェース制御装置の制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161206

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20170803

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20170803

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20170804

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171129

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20180214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20180219

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20180219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180403

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180416

R150 Certificate of patent or registration of utility model

Ref document number: 6331574

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150