JP5900115B2 - 情報処理装置、演算装置、及び情報処理装置の制御方法 - Google Patents

情報処理装置、演算装置、及び情報処理装置の制御方法 Download PDF

Info

Publication number
JP5900115B2
JP5900115B2 JP2012082847A JP2012082847A JP5900115B2 JP 5900115 B2 JP5900115 B2 JP 5900115B2 JP 2012082847 A JP2012082847 A JP 2012082847A JP 2012082847 A JP2012082847 A JP 2012082847A JP 5900115 B2 JP5900115 B2 JP 5900115B2
Authority
JP
Japan
Prior art keywords
terminals
unit
upper layer
pair
arithmetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012082847A
Other languages
English (en)
Other versions
JP2013214809A (ja
Inventor
吉朗 池田
吉朗 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012082847A priority Critical patent/JP5900115B2/ja
Priority to US13/751,249 priority patent/US9117034B2/en
Priority to CN2013100375582A priority patent/CN103368931A/zh
Publication of JP2013214809A publication Critical patent/JP2013214809A/ja
Application granted granted Critical
Publication of JP5900115B2 publication Critical patent/JP5900115B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4022Coupling between buses using switching circuits, e.g. switching matrix, connection or expansion network
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B9/00Safety arrangements
    • G05B9/02Safety arrangements electric
    • G05B9/03Safety arrangements electric with multiple-channel loop, i.e. redundant control systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/42Loop networks
    • H04L12/437Ring fault isolation or reconfiguration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/54Store-and-forward switching systems 
    • H04L12/56Packet switching systems
    • H04L12/5691Access to open networks; Ingress point selection, e.g. ISP selection
    • H04L12/5692Selection among different networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/66Arrangements for connecting between networks having differing types of switching systems, e.g. gateways

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Automation & Control Theory (AREA)
  • Small-Scale Networks (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

開示の技術は、情報処理装置、演算装置及び情報処理装置の制御方法に関する。
情報処理システムに含まれる複数の情報処理装置の間を接続する接続方式として、情報処理装置の間を外付けの専用ルータを介して接続する間接接続方式と、情報処理装置同士を直接接続する直接接続方式が知られている。直接接続方式では、複数の情報処理装置が、演算を行う情報処理装置の各々と通信を行うルータ部を各々備え、通信網(直接網)を介して相互に接続されている。
また、情報処理装置同士の通信における通信プロトコルは一例として図21に示すように階層化されている。
特開平11−328134号公報
ところで、情報処理装置内部の直接接続方式で相互に接続された複数の演算装置は、パケットを送信する送信ノード及びパケットを受信する受信ノードとして機能する。また、演算装置はパケットを中継する中継ノードとしても機能する。この中継ノードとして機能する場合、演算装置は、一例として図22に示すように、送信ノードから送信されたパケットをデータリンク層に取り込み、取り込んだパケットに含まれる宛先に基づいて転送先を決定する、というデータリンク層レベルの処理を行う。そして、クロスバースイッチに対してスイッチング制御を行うことで、転送先である受信ノードに対してパケットを転送することでパケットの中継を行う。
しかしながら、演算装置が中継ノードとして機能する場合、パケットをデータリンク層まで取り込み、パケットに含まれる宛先の読み込みやパケットのエラーチェックなどのデータリンク層レベルの処理を行う。そのため、その分だけ通信に要する時間が長くなってしまう、という問題点があった。
1つの側面では、本発明は、情報処理装置内の1個以上の演算装置で中継される通信における通信時間の短縮を図ることが目的である。
他の側面では、本発明は、演算装置内の1個以上のコアで中継される通信における通信時間の短縮を図ることが目的である。
開示の技術は、通信路を介して互いに接続される複数の演算装置と前記複数の演算装置を制御する制御装置とを有する情報処理装置において、前記演算装置が、前記通信路にそれぞれ接続された複数の端子を有する。また、前記演算装置は、前記複数の端子の何れかと接続可能な内部経路を介して通信規約上の物理層よりも上位層の通信を行う通信部を有する。また、前記演算装置は、前記複数の端子の何れか一対を接続可能なバイパス部を有する。また、前記演算装置は、上位層使用状態と上位層不使用状態とを切り替える各端子に設けられた切替部を有する。上位層使用状態とは、例えば前記通信部による前記複数の端子の何れかと対応する内部経路と通信を行うが、前記バイパス部による対応する前記複数の端子の何れか一対の接続を行わない状態を指す。上位層不使用状態とは、例えば前記通信部による前記複数の端子の何れかと対応する内部経路との通信を行わないが、前記バイパス部による対応する前記複数の端子の何れか一対の接続を行う状態を指す。また、前記演算装置は、前記制御装置から入力される制御情報に基づいて、前記各端子に設けられた切替部を、前記上位層使用状態と前記上位層不使用状態との何れかにそれぞれ制御する制御部を有する。そして、前記制御装置は、各演算装置の前記制御部に対して前記制御情報を出力する。
開示の技術の情報処理装置において、演算装置は、該演算装置に含まれる部位の故障を検出する検出部を更に含む。制御装置は、複数の演算装置のうち検出部によって故障が検出された演算装置の制御部に対して、該故障が検出された部位に関連する端子に対応する切替部が上位層不使用状態に切替わるように制御する。通信部は、端子毎に対応して設けられ、対応する端子から内部経路経由での情報の授受を司る複数のインタフェース部を更に含む。検出部は、端子毎のインタフェース部の故障を検出し、制御装置は、複数の演算装置のうち検出部によって故障が検出された演算装置の制御部に対して、該故障が検出されたインタフェース部に関連する端子に対応する切替部が上位層不使用状態に切替わるように制御する。
1つの側面では、本発明は、情報処理装置内の1個以上の演算装置で中継される通信における通信時間の短縮を図ることができる、という効果を有する。
他の側面では、本発明は、演算装置内の1個以上のコアで中継される通信における通信時間の短縮を図ることが目的である。
実施形態に係る情報処理装置の構成の一例を示す概略構成図である。 実施形態に係る情報処理装置に含まれる演算装置の構成の一例を示す概略構成図である。 実施形態に係る情報処理装置の要部機能の一例を示すブロック図である。 実施形態に係るサービスプロセッサの電気系の構成の一例を示すブロック図である。 実施形態に係るサービスプロセッサに含まれる演算負担割当DBの構成の一例を示す模式図である。 実施形態に係るコントローラの電気系の構成の一例を示すブロック図である。 実施形態に係る供給処理の流れの一例を示すフローチャートである。 実施形態に係る切替制御処理の流れの一例を示すフローチャートである。 実施形態に係る切替制御処理が行われることで得られる作用及び効果の一例を示す模式図である。 実施形態に係る切替制御処理が行われることでポート間が物理層レベルで接続された態様の一例を示す概略構成図である。 実施形態に係る切替制御処理が行われることでポート間が上位層レベル(データリンク層レベル)で接続された態様の一例を示す概略構成図である。 実施形態に係る並列演算部にトーラス・ネットワークが形成された場合の態様の一例を示す概略構成図である。 実施形態に係る並列演算部にハイパーキューブ・ネットワークが形成された場合の態様の一例を示す概略構成図である。 実施形態に係る並列演算部の変形例を示す概略構成図である。 図14に示す並列演算部に含まれる演算装置の要部構成の一例を示す概略構成図である。 図14に示す並列演算部にメッシュ・トーラス・ネットワークが形成された場合の態様の一例が示す概略構成図である。 図16に示すメッシュ・トーラス・ネットワークが形成された並列演算部に含まれる演算装置の要部構成の一例を示す概略構成図である。 データリンク層からアプリケーション層の直下の層までを省電力化対象としたことを示す模式図である。 データリンク層からアプリケーション層の直下の層までを省電力化対象としたことに加え、物理層に含まれるRS層も省電力化対象としたことを示す模式図である。 データリンク層からアプリケーション層の直下の層までを省電力化対象としたことに加え、物理層に含まれるPMA層からRS層までも省電力化対象としたことを示す模式図である。 通信規約上の階層の一例を示す模式図である。 パケットを送信するノード(パケット送信ノード)、パケットを受信するノード(パケット受信ノード)及びパケットを中継するノード(中継ノード)の従前の一例を示す模式図である。
以下、図面を参照して開示の技術の実施形態の一例を詳細に説明する。なお、以下の説明では、複数の演算装置で1つのタスクを動作させる並列演算を行う情報処理装置を例に挙げて説明するが、開示の技術に係る演算装置は、これに限定されるものではない。開示の技術は、例えば、1台以上の演算装置が搭載された携帯型又は据置型のパーソナル・コンピュータ(PC)などにも適用可能である。また、以下の説明では、システムボードに設けられた複数の演算装置間を接続する場合を例に挙げて説明するが、開示の技術は、これに限定されるものではない。例えば、表1に示すようにチップ内のコア間接続(Network On Chip)や、各々演算装置が搭載された複数のシステムボード間での接続などを行う場合にも適用可能である。
図1には、本実施形態に係る情報処理システム10の要部構成の一例が概略的に示されている。情報処理システム10は、制御装置としてのサービスプロセッサ12及び情報処理装置14を備えている。サービスプロセッサ12は、情報処理システム10全体を制御する。例えば、サービスプロセッサ12は、インターネットやLAN(Local Area Network)などを介して外部装置(例えばPC(Personal Computer))に接続されており、外部装置の要求に応じた処理を情報処理装置14に対して実行させる。そして、情報処理装置14による処理の実行結果を外部装置に出力する。情報処理装置14は、マトリクス状に配置された複数の演算ノードとしての演算装置16を備えている。なお、本実施形態では、情報処理装置14における演算装置16の位置を、一例として図1に示すように、X軸とY軸を有する二次元座標を利用して特定する例を挙げて説明する。また、本実施形態では、複数の演算装置16の一例として、8行8列(X軸方向8台×Y軸方向8台)に配置された64台の演算装置16がシステムボード(図示省略)に設けられている。そのため、演算装置16の位置を特定するX座標及びY座標の各々は0〜7の整数値で表現することができる。
複数の演算装置16の各々は、通信線18を介して隣接する演算装置16と接続されており、通信線18を介して隣接する演算装置16と通信可能とされている。なお、本実施形態では、説明の便宜上、一例として複数の演算装置16の各々が2本の通信線18を介して隣接する演算装置16と接続されている態様を挙げているが、開示の技術はこれに限定されるものではない。例えば、複数の演算装置16の各々は、1本又は3本以上の通信線18を介して隣接する演算装置16と接続されていてもよい。
図2には、図1に示す破線円形枠で囲まれた演算装置16の要部構成の一例が示されている。図2に示すように、演算装置16は、処理を実行する演算処理装置としてのCPU(Central Processing Unit)20と、メモリ21と、他の演算装置16との情報の送受信を司るルータ部22と、を含んで構成されている。CPU20は、OSI基本参照モデルでのトランスポート層(第4層)からアプリケーション層(第7層)までの通信を担っている。ルータ部22は、OSI基本参照モデルでの物理層(第1層)からネットワーク層(第3層)までの通信を担っている。
メモリ21は、各種プログラムの実行時のワークエリア等として用いられる記憶媒体であるRAM領域と電源スイッチが切られても保持する必要がある各種情報を記憶する不揮発性の記憶媒体であるROM領域と、を有し、CPU20によって用いられる。
ルータ部22は、隣接する他の演算装置16と2本の通信線18を介して通信可能に接続されており、サービスプロセッサ12とは通信線24を介して通信可能に接続されている。ルータ部22は、複数のポート26、コントローラ28、開示の技術に係るバイパス部の一例であるバイパス線29、開示の技術に係る通信部の一例であるクロスバースイッチ30及びパケット送受信部32を備えている。
複数のポート26の各々は、通信線18を介して他の演算装置16に接続されており、他の演算装置16から送信された情報を取り込む入力ポートとして機能すると共に、他の演算装置16へ情報を送信する出力ポートとして機能する。本実施形態では、複数のポート26の一例として1台の演算装置16につき8個のポート26を備えている。図2に示す例では、8個のポート26は、クロスバースイッチ30を挟んで、X軸方向及びY軸方向の両端部に2個ずつ配置されており、隣り合う2個で一対を成している。そして、バイパス線29が、対を成すポート26間を接続している。
コントローラ28は、サービスプロセッサ12の制御下でルータ部22全体の動作を制御する。コントローラ28には、複数のポート26の各々、クロスバースイッチ30及びパケット送受信部32が個別に接続されている。従って、コントローラ28は、複数のポート26の各々、クロスバースイッチ30及びパケット送受信部32の監視及び制御を行うことができる。
クロスバースイッチ30は、X軸に略平行な複数の通信路(図示省略)及びY軸に略平行な複数の通信路(図示省略)と、X軸に平行な通信路とY軸に平行な通信路の交点に各々設けられたスイッチ(図示省略)と、を有している。そして、これらのスイッチの動作が制御されることで情報の転送先を切替える。本実施形態に係るクロスバースイッチ30には、複数のポート26、コントローラ28及びパケット送受信部32が接続されている。従って、複数のポート26、コントローラ28及びパケット送受信部32はクロスバースイッチ30を介して相互に情報の授受を行うことができる。
パケット送受信部32は、CPU20に接続されており、CPU20の指示に従ってパケットを生成してクロスバースイッチ30へ送り出す。また、パケット送受信部32は、何れかのポート26及びクロスバースイッチ30を介して他の演算装置16から送信されたパケットを受信し、受信したパケットから特定の情報を抽出し、抽出した情報をCPU20の要求に応じてCPU20へ提供する。
図3には、図2に示す破線円形枠で囲まれたポート26の要部構成の一例、並びにサービスプロセッサ12及びコントローラ28の要部機能の一例が示されている。図3に示すように、ポート26は、端子34と、開示の技術に係る切替部の一例であるセレクタ36と、開示の技術に係るインタフェース部の一例である論理回路38と、ポート制御用レジスタ40と、を含んでいる。端子34は、通信線18Aを介して隣接する他の演算装置16の端子34と接続されている。
セレクタ36は端子34毎に設けられており、上位層使用状態と上位層不使用状態とに切替可能である。ここで言う「上位層使用状態」とは、例えば論理回路38による複数の端子34の何れかと対応する通信線37(後述)と通信を行うが、バイパス線29による対応する複数の端子34の何れか一対の接続を行わない状態を指す。より詳しくは、例えば、対応する端子34と論理回路38とを接続し且つ対応する端子34とバイパス線29とを切断した状態を指す。また、ここで言う「上位層不使用状態」とは、例えば論理回路38による複数の端子34の何れかと対応する通信線37と通信を行わないが、バイパス線29による対応する複数の端子34の何れか一対の接続を行う状態を指す。より詳しくは、例えば対応する端子34と論理回路38とを切断し且つ対応する端子34とバイパス線29とを接続した状態を指す。
セレクタ36は、単極双投スイッチ42を備えている。単極双投スイッチ42の共通接点42Aは端子34に接続されている。単極双投スイッチ42のノーマリーオープンとされるa接点42Bはバイパス線29の一端に接続されている。なお、バイパス線29の他端は、図3に示すポート26と対を成すポート26に含まれるセレクタ26における単極双投スイッチ42のa接点42Bに接続されている。
単極双投スイッチ42のノーマリークローズとされるb接点42Cは、開示の技術に係る内部経路の一例である通信線37の一端に接続されている。なお、通信線37の他端は論理回路38に接続されている。
論理回路38は、端子34毎に対応して設けられており、対応する端子34とコントローラ28との間の情報の授受、及び、対応する端子34とパケット送受信部32との間の情報の授受を司る。論理回路38が行う処理には、例えば、セレクタ36を介して他の演算装置16から送信されたパケットを受信し、受信したパケットに対してヘッダ解析及びエラーチェックなどのデータリンク層レベルの一部の処理が含まれる。そして、所定処理を行ったパケットをクロスバースイッチ30を介してパケット送受信部32へ送信する。
ポート制御用レジスタ40はコントローラ28に接続されている。従って、コントローラ28は、ポート制御部レジスタ40における設定レジスタの値を変更することができる。また、ポート制御用レジスタ40はセレクタ36にも接続されており、セレクタ36の単極双投スイッチ42の動作は、ポート制御部レジスタ40における設定レジスタの値に従って制御される。例えば、ポート制御用レジスタ40の設定レジスタの値が“0”の場合は単極双投スイッチ42のb接点42Cが閉じられ、ポート制御用レジスタ40の設定レジスタの値が“1”の場合は単極双投スイッチ42のa接点42Bが閉じられる。また、論理回路38は、受電制御スイッチ(図示省略)を有している。この受電制御スイッチは、オンされると論理回路38に対して電力の供給が行われ、オフされると論理回路38に対しての電力の供給が停止される。受電制御スイッチのオン及びオフの切替は、ポート制御部レジスタ40における設定レジスタの値に従って制御される。例えば、ポート制御用レジスタ40の設定レジスタの値が“0”の場合は受電制御スイッチがオンされ、ポート制御用レジスタ40の設定レジスタの値が“1”の場合は受電制御スイッチがオフされる。
コントローラ28は、制御部44及び検出部46を備えている。制御部44は、サービスプロセッサ12から入力される開示の技術に係る制御情報(一例として後述の上位層使用指示情報及び上位層不使用指示情報)に基づいて、各端子34に設けられたセレクタ36を、上位層使用状態と上位層不使用状態との何れかに制御する。例えば、一対のポート26の各々に含まれる端子34(一対の端子34)間を物理層レベルで接続する場合に一対の端子34の何れかに各々対応する一対のセレクタ36が上位層不使用状態に切替わるようにセレクタ36を制御する。より詳しくは、例えば、物理層レベルで接続する一対の端子34を指示する上位層不使用指示情報が供給された場合、上位層不使用指示情報により指示された一対の端子34の何れかに各々対応する一対のセレクタ36が上位層不使用状態に切替わるように制御する。この場合のセレクタ36を制御する構成の一例として、本実施形態では、ポート制御用レジスタ40の設定レジスタの値を“1”に設定することでセレクタ36を制御している。
また、制御部44は、一対の端子34を論理回路28に各々接続する場合に一対の端子34の何れかに各々対応する一対のセレクタ36が上位層使用状態に切替わるようにセレクタ36を制御する。例えば、論理回路38に接続する一対の端子34を指示する上位層使用指示情報が供給された場合、上位層使用指示情報により指示された一対の端子34の何れかに各々対応する一対のセレクタ36が上位層使用状態に切替わるように制御する。この場合のセレクタ36を制御する構成の一例として、本実施形態では、ポート制御用レジスタ40の設定レジスタの値を“0”に設定することでセレクタ36を制御している。
検出部46は、クロスバースイッチ30及び論理回路38を含むデータリンク層の接続を担う回路素子の少なくとも1つの故障を検出する。なお、本実施形態では、クロスバースイッチ30及び論理回路38の少なくとも1つの故障を検出する。
制御部44は、クロスバースイッチ30及び論理回路38の少なくとも1つの故障が検出部46によって検出された場合に、故障が検出された対象を有するポート26の端子34と、この端子34と対を成す端子34との間を物理層レベルで接続する。
また、制御部44は、クロスバースイッチ30及び論理回路38の少なくとも1つの故障が検出部46によって検出された場合に、故障が検出された対象の消費電力が抑制されるように制御する。例えば、故障が検出された対象が論理回路38の場合は、ポート制御用レジスタ40の設定レジスタの値を“1”に設定する。
サービスプロセッサ12は、供給部48を備えている。供給部48は、各演算装置16の制御部44に対して開示の技術に係る制御情報を出力する。例えば、複数の演算装置16の各々の制御部44に対して上位層不使用指示情報及び上位層使用指示情報を選択的に供給する。この場合、上位層不使用指示情報は、物理層レベルで接続する一対の端子34のうちの少なくとも一方を特定する開示の技術に係る第1特定情報を含む。また、上位層不使用指示情報は、論理回路38に接続する一対の端子34のうちの少なくとも一方を特定する開示の技術に係る第2特定情報を含む。
制御部44は、供給部48によって上位層不使用指示情報が供給された場合、上位層不使用指示情報に含まれる第1特定情報に従って特定された一対の端子34の何れかに各々対応する一対のセレクタ36が上位層不使用状態に切替わるように制御する。また、制御部44は、供給部48によって上位層使用指示情報が供給された場合、上位層使用指示情報に含まれる第2特定情報に従って特定された一対の端子34の何れかに各々対応する一対のセレクタ36が上位層使用状態に切替わるように制御する。
図4には、サービスプロセッサ12の電気系の要部構成の一例が示されている。図4に示すように、サービスプロセッサ12は、CPU50、メモリ52及び不揮発性の記憶部54を備え、これらはアドレスバスやシステムバス等を含んで構成されたバス56を介して互いに接続されている。なお、記憶部54は、HDD(Hard Disk Drive)やフラッシュメモリなどによって実現できる。記憶媒体としての記憶部54には、供給処理プログラム57及び演算負担割当DB(データベース)58(後述)が記憶されている。
CPU50は、記憶部54から供給処理プログラム57を読み出してメモリ52に展開し、供給処理プログラム57が有するプロセスを順次実行する。供給処理プログラム57は、供給プロセス60を有する。CPU50は、供給プロセス60を実行することで、図3に示す供給部48として動作する。
なお、ここでは供給処理プログラム57を記憶部54から読み出す場合を例示したが、必ずしも最初から記憶部54に記憶させておく必要はない。例えば、サービスプロセッサ12に接続されて使用されるフレキシブルディスク、いわゆるFD、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの任意の「可搬型の物理媒体」に先ずは供給処理プログラム57を記憶させておいてもよい。そして、サービスプロセッサ12がこれらの可搬型の物理媒体から供給処理プログラム57を取得して実行するようにしてもよい。また、インターネットやLANなどを介してサービスプロセッサ12に接続される他のコンピュータまたはサーバ装置などに供給処理プログラム57を記憶させておき、サービスプロセッサ12がこれらから供給処理プログラム57を取得して実行してもよい。
図5には、演算負担割当DB58の構成の一例が示されている。図5に示すように、演算負担割当DB58は、情報処理装置14において演算を行わせる(負担させる)演算装置16、検出部46で故障が検出されたポート26、及び検出部46で故障が検出されなかったポート26を特定するために用いるDBである。演算負担割当DB58は、情報処理装置14に含まれる全ての演算装置16の各々を特定する座標値が登録されている。また、演算負担割当DB58は、各座標値毎に、対応する座標値により特定される演算装置16が演算を行わせる対象として指定されているか否かを示す演算負担指定値が設定されている。本実施形態では、演算装置16が演算を行わせる対象として指定されていることを示す演算負担指示値の一例として“1”を、演算装置16が演算を行わせる対象として指定されていないことを示す演算負担指示値の一例として“0”を各々用いている。
また、演算負担割当DB58は、各座標値毎に、対応する座標値により特定される演算装置16が有するポート26を特定するポートIDが設定されている。また、演算負担割当DB58は、ポートID毎に、対応するポートIDにより特定されるポート26の故障の有無を特定する故障特定値が設定されている。本実施形態では、ポート26の故障が有ることを特定する故障特定値の一例として“1”を、ポート26の故障が無いことを特定する故障特定値の一例として“0”を各々用いている。
なお、演算負担割当DB58は、情報処理装置14に対して演算を行わせる前に作成され、その内容は、処理対象情報の量や要求される処理時間などによって異なる。例えば、1台の演算装置16で間に合う処理内容であれば、演算負担割当DB58の演算負担指定値として“1”が割り当てられる座標値は1個である。逆に、全ての演算装置16を使用することが望ましい処理内容であれば、演算負担割当DB58の演算負担指定値として“1”が割り当てられる座標値は最大で64個である。
また、本実施形態では、全ての演算装置16の各々の検出部46での検出結果に基づいて、当初使用を予定していた演算装置16が使用不可能であることが判明した場合、演算負担割当DB58の内容が変更される可能性がある。例えば、当初使用を予定していた1台の演算装置16における全てのポート26で故障が検出された場合にその演算装置16に割り当てられた演算負担指定値が“0”に変更される。そして、少なくとも一対のポート26で故障が検出されていない演算装置16であって、現時点で演算負担指定値が“0”に設定されている演算装置16が存在する場合、そのうちの1台の演算装置16の演算負担指定値が“1”に変更される。なお、この場合、全てのポート26で故障が検出されていない演算装置16から優先的に演算負担指定値が“1”に変更されるようにしてもよい。
図6には、コントローラ28の電気系の要部構成の一例が示されている。図6に示すように、コントローラ28は、CPU62、メモリ64及び不揮発性の記憶部66を備え、これらはアドレスバスやシステムバス等を含んで構成されたバス68を介して互いに接続されている。なお、記憶部66は、HDDやフラッシュメモリなどによって実現できる。記憶媒体としての記憶部66には、切替制御処理プログラム70が記憶されている。
CPU62は、記憶部66から切替制御処理プログラム70を読み出してメモリ64に展開し、切替制御処理プログラム70が有するプロセスを順次実行する。切替制御処理プログラム70は、制御プロセス72を有する。CPU62は、制御プロセス72を実行することで、図3に示す制御部44として動作する。CPU62は、検出プロセス74を実行することで、図3に示す検出部46として動作する。
なお、ここでは切替制御処理プログラム70を記憶部66から読み出す場合を例示したが、必ずしも最初から記憶部66に記憶させておく必要はない。例えば、コントローラ28に接続されて使用されるフレキシブルディスク、いわゆるFD、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの任意の「可搬型の物理媒体」に先ずは切替制御処理プログラム70を記憶させておいてもよい。そして、コントローラ28がこれらの可搬型の物理媒体から切替制御処理プログラム70を取得して実行するようにしてもよい。また、インターネットやLANなどを介してコントローラ28に接続される他のコンピュータまたはサーバ装置などに切替制御処理プログラム70を記憶させておき、コントローラ28がこれらから切替制御処理プログラム70を取得して実行するようにしてもよい。
次に本実施形態の作用として、CPU50が供給処理プログラム57を実行することでサービスプロセッサ12で行われる供給処理について、図7を参照して説明する。図7には情報処理装置10に対して電源投入がされた際に行われる供給処理が示されている。
ステップ104では、供給部48により、全ての演算装置16から後述するステップ164で送信された検査結果情報を受信したか否かが判定される。ここで言う「検査結果情報」とは、例えば演算装置16の検出部44での検出結果に相当する情報である。すなわち、ポートID毎に特定されるポート26の故障の有無を示す情報である。なお、ここでは錯綜を回避するためにポート26の故障の有無を例示しているが、CPU20やパケット送受信部32の故障の有無であってもよく、演算装置16に含まれる部位の故障であればよい。本ステップ104において、全ての演算装置16から検査結果情報を受信した場合は判定が肯定されてステップ106へ移行する。本ステップ104において、全ての演算装置16から検査結果情報を受信していない場合は判定が否定されて再びステップ104の判定が行われる。このように供給部48によって検査結果情報が取得されると、例えば後述のメッシュ・ネットワーク、ハイパーキューブ・ネットワーク又はメッシュ・トーラス・ネットワークなどの接続形態が決定される。そして、供給部48は、決定された接続形態に最適な形で、かつ、故障により使用できない演算装置16やポート26などを回避するように各演算装置16にジョブを割り当てる(演算負担割当DB58の演算負担指定値を設定する)。
ステップ106では、供給部48により、上記のステップ104で受信された検査結果情報に基づいて故障しているポート26が存在しているか否かが判定される。本ステップ106において、故障しているポート26が存在している場合は判定が肯定されてステップ107へ移行する。本ステップ106において、故障しているポート26が存在していない場合は判定が否定されてステップ116へ移行する。
ステップ107では、供給部48により、上記のステップ104で受信された検査結果情報に従って演算負担担当DB58が変更される。例えば、検査結果情報に含まれているポートIDにより特定されるポート26が故障しているにも拘らず、演算負担担当DB58における対応するポートIDには故障有無特定値として“0”が割り当てられている場合、故障有無特定値が“1”に変更される。逆に、検査結果情報に含まれているポートIDにより特定されるポート26が故障していないにも拘らず、演算負担担当DB58における対応するポートIDには故障有無特定値として“1”が割り当てられている場合、故障有無特定値が“0”に変更される。
次のステップ108では、供給部48により、上記のステップ100で取得された演算負担割当DB58に基づいて、故障しているポート26が演算処理で使用するポート26であるか否かが判定される。本ステップ108において、故障しているポート26が演算処理で使用するポート26である場合は判定が肯定されてステップ109へ移行する。本ステップ108において、故障しているポート26が演算処理で使用するポート26でない場合は判定が否定されてステップ116へ移行する。
ステップ109において、供給部48により、上記のステップ107で変更された演算負担割当DB58に基づいて、演算処理を代替させることが必要な演算装置16が存在しているか否かが判定される。すなわち、全てのポート26が故障している演算装置16が存在しているか否かが判定される。本ステップ109において、演算処理を代替させることが必要な演算装置16が存在していない場合は判定が否定されてステップ116へ移行する。本ステップ109において、演算処理を代替させることが必要な演算装置16が存在している場合は判定が肯定されてステップ110へ移行する。
ステップ110では、上記のステップ107で変更された演算負担割当DB58に基づいて、少なくとも一対のポート26が故障していない代替可能な演算装置16が存在しているか否かが判定される。本ステップ110において、代替可能な演算装置16が存在している場合は判定が肯定されてステップ112へ移行する。本ステップ110において、代替可能な演算装置16が存在していない場合は判定が否定されてステップ114へ移行する。ステップ114では、供給部48により、エラー処理が行われた後、本供給処理を終了する。ここで言う「エラー処理」の一例としては、演算処理を行うことが困難であること(例えばアラート)を通知支援デバイス(例えばサービスプロセッサ12に接続されたディスプレイ)を介して利用者に通知する処理が挙げられる。
ステップ112では、供給部48により、上記のステップ107で変更された演算負担割当DB58が更に変更される。すなわち、供給部48は、演算負担割当DB58に含まれる演算負担指定値のうちの、予め定められたルールに従って代替可能な演算装置16として指定された演算装置16に対応する演算負担指定値を“1”に変更する。また、代替元の演算負担指定値を“0”に変更する。
ステップ116では、供給部48により、現時点で取得されている演算負担割当DB58に基づいて上位層不使用指示情報及び上位層使用指示情報(以下、区別して説明する必要がない場合は「指示情報」という)が生成される。すなわち、演算負担指定値として“1”が設定されている座標値、この座標値に割り当てられているポートIDであって故障有無特定値として“1”が割り当てられたポートID、及びこのポートIDと対を成すポートIDを含む上位層不使用指示情報が生成される。また、演算負担指定値として“1”が設定されている座標値、及びこの座標値に割り当てられているポートIDであって上位層不使用指示情報に含まれなかった故障有無特定値が割り当てられたポートIDを含む上位層使用指示情報が生成される。なお、上記の「ポートIDと対を成すポートID」とは、ポートIDにより特定されるポート26と対を成すポート26を特定するポートIDのことを意味する。また、ここでは、上位層不使用指示情報に含まれるポートIDは開示の技術に係る第1特定情報の一例であり、上位層使用指示情報に含まれるポートIDは開示の技術にかかる第2特定情報の一例である。
次のステップ118では、供給部48により、上記のステップ116で生成された指示情報に含まれる座標値により特定される演算装置16に対して、上記のステップ116で生成された指示情報が送信される。本ステップ118の処理が行われた後、CPU62は本供給処理を終了する。
次に、CPU62が切替制御処理プログラム70を実行することにより、コントローラ28で行われる切替制御処理について、図8を参照して説明する。なお、以下では、上位層不使用指示情報及び上位層使用指示情報を区別して説明する必要がない場合は「指示情報」と称する。
図8に示す切替制御処理では、先ず、ステップ152において、検出部46により、故障検査対象とされているポート26であって、今回の切替制御処理において本ステップ152で未だに検査信号の送信先とされていない1つのポート26を送信先として検査信号が送信される。なお、ここでは「故障検出対象とされているポート26」の一例としてルータ部22に含まれる全てのポート26を採用している。そのため、検出部46は、全てのポート26の論理回路38を送信先として個別にクロスバースイッチ30を介して検査信号を送信する。故障していない論理回路38は、検査信号を受信すると、故障していないことを示す応答信号をクロスバースイッチ30を介して検出部46へ送信する。この場合、検出部46は、コントローラ28から論理回路38までの経路が故障していなければ応答信号を受信することができる。逆に、故障している論理回路38は、検査信号を受信できないか、受信したとしても上記の応答信号をクロスバースイッチ30を介して検出部46へ送信することができないため、検出部46は応答信号を受信することができない。また、コントローラ28から論理回路38までの経路が故障していれば、検査信号が論理回路38に届かないという事態や応答信号がコントローラ28に届かなないという事態が生じる。この場合も検出部46は事前に想定する応答信号を受信することができない。
そこで、次のステップ154では、検出部46により、検査信号の送信先とされた論理回路38から、想定通りの応答信号が受信されたか(想定通りの応答があったか)否かが判定される。本ステップ154において、想定通りの応答信号が受信された場合は判定が肯定されてステップ160へ移行する。本ステップ154において、想定通りの応答信号が受信されていない場合は判定が否定されてステップ156へ移行する。ステップ156では、検出部46により、上記のステップ152が終了してから所定時間(例えば0.01秒)を経過したか否かが判定される。本ステップ156において、所定時間を経過していない場合は判定が否定されてステップ154へ移行する。本ステップ156において、所定時間を経過した場合は判定が肯定されてステップ158へ移行する。ステップ158では、検出部46により、上記のステップ152で検査信号の送信先とされた論理回路38が属するポート26を特定するポートIDがメモリ64に記憶される。
次のステップ160では、検出部46により、故障検査対象とされている全てのポート26に対して検査信号が送信されたか否かが判定される。本ステップ160において、全てのポート26へ検査信号が送信されていない場合はステップ152へ移行する。本ステップ160において、全てのポート26へ検査信号が送信された場合はステップ162へ移行する。
ステップ162では、検出部46により、検査結果情報が生成され、メモリ64にポートIDが記憶されている場合にはメモリ64からポートIDが消去される。すなわち、メモリ64に全てのポート26に係るポートIDが記憶されている場合には、メモリ64に記憶されているポートIDにより特定されるポート26が故障していることを示す検査結果情報が生成され、メモリ64からポートIDが消去される。逆に、メモリ64にポートIDが記憶されていない場合には、全てのポート26に係るポートIDにより特定されるポート26が故障していないことを示す検査結果情報が生成される。また、メモリ64に一部のポート26に係るポートIDが記憶されている場合には、メモリ64に記憶されているポートIDにより特定されるポート26が故障しており、それ以外のポート26が故障していないことを示す検査結果情報が生成される。そして、この場合もメモリ64からポートIDが消去される。
次のステップ164では、検出部46により、上記のステップ162で生成された検査結果情報がサービスプロセッサ12に送信される。本ステップ164で送信された検査結果情報は前述したステップ104で受信される。
次のステップ166では、制御部44により、上記のステップ118で送信された指示情報を受信したか否かが判定される。本ステップ166において、指示情報を受信していない場合は判定が否定されてステップ168へ移行する。ステップ168では、制御部44により、本切替制御処理の終了条件(例えば上記のステップ164が終了してから所定時間(例えば0.1秒)を経過したとの条件)を満足したか否かが判定される。本ステップ168において、終了条件を満足した場合は判定が肯定されて本切替制御処理を終了する。本ステップ168において、終了条件を満足していない場合は判定が否定されてステップ166へ移行する。
ステップ166において、指示情報を受信した場合は判定が肯定されてステップ169へ移行する。ステップ169では、制御部44により、上記のステップ166で受信された指示情報がメモリ64に記憶される。次のステップ170では、制御部44により、上記のステップ166で全てのポート26についての指示情報が受信されたか否かが判定される。本ステップ170において、全てのポート26についての指示情報が受信されていない場合は判定が否定されてステップ166へ移行する。本ステップ170において、全てのポート26についての指示情報が受信された場合は判定が肯定されてステップ171へ移行する。
ステップ171では、制御部44により、メモリ64から1つの指示情報が取得される。次のステップ172では、上記のステップ171で取得された指示情報により特定されるポート26に含まれるセレクタ36における単極双投スイッチ42の接続先の切替を要するか否かが判定される。本ステップ172において、単極双投スイッチ42の接続先の切替を要しない場合は判定が否定されてステップ176へ移行する。本ステップ172において、単極双投スイッチ42の接続先の切替を要する場合は判定が肯定されてステップ174へ移行する。
ステップ174では、制御部44により、メモリ64に記憶された指示情報に従って、単極双投スイッチ42の接続先の切替を要するセレクタ36が制御されると共に、切替を要するセレクタ36に対応する論理回路38に対する給電が制御される。例えば、上記のステップ171で取得された指示情報が上位層不使用指示情報の場合は上位層不使用指示情報に含まれるポートIDにより特定される一対のポート26の各々のセレクタ36及び論理回路38が制御対象とされる。この場合、制御部44は、上位層不使用指示情報に含まれるポートIDにより特定される一対のポート26の各々に含まれるポート制御用レジスタ40の設定レジスタの値を“1”に設定する。これにより、上記のステップ171で取得された上位層不使用指示情報に含まれるポートIDにより特定される一対のポート26の各々に含まれるセレクタ36に含まれる単極双投スイッチ42の接続先がa接点42Bに切替えられる。また、上記のステップ171で取得された上位層不使用指示情報に含まれるポートIDにより特定される一対のポート26の各々に含まれる論理回路38の受電制御スイッチがオフされる。これにより、上記のステップ171で取得された上位層不使用指示情報に含まれるポートIDにより特定される一対のポート26の各々に含まれる論理回路38に対する電力供給が停止される。
このように、一対のポート26の各々に含まれるセレクタ36に含まれる単極双投スイッチ42の接続先がa接点42Bに切替えられると、一対のポート26の各々の端子34がバイパス線29を介して導通される。この場合、本実施形態に係る情報処理システム10は、本ステップ172を行っている制御部44を含む演算装置16を、一例として図9に示すように中継ノードとして機能させることができる。すなわち、パケット送信ノードとしての他の演算装置16から送信されたパケットを一対の端子34及びバイパス線29を素通しさせてパケット受信ノードとしての他の演算装置16で受信させることができる。この場合、中継ノードではデータリンク層やその上位層レベルの処理は行われない。従って、パケットが中継ノードの通過に要する時間が短縮される。
これに対し、上記のステップ171で取得された指示情報が上位層使用指示情報の場合は上位層使用指示情報に含まれるポートIDにより特定される一対のポート26の各々のセレクタ36及び論理回路38が制御対象とされる。この場合、制御部44は、上位層使用指示情報に含まれるポートIDにより特定される一対のポート26に含まれるポート制御用レジスタ40の設定レジスタの値を“0”に設定する。これにより、上記のステップ171で取得された上位層使用指示情報に含まれるポートIDにより特定される一対のポート26に含まれるセレクタ36の単極双投スイッチ42の接続先がb接点42Cに切替えられる。また、上記のステップ171で取得された上位層使用指示情報に含まれるポートIDにより特定される一対のポート26の各々に含まれる論理回路38の受電制御スイッチがオンされる。これにより、上記のステップ171で取得された上位層使用指示情報に含まれるポートIDにより特定される一対のポート26に含まれる論理回路38に対して電力供給が開始される。
次のステップ176では、上記のステップ169でメモリ64に記憶された指示情報の全てについて上記のステップ171が行われたか否かが判定される。本ステップ176において、メモリ64に記憶されている指示情報の全てについて上記のステップ171が行われていない場合はステップ171へ移行する。本ステップ176において、メモリ64に記憶されている指示情報の全てについて上記のステップ171が行われた場合はメモリ64から指示情報が消去されると共に判定が肯定されて本切替制御処理を終了する。
なお、上記のステップ166〜176では、説明の便宜上、一例として全てのポート26についての指示情報を確認する態様を挙げたが、必ずしも全てのポート26の各々について指示情報を確認する必要はない。どのポート26の設定をどう変えるかはサービスプロセッサ12が指示するので、各ルータ部22のコントローラ28はサービスプロセッサ12の指示に従って動作すれば済む。すなわち、制御部44は、サービスプロセッサ12から新しい物理層のバイパス設定(更新前との差分)を受信し、セレクタ36内の単極双投スイッチ42の切替が必要なポート26に対して設定の変更を指示すればよいということである。
図10には、ある演算装置16に含まれる対を成すポート26の全てが対毎に物理層レベルで接続された態様の一例が示されている。図10に示す演算装置16は、対を成すポート26の全てが対毎にバイパス線29で端子34同士が接続されている。従って、X軸方向で隣接する一方の演算装置16から送り込まれたパケットをそのまま素通ししてX軸方向に隣接する他方の演算装置16へ送り出すことができる。また、Y軸方向に隣接する一方の演算装置16から送り込まれたパケットもそのまま素通ししてY軸方向で隣接する他方の演算装置16へ送り出すことができる。
図11には、図10に示す例とは対照的な接続態様の一例として、所謂ポート・トランキング(例えばハブ同士の接続に複数のポート26を使うことでハブ同士の接続速度を高める方法)を採用した場合の一例が示されている。この場合、対を成すポート26の全てがクロスバースイッチ30に接続される。これにより、情報処理装置14には全体として所謂メッシュ・ネットワークが形成され、何れかの一対のポート26が物理層レベルで接続された場合と比較して通信帯域が広くなる。つまり、リンク(通信線18)の本数は変わらないものの、ポート・トランキングを採用しているので、例えばアプリケーション層に対して、一対のポート26が物理層レベルで接続された場合と比較して広帯域のリンクに見せることができる。
図10に示す例は、1台の演算装置16につき、対を成すポート26の全てが対毎に物理層レベルで接続された場合であるが、対を成すポート26の一部の対が物理層レベルで接続されてもよい。この場合の一例が図12及び図13に示されている。図12に示す例は、各演算装置16でのポート26間の物理層レベルでの接続を、通信線18毎に各演算装置16で互い違いに行った場合のトポロジを示している。つまり、X軸方向の演算装置16及びY軸方向の演算装置16がそれぞれ所謂リング接続され、これによって情報処理装置14には全体として所謂トーラス・ネットワークが形成される。
図13に示す例では、X軸方向に並行している4本の通信線18を一単位とした場合の各単位毎の4本の通信線18について2本おきに各演算装置16にて物理層レベルでポート26間が接続されている。また、Y軸方向に並行している4本の通信線18を一単位とした場合の各単位毎の4本の通信線18についても2本おきに各演算装置16にて物理層レベルでポート26間が接続されている。これによって情報処理装置14には全体として所謂ハイパーキューブ・ネットワークが形成される。
図14には、情報処理装置14の変形例である情報処理装置76の一例が示されている。情報処理装置76は、情報処理装置14と比較して、情報処理装置14に含まれる各々隣接して対を成す一部の複数組の演算装置16に代えて、各々ポート26が増設され且つ各々隣接して対を成す複数組の演算装置80を適用した点が異なっている。図14に示すように、演算装置80は、隣接して対を成す演算装置80と通信線82で接続されている。図14における太線で図示された演算装置80の構成の一例が図15に示されている。図15に示すように、演算装置80は、図2に示す演算装置16と比較して、ポート84が増設されている点が異なっている。ポート84は、ポート26と比較して、通信線18に代えて通信線82を適用した点及びバイパス線29が接続されていない点が異なっている。
このように構成された情報処理装置14では、対を成す演算装置80のポート84間を切断することで、所謂メッシュ・ネットワークが形成される。これにより、X軸方向とY軸方向との通信帯域を均等にすることができる。また、通信線82を使用しない場合にはポート84に含まれる論理回路38の受電制御スイッチをオフすることで省電力化を図ることができる。なお、ポート84間の切断及び受電制御スイッチをオフする制御は、ポート84に含まれるポート制御用レジスタ40の設定レジスタの値を“1”に設定することで実現される。
図16には、図14に示す情報処理装置76にメッシュ・トーラス・ネットワークが形成された場合の一例が示されている。ここで言うメッシュ・トーラス・ネットワークとは、例えばX軸、Y軸等の軸方向によるメッシュによるネットワークとトーラスによるネットワークとが混在している形態を指す。図16に示す破線メッシュ、一点鎖線メッシュ、実線メッシュ及び二点鎖線メッシュはそれぞれ4×4のメッシュ・ネットワークを示しており、各メッシュ・ネットワークの各頂点をリング接続している。図16に示す例では、太線の四角形の頂点が破線メッシュ、一点鎖線メッシュ、実線メッシュ及び二点鎖線メッシュの少なくとも何れか1つの頂点とされている。図16における太線で図示された演算装置80の構成の一例が図17に示されている。図17に示すように、演算装置80は、図16に示す破線メッシュ及び二点鎖線メッシュに相当する通信線18及びバイパス線29が対応するポート26に物理層レベルで接続され、それ以外の通信線18,82は対応するポート26に上位層レベルで接続される。
このように、ポート26間を物理層レベルで接続する場合と上位層レベルで接続する場合とを切り替えることで、2次元的に配置されたノード間(演算装置16同士、演算装置80同士及び演算装置16,84同士)の接続に3次元トポロジを採用することができる。よって、2次元通信網(図16に示す例ではメッシュ・ネットワーク)と3次元通信網(図16に示す例ではメッシュ・トーラス・ネットワーク)とを切り替えることができる。従って、図16に示す技術を利用すれば、3次元以上の空間を取り扱う物理分野でのシミュレーションや結晶や有機物の物性などの化学分野での3次元的なモデリングを行う場合、上記の3次元通信網を採用することで問題のマッピングを容易に行うことができる。また、Lattice QCDのように3次元にマッピングされた各ノード隣接間で同時並行的に通信が多く行われるような問題に対しては物理層レベルで接続することにより、個々のノード同士がリンクを共有して干渉するという事態の発生を回避することができる。また、通信効率の低下やノード間の帯域の不均衡を抑制することもできる。
なお、上記ではポート26間を物理層レベルで接続する場合にデータリンク層の接続を担う論理回路38の消費電力を制御部44により抑制する制御を行う態様を例示したが、開示の技術はこれに限定されるものではない。例えば図18に示すようにデータリンク層からアプリケーション層の直下の層の通信を担う各部に対する電力供給を停止するように制御してもよい。この場合、例えば制御部44がコントローラ28及びパケット送受信部32に対する電力供給を停止する態様が例示できる。
また、物理層が上述した物理層レベルでの接続に供する層を含む通信規約上の複数の階層を含んでいる場合、制御部44により、上述した物理層レベルでの接続に供する層以外の層の通信を担う各部の消費電力が抑制されるように更に制御してもよい。
図19には、物理層が複数の階層を含んで構成され且つ各層間をSerDes(コンピュータのバス等においてシリアル・パラレルを相互変換する回路)で繋いだ例が模式的に示されている。物理層は、最下位から最上位層にかけてPMD(Physical Media Dependent)層と、PMA(Phsical Medium Attachment)層の一例であるPMA回路、PCS(Physical Coding Sublayer)層の一例であるPCS回路及びRS層の一例であるRS回路を備えている。PMA回路、PCS回路及びRS回路はそれぞれの間で双方向にデータを授受(送受信)する。PMD層は、接続や光の波長・特性などが定義される層であり、例えば通信デバイスが挙げられる。PMA回路は、PCSで符号化したパラレルデータをシリアルデータに変換したり、或いはその逆の変換を行ったりする回路である。PCS回路は、データの符号化を担う回路である。RS回路はシリアル通信方式のインタフェースとしての機能を担う回路である。なお、ここで言うPMA回路、PCS回路及びRS回路は何れも例えばイーサネット(登録商標)の標準仕様等で機能が定義されている。図19に示す物理層を用いてポート26間を物理層レベルで接続する場合はPMD層の通信デバイス(以下、単に「通信デバイス」という)を必ず使用する。しかし、物理層レベルで接続した結果、伝送距離が伸びてクロック調整が必要になった場合はPMA回路及びPCS回路も使用することとなる。この場合、物理層のうちのRS回路は使用する必要がないため、制御部44は、通信デバイス、PMA回路及びPCS回路に対する電力供給を停止せずに、RS回路に対する電力供給を停止するように制御すればよい。
これに対し、SerDesのマージンが十分に大きく且つクロック調整が不要な場合は、PMA回路、PCS回路及びRS回路は必須ではない。この場合、制御部44は、一例として図20に示すように通信デバイスに対する電力供給を停止せずに、PMA回路、PCS回路及びRS回路に対する電力供給を停止するように制御すればよい。
また、PMA回路、PCS回路及びRS回路を用いない場合、すなわち、通信デバイスだけポート26間を接続する場合は、通信デバイス、PMA回路、PCS回路及びRS回路の全てを用いてポート26間を接続する場合に比べ、転送速度が向上する。例えば、データの伝送方式として8b10b(10ビット中の8ビットをデータ本体とし、残りの2ビットを読み込みタイミングを規定するビットとした伝送方式)を採用している場合は10ビット単位で処理する必要がある。そのため、通信デバイス、PMA回路、PCS回路及びRS回路の全てを用いてポート26間を接続する場合は、10ビット全てを受信するまで最初に受信した1ビットを転送することができず、転送速度の遅延が生じる。64b66b(66ビット中の64ビットをデータ本体とし、残りの2ビットを読み込みタイミングを規定するビットとした伝送方式)の場合は遅延が更に大きくなる。しかし、PMA回路、PCS回路及びRS回路を使用しない場合は、情報が単に通信デバイスを素通りするだけなので、遅延が大幅に抑制される。
また、上記では、論理回路38の電源をオフすることで消費電力を抑制する例を挙げたが、開示の技術はこれに限定されるものではない。例えば、低消費電力モード(一例としてスリープモード)で動作させてもよい。
また、上記では、下記の表1に示す情報処理システムに相当する情報処理装置10を例示したが、開示の技術はこれに限定されるものではない。例えば表1に示す演算処理装置(CPUチップ)にも適用可能である。すなわち、情報処理システム(情報処理装置12)では表1に示すように演算処理ノード(演算装置16)間を接続するに対し、表1に示す演算処理装置はキャッシュメモリを含む演算処理部(コア)間を接続する。また、情報処理システムではCPUチップ間のボード配線又はボード間のケーブルによる接続であるのに対し、演算処理装置はCPUチップ内の配線である。
また、上記では、説明の便宜上、検出部46が、クロスバースイッチ30及び論理回路38の少なくとも1つの故障を検出する場合を例示しているが、開示の技術はこれに限定されるものではない。例えば、CPU20やパケット送信部32などの演算装置16に含まれる部位の故障を検出してもよい。CPU20やパケット送信部32が故障したときは、例えばサービスプロセッサ12は、故障の通知を受けて、その演算装置16の全てのポート26を物理層レベルで接続することで、演算装置16を他の演算装置16から切り離す。なお、演算処理装置内のコアについても同様のことが言える。
また、上記では、サービスプロセッサ12によって演算負担指定値を設定(更新)する態様(ジョブ管理もサービスプロセッサ12で行う場合)を例示しているが、開示の技術はこれに限定されるものではない。例えば、サービスプロセッサ12とは別の情報処理装置(例えばサーバ装置)上で動くジョブ管理ソフトウェアがジョブの割り当て(演算負担割当:上記の例で言うところの、演算負担指定値の設定)を行ってもよい。なお。この場合、システムのハードウェアの見え方を変える制御(トポロジ設定情報や演算装置16からの故障通知を得てポート26間を物理層レベルで接続する制御やポート26の電源管理)を行うサービスプロセッサ12はファームウェアの範疇に属する。これに対し、ジョブ管理ソフトウェアは、ファームウェアが提供するシステムビュー(システムのハードウェアの見え方)に応じて、最適な形でジョブを割り当てるもので、ファームウェアよりも上位のミドルウェアの範疇に属する。従って、ジョブ管理ソフトウェアに基づいて動作する情報処理装置は、演算負担割当DB58を参照するか、若しくはサービスプロセッサ12に問い合わせて演算負担割当DB58の情報を引き出すこととなる。そして、ミドルウェアの上位でユーザアプリケーション(ジョブ)が動くこととなる。また、この場合、演算負担指定値はジョブ管理ソフトウェアによって管理される。例えば、CPUチップ内に複数のコアが存在するケースでは、複数のジョブの並行実行が可能なので、ジョブに表1に示すようにID(ジョブID)を付与して、このジョブIDを演算負担指定値としてメモリに記憶することになる。このようにしておくと、ノードが使用されているかどうかを管理することができ、使用されているならばどのジョブが実行中かを管理することができる。同じジョブを担当するコア同士は通信を行う可能性が高いので、ジョブ管理ソフトとしては、同じジョブIDを持つノード同士が物理的に近い位置にあるように管理することとなる。なお、下記の表1に示すようにジョブ管理ソフトウェアが演算負担指定値を管理するのであれば、サービスプロセッサ12が故障有無特定値と物理層バイパス・データリンク層電源設定状態を特定する情報とを管理することが好ましい。ここで言う「物理層バイパス・データリンク層電源設定状態を特定する情報」とは、何れのポート26間を物理層で接続するのか、データリンク層経由で接続するのかを各々特定する情報のことであり、ポートIDなどを用いて表現できる。
本明細書に記載された全ての文献、特許出願及び技術規格は、個々の文献、特許出願及び技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。
10 情報処理システム
12 サービスプロセッサ
14 情報処理装置
16 演算装置
18,37 通信線
29 バイパス線
28 コントローラ
30 クロスバースイッチ
34 端子
36 セレクタ
38 論理回路
44 制御部
46 検出部
48 供給部

Claims (16)

  1. 通信路を介して互いに接続される複数の演算装置と前記複数の演算装置を制御する制御装置とを有する情報処理装置において、
    前記演算装置は、
    前記通信路にそれぞれ接続された複数の端子と、
    前記複数の端子の何れかと接続可能な内部経路を介して通信規約上の物理層よりも上位層の通信を行う通信部と、
    前記複数の端子の何れか一対を接続可能なバイパス部と、
    前記通信部による前記複数の端子の何れかと対応する内部経路と通信を行うが、前記バイパス部による対応する前記複数の端子の何れか一対の接続を行わない上位層使用状態と、前記通信部による前記複数の端子の何れかと対応する内部経路との通信を行わないが、前記バイパス部による対応する前記複数の端子の何れか一対の接続を行う上位層不使用状態とを切り替える各端子に設けられた切替部と、
    前記制御装置から入力される制御情報に基づいて、前記各端子に設けられた切替部を、前記上位層使用状態と前記上位層不使用状態との何れかにそれぞれ制御する制御部と、を有し、
    前記制御装置は、
    各演算装置の前記制御部に対して前記制御情報を出力し、
    前記演算装置は、該演算装置に含まれる部位の故障を検出する検出部を更に含み、
    前記制御装置は、前記複数の演算装置のうち前記検出部によって故障が検出された演算装置の前記制御部に対して、該故障が検出された部位に関連する前記端子に対応する前記切替部が前記上位層不使用状態に切替わるように制御し、
    前記通信部は、前記端子毎に対応して設けられ、対応する前記端子から前記内部経路経由での情報の授受を司る複数のインタフェース部を更に含み、
    前記検出部は、前記端子毎の前記インタフェース部の故障を検出し、
    前記制御装置は、前記複数の演算装置のうち前記検出部によって故障が検出された演算装置の前記制御部に対して、該故障が検出された前記インタフェース部に関連する前記端子に対応する前記切替部が前記上位層不使用状態に切替わるように制御する、
    情報処理装置。
  2. 前記制御情報は、前記上位層不使用状態で接続する前記一対の端子のうちの少なくとも一方を特定する第1特定情報及び前記上位層使用状態で接続する前記一対の端子のうちの少なくとも一方を特定する第2特定情報の少なくとも1つを含み、
    前記制御部は、入力された前記制御情報に前記第1特定情報が含まれていた場合、該第1特定情報に従って特定された前記一対の端子の何れかに各々対応する一対の前記切替部が前記上位層不使用状態に切替わり、入力された前記制御情報に前記第2特定情報が含まれていた場合、該第2特定情報に従って特定された前記一対の端子の何れかに各々対応する一対の前記切替部が前記上位層使用状態に切替わるように制御する請求項1に記載の情報処理装置。
  3. 前記制御部は、前記検出部で故障が検出された前記インタフェース部の消費電力が抑制されるように更に制御する請求項1又は請求項2に記載の情報処理装置。
  4. 前記制御部は、前記一対の端子間を前記上位層不使用状態で接続する場合、前記上位層不使用状態で接続する前記一対の端子の何れかに各々対応する前記インタフェース部の消費電力が抑制されるように更に制御する請求項1に記載の情報処理装置。
  5. 前記演算装置における前記物理層は、前記一対の端子間の前記上位層不使用状態での接続に供する層を含む通信規約上の複数の階層を含み、
    前記制御部は、前記一対の端子間を前記上位層不使用状態で接続する場合に前記接続に供する層以外の層の通信を担う各部の消費電力が抑制されるように更に制御する請求項1〜請求項の何れか1項に記載の情報処理装置。
  6. 前記演算装置は、入力された前記制御情報に前記第1特定情報が含まれていた場合、該第1特定情報により特定された前記一対の端子の何れかに各々に対応する一対の前記切替部が前記上位層不使用状態に切替わるように前記制御部によって制御されることで、前記上位層不使用状態で接続された前記一対の端子を介して他の前記演算装置間での情報の授受を中継する請求項に記載の情報処理装置。
  7. 制御装置に接続される演算装置において、
    通信路にそれぞれ接続された複数の端子と、
    前記複数の端子の何れかと接続可能な内部経路を介して通信規約上の物理層よりも上位層の通信を行う通信部と、
    前記複数の端子の何れか一対を接続可能なバイパス部と、
    前記通信部による前記複数の端子の何れかと対応する内部経路との通信を行うが、前記バイパス部による対応する前記複数の端子の何れか一対の接続を行わない上位層使用状態と、前記通信部による前記複数の端子の何れかと対応する内部経路との通信を行わないが、前記バイパス部による対応する前記複数の端子の何れか一対の接続を行う上位層不使用状態とを切り替える各端子に設けられた切替部と、
    前記制御装置から入力される制御情報に基づいて、前記各端子に設けられた切替部を、上位層使用状態と上位層不使用状態との何れかにそれぞれ制御する制御部と、
    を含み、
    前記演算装置に含まれる部位の故障を検出する検出部を更に含み、
    前記制御部は、前記検出部によって故障が検出された部位に関連する前記端子に対応する前記切替部が前記上位層不使用状態に切替わるように制御し、
    前記通信部は、前記端子毎に対応して設けられ、対応する前記端子から前記内部経路経由での情報の授受を司る複数のインタフェース部を更に含み、
    前記検出部は、前記端子毎の前記インタフェース部の故障を検出し、
    前記制御部は、前記検出部によって故障が検出された前記インタフェース部に関連する前記端子に対応する前記切替部が前記上位層不使用状態に切替わるように制御する、
    演算装置。
  8. 前記制御部は、前記検出部で故障が検出された前記インタフェース部の消費電力が抑制されるように更に制御する請求項に記載の演算装置。
  9. 前記制御部は、前記一対の端子間を前記上位層不使用状態で接続する場合、前記上位層不使用状態で接続する前記一対の端子の何れかに各々対応する前記インタフェース部の消費電力が抑制されるように更に制御する請求項に記載の演算装置。
  10. 前記演算装置における前記物理層は、前記一対の端子間の前記上位層不使用状態での接続に供する層を含む通信規約上の複数の階層を含み、
    前記制御部は、前記一対の端子間を前記上位層不使用状態で接続する場合に前記接続に供する層以外の層の通信を担う各部の消費電力が抑制されるように更に制御する請求項〜請求項の何れか1項に記載の演算装置。
  11. 通信路を介して互いに接続される複数の演算装置と前記複数の演算装置を制御する制御装置とを有する情報処理装置の制御方法において、
    前記制御装置が、各演算装置に対して制御情報を出力し、
    前記各演算装置が、前記制御情報に基づいて、前記演算装置が有する各端子について、前記通信路にそれぞれ接続された複数の何れかと接続可能な内部経路を介して通信規約上の物理層よりも上位層の通信を行う通信部を用いて前記複数の端子の何れかと対応する内部経路との通信を行うが、前記複数の端子の何れか一対を接続可能なバイパス部を用いて対応する前記複数の端子の何れか一対の接続を行わない上位層使用状態と、前記通信部を用いた前記複数の端子の何れかと対応する内部経路との通信を行わないが、前記バイパス部を用いた対応する前記複数の端子の何れか一対の接続を行う上位層不使用状態とを切り替え
    前記演算装置が、該演算装置に含まれる部位の故障を検出し、
    前記制御装置が、前記複数の演算装置のうち故障が検出された部位に関連する前記端子について前記上位層使用状態とされている場合、該一対の端子について前記上位層使用状態を前記上位層不使用状態に切り替え、
    前記演算装置が、前記端子毎に対応して設けられ、対応する前記端子から前記内部経路経由での情報の授受を司る複数のインタフェース部の故障を検出し、
    該故障が検出された前記演算装置に対して、該故障が検出された前記インタフェース部に関連する前記端子について前記上位層使用状態とされている場合、該一対の端子について前記上位層使用状態を前記上位層不使用状態に切り替える、
    情報処理装置の制御方法。
  12. 前記制御情報が、前記上位層不使用状態で接続する前記一対の端子のうちの少なくとも一方を特定する第1特定情報及び前記上位層使用状態で接続する前記一対の端子のうちの少なくとも一方を特定する第2特定情報の少なくとも1つを含み、
    前記演算装置が、入力された前記制御情報に前記第1特定情報が含まれている状態で、該第1特定情報に従って特定された前記一対の端子について前記上位層使用状態とされている場合、該一対の端子について前記上位層使用状態を前記上位層不使用状態に切り替える請求項11に記載の情報処理装置の制御方法。
  13. 前記演算装置が、前記故障が検出された前記インタフェース部の消費電力を抑制する請求項12に記載の情報処理装置の制御方法。
  14. 前記演算装置が、前記一対の端子間を前記上位層不使用状態で接続する場合、複数の前記インタフェース部のうち前記上位層不使用状態で接続する前記一対の端子の何れかに各々対応する前記インタフェース部の消費電力を抑制する請求項11に記載の情報処理装置の制御方法。
  15. 前記演算装置における前記物理層は、前記一対の端子間の前記上位層不使用状態での接続に供する層を含む通信規約上の複数の階層を含み、
    前記演算装置が、前記一対の端子間を前記上位層不使用状態で接続する場合に前記接続に供する層以外の層の通信を担う各部の消費電力を抑制する請求項11〜請求項14の何れか1項に記載の情報処理装置の制御方法。
  16. 前記演算装置が、入力された前記制御情報に前記第1特定情報が含まれていた場合、該第1特定情報により特定された前記一対の端子の何れかに各々について前記上位層不使用状態に切替えることで、前記上位層不使用状態で接続された前記一対の端子を介して他の前記演算装置間での情報の授受を中継する請求項12に記載の情報処理装置の制御方法。
JP2012082847A 2012-03-30 2012-03-30 情報処理装置、演算装置、及び情報処理装置の制御方法 Active JP5900115B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012082847A JP5900115B2 (ja) 2012-03-30 2012-03-30 情報処理装置、演算装置、及び情報処理装置の制御方法
US13/751,249 US9117034B2 (en) 2012-03-30 2013-01-28 Data processing apparatus, computation device, control method for data processing apparatus
CN2013100375582A CN103368931A (zh) 2012-03-30 2013-01-30 数据处理设备、计算装置、用于数据处理设备的控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012082847A JP5900115B2 (ja) 2012-03-30 2012-03-30 情報処理装置、演算装置、及び情報処理装置の制御方法

Publications (2)

Publication Number Publication Date
JP2013214809A JP2013214809A (ja) 2013-10-17
JP5900115B2 true JP5900115B2 (ja) 2016-04-06

Family

ID=49236621

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012082847A Active JP5900115B2 (ja) 2012-03-30 2012-03-30 情報処理装置、演算装置、及び情報処理装置の制御方法

Country Status (3)

Country Link
US (1) US9117034B2 (ja)
JP (1) JP5900115B2 (ja)
CN (1) CN103368931A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3214822B1 (en) * 2014-11-28 2020-05-27 Huawei Technologies Co., Ltd. Network on chip, communication control method and controller
JP6464865B2 (ja) * 2015-03-25 2019-02-06 富士通株式会社 センサシステム、センサ装置、及び情報処理方法
CN108701117B (zh) * 2017-05-04 2022-03-29 华为技术有限公司 互连系统、互连控制方法和装置
US10666540B2 (en) * 2017-07-17 2020-05-26 International Business Machines Corporation Dynamic time-domain reflectometry analysis for field replaceable unit isolation in a running system
US11044169B2 (en) 2019-01-07 2021-06-22 International Business Machines Corporation Mapping 2-dimensional meshes on 3-dimensional torus

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5155726A (en) * 1990-01-22 1992-10-13 Digital Equipment Corporation Station-to-station full duplex communication in a token ring local area network
JPH08195745A (ja) * 1995-01-13 1996-07-30 Fujitsu Ltd パス切替装置およびパス切替方法
JP3628514B2 (ja) 1998-05-14 2005-03-16 株式会社日立製作所 計算機間データ送受信方法
KR100449010B1 (ko) * 2002-05-27 2004-09-18 삼성전자주식회사 게이트웨이의 바이패스 장치
CN100586125C (zh) * 2006-06-02 2010-01-27 杭州华三通信技术有限公司 以太网物理层交叉装置及交叉方法
CN101420351B (zh) * 2007-10-25 2011-05-04 华为技术有限公司 一种实现弹性分组环上业务保护的装置及方法
CN101789898B (zh) * 2009-01-23 2013-01-02 雷凌科技股份有限公司 用于转发包的方法和设备
CN201393231Y (zh) * 2009-04-03 2010-01-27 深圳市宝德计算机系统有限公司 一种带有旁路开关的网关设备
CN102006601B (zh) * 2009-09-02 2014-03-19 电信科学技术研究院 一种发送协同数据的方法、系统和装置
CN101729419B (zh) * 2009-12-11 2012-07-25 烽火通信科技股份有限公司 以太交换芯片数据转发方法及宽带接入设备保护倒换方法
US9236768B2 (en) * 2012-01-31 2016-01-12 Lorenzo Giuntini Systems, methods, and devices for control of parallel uninterruptible power supplies

Also Published As

Publication number Publication date
US20130262735A1 (en) 2013-10-03
US9117034B2 (en) 2015-08-25
JP2013214809A (ja) 2013-10-17
CN103368931A (zh) 2013-10-23

Similar Documents

Publication Publication Date Title
TWI543566B (zh) 基於軟體定義網路的資料中心網路系統及其封包傳送方法、位址解析方法與路由控制器
US9300574B2 (en) Link aggregation emulation for virtual NICs in a cluster server
US9571420B2 (en) Integrated NoC for performing data communication and NoC functions
CN103081418B (zh) 计算机系统和计算机系统中的通信方法
CN102017544B (zh) 卸载网络处理的方法和系统
US8976652B2 (en) Relay device, method of controlling relay device, and relay system
JP5900115B2 (ja) 情報処理装置、演算装置、及び情報処理装置の制御方法
US9461885B2 (en) Constructing and verifying switch fabric cabling schemes
US20140189094A1 (en) Resilient duplicate link aggregation emulation
EP3063903A1 (en) Method and system for load balancing at a data network
US7539129B2 (en) Server, method for controlling data communication of server, computer product
JP6004079B2 (ja) スイッチ及びプログラム
US9384102B2 (en) Redundant, fault-tolerant management fabric for multipartition servers
TWI586127B (zh) 具有改良之故障處理之多片式網路流量管理設備及其方法
US9559990B2 (en) System and method for supporting host channel adapter (HCA) filtering in an engineered system for middleware and application execution
WO2016048390A1 (en) Link aggregation configuration for a node in a software-defined network
US20210096968A1 (en) Server system
CN116155682A (zh) 数据抓包方法、装置、电子设备及存储介质
EP3750059B1 (en) Server system
US9755892B2 (en) Integrated device managment over Ethernet network
US20160099827A1 (en) Fiber Channel 1:N Redundancy
WO2016117302A1 (ja) 情報処理装置、情報処理方法、及び、記録媒体
JP2014086884A (ja) ネットワーク機器、方法、及びプログラム
US8977784B2 (en) Port teaming
JP2009206863A (ja) レイヤ2スイッチシステム及びレイヤ2スイッチ

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150908

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160222

R150 Certificate of patent (=grant) or registration of utility model

Ref document number: 5900115

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150