JP4887837B2 - マルチノードコンピュータシステム、統合サービスプロセッサ及びそれらに用いる多重化制御方法 - Google Patents

マルチノードコンピュータシステム、統合サービスプロセッサ及びそれらに用いる多重化制御方法 Download PDF

Info

Publication number
JP4887837B2
JP4887837B2 JP2006055653A JP2006055653A JP4887837B2 JP 4887837 B2 JP4887837 B2 JP 4887837B2 JP 2006055653 A JP2006055653 A JP 2006055653A JP 2006055653 A JP2006055653 A JP 2006055653A JP 4887837 B2 JP4887837 B2 JP 4887837B2
Authority
JP
Japan
Prior art keywords
node
inter
active
crossbar switch
ixs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006055653A
Other languages
English (en)
Other versions
JP2007233777A (ja
Inventor
隆 米村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2006055653A priority Critical patent/JP4887837B2/ja
Publication of JP2007233777A publication Critical patent/JP2007233777A/ja
Application granted granted Critical
Publication of JP4887837B2 publication Critical patent/JP4887837B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明はマルチノードコンピュータシステム、統合サービスプロセッサ及びそれらに用いる多重化制御方法並びにそのプログラムに関し、特にマルチノードコンピュータシステムにおいてノード間の接続を行うノード間クロスバスイッチに関する。
近年、科学技術計算の分野において計算性能の向上の要求が高まっている。そこでスーパーコンピュータ等の高速計算機は複数のCPU(中央処理装置)と共有メモリとで構成される高性能のノードを更に複数接続し、マルチノード構成をとることでシステム全体としての計算性能の向上を実現している。
ノード間の接続はIXS(Internode Crossbar Switch:ノード間クロスバスイッチ)を介して行われるが、IXSに障害が発生するとシステムがダウンする、つまりIXSがシステムのSPOF(Single Point Of Failure)になってしまうという問題がある。
この問題を解決するため、IXSを多重化して運用系のIXSに障害が発生した場合に、障害が発生したIXSを待機系のIXSに切替えることで(例えば、特許文献1参照)、システムダウンを防止することができるマルチノードコンピュータシステムが提案されている。
特開2006−039897号公報
しかし、上述した従来のマルチノードコンピュータシステムでは、IXS障害発生時にシステムダウンを防止することができるが、図8に示すように、IXS切替え時にIXS−ノード間で論理パスの切替えをするため、IXSを介したノード間のデータ転送を一旦停止する必要があり、ノード間通信を用いて複数ノードで実行していたマルチノードJOBがアボートしてしまうという問題点がある。
また、従来のマルチノードコンピュータシステムでは、上記の問題点によって、IXSの切替えが発生した場合に、ユーザがアボートしたマルチノードJOBを再実行しなければならず、復旧に人手を要し、手間がかかってしまうという問題点がある。
そこで、本発明の目的は上記の問題点を解消し、IXSの切替えが発生した時にユーザによるマルチノードJOBの再実行を不要とすることができるマルチノードコンピュータシステム、統合サービスプロセッサ及びそれらに用いる多重化制御方法並びにそのプログラムを提供することにある。
本発明によるマルチノードコンピュータシステムは、複数のノードが、多重化された複数のノード間クロスバスイッチを介して相互に接続され、運用系のノード間クロスバスイッチに訂正不可能障害が発生した場合に待機系のノード間クロスバスイッチを運用系に切替えるマルチノードコンピュータシステムであって、
前記複数のノード間クロスバスイッチを制御する統合サービスプロセッサと、前記複数のノード各々を制御する複数のノードサービスプロセッサとを備え、
前記統合サービスプロセッサは、前記運用系のノード間クロスバスイッチに訂正可能障害が発生した場合に前記ノードサービスプロセッサを介して前記ノード間クロスバスイッチの運用系/待機系の切替えを「運用系/待機系」の状態から「運用系/運用系」の状態に変更した後に「待機系/運用系」の状態に変更し
前記運用系のノード間クロスバスイッチに訂正可能障害が発生した段階で前記ノード間クロスバスイッチにおける前記運用系と前記待機系との切替えを行い、前記訂正可能障害が発生したノード間クロスバスイッチの保守を行っている。
本発明による統合サービスプロセッサは、複数のノードが、多重化された複数のノード間クロスバスイッチを介して相互に接続され、運用系のノード間クロスバスイッチに訂正不可能障害が発生した場合に待機系のノード間クロスバスイッチを運用系に切替えるマルチノードコンピュータシステムにおいて前記複数のノード間クロスバスイッチを制御する統合サービスプロセッサであって、
前記運用系のノード間クロスバスイッチに訂正可能障害が発生した場合に前記複数のノード各々を制御する複数のノードサービスプロセッサを介して前記ノード間クロスバスイッチの運用系/待機系の切替えを「運用系/待機系」の状態から「運用系/運用系」の状態に変更した後に「待機系/運用系」の状態に変更する制御手段を備え
前記制御手段は、前記運用系のノード間クロスバスイッチに訂正可能障害が発生した段階で前記ノード間クロスバスイッチにおける前記運用系と前記待機系との切替えを行っている。
本発明による多重化制御方法は、複数のノードが、多重化された複数のノード間クロスバスイッチを介して相互に接続され、運用系のノード間クロスバスイッチに訂正不可能障害が発生した場合に待機系のノード間クロスバスイッチを運用系に切替えるマルチノードコンピュータシステムに用いる多重化制御方法であって、
前記複数のノード間クロスバスイッチを制御する統合サービスプロセッサが、前記運用系のノード間クロスバスイッチに訂正可能障害が発生した場合に前記複数のノード各々を制御する複数のノードサービスプロセッサを介して前記ノード間クロスバスイッチの運用系/待機系の切替えを「運用系/待機系」の状態から「運用系/運用系」の状態に変更した後に「待機系/運用系」の状態に変更する処理を実行し
前記統合サービスプロセッサが、前記運用系のノード間クロスバスイッチに訂正可能障害が発生した段階で前記ノード間クロスバスイッチにおける前記運用系と前記待機系との切替えを行っている。
本発明によるプログラムは、複数のノードが、多重化された複数のノード間クロスバスイッチを介して相互に接続され、運用系のノード間クロスバスイッチに訂正不可能障害が発生した場合に待機系のノード間クロスバスイッチを運用系に切替えるマルチノードコンピュータシステムにおいて前記複数のノード間クロスバスイッチを制御する統合サービスプロセッサに実行させるプログラムであって、
前記運用系のノード間クロスバスイッチに訂正可能障害が発生した場合に前記複数のノード各々を制御する複数のノードサービスプロセッサを介して前記ノード間クロスバスイッチの運用系/待機系の切替えを「運用系/待機系」の状態から「運用系/運用系」の状態に変更した後に「待機系/運用系」の状態に変更する処理を含み、
前記統合サービスプロセッサが、前記運用系のノード間クロスバスイッチに訂正可能障害が発生した段階で前記ノード間クロスバスイッチにおける前記運用系と前記待機系との切替えを行わせることを特徴とする
すなわち、本発明の多重化ノード間クロスバスイッチの多重化制御方法は、複数のノードが、多重化された複数のノード間クロスバスイッチ[以下、IXS(Internode Crossbar Switch)とする]を介して相互に接続される大規模マルチノードコンピュータシステム(例えば、スーパーコンピュータ等)において、IXSを制御する統合サービスプロセッサ[以下、統合SVP(SerVice Processor)とする]と各ノードを制御する複数のノードサービスプロセッサ(以下、ノードSVPとする)とを有し、運用状態のIXS(以下、この状態を運用系とする)以外に、待機状態のIXS(以下、この状態を待機系とする)を設けることでIXSを多重化し、運用系のIXSに障害が発生した場合に待機系のIXSを運用系に切替えてシステムダウンを防止する、IXSの多重化制御方法に関するものである。
本発明の多重化ノード間クロスバスイッチの多重化制御方法では、運用系のIXSに訂正可能障害(軽障害)が発生した段階で、IXSの状態を切替え、保守することによって、訂正可能障害に続いて発生する可能性が高い、重障害の発生を未然に防止することが可能となる(これを特長1とする)。
また、本発明の多重化ノード間クロスバスイッチの多重化制御方法では、統合SVP、ノードSVPを介して、IXSの運用系/待機系の切替えを「運用系/待機系」の状態から一旦、「運用系/運用系」の状態に変更し、その後「待機系/運用系」の状態に変更する、二段階の状態変更で行うことによって、従来のシステムに存在していた、IXS切替え時に運用中のマルチノードJOBがアボートしてしまい、IXS切替え後にユーザによるJOBの再実行が必要であるという問題点を解決することが可能となる(これを特長2とする)。
尚、本発明の多重化ノード間クロスバスイッチの多重化制御方法では、従来のシステムが、運用系のIXSに訂正不可能障害(重障害)が発生した場合のみを対象としたものであるのに対し、運用系のIXSに訂正可能障害(軽障害)が発生した場合を対象とすることによって、上記の特長1及び特長2によって、IXS障害に対して、より安定した運用が可能なマルチノードシステムを提供することが可能となる。よって、本発明の多重化ノード間クロスバスイッチの制御方法では、運用系のIXSに訂正可能障害が発生した場合において、上述した問題点を解決することが可能となる。
本発明は、上記のような構成及び動作とすることで、IXSの切替えが発生した時にユーザによるマルチノードJOBの再実行を不要とすることができるという効果が得られる。
次に、本発明の実施の形態について図面を参照して説明する。図1は本発明の実施の形態によるマルチノードコンピュータシステムの構成例を示すブロック図である。図1において、本発明の実施の形態によるマルチノードコンピュータシステムでは、IXS(Internode Crossbar Switch:ノード間クロスバスイッチ)を二重化しているが、IXSの数を2つに限定するものではなく、同様の原理・方法に基づくものであれば、より冗長性を持たせたIXSの数が3つ以上の構成にも適用することが可能である。
本発明の実施の形態によるマルチノードコンピュータシステムでは、IXS(#0)40とIXS(#1)41との二重化されたIXSを介して、ノード(#0〜#m)30〜3mの複数のノードがデータ転送パス600によって接続されている。また、IXS(#0)40及びIXS(#1)41にはIXSを管理・制御する統合SVP(SerVice Processor:サービスプロセッサ)2が接続され、ノード(#0〜#m)30〜3mにはノードを管理・制御するためのSVPであるノードSVP(#0〜#n)10〜1nが接続されている。ノードSVP(#0〜#n)10〜1nと統合SVP2とはLAN(Local Area Network)500を介して接続され、互いに通信することが可能である。
IXS(#0)40及びIXS(#1)41は障害通知手段401,411を備え、統合SVP2はSVP−SVP間通信手段21と、IXS制御手段22と、IXS正常性判定手段23と、障害判別手段24とを備えている。ノード(#0〜#m)30〜3mはIXS接続ポート部301〜3m1と、IXS診断手段302〜3m2とを備え、ノードSVP(#0〜#n)10〜1nはノード制御手段101〜1n1と、SVP−SVP間通信手段102〜1n2とを備えている。
統合SVP2のSVP−SVP間通信手段21及びノードSVP(#0〜#n)10〜1nのSVP−SVP間通信手段102〜1n2によって、統合SVP2とノードSVP(#0〜#n)10〜1nはLAN500を介して互いに通信することができる。また、統合SVP2はIXS制御手段22によってIXS(#0)40及びIXS(#1)41を制御することができ、運用系/待機系の状態変更やシステムへの組み込み/縮退の操作等、様々な制御を行うことができる。
ノードSVP(#0〜#n)10〜1nはノード制御手段101〜1n1によって、それぞれのノードSVPが制御対象とするノードを制御することができ、システムの資源[CPU(中央処理装置)やメモリ等]の制御やIXSとの接続の接点であるIXS接続ポート部301〜3m1を制御し、各ノード(#0〜#m)30〜3mとIXS(#0)40及びIXS(#1)41との接続を個別に有効/無効に変更することができる。
IXS(#0)40及びIXS(#1)41は障害通知手段401,411によって、障害発生時に統合SVP2に通知を行う。統合SVP2の障害判別手段24はIXSで発生し、通知された障害が訂正可能障害(軽障害)なのか、訂正不可能障害(重障害)なのかを判別するための手段である。IXS正常性判定手段23、IXS診断手段302〜3m2はIXSの切替えにおいて、正常性の確認の取れていない待機系から運用系に変更したIXSの正常性を診断するための手段である。
各ノード(#0〜#m)30〜3mでIXS診断手段302〜3m2によって、当該IXSの診断を行い、ノードSVP(#0〜#n)10〜1nを介して統合SVP2に通知し、当該IXSの正常性を統合SVP2のIXS正常性判定手段23が判断するものである。
図2は本発明の実施の形態によるIXSの状態変更の概念を示す図である。これら図1及び図2を参照して本発明の実施の形態によるマルチノードコンピュータシステムの動作について説明する。以下の説明では、はじめ、IXS(#0)40が運用系、IXS(#1)41が待機系として運用中に、運用系のIXS(#0)40に訂正可能障害が発生したものとする。また、ノード(#0〜#m)30〜3mのIXS接続ポート部301〜3m1は運用系のIXSのみとの接続が有効になるように制御されており、はじめ、運用系のIXS(#0)40との接続が有効、待機系のIXS(#1)41との接続が無効になっているものとする。尚、IXS(#1)41が運用系、IXS(#0)40が待機系で、運用系のIXS(#1)41に訂正可能障害が発生した場合にはIXS(#0)40とIXS(#1)41とが逆になるが、同様の動作となるため、その説明を省略する。
訂正可能障害が発生したIXS(#0)40は障害通知手段401によって、発生した障害を統合SVP2に通知する。IXS(#0)40からの障害通知を受けた統合SVP2は障害判別手段24によって、IXS(#0)で発生した障害が訂正可能障害(軽障害)か、訂正不可能障害(重障害)かを判別する。統合SVP2は発生した障害が訂正可能障害の場合に以下に示す2段階の状態変更によるIXSの切替え動作を行う。このIXSの状態変更の概念を図2に示す。
統合SVP2はIXS(#0)40及びIXS(#1)41の状態を(IXS#0:運用系、IXS#1:待機系)から(IXS#0:運用系、IXS#1:運用系)に一時的に変更する。そして、統合SVP2はIXS(#1)41の正常性を確認した後、接続しているノードとの同期をとりながらIXSの状態を(IXS#0:待機系,IXS#1:運用系)の状態に変更する。
本発明の実施の形態では、上記の状態変更を次のように実現する。統合SVP2はIXS制御手段22によって、IXS(#1)41を待機系から運用系に状態変更をさせる。また、統合SVP2はSVP−SVP間通信手段21を用いて、全ノードSVP(#0〜#n)10〜1nに対して、各ノード(#0〜#m)30〜3mのIXS(#1)41との接続を無効から有効に変更するように指示を出す。
ノードSVP(#0〜#n)10〜1nはその指示をSVP−SVP間通信手段102〜1n2によって受けると、それぞれの制御対象のノード(#0〜#m)30〜3mに対して、ノード制御手段101〜1n1によって各ノード(#0〜#m)30〜3mのIXS接続ポート部301〜3m1のIXS(#1)41の接続を無効から有効に変更する。この時点で、本発明の実施の形態によるマルチノードコンピュータシステムは(IXS#0:運用系,IXS#1:運用系)に状態変更し、IXS(#0)40及びIXS(#1)41の両IXSを使用しての運用となる。
ところで、IXS(#1)41はもともと待機系であったため、使用されておらず、ケーブルを含むノード間通信の正常性の確認ができていない。そこで、各ノード(#0〜#m)30〜3mはIXS診断手段302〜3m2によって、IXS(#1)41の正常性を診断する。診断の結果は各ノード(#0〜#m)30〜3mから統合SVP2にノードSVP(#0〜#n)10〜1nを介して報告される。
統合SVP2はIXS正常性判定手段23によって、各ノード(#0〜#m)30〜3mから報告されたIXS(#1)41の診断結果を確認し、IXS(#1)41が正常か否かを判断する。IXS(#1)41が正常と判断できる場合、統合SVP2はIXS制御手段22によって、IXS(#0)40を運用系から待機系に変更するとともに、SVP−SVP間通信手段21を用いて、全ノードSVP(#0〜#n)10〜1nに対して、各ノード(#0〜#m)30〜3mのIXS(#0)40への接続を有効から無効に変更するように指示する。
この指示を受けたノードSVP(#0〜#n)10〜1nはノード制御手段101〜1n1によって、各ノード(#0〜#m)30〜3mのIXS接続ポート部301〜3m1におけるIXS(#0)40との接続を有効から無効に変更する。
上記の処理によって、本発明の実施の形態によるマルチノードコンピュータシステムは(IXS#0:待機系、IXS#1:運用系)に変更される。尚、診断の結果、IXS(#1)41に異常が見つかった場合にはIXSの切替えを中止し、初期の状態(IXS#0:運用系、IXS#1:待機系)に戻す。この場合、IXS(#0)40で発生した障害は訂正可能障害のため、システムの運用は継続可能である。
このように、本発明の実施の形態では、上述した2段階の状態変更を介して、ノード(#0〜#m)30〜3mとIXS(#0)40及びIXS(#1)41との同期を取りながら、IXS(#0)40及びIXS(#1)41の切替えを行うことによって、ノード(#0〜#m)30〜3mとIXS(#0)40及びIXS(#1)41との間の接続(論理パス)を保ったまま、IXS(#0)40及びIXS(#1)41の切替えを行うことができる。その結果、IXS(#0)40及びIXS(#1)41を介したノード(#0〜#m)30〜3m間のデータ転送をIXS(#0)40及びIXS(#1)41の切替え時に停止する必要がなくなり、従来の課題であったIXS切替え時に実行中のマルチノードJOBがアボートしてしまい、マルチノードJOBを再実行しなければならないという問題を解決することができる(上記の特長2)。
また、訂正不可能障害(重障害)の発生は訂正可能障害(軽障害)を兆候として発生する傾向があり、本発明の実施の形態によって訂正可能障害(軽障害)発生の段階でIXS(#0)40及びIXS(#1)41の切替えを行い、切替え後のIXS(#0)40及びIXS(#1)41を保守することによって、訂正可能障害(軽障害)に続いて発生する可能性のある訂正不可能障害(重障害)の発生を未然に防止することができる(上記の特長1)。
尚、IXS(#0)40で発生した障害が訂正不可能障害(重障害)の場合には、別途、従来の技術によるIXS切替えが行われ、システムダウンとなるのを回避する動作を行うが、本発明の実施の形態ではIXS(#0)40及びIXS(#1)41に訂正可能障害が発生した場合を対象としているので、そのIXS切替えについての説明は省略する。
また、各ノード(#0〜#m)30〜3mのIXS診断手段302〜3m2は、上述したIXS切替えの際でのみ動作するものである。これは本発明の実施の形態の対象であるスーパーコンピュータ等のマルチノードシステムにおいてシステムの高速性が要求されるため、運用中に性能のオーバーヘッドとなるような処理を極力行わないようにするためである。
図3は本発明の一実施例によるマルチノードコンピュータシステムの構成を示すブロック図である。図1において、本発明の一実施例によるマルチノードコンピュータシステムは、2重化されたIXS(#0)40及びIXS(#1)41を介して複数のノード(#0〜#m)30〜3mがデータ転送パス600で接続された大規模マルチノードコンピュータシステムであり、IXS(#0)40及びIXS(#1)41を管理・制御する統合SVP2と、ノード(#0〜#m)30〜3mを管理・制御する複数のノードSVP(#0〜#n)10〜1nとを備えており、統合SVP2とノードSVP(#0〜#n)10〜1nとはLAN500によって接続されている。
IXS(#0)40及びIXS(#1)41は障害通知手段401,411を備え、統合SVP2はSVP−SVP間通信手段21と、IXS制御手段22と、IXS正常性判定手段23と、障害判別手段24とを備えている。また、ノード(#0〜#m)30〜3mはIXS接続ポート部301〜3m1と、ポートデータ検証手段303〜3m3とを備え、ノードSVP(#0〜#n)10〜1nはノード制御手段101〜1m1と、SVP−SVP間通信手段102〜1n2とを備えている。
ポートデータ検証手段303〜3m3は正常性の確認ができていない待機系から運用系に変更するIXS(#0)40及びIXS(#1)41の正常性を確認するための手段であり、上述した本発明の実施の形態におけるIXS診断手段302〜3m2(図1参照)を具体化したものである。尚、図3に示す他の構成手段については、上述した図1に示す本発明の実施の形態と同様であるため、それらの動作についての説明は省略する。
IXSに訂正可能障害が発生した際に、本実施例ではIXSの切替えを「運用系/待機系」状態から一旦「運用系/運用系」の状態に遷移させ、その後「待機系/運用系」の状態に遷移させることで行うが、はじめ待機系であったIXSは使用されておらず、ケーブルを含むノード間通信の正常性が確認できていない。
一方、訂正可能障害が発生した運用系のIXSはハードウェア(HW)によってエラーが訂正されるため、ノードに伝送されるデータは正しいものとなる。そこで、「運用系/運用系」の状態において、各ノード(#0〜#m)30〜3mはポートデータ検証手段303〜3m3によって、IXS接続ポート部301〜3m1に接続されたIXS(#0)40及びIXS(#1)41の両方から受け取るデータを一定時間比較し、同一かどうかを確認する。データが一致する場合には待機系であったIXSが正常であり、不一致が発生した場合には異常があると判断することができる。
一定時間の間に異常を検出した場合、異常を検出したノード(#0〜#m)30〜3mはノードSVP(#0〜#n)10〜1nを経由して統合SVP2へアラームをあげる。統合SVP2はIXS正常性判定手段23によって、IXSを「運用系/運用系」の状態に遷移させてから一定時間内に上記のアラームを受信していないかどうかによって、待機系から運用系に遷移させたIXSの正常性を判断する。
そして、正常性が確認できた場合、統合SVP2は訂正可能障害が発生した運用系のIXSを待機系に変更することで、IXSの状態を「待機系/運用系」の状態に遷移させ、はじめ待機系であったIXSのみに切替えての運用に移る。また、待機系であったIXSに異常があると判断できた場合、統合SVP2はIXSの状態を初期の「運用系/待機系」の状態に戻し、IXSの切替えを中止する。ポートデータ検証手段303〜3m3は運用中に動作してしまうと性能面でのオーバーヘッドとなってしまうため、上述したIXSの状態が「運用系/運用系」の状態での待機系から運用系に変更したIXSの正常性を確認する一定時間のみ動作するものである。
図4〜図7は本発明の一実施例によるマルチノードコンピュータシステムの動作を示すシーケンスチャートである。これら図3〜図7を参照して本発明の一実施例によるマルチノードコンピュータシステムの動作について説明する。尚、図4及び図6における統合SVP2の処理は、統合SVP2が図示せぬ記録媒体に格納されたプログラムを実行することで実現される。
以下の説明では、はじめ、IXS(#0)40が運用系、IXS(#1)41が待機系として運用中に、運用系のIXS(#0)40に訂正可能障害が発生したものとする。また、ノード(#0〜#m)30〜3mのIXS接続ポート部301〜3m1は運用系のIXSのみとの接続が有効になるように制御されており、はじめ、運用系のIXS(#0)40との接続が有効、待機系のIXS(#1)41との接続が無効になっているものとする。尚、IXS(#1)41が運用系、IXS(#0)40が待機系で、運用系のIXS(#1)41に訂正可能障害が発生した場合、上記とはIXS(#0)40及びIXS(#1)41の関係が逆になるが、同様の動作となるため、それらの動作についての説明は省略する。
訂正可能障害が発生したIXS(#0)40は障害通知手段401によって、統合SVP2に訂正可能障害の発生を通知する(図4のステップb1)。その通知を受けた統合SVP2は障害判定手段24によって、IXS(#0)40で発生した障害が訂正可能障害であると認識し、以降のIXSの切替え処理を開始する(図4のステップa1)。
統合SVP2はIXS制御手段22によって、IXS(#1)41の状態を待機系から運用系に変更する(図4のステップa2,ステップc1)。次に、統合SVP2はSVP−SVP間通信手段21によって、全ノードSVP(#0〜#n)10〜1nに各ノード(#0〜#m)30〜3mのIXS接続状態の変更[IXS(#1)41との接続状態を無効から有効とする]を指示する(図5のステップa3)。
ノードSVP(#0〜#n)10〜1nはSVP−SVP間通信手段102〜1n2によって、統合SVP2からの前記指示を受信すると(図5のステップd1)、ノード制御手段101〜1n1によって、それぞれが制御対象としているノード(#0〜#m)30〜3mに対してIXS接続状態の変更[IXS(#1)41との接続状態を無効から有効とする]を指示する(図5のステップd2)。
各ノード(#0〜#m)30〜3mはノードSVP(#0〜#n)10〜1nからの指示によって、IXS接続ポート部301〜3m1におけるIXSとの接続状態を変更する[IXS(#1)41との接続状態を無効から有効とする](図5のステップe1)。この時点で、IXS(#0)40及びIXS(#1)41は共に運用系となり、各ノード間の通信はIXS(#0)40及びIXS(#1)41の両方から同じデータを受信して行われるようになる。
この状態で、各ノード(#0〜#m)30〜3mはポートデータ検証手段302〜3m2によって、一定時間、IXS(#0)40及びIXS(#1)41からの受信データを比較する(図5のステップe2)。データの不一致があった場合には(図5のステップe3でYES)、IXS(#1)41に異常が認められたことになり、データの不一致を検出したノードが当該ノードを制御しているノードSVPにアラームを送信する(図5のステップe4)。データの不一致が発生しなかった場合には(図5のステップe3でNO)、IXS(#1)41の正常性が確認されたことになり、特にノードはここでは何もしない。
ノードSVP(#0〜#n)10〜1nは自身が制御しているノードより、IXS(#1)41の異常を示すアラームを受信した場合には(図5のステップd3でYES)、そのアラームをノードSVP(#0〜#n)10〜1nのSVP−SVP間通信手段102〜1n2によって、統合SVP2に送信する(図5のステップd4)。ノードからアラームを受信しない場合(図5のステップd3でNO)、ノードSVP(#0〜#n)10〜1nは特に何もしない。
統合SVP2は上記のステップa3の処理の後、IXS正常性判定手段23によって、ノードSVP(#0〜#n)10〜1n経由で上がってくるノードからのアラームの受信待ちを行う(図4のステップa4)。アラームを受信した場合(図4のステップa5でYES)、統合SVP2はIXS正常性判定手段23によって、IXS(#1)41に異常があると判断し、IXSの状態とノードにおけるIXSとの接続状態を初期状態に戻す状態戻し処理を行う。この状態戻し処理については後述する。
ノードSVP(#0〜#n)10〜1n経由でノードからのアラームを受信しなかった場合(図4のステップa5でNO)、統合SVP2はIXS正常性判定手段23によって、IXS(#1)41はケーブルを含むノード間通信の正常性が確認できたと判断し、以降でIXS(#1)41のみの運用に切替える。統合SVP2はIXS制御手段22によって、IXS(#0)40の状態を運用系から待機系に変更する(図6のステップa6、ステップb2)。
また、統合SVP2はSVP−SVP間通信手段21によって、全ノードSVP(#0〜#n)10〜1nへ各ノード(#0〜#m)30〜3mのIXS接続状態の変更[IXS(#0)40の接続を有効から無効に変更]を指示する(図6のステップa7)。各ノードSVP(#0〜#n)10〜1nはSVP−SVP間通信手段102〜1n2によって、統合SVP2からの指示を受信すると(図7のステップd5)、ノード制御手段101〜1n1によって、制御対象の全ノード(#0〜#m)30〜3mにおけるIXS(#0)40の接続状態を有効から無効に変更するよう制御する(図7のステップd6)。
上記の処理によって、全ノード(#0〜#m)30〜3mはIXS接続ポート部301〜3m1のIXS(#0)40の接続状態を無効に変更する(図7のステップe5)。
上述した処理によって、IXS(#0)40及びIXS(#1)41の切替えが完了し、以後、各ノード(#0〜#m)30〜3mは、はじめ待機系であったIXS(#1)41を使用してノード間通信を行う。また、待機系に変更されたIXS(#0)40に対しては予防保守を行う。これによって、本実施例では、訂正可能障害に続いて発生する可能性がある訂正不可能障害が発生するのを未然に防止することができる。
次に、図4のステップa5において、統合SVP2がノードSVP(#0〜#n)10〜1n経由でノードからアラームを受信した場合(図4のステップa5でYES)に実行される、状態戻し処理について説明する。統合SVP2はIXS正常性判定手段23によって、受信したアラームからIXS(#1)41に異常があると判断し、IXS(#1)41単独での運用ができないことを認識する。そして、統合SVP2はIXSの切替えを中止し、IXSの状態を元の状態(IXS#0:運用系、IXS#1:待機系)に戻す処理を行う。この場合、IXS(#0)40で発生した障害は訂正可能障害であり、IXS(#0)40のエラーは訂正されるため、IXS(#0)40を使用した継続運用は可能である。
統合SVP2はIXS制御手段22によって、IXS(#1)41の状態を運用系から待機系に戻す(図6のステップa8、ステップc2)。次に、統合SVP2はSVP−SVP間通信手段21によって、全ノードSVP(#0〜#n)10〜1nへ全ノード(#0〜#m)30〜3mのIXSとの接続状態の変更[IXS(#1)41との接続状態を有効から無効に変更]を指示する(図6のステップa9)。
各ノードSVP(#0〜#n)10〜1nはSVP−SVP間通信手段102〜1n2によって、統合SVP2からの指示を受信すると(図7のステップd7)、ノード制御手段101〜1n1によって、制御対象の全ノード(#0〜#m)30〜3mのIXS接続状態を変更[IXS(#1)41との接続状態を有効から無効に変更]するように各ノード(#0〜#m)30〜3mに指示する(図7のステップd8)。
ノードSVP(#0〜#n)10〜1nからの指示によって、各ノード(#0〜#m)30〜3mはIXS接続ポート部301〜3m1におけるIXS(#1)41との接続状態を有効から無効に変更する(図7のステップe6)。
上記の処理によって、本実施例では、初期状態への状態戻し処理が完了し、各ノード(#0〜#m)30〜3mが、訂正可能障害が発生したが、エラー訂正によって継続運用可能なIXS(#0)40を使用してノード間通信を行うようになる。尚、異常を検出して切替えができなかった待機系のIXS(#1)41は速やかに保守・修理を行い、次回のIXS切替えが発生した場合に正常に動作できるようにしておく。
このように、本実施例では、多重化されているIXS切替え時に実行中のマルチノードJOBがアボートしてしまい、IXS切替え後にユーザによるJOBの再実行が必要であるという従来のシステムの問題を解決し、IXSの切替えが発生した時にユーザによるマルチノードJOBの再実行を不要とすることができる。
これは、IXSの切替えを訂正不可能障害(重障害)が発生する兆候として、事前に発生する可能性の高い、訂正可能障害(軽障害)が発生した段階で行い、統合SVP2、ノードSVP(#0〜#n)10〜1nを介して、IXSの状態の切替えを「運用系/待機系」の状態から一旦、「運用系/運用系」の状態に変更し、その後「待機系/運用系」の状態に変更するという二段階の状態変更で行うことによって、IXS切替え時にマルチノードJOBがアボートすることを防ぐことができるためである。
但し、本実施例は訂正不可能障害(重障害)の兆候として発生する可能性の高い、訂正可能障害(軽障害)を対象としたものであるため、訂正可能障害が発生せずに、突然、訂正不可能障害(重障害)が発生するようなケースにおいては上記の処理方法を適用することができない。しかしながら、訂正不可能障害(重障害)の兆候として訂正可能障害(軽障害)が発生する可能性は高く、本実施例の効果によって、十分にユーザの手間を削減し、システムの稼働率を向上させることができる。
また、本実施例では、システムに訂正不可能障害(重障害)が発生することを未然に防止することができ、IXS障害に対してより安定した運用が可能なマルチノードシステムを提供することができる。
これは、運用系のIXSに訂正可能障害(軽障害)が発生した段階で、IXSの状態を切替えて保守することによって、訂正可能障害に続いて発生する可能性が高い、訂正不可能障害(重障害)の発生を未然に防止することができるためである。
本発明は、科学技術計算分野等で計算性能が要求されるスーパーコンピュータ等のノード間クロスバスイッチを用いて実現される大規模マルチノード構成のコンピュータシステムに適用可能である。
本発明の実施の形態によるマルチノードコンピュータシステムの構成例を示すブロック図である。 本発明の実施の形態によるIXSの状態変更の概念を示す図である。 本発明の一実施例によるマルチノードコンピュータシステムの構成を示すブロック図である。 本発明の一実施例によるマルチノードコンピュータシステムの動作を示すシーケンスチャートである。 本発明の一実施例によるマルチノードコンピュータシステムの動作を示すシーケンスチャートである。 本発明の一実施例によるマルチノードコンピュータシステムの動作を示すシーケンスチャートである。 本発明の一実施例によるマルチノードコンピュータシステムの動作を示すシーケンスチャートである。 従来のシステムの問題点の概念を示す図である。
符号の説明
2 統合SVP
10〜1n ノードSVP(#0〜#n)
21,102〜1n2 SVP−SVP間通信手段
22 IXS制御手段
23 IXS正常性判定手段
24 障害判別手段
30〜3m ノード(#0〜#m)
40 IXS(#0)
41 IXS(#1)
101〜1n1 ノード制御手段
301〜3m1 IXS接続ポート部
302〜3m2 IXS診断手段
303〜3m3 ポートデータ検証手段
401,411 障害通知手段
500 LAN
600 データ転送パス

Claims (13)

  1. 複数のノードが、多重化された複数のノード間クロスバスイッチを介して相互に接続され、運用系のノード間クロスバスイッチに訂正不可能障害が発生した場合に待機系のノード間クロスバスイッチを運用系に切替えるマルチノードコンピュータシステムであって、
    前記複数のノード間クロスバスイッチを制御する統合サービスプロセッサと、前記複数のノード各々を制御する複数のノードサービスプロセッサとを有し、
    前記統合サービスプロセッサは、前記運用系のノード間クロスバスイッチに訂正可能障害が発生した場合に前記ノードサービスプロセッサを介して前記ノード間クロスバスイッチの運用系/待機系の切替えを「運用系/待機系」の状態から「運用系/運用系」の状態に変更した後に「待機系/運用系」の状態に変更し、
    前記運用系のノード間クロスバスイッチに訂正可能障害が発生した段階で前記ノード間クロスバスイッチにおける前記運用系と前記待機系との切替えを行い、前記訂正可能障害が発生したノード間クロスバスイッチの保守を行うことを特徴とするマルチノードコンピュータシステム。
  2. 前記統合サービスプロセッサは、前記ノード間クロスバスイッチにおける前記運用系と前記待機系との切替えを行う際に、前記ノードサービスプロセッサを介して前記複数のノード各々の前記複数のノード間クロスバスイッチとの接続情報の有効/無効を制御することを特徴とする請求項1記載のマルチノードコンピュータシステム。
  3. 前記統合サービスプロセッサは、前記運用系のノード間クロスバスイッチに訂正可能障害が発生した際に前記待機系のノード間クロスバスイッチの正常性を確認し、前記待機系のノード間クロスバスイッチを正常と判定した時に前記ノード間クロスバスイッチにおける前記運用系と前記待機系との切替えを行うことを特徴とする請求項1または請求項2記載のマルチノードコンピュータシステム。
  4. 前記統合サービスプロセッサは、前記待機系のノード間クロスバスイッチを正常と判定した時に前記ノード間クロスバスイッチを前記訂正可能障害の発生前の状態に戻すことを特徴とする請求項3記載のマルチノードコンピュータシステム。
  5. 複数のノードが、多重化された複数のノード間クロスバスイッチを介して相互に接続され、運用系のノード間クロスバスイッチに訂正不可能障害が発生した場合に待機系のノード間クロスバスイッチを運用系に切替えるマルチノードコンピュータシステムにおいて前記複数のノード間クロスバスイッチを制御する統合サービスプロセッサであって、
    前記運用系のノード間クロスバスイッチに訂正可能障害が発生した場合に前記複数のノード各々を制御する複数のノードサービスプロセッサを介して前記ノード間クロスバスイッチの運用系/待機系の切替えを「運用系/待機系」の状態から「運用系/運用系」の状態に変更した後に「待機系/運用系」の状態に変更する制御手段を有し、
    前記制御手段は、前記運用系のノード間クロスバスイッチに訂正可能障害が発生した段階で前記ノード間クロスバスイッチにおける前記運用系と前記待機系との切替えを行うことを特徴とする統合サービスプロセッサ。
  6. 前記制御手段は、前記ノード間クロスバスイッチにおける前記運用系と前記待機系との切替えを行う際に、前記ノードサービスプロセッサを介して前記複数のノード各々の前記複数のノード間クロスバスイッチとの接続情報の有効/無効を制御することを特徴とする請求項5記載の統合サービスプロセッサ。
  7. 前記運用系のノード間クロスバスイッチに訂正可能障害が発生した際に前記待機系のノード間クロスバスイッチの正常性を確認する手段を含み、
    前記制御手段は、前記待機系のノード間クロスバスイッチが正常と判定された時に前記ノード間クロスバスイッチにおける前記運用系と前記待機系との切替えを行うことを特徴とする請求項5または請求項6記載の統合サービスプロセッサ。
  8. 前記制御手段は、前記待機系のノード間クロスバスイッチが正常と判定された時に前記ノード間クロスバスイッチを前記訂正可能障害の発生前の状態に戻すことを特徴とする請求項7記載の統合サービスプロセッサ。
  9. 複数のノードが、多重化された複数のノード間クロスバスイッチを介して相互に接続され、運用系のノード間クロスバスイッチに訂正不可能障害が発生した場合に待機系のノード間クロスバスイッチを運用系に切替えるマルチノードコンピュータシステムに用いる多重化制御方法であって、
    前記複数のノード間クロスバスイッチを制御する統合サービスプロセッサが、前記運用系のノード間クロスバスイッチに訂正可能障害が発生した場合に前記複数のノード各々を制御する複数のノードサービスプロセッサを介して前記ノード間クロスバスイッチの運用系/待機系の切替えを「運用系/待機系」の状態から「運用系/運用系」の状態に変更した後に「待機系/運用系」の状態に変更する処理を実行し、
    前記統合サービスプロセッサが、前記運用系のノード間クロスバスイッチに訂正可能障害が発生した段階で前記ノード間クロスバスイッチにおける前記運用系と前記待機系との切替えを行うことを特徴とする多重化制御方法。
  10. 前記統合サービスプロセッサが、前記ノード間クロスバスイッチにおける前記運用系と前記待機系との切替えを行う際に、前記ノードサービスプロセッサを介して前記複数のノード各々の前記複数のノード間クロスバスイッチとの接続情報の有効/無効を制御することを特徴とする請求項9記載の多重化制御方法。
  11. 前記統合サービスプロセッサが、前記運用系のノード間クロスバスイッチに訂正可能障害が発生した際に前記待機系のノード間クロスバスイッチの正常性を確認し、前記待機系のノード間クロスバスイッチを正常と判定した時に前記ノード間クロスバスイッチにおける前記運用系と前記待機系との切替えを行うことを特徴とする請求項9または請求項10記載の多重化制御方法。
  12. 前記統合サービスプロセッサが、前記待機系のノード間クロスバスイッチを正常と判定した時に前記ノード間クロスバスイッチを前記訂正可能障害の発生前の状態に戻すことを特徴とする請求項11記載の多重化制御方法。
  13. 複数のノードが、多重化された複数のノード間クロスバスイッチを介して相互に接続され、運用系のノード間クロスバスイッチに訂正不可能障害が発生した場合に待機系のノード間クロスバスイッチを運用系に切替えるマルチノードコンピュータシステムにおいて前記複数のノード間クロスバスイッチを制御する統合サービスプロセッサに実行させるプログラムであって、
    前記運用系のノード間クロスバスイッチに訂正可能障害が発生した場合に前記複数のノード各々を制御する複数のノードサービスプロセッサを介して前記ノード間クロスバスイッチの運用系/待機系の切替えを「運用系/待機系」の状態から「運用系/運用系」の状態に変更した後に「待機系/運用系」の状態に変更する処理を含み、
    前記統合サービスプロセッサが、前記運用系のノード間クロスバスイッチに訂正可能障害が発生した段階で前記ノード間クロスバスイッチにおける前記運用系と前記待機系との切替えを行わせることを特徴とするプログラム。
JP2006055653A 2006-03-02 2006-03-02 マルチノードコンピュータシステム、統合サービスプロセッサ及びそれらに用いる多重化制御方法 Expired - Fee Related JP4887837B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006055653A JP4887837B2 (ja) 2006-03-02 2006-03-02 マルチノードコンピュータシステム、統合サービスプロセッサ及びそれらに用いる多重化制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006055653A JP4887837B2 (ja) 2006-03-02 2006-03-02 マルチノードコンピュータシステム、統合サービスプロセッサ及びそれらに用いる多重化制御方法

Publications (2)

Publication Number Publication Date
JP2007233777A JP2007233777A (ja) 2007-09-13
JP4887837B2 true JP4887837B2 (ja) 2012-02-29

Family

ID=38554303

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006055653A Expired - Fee Related JP4887837B2 (ja) 2006-03-02 2006-03-02 マルチノードコンピュータシステム、統合サービスプロセッサ及びそれらに用いる多重化制御方法

Country Status (1)

Country Link
JP (1) JP4887837B2 (ja)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH088555B2 (ja) * 1989-09-20 1996-01-29 富士通株式会社 二重化接続装置
JPH07311718A (ja) * 1994-05-18 1995-11-28 Nec Corp 2重化システム
JPH1011370A (ja) * 1996-06-19 1998-01-16 Oki Electric Ind Co Ltd 多重化システム
JP3156654B2 (ja) * 1997-10-30 2001-04-16 日本電気株式会社 二重化コンピュータシステムおよびその運用方法
JP2000244526A (ja) * 1999-02-23 2000-09-08 Hitachi Ltd 多重化したネットワーク接続装置システム
JP2004013723A (ja) * 2002-06-10 2004-01-15 Nec Computertechno Ltd 共有メモリを使ったクラスタ構成を採用した情報処理システムの障害処理装置と方法
JP3988146B2 (ja) * 2004-07-27 2007-10-10 日本電気株式会社 マルチノードシステム、ノード間クロスバスイッチ、ノード、スイッチプログラム及びノードプログラム

Also Published As

Publication number Publication date
JP2007233777A (ja) 2007-09-13

Similar Documents

Publication Publication Date Title
JP4330547B2 (ja) 情報処理システムの制御方法、情報処理システム、情報処理システムの制御プログラム、冗長構成制御装置
US9195553B2 (en) Redundant system control method
JP2006178557A (ja) コンピュータシステム及びエラー処理方法
JP4315016B2 (ja) コンピュータシステムの系切替方法
JP5287974B2 (ja) 演算処理システム、再同期方法、およびファームプログラム
JP6083480B1 (ja) 監視装置、フォールトトレラントシステムおよび方法
JP2006039897A (ja) マルチノードシステム、ノード間クロスバスイッチ、ノード、スイッチプログラム及びノードプログラム
JP4117684B2 (ja) フォルトトレラント・二重化コンピュータシステムとその制御方法
JPH0375834A (ja) パリティの置換装置及び方法
JP4629793B2 (ja) 情報処理装置、エラー処理方法
JP4887837B2 (ja) マルチノードコンピュータシステム、統合サービスプロセッサ及びそれらに用いる多重化制御方法
JPH07182189A (ja) 計算機システム及びプロセッサチップ及び障害復旧方法
JP6089766B2 (ja) 情報処理システム、及び情報処理装置の障害処理方法
JP6394727B1 (ja) 制御装置、制御方法、及び、フォールトトレラント装置
JP6654662B2 (ja) サーバ装置およびサーバシステム
JP3156654B2 (ja) 二重化コンピュータシステムおよびその運用方法
JP4640359B2 (ja) フォールトトレラントコンピュータ、フォールトトレラントコンピュータにおける同期制御方法
JP2606107B2 (ja) プロセッサ冗長化方式
JP2004013723A (ja) 共有メモリを使ったクラスタ構成を採用した情報処理システムの障害処理装置と方法
JP3652232B2 (ja) マイクロコンピュータのエラー検出方法及びエラー検出回路及びマイクロコンピュータシステム
JP4399792B2 (ja) 二重化プロセッサシステム
JP2010055509A (ja) 障害復旧システム、方法及びプログラム、並びにクラスタシステム
JP2002312333A (ja) マルチプロセッサ初期化/並行診断方法
JPH04241039A (ja) ベーシックプロセッシングユニット及び高信頼化コンピュータシステム
JP2011022741A (ja) コンピュータシステム、サービスプロセッサ、及びその診断方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110726

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110829

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111115

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111128

R150 Certificate of patent or registration of utility model

Ref document number: 4887837

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141222

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees