JP5470884B2 - マルチノードシステム、異常処理方法、スイッチ、ノード及びプログラム - Google Patents

マルチノードシステム、異常処理方法、スイッチ、ノード及びプログラム Download PDF

Info

Publication number
JP5470884B2
JP5470884B2 JP2009029752A JP2009029752A JP5470884B2 JP 5470884 B2 JP5470884 B2 JP 5470884B2 JP 2009029752 A JP2009029752 A JP 2009029752A JP 2009029752 A JP2009029752 A JP 2009029752A JP 5470884 B2 JP5470884 B2 JP 5470884B2
Authority
JP
Japan
Prior art keywords
node
switch
abnormality
diagnostic
data transfer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009029752A
Other languages
English (en)
Other versions
JP2010186302A (ja
Inventor
浩子 中曽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009029752A priority Critical patent/JP5470884B2/ja
Publication of JP2010186302A publication Critical patent/JP2010186302A/ja
Application granted granted Critical
Publication of JP5470884B2 publication Critical patent/JP5470884B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)

Description

本発明はマルチノードシステム、異常処理方法、スイッチ、ノード及びプログラムに関する。
マルチノードシステムに関する技術が特許文献1に開示されている。特許文献1に記載のマルチノードシステムは、複数のノードと、これらの複数のノードからの転送データを転送先のノードに送信するスイッチを備えた複数のノード間クロスバスイッチから構成される。また、ノード間クロスバスイッチは、ノード間クロスバスイッチ内の障害処理や構成制御を行う診断装置を有する。
特許文献1に記載のマルチノードシステムは、スイッチに障害が発生した場合、診断装置がデータ転送パスを用いて、ノード間クロスバスイッチが障害状態にあるというステータス通信を全ノードに通知する。そして、各ノードは、使用するノード間クロスバスイッチを障害が発生していないノード間クロスバスイッチのみとする。
しかし、特許文献1に記載のマルチノードシステムは、データ転送パスを用いて、ステータス通信を行っている。そのため、ノード間クロスバスイッチが正常に初期化され、データ転送パスが使用可能となるまでにノード間クロスバスイッチの障害が発生した場合には、ステータス通信が全ノードに通知される保障がなく、マルチノードシステム全体として統一されたステータスを認識することができなくなってしまうという問題がある。
例えば、ノード間クロスバスイッチの初期化に失敗し、ノード間クロスバスイッチとデータ転送パスによって通信可能なノードと、通信可能でないノードができてしまった場合は、ステータス通信を通信可能なノードのみが受信することとなる。この場合は、ノード間クロスバスイッチを使用できると判断するノードと、使用できないと判断するノードができてしまい、各ノードにおける処理に不整合が生じてしまうという問題がある。これは、ノード間クロスバスイッチが障害状態にあるというステータスを認識することができていないノードができてしまっている、つまり、マルチノードシステム全体として統一されたステータスを認識することができていないためである。
また、特許文献1に記載のマルチノードシステムは、診断装置が故障している場合、ノード間クロスバスイッチにおいて発生した障害を各ノードに通知することができず、各ノードは障害状態にあるノード間クロスバスイッチを誤って使用してしまうという問題がある。これは、診断装置が障害状態にある、もしくは、ノード間クロスバスイッチが障害状態にあるというステータスを各ノードが認識することができていない、つまり、マルチノードシステム全体として統一して認識することができていないためである。
なお、特許文献2には、ノード間制御装置とノードとの間に通信障害が発生した場合に、通信障害が発生したノード間通信制御装置を直ちに初期化し、初期化が成功したか否かに応じて発生した障害を間欠障害と固定障害とに区別し、障害に応じた処理を行う技術が開示されている。
しかし、特許文献2に記載のマルチノードシステムは、ノード間でデータのやりとりを行うための経路とは異なる統合サービスプロセッサとノード用サービスプロセッサ間の経路において通信を正常に行うことができない場合は、統合サービスプロセッサから各ノードに対しノード間通信制御装置をシステムから切り離す指示を出すことができない。
また、特許文献2に記載のマルチノードシステムは、各ノード間通信制御装置の構成制御や障害監視などの処理を行う統合サービスプロセッサが故障している場合は、ノード間通信制御装置とノードとの間で通信障害が発生しても、各ノードに対しノード間通信制御装置をシステムから切り離す指示を出すことができない。
つまり、特許文献2に記載のマルチノードシステムにおいても、これらのような場合は、マルチノードシステム全体として統一されたステータスを認識することができなくなってしまうという問題がある。
また、特許文献3には、ノード及びノード間接続網に備えた診断プロセッサ間をノード間データ転送用とは別の診断専用バスで接続し、相互に連絡し合うことにより障害処理と構成制御とを行うようにし、ノードとノード間接続網とのインタフェース部で障害が発生した場合でも、障害を検出した側が疑似障害を発生させ、相手側に余計な障害検出を実施させる無駄をなくし、ノードをマルチノードシステムから切り離す技術が開示されている。
しかし、特許文献3に記載のマルチノードシステムは、診断専用バスにおいて通信を正常に行うことができない場合は、障害を発生したノードから他のノードやノード間接続網にノード間障害報告信号を送出することができない。
また、特許文献3に記載のマルチノードシステムは、各ノード間接続網の診断および障害処理を行う診断プロセッサが故障している場合は、ノードとノード間接続網とのインタフェース部で障害が発生しても、他のノードやノード間接続網にノード間障害報告信号を送出することができない。
つまり、特許文献3に記載のマルチノードシステムにおいても、これらのような場合は、マルチノードシステム全体として統一されたステータスを認識することができなくなってしまうという問題がある。
特開2006−039897号公報 特開2006−146685号公報 特開平10−333932号公報
背景技術として説明したように、マルチノードシステムは、マルチノードシステム全体として統一されたステータスを認識することができなくなってしまうことがあるという問題がある。
本発明の目的は、上述のような問題を解決するためになされたものであり、マルチノードシステム全体として統一されたステータスを認識することができるマルチノードシステム、異常処理方法、スイッチ、ノード及びプログラムを提供することにある。
本発明にかかるマルチノードシステムは、複数のノードと、前記複数のノードに含まれる任意のノード間でデータ転送用パスを介してデータを転送するスイッチと、前記スイッチの異常を検出した場合に、検出した異常を通知する異常通知を前記データ転送用パスに出力するとともに、前記データ転送用パスとは異なる診断用パスに出力するスイッチ診断装置と、前記異常通知を前記データ転送用パスもしくは前記診断用パスから取得するノード診断装置を備えたものである。
他方、本発明にかかるマルチノードシステムは、複数のノードと、前記複数ノードに含まれる任意のノード間でデータ転送用パスを介してデータを転送するスイッチと、前記スイッチの異常を検出した場合に、検出した異常を通知する異常通知を前記データ転送用パスを介して前記ノードに出力するスイッチ診断装置と、前記異常通知を前記データ転送用パスもしくは前記診断用パスから取得するノード診断装置と、前記診断用パスによって前記ノード及び前記スイッチと接続され、前記スイッチの初期化指示を前記スイッチ診断装置に出力し、前記スイッチの初期化指示に応じて、前記スイッチの初期化を実行した前記スイッチ診断装置より出力された前記スイッチの初期化結果通知が初期化失敗を示している場合に、前記異常通知を前記ノードに出力する保守装置を備えたものである。
本発明にかかる異常処理方法は、複数のノード間でデータ転送用パスを介してデータ転送を行うスイッチの異常処理方法であって、前記スイッチの異常を検出するステップと、検出した異常を前記ノードに通知する異常通知を前記データ転送用パスに出力するステップと、検出した異常を前記ノードに通知する異常通知を前記データ転送用パスとは異なる診断用パスに出力するステップを備えたものである。
本発明にかかるスイッチは、複数のノードと、データ転送用パスを介して前記ノードから出力された転送データを転送先のノードに出力するスイッチであって、前記スイッチの異常を検出した場合に、検出した異常を前記ノードに通知する異常通知を前記データ転送用パスに出力するとともに、前記データ転送用パスとは異なる診断用パスに出力するスイッチ診断装置を備えたものである。
本発明にかかるノードは、他のノードに転送する転送データをデータ転送用パスを介してスイッチに出力するノードであって、前記スイッチから出力され、前記スイッチの異常を通知する異常通知を前記データ転送用パスもしくは前記データ転送用パスとは異なる診断用パスから取得するノード診断装置を備えたものである。
本発明にかかるプログラムは、複数のノードと、データ転送用パスを介して前記ノードから出力された転送データを転送先のノードに出力するスイッチを制御するプログラム、 前記スイッチの異常を検出するステップと、検出した異常を前記ノードに通知する異常通知を前記データ転送用パスに出力するステップと、検出した異常を前記ノードに通知する異常通知を前記データ転送用パスとは異なる診断用パスに出力するステップをコンピュータに実行させるものである。
他方、本発明にかかるプログラムは、他のノードに転送する転送データをデータ転送用パスを介してノード間クロスバスイッチに出力するノードを制御するプログラムであって、前記スイッチから出力され、前記スイッチの異常を通知する異常通知を前記データ転送用パスもしくは前記データ転送用パスとは異なる診断用パスから取得するステップをコンピュータに実行させるものである。
本発明により、マルチノードシステム全体として統一されたステータスを認識することができるマルチノードシステム、異常処理方法、スイッチ、ノード及びプログラムを提供することができる。
実施の形態1にかかるマルチノードシステムの概要を示すブロック図である。 実施の形態1にかかるマルチノードシステムのブロック図である。 実施の形態1にかかるマルチノードシステムの診断プロセッサのブロック図である。 実施の形態1にかかるマルチノードシステムの保守用プロセッサのブロック図である。 実施の形態1にかかるマルチノードシステムの構成情報を示す図である。 実施の形態1にかかるマルチノードシステムの処理の概要を示す図である。 実施の形態1にかかるマルチノードシステムの処理を示すフローチャートである。 実施の形態1にかかるマルチノードシステムの運用中の処理を示すフローチャートである。 実施の形態2にかかるマルチノードシステムの処理の概要を示す図である。 実施の形態2にかかるマルチノードシステムの処理を示すフローチャート図である。
発明の実施の形態1.
まず、図1を参照して、本発明の実施の形態1にかかるマルチノードシステムの概要について説明する。
マルチノードシステムは、スイッチ診断装置4を有するスイッチ1と、ノード診断装置5を有するノード2及びノード診断装置6を有するノード3を備える。スイッチ1及びノード2、3は、データ転送用パス7によって相互に接続される。また、スイッチ1及びノード2、3は、診断用パス8によって相互に接続される。
スイッチ1は、ノード2及びノード3間でデータ転送用パス7を介して転送データを転送先のノードに転送する処理を行う。
スイッチ診断装置4は、スイッチ1の異常を検出した場合に、検出した異常を通知する異常通知をデータ転送用パス7に出力するとともに、診断用パス8に出力する。
ノード2、3は、スイッチ1を介して相互に転送データの転送を行いながら演算処理を実行する。
ノード診断装置5、6は、データ転送用パス7もしくは診断用パス8から異常通知を取得する。また、ノード診断装置5、6は、異常通知を取得した場合に、ノード2、3をスイッチ1から切り離し、自身の有しているスイッチ1のステータスを切り離し状態に変更する処理を行う。
続いて、本発明の実施の形態1にかかるマルチノードシステムの処理の概要について説明する。
まず、スイッチ1のスイッチ診断装置4は、スイッチ1の異常を検出した場合に、検出した異常を通知する異常通知をデータ転送用パス7に出力するとともに、診断用パス8に出力する。
ノード2、3のノード診断装置5、6は、データ転送用パス7もしくは診断用パス8から異常通知を取得する。そして、ノード診断装置5、6は、異常通知を取得すると、ノード2、3をスイッチ1から切り離し、自身の有しているスイッチ1のステータスを切り離し状態に変更する処理を行う。
続いて、図2を参照して、本発明の実施の形態1にかかるマルチノードシステムについて詳細に説明する。
マルチノードシステムは、ノード間クロスバスイッチ10、11、ノード30、31及び保守用プロセッサ40を備える。ノード間クロスバスイッチ10、11及びノード30、31は、データ転送用パス100によって相互に接続される。また、ノード間クロスバスイッチ10、11、ノード30、31及び保守用プロセッサ40は、診断用パス101によって相互に接続される。なお、図2に示すマルチノードシステムは、n個のノードを有し、ノード間クロスバスイッチ内にm個のスイッチを有する例である。また、各ノードは、ノード間制御装置(以下、「RCU」とする)及びCPU(Central Processing Unit)をそれぞれm個ずつ有する例である。なお、n及びmは正整数である。
ノード間クロスバスイッチ10は、診断プロセッサ50を有するスイッチ20及び診断プロセッサ51を有するスイッチ21を含む。ノード間クロスバスイッチ11は、診断プロセッサ52を有するスイッチ22及び診断プロセッサ53を有するスイッチ23を含む。
スイッチ20、21、22、23は、複数のノードに含まれる任意のノード間でデータ転送用パス100を介して転送データを転送先のノードに転送する処理を行う。
診断プロセッサ50、51、52、53は、スイッチ20、21、22、23の電源制御、初期化処理、構成制御および障害処理を行う。なお、診断プロセッサ50、51、52、53については、後に詳述する。診断プロセッサ50、51、52、53は、スイッチ診断装置として機能する。
ノード30は、診断プロセッサ60、RCU70、71、72、CPU80、81、82及び共有メモリ90を含む。ノード31は、診断プロセッサ61、RCU73、74、75、CPU83、84、85及び共有メモリ91を含む。
診断プロセッサ60、61は、ノード30、31の電源制御、初期化処理、構成制御および障害処理を行う。なお、診断プロセッサ60、61については、後に詳述する。診断プロセッサ60、61は、ノード診断装置として機能する。
RCU70、71、72、73、74、75は、CPU80、81、82、83、84、85からの転送リクエストに応じて、ノード30、31からノード間クロスバスイッチ10、11に転送データを出力する。また、RCU70、71、72、73、74、75は、ノード間クロスバスイッチ10、11から出力された転送データを取得する処理を行う。
CPU80、81、82、83、84、85は、共有メモリ90、91に記憶されるデータを用いて、演算処理を実行する。また、CPU80、81、82、83、84、85は、転送データを他のノードに転送する場合は、RCU70、71、72、73、74、75に転送データの転送を依頼する転送リクエストを出力する。
共有メモリ90、91は、CPU80、81、82、83、84、85の演算処理に用いられるデータを記憶する。また、このデータには、他のノードに転送する転送データが含まれる。
保守用プロセッサ40は、診断プロセッサ50、51、52、53、60、61に対してマルチノードシステムの保守やノード30、31及びノード間クロスバスイッチ10、11の制御を行う。なお、保守用プロセッサ40については、後に詳述する。保守プロセッサ40は、保守装置として機能する。
続いて、図3を参照して、本発明の実施の形態1にかかるマルチノードシステムの診断プロセッサについて説明する。
診断プロセッサ50、51、52、53、60、61は、ハードウェア制御部(以下、「HW制御部」とする)110、電源制御部111、初期化処理部112、構成制御部113、障害処理部114、ステータス情報記憶部115、保守用プロセッサ通信部116を備える。
HW制御部110は、電源制御部111、初期化処理部112、構成制御部113もしくは障害処理部114からの処理要求に応じて、自身を含む装置を制御する処理を行う。また、HW制御部110は、構成制御部113からの要求に応じて、スイッチ20、21、22、23とノード30、31間で、データ転送用パスを介して任意のデータを出力する処理を行う。また、HW制御部110は、データ転送用パスを介して出力された任意のデータを取得し、取得したデータを構成制御部113に出力する処理を行う。なお、実際にデータ転送用パスへのデータを出力およびデータ転送用パスからのデータの取得をする処理は、ノード間クロスバスイッチ10、11ではスイッチ20、21、22、23によって、ノード30、31ではRCU70、71、72、73、74、75によって行われる。
ここで、自身を含む装置とは、診断プロセッサ50、51、52、53の場合は、スイッチ20、21、22、23であり、診断プロセッサ60、61の場合は、ノード30、31である。
電源制御部111は、HW制御部110に電源投入や電源切断の処理要求を出力することにより、自身を含む装置の電源投入や電源切断などの処理を行う。
初期化処理112は、HW制御部110に初期化の処理要求を出力することにより、自身を含む装置を初期化する処理を行う。
構成制御部113は、HW制御部110に状態遷移の処理要求を出力することにより、自身を含む装置を通常状態や切り離し状態に遷移する等の処理を行う。自身を含む装置がスイッチ20、21、22、23の場合、通常状態は、ノード30、31から出力された転送データを転送して動作する状態であり、切り離し状態は、ノード30、31から切り離して転送データの転送を行わずに動作する状態である。自身を含む装置がノード30、31の場合、通常状態は、スイッチ20、21、22、23を介して他のノードと相互に転送データの転送を行って動作する状態であり、切り離し状態は、スイッチ20、21、22、23から切り離して転送データの転送を行わずに動作する状態である。また、構成制御部113は、ステータス情報記憶部115に格納する構成情報を更新する処理を行う。なお、構成情報については後に詳述する。
障害処理部114は、自身を含む装置において障害などの異常が発生した場合に、HW制御部110に障害情報取得の処理要求を出力することにより、自身を含む装置からの障害情報を取得し、取得した障害情報から障害ログを生成する等の処理を行う。また、障害処理部114は、取得した障害情報に基づいて、自身を含む装置を切り離し状態にするか否かの判断を行う。
ステータス情報記憶部115は、自身を含む装置および自身を含む装置に関連する装置のステータスを示す構成情報を格納する。ステータス情報記憶部115は、例えば、メモリにより構成される。
保守用プロセッサ通信部116は、電源制御部111、初期化処理部112、構成制御部113もしくは障害処理部114からの要求に応じて、保守用プロセッサ40に診断用パスを介して任意のデータを出力する処理を行う。また、保守用プロセッサ通信部116は、保守用プロセッサ40から診断用パスを介して出力された任意のデータを取得し、取得したデータをそのデータの内容に応じて、電源制御部111、初期化処理部112、構成制御部113もしくは障害処理部114に出力する処理を行う。
続いて、図4を参照して、本発明の実施の形態1にかかるマルチノードシステムの保守用プロセッサについて説明する。
保守用プロセッサ40は、診断プロセッサ通信部120、ハードウェア操作部(以下、「HW操作部」とする)121、構成制御部122、障害処理部123及びユーザインタフェース部124、外部記憶装置125を備える。
診断プロセッサ通信部120は、HW操作部121、構成制御部122もしくは障害処理部123からの要求に応じて、診断プロセッサ50、51、52、53、60、61に診断用パスを介して任意のデータを出力する処理を行う。また、診断プロセッサ50、51、52、53、60、61から診断用パスを介して出力された任意のデータを取得し、取得したデータをそのデータの内容に応じて、HW操作部121、構成制御部122もしくは障害処理部123に出力する処理を行う。
HW操作部121は、ユーザインタフェース部124からの指示に応じて、ノード間クロスバスイッチ10、11やノード30、31に電源投入、電源切断もしくは初期化などの指示を出力する処理を行う。
構成制御部122は、マルチノードシステム内のスイッチ20、21、22、23やノード30、31の状態を管理する処理を行う。構成制御部122は、スイッチ20、21、22、23やノード30、31から出力されたステータス情報を外部記憶装置125に格納する処理を行う。
障害処理部123は、スイッチ20、21、22、23やノード30、31から出力された障害ログを外部記憶装置125に格納する処理を行う。また、障害処理部123は、HW操作部121がノード間クロスバスイッチ10、11もしくはノード30、31に電源投入、電源切断もしくは初期化などの指示を出力した場合に、これらの指示に応じた処理を実行した結果が所定の時間内に保守用プロセッサ40に出力されてくるかどうかを監視する処理を行う。
ユーザインタフェース部124は、使用者からのノード間クロスバスイッチ10、11やノード30、31の電源投入、電源切断または初期化などの指示の入力を処理する。また、ユーザインタフェース部124は、これらの指示の入力に基づいて操作ログを生成し、生成した操作ログを外部記憶装置125に格納する処理を行う。
外部記憶装置125は、マルチノードシステム内の全診断プロセッサ50、51、52、53、60、61のそれぞれがステータス情報記憶部115に格納する構成情報と同様の内容を格納する。また、外部記憶装置125は、操作ログ及び障害ログを格納する。外部記憶装置125は、例えば、不揮発性のメモリやHDD(Hard Disc Drive)等の記憶装置である。
続いて、図5を参照して、本発明の実施の形態1にかかるマルチノードシステムの構成情報について説明する。
図5(a)は、スイッチ20、21、22、23のステータス情報格納部115に格納する構成情報を示す図である。
"SW番号"は、スイッチ20、21、22、23の番号を示す情報である。
"Port番号"は、スイッチ20、21、22、23が含まれるノード間クロスバスイッチの番号を示す情報である。
"ステータス"の"SW"は、スイッチ20、21、22、23が通常状態であるのか、切り離し状態であるのかを示す情報である。
"ステータス"の"ノード"は、スイッチ20、21、22、23のポート部およびこのポート部の先に接続されているノードが通常状態であるのか、切り離し状態であるのかを示す情報である。
図5(b)は、ノード30、31のステータス情報格納部115に格納する構成情報を示す図である。
"RCU実装状況"は、RCUが実装されているか、未実装であるのかを示す情報である。
"RCUポート部実装状況"は、RCUのポート部およびこのポート部とスイッチ20、21、22、23のポート部とを接続するケーブルが実装されているか、未実装であるのかを示す情報である。
"ステータス"の"RCU縮退情報"は、RCUが通常状態であるのか、切り離し状態であるのかを示す情報である。
"ステータス"の"ノード間クロスバスイッチステータス"は、RCUのポート部およびこのポート部の先に接続されているノード間クロスバスイッチが通常状態であるのか、切り離し状態であるのかを示す情報である。
続いて、本発明の実施の形態1にかかるマルチノードシステムのデータ転送用パスによるデータ転送処理について説明する。
ノード30、31間のデータ転送は、ノード30、31内のCPU80、81、82、83、84、85からRCU70、71、72、73、74、75に転送リクエストが出力されることにより開始される。
例えば、ノード30の共有メモリ90に記憶するデータをノード31の共有メモリ31に転送する場合、CPU80は、転送リクエストをRCU70に出力する。
RCU70はCPU80から出力された転送リクエストを取得すると、転送データを共有メモリ90から読み出し、転送データをノード間クロスバスイッチ10のスイッチ20に出力する。
ノード間クロスバスイッチ10のスイッチ20は、ノード30から出力された転送データを取得し、取得した転送データに含まれる転送先のノードを示す番号に従って、スイッチを切り替え、ノード31に転送データを出力する。
RCU73は、ノード間クロスバスイッチ10から出力された転送データを取得して、取得した転送データを共有メモリ91に書き込む。
続いて、図6及び図7を参照して、本実施の形態1にかかるマルチノードシステムの処理について説明する。ここでは、ノード間クロスバスイッチ10のスイッチ20の初期化において、スイッチ20の初期化に失敗した場合について例示する。
まず、使用者は、ノード間クロスバスイッチ10、11の初期化を行う場合、ユーザインタフェース部124にノード間クロスバスイッチ10、11の初期化の指示を入力する(S300)。
ユーザインタフェース部124は、使用者からノード間クロスバスイッチ10、11の初期化の指示が入力されると、その指示をHW操作部121に出力する。そして、HW操作部121は、ユーザインタフェース部124から出力されたノード間クロスバスイッチ10、11の初期化の指示を取得すると、初期化指示の出力要求を診断プロセッサ通信部120に出力する。診断プロセッサ通信部120は、HW操作部121からの要求に応じて、初期化指示を診断用パス101を介してノード間クロスバスイッチ10、11の各スイッチ20、21、22、23に出力する(S301)。
スイッチ20、21、22、23の診断プロセッサ50、51、52、53の保守用プロセッサ通信部116は、保守用プロセッサ40から診断用パス101を介して出力されたデータを取得する(S310)。
保守用プロセッサ通信部116は、取得したデータが初期化指示であると判断すると、この初期化指示を初期化処理部112に出力する(S311)。
初期化処理部112は、保守用プロセッサ通信部116から出力された初期化指示を取得すると、1回目のスイッチ20、21、22、23の初期化を行う(S312)。
初期化処理部112は、ステップS313における初期化が正常に終了したか、失敗したかを判断する(S313)。そして、初期化処理部112は、初期化結果を構成制御部113に出力する。
初期化処理部112から出力された初期化結果が正常終了を示している場合、構成制御部113は、ノード間クロスバスイッチ10、11のステータスを正常のままとする旨を示すステータス更新通知の出力要求を保守用プロセッサ通信部116に出力する。保守用プロセッサ通信部116は構成制御部113からの要求に応じて、ステータス更新通知を診断用パスを介して保守用プロセッサ40に出力する(S315)。
初期化処理部112から出力された初期化結果がスイッチ20の初期化の失敗を示している場合、構成制御部113は、初期化を2回実行済みかどうかを判断する(S314)。
初期化を2回実行済みでない場合、構成制御部113は、再度スイッチ20の初期化を行うための初期化指示を初期化処理部112に出力する(S311)。そして、初期化処理部112は、構成制御部113から出力された初期化指示を取得すると、再びスイッチ20の初期化を行う(S312)。
なお、ここではスイッチ20の初期化に失敗した場合を例示しているため、スイッチ20の診断プロセッサ50に含まれている初期化処理部112及び構成制御部113における処理となる。
初期化を2回実行済みである場合、構成制御部113は、スイッチ20の異常を通知する異常通知として、スイッチ20を含むノード間クロスバスイッチ10のステータスを異常とする旨を示すステータス更新通知の出力要求をHW制御部110及び保守用プロセッサ通信部116に出力する。HW制御部110は、構成制御部113からの要求に応じて、ステータス更新通知をデータ転送用パス100を介して、各ノード30、31に出力する。また、保守用プロセッサ通信部116は、構成制御部113からの要求に応じて、ステータス更新通知を診断用パス101を介して保守用プロセッサ40に出力する(S315)。
なお、ノード30、31の診断プロセッサがステータス更新通知をデータ転送用パス100を介して取得した場合における処理は、後に詳述する。
保守用プロセッサ40では、ノード間クロスバスイッチ10、20の初期化指示の結果として、ステータス更新通知を待ち合わせており、診断プロセッサ通信部120は、ノード間クロスバスイッチ10、20の各診断プロセッサ50、51、52、53から出力されたステータス更新通知を取得し、取得したステータス更新通知を構成制御部122に出力する(S302)。
構成制御部122は、診断プロセッサ通信部120から出力されたステータス更新通知を取得し、取得したステータス更新通知に基づいて、ノード間クロスバスイッチ10、20の各スイッチ20、21、22、23の初期化に成功したか、失敗したかを判断する(S303)。
ステータス更新通知がノード間クロスバスイッチ10、11のステータスを正常のままとする旨を示している場合、初期化に成功しているため、構成制御部122は、処理を終了して次の処理を待ち合わせる(S307)。
ステータス更新通知がノード間クロスバスイッチ10のステータスを異常とする旨を示している場合、初期化に失敗しているため、構成制御部122は、取得したステータス更新通知の出力要求を診断プロセッサ通信部120に出力する。診断プロセッサ通信部120は、構成制御部122からの要求に応じて、ステータス更新通知を診断用パス101を介して、全診断プロセッサ50、51、52、53、60、61に出力する(S304)。
なお、ここでは、診断プロセッサ51、52、53から出力されたステータス更新通知が初期化に成功した旨を示しており、スイッチ20に含まれる診断プロセッサ50から出力されたステータス更新通知が初期化に失敗した旨を示していることとなる。
診断プロセッサ50、51、52、53、60、61の保守用プロセッサ通信部116は、保守用プロセッサ40から診断用パス101を介して出力されたデータを取得すると、取得したデータがステータス更新通知かどうかを判断する(S320、321)。
ステータス更新通知である場合、保守用プロセッサ通信部116は、取得したデータであるステータス更新通知を構成制御部113に出力する。
ステータス更新通知でない場合、保守用プロセッサ通信部116は、データの内容に応じて、電源制御部111、初期化処理部112、構成制御部113もしくは障害処理部114に出力する。それにより、データの内容に合わせた処理を実行する(S322)。
構成制御部113は、保守用プロセッサ通信部116から出力されたステータス更新通知を取得すると、ステータス更新通知の内容に従って、ノード間クロスバスイッチ10を切り離し状態にする処理を行う(S323)。
また、構成制御部113は、ステータス情報記憶部115に格納する構成情報のうち、ノード間クロスバスッチ10もしくはそれに含まれるスイッチ20、21のステータスを切り離し状態に変更する処理を行う(S324)。
なお、ステップS324では、ノード間クロスバスイッチ10の診断プロセッサ50、51の構成制御部113は、ステータス情報記憶部115に含まれる構成情報のステータスの"SW"を"1"の切り離し状態に変更する。また、ノード30、31の診断プロセッサ60、61の構成制御部113は、ステータス情報記憶部115に含まれる構成情報のステータスの"ノード間クロスバスイッチステータス"のノード間クロスバスイッチ10を示すbit0を"1"の切り離し状態に変更する。
そして、構成制御部113は、変更した構成情報を含んだステータス通知の出力要求を保守用プロセッサ通信部116に出力する。保守用プロセッサ通信部116は、構成制御部113からの要求に応じて、ステータス通知を診断用パス101を介して、保守用プロセッサ40に出力する(S325)。
保守用プロセッサ40の診断プロセッサ通信部120は、診断プロセッサ50、51、60、61から出力されたステータス通知を取得し、取得したステータス通知を構成制御部122に出力する(S305)。
構成制御部122は、診断プロセッサ通信部120から出力されたステータス通知を取得し、取得したステータス通知に含まれる構成情報を外部記憶装置125に格納する(S306)。そして、構成制御部122は、処理を終了して次の処理を待ち合わせる(S307)。
このように、保守用プロセッサ40の構成制御部122は、マルチノードシステムに含まれる全診断プロセッサ50、51、52、53、60、61のステータス情報格納部115に格納する構成情報を更新した場合、更新した構成情報を外部記憶装置125にも格納する。これにより、外部記憶装置125には、常に最新の構成情報が退避される。
また、これにより、マルチノードシステムに電源が投入され、保守用プロセッサ40及び診断プロセッサ50、51、52、53、60、61が起動した場合に、外部記憶装置125に記憶されている構成情報を保守用プロセッサ40から診断プロセッサ50、51、52、53、60、61に出力し、出力した構成情報を診断プロセッサ50、51、52、53、60、61のステータス情報記憶部115に格納することができる。
より具体的には、構成制御部122が外部記憶装置125から構成情報を取得し、取得した構成情報の出力要求を診断プロセッサ通信部120に出力する。診断プロセッサ通信部120は、構成制御部122からの要求に応じて、構成情報を診断用パス101を介して、各診断プロセッサ50、51、52、53、60、61に出力する。各診断プロセッサ50、51、52、53、60、61の保守用プロセッサ通信部116は、保守用プロセッサ40から出力された構成情報を取得し、取得した構成情報を構成制御部113に出力する。構成制御部113は、保守用プロセッサ通信部116から出力された構成情報をステータス情報記憶部115に格納する。
その結果、ステータス情報記憶部115が揮発性の記憶装置によって構成されていても、マルチノードシステムの電源切断および投入をまたいで、ノード間クロスバスイッチ10、11の切り離し状態を引き継ぐことができる。
以上に説明したように、本実施の形態1においては、スイッチの初期化に失敗した場合、異常通知として、ステータス更新通知をデータ転送用パス100及び診断用パス101に出力している。これにより、スイッチの初期化失敗によってデータ転送用パスが通信不能となっていても、ステータス更新通知を診断用パスを介して、各診断プロセッサに通知することができる。
続いて、図8を参照して、本実施の形態1にかかるマルチノードシステムの運用中の処理について説明する。なお、本実施の形態1において、運用中とは、ノード間クロスバスイッチ10、11及びノード30、31の電源投入および初期化が完了した状態をいう。ここでは、ノード間クロスバスイッチ10、11及びノード30、31の電源投入および初期化が正常に完了した状態における処理について例示する。また、ノード間クロスバスイッチ10のスイッチ20において異常が発生した場合について例示する。
まず、ノード間クロスバスイッチ10のスイッチ20において異常が発生すると、スイッチ20の診断プロセッサ50の障害処理部114が発生した異常を検出する(S410)。
障害処理部114は、発生した異常に関する情報を障害情報としてスイッチ20から取得する。障害処理部114は、取得した障害情報に基づいて、スイッチ20の切り離しが必要かどうかを判断し、スイッチ20の切り離しが必要な場合は、スイッチ20の切り離し指示を構成制御部113に出力する。
構成制御部113は、障害処理部114から出力された切り離し指示に応じて、スイッチ20を切り離し状態にする処理を行う(S411)。
また、構成制御部113は、ステータス情報記憶部115に格納する構成情報のうち、スイッチの20のステータスを切り離し状態に変更する処理を行う(S412)。
なお、ステップS412では、構成制御部113は、診断プロセッサ50のステータス情報記憶部115に含まれる構成情報のステータスの"SW"を"1"の切り離し状態に変更する。
そして、構成制御部113は、変更した構成情報を含んだステータス通知の出力要求を保守用プロセッサ通信部116に出力する。保守用プロセッサ通信部116は、構成制御部113からの要求に応じて、ステータス通知を診断用パス101を介して、保守用プロセッサ40に出力する(S413)。
保守用プロセッサ40の診断プロセッサ通信部120は、診断プロセッサ50から出力されたステータス通知を取得し、取得したステータス通知を構成制御部122に出力する(S400)。
構成制御部122は、診断プロセッサ通信部120から出力されたステータス通知を取得し、取得したステータス通知に含まれる構成情報を外部記憶装置125に格納する(S401)。
また、構成制御部113は、スイッチ20の異常を通知する異常通知として、スイッチ20を含むノード間クロスバスイッチ10のステータスを異常とする旨を示すステータス更新通知の出力要求をHW制御部110に出力する。HW制御部110は、構成制御部113からの要求に応じて、ステータス更新通知をデータ転送用パス100を介して、各ノード30、31に出力する(S414)。
ノード30、31の診断プロセッサ60、61のHW制御部110は、診断プロセッサ50からデータ転送用パス100を介して出力されたステータス更新通知をRCU70、73を介して取得すると、取得したステータス更新通知を構成制御部113に出力する。
構成制御部113は、HW制御部110から出力されたステータス更新通知を取得すると、ステータス更新通知の内容に従って、ノード間クロスバスイッチ10を切り離し状態にする処理を行う(S421)。
また、構成制御部113は、ステータス情報記憶部115に格納する構成情報のうち、ノード間クロスバスッチ10もしくはそれに含まれるスイッチ20のステータスを切り離し状態に変更する処理を行う(S422)。
なお、ステップS422では、ノード30、31の診断プロセッサ60、61の構成制御部113は、ステータス情報記憶部115に含まれる構成情報のステータスの"ノード間クロスバスイッチステータス"のノード間クロスバスイッチ10を示すbit0を"1"の切り離し状態に変更する。
そして、構成制御部113は、変更した構成情報を含んだステータス通知の出力要求を保守用プロセッサ通信部116に出力する。保守用プロセッサ通信部116は、構成制御部113からの要求に応じて、ステータス通知を診断用パス101を介して、保守用プロセッサ40に出力する(S423)。
保守用プロセッサ40の診断プロセッサ通信部120は、診断プロセッサ60、61から出力されたステータス通知を取得し、取得したステータス通知を構成制御部122に出力する(S402)。
構成制御部122は、診断プロセッサ通信部120から出力されたステータス通知を取得し、取得したステータス通知に含まれる構成情報を外部記憶装置125に格納する(S403)。そして、構成制御部122は、処理を終了して次の処理を待ち合わせる(S404)。
ここで、本実施の形態1における運用中の処理においては、スイッチ20の異常を検出した診断プロセッサ50からステータス更新通知を各ノード30、31のみに通知しているが、各ノード30、31が異常となったスイッチ20を含むノード間クロスバスイッチ10を使用しないように処理を行えば、各ノード30、31における処理に不整合が生ずることはなくなる。そのため、運用中の処理の説明において、ノード間クロスバスイッチ10の診断プロセッサ51にステータス更新通知が通知されていない点は問題となることはない。
つまり、本実施の形態1においては、各ノード30、31が異常となったスイッチ20を認識することができていれば、マルチノードシステム全体として統一されたステータスを認識していることと等しくなる。なお、ノード間クロスバスイッチ10の診断プロセッサ51にもステータス更新通知を出力するようにしてもよい。
以上に説明した、本発明は上述した本実施の形態1に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
例えば、本実施の形態1では、異常通知としてのステータス更新通知をノード間クロスバスイッチ10、11の初期化時のみ診断用パス101に出力するようにしているが、運用中であっても異常通知を診断用パス101に出力するようにしてもよい。なお、それにより、診断プロセッサが同じ異常通知をデータ転送用パス100と、診断用パス101のそれぞれから2つ取得してしまった場合、後続の異常通知を破棄するようにしてもよく、後続の異常通知についても処理を行い構成情報を同一の内容で上書きして格納するようにしてもよい。
また、本実施の形態1では、スイッチ20の初期化に失敗した場合、このスイッチ20を含むノード間クロスバスイッチ10を切り離すように処理を行っているが、各ノード30、31の構成情報にスイッチ単位で通常状態もしくは切り離し状態を示すステータスを格納するようにし、スイッチ単位での切り離しを行うようにしてもよい。
さらに、本実施の形態1では、保守用プロセッサ40は、ノード間クロスバスイッチ10、11の初期化結果としてステータス更新通知の出力を受けているが、初期化結果として初期化の正否のみを示す情報の出力を受けて、保守用プロセッサ40においてステータス更新通知を生成するようにしてもよい。
また、診断用パス101を複数のパスによって構成されるようにし、診断プロセッサ50、51、52、53、60、61が初期化指示やステータス更新通知などをそれぞれの異なるパスに出力、もしくは異なるパスから取得されるようにしてもよい。
発明の実施の形態2.
続いて、図9及び図10を参照して、本発明の実施の形態2にかかるマルチノードシステムの処理について説明する。ここでは、スイッチ20の診断プロセッサ50が故障もしくは障害状態にあり、初期化結果としてステータス更新通知を出力できない場合について例示する。
なお、本実施の形態2にかかるマルチノードシステムの構成は、図2、図3、図4及び図5に示す実施の形態1にかかるマルチノードシステムの構成と同様であるため、説明を省略する。
まず、実施の形態1において説明した図7におけるステップS300、S301と同様に、ユーザインタフェース部124に使用者からノード間クロスバスイッチ10、11の初期化の指示が入力されると(S500)、HW操作部121は、初期化指示の出力要求を診断プロセッサ通信部120に出力する。診断プロセッサ通信部120は、HW操作部121からの要求に応じて、初期化指示を診断用パス101を介してノード間クロスバスイッチ10、11の各スイッチ20、21、22、23に出力する(S501)。
スイッチ20の診断プロセッサ50は、故障もしくは障害状態にあり、保守用プロセッサ通信部116が保守用プロセッサ40から診断用パス101を介して出力された初期化指示を取得できない、又は、初期化処理部112が初期化処理を実行できない等となっている(S510)。
保守用プロセッサ40では、初期化指示の結果として、ステータス更新通知を待ち合わせる。そして、保守用プロセッサ40の障害処理部123は、初期化指示を出力してから、スイッチ20、21、22、23からのステータス更新通知の出力を所定の時間内に取得できなかったかどうかを判断する(S502)。
所定の時間内に取得できた場合、実施の形態1と同様の処理を行う。
所定の時間内に取得できなかった場合、障害処理部123は、その旨をステータス更新通知を取得できなかったスイッチ20を示す情報を含めて構成制御部122に出力する。
そして、構成制御部122は、障害処理部123からの通知に応じて、外部記憶装置125に格納され、スイッチ20が含まれるノード間クロスバスイッチ10の診断プロセッサ50、51に対応する構成情報のうち、ノード間クロスバスッチ10もしくはそれに含まれるスイッチ20のステータスを切り離し状態に変更する処理を行う(S504)。
なお、ステップS504では、構成制御部122は、外部記憶装置125に含まれる診断プロセッサ50、51に対応する構成情報のステータスの"SW"を"1"の切り離し状態に変更する。
構成制御部122は、スイッチ20の異常を通知する異常通知として、スイッチ20を含むノード間クロスバスイッチ10のステータスを異常とする旨を示すステータス更新通知を生成する(S505)。
そして、構成制御部122は、生成したステータス更新通知の出力要求を診断プロセッサ通信部120に出力する。診断プロセッサ通信部120は、構成制御部122からの要求に応じて、ステータス更新通知を診断用パス101を介して、各スイッチ20、21、22、23及び各ノード30、31に出力する(S506)。
以降のステップS520、S521、S522、S523、S524、S525、S505、S506、S507は、実施の形態1において説明した図7におけるステップS320、S321、S322、S323、S324、S325、S305、S306、S307と同様であるため、説明を省略する。
以上に説明したように、本発明の実施の形態によれば、スイッチにおいて異常を検出した場合に、検出した異常を通知する異常通知をデータ転送用パスに出力するとともに、診断用パスに出力することにより、スイッチとノードがデータ転送用パスを介して通信不能となっていても、診断用パスによって異常通知をノードに通知することができる。また、スイッチとノードが診断用パスを介して通信不能となっていても、データ転送用パスによって異常通知をノードに通知することができる。
これにより、マルチノードシステム全体として統一されたステータスを認識することができるようになる。また、それにより、マルチノードシステムの各ノードにおける処理に不整合が生じないようにすることができる。
なお、本発明の実施の形態によれば、特に、スイッチの初期化時の異常のように、データ転送用パスによって通信できないノードがある場合に、診断用パスによって異常通知をノードに通知することができる。
また、本発明の実施の形態によれば、特に、マルチノードシステムの運用中に、スイッチとノードが診断用パスによって通信不能となった場合に、データ転送用パスによって異常通知をノードに通知することができる。
さらに、本発明の実施の形態によれば、スイッチの初期化結果としてのステータス更新通知が所定の時間内にスイッチから出力されなかった場合に、このスイッチを異常とする異常通知を各ノードに通知する。これにより、このスイッチを異常として、マルチノードシステム全体として統一されたステータスを認識することができるようになる。
よって、マルチノードシステム全体として統一されたステータスを認識することができるようになる。また、それにより、各ノードが障害状態にある診断プロセッサを含むスイッチ、もしくは、障害状態にあるスイッチを誤って使用しないようにすることができる。
また、本発明の実施の形態によれば、各スイッチと各ノードの診断プロセッサが有するスイッチのステータスを示す構成情報と同様の内容を外部記憶装置に格納し、保守用プロセッサ及び診断プロセッサが起動した場合に、外部記憶装置に格納している構成情報を診断プロセッサに格納している。これにより、構成情報を格納するステータス情報記憶部が揮発性の記憶装置であっても、マルチノードシステムの電源切断および投入をまたいで、スイッチの切り離し状態を引き継ぐことができる。
よって、マルチノードシステムの電源を投入した場合に、マルチノードシステムの電源切断前の切り離し状態のままで、マルチノードシステムを運用することが可能となる。
以上に説明した本発明にかかるマルチノードシステムは、上述の実施の形態の機能を実現するプログラムを記憶した記憶媒体をシステムもしくは装置に供給し、システムあるいは装置の有するコンピュータ又はCPU、MPU(Micro Processing Unit)がこのプログラムを実行することによって、構成することが可能である。
また、このプログラムは様々な種類の記憶媒体に格納することが可能であり、通信媒体を介して伝達されることが可能である。ここで、記憶媒体には、例えば、フレキシブルディスク、ハードディスク、磁気ディスク、光磁気ディスク、CD−ROM(Compact Disc Read Only Memory)、DVD(Digital Versatile Disc)、BD(Blu-ray Disc)、ROM(Read Only Memory)カートリッジ、バッテリバックアップ付きRAM(Random Access Memory)メモリカートリッジ、フラッシュメモリカートリッジ、不揮発性RAMカートリッジを含む。また、通信媒体には、電話回線の有線通信媒体、マイクロ波回線の無線通信媒体を含み、インターネットも含まれる。
また、コンピュータが上述の実施の形態の機能を実現するプログラムを実行することにより、上述の実施の形態の機能が実現されるだけではなく、このプログラムの指示に基づき、コンピュータ上で稼動しているOS(Operating System)もしくはアプリケーションソフトと共同して上述の実施の形態の機能が実現される場合も、発明の実施の形態に含まれる。
さらに、このプログラムの処理の全てもしくは一部がコンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットにより行われて上述の実施の形態の機能が実現される場合も、発明の実施の形態に含まれる。
1、20、21、22、23 スイッチ
2、3、30、31 ノード
4 スイッチ診断装置
5、6 ノード診断装置
7、100 データ転送用パス
8、101 診断用パス
10、11 ノード間クロスバスイッチ
40 保守用プロセッサ
50、51、52、53、60、61 診断プロセッサ
70、71、72、73、74、75 RCU
80、81、82、83、84、85 CPU
90、91 共有メモリ
110 HW制御部
111 電源制御部
112 初期化処理部
113、122 構成制御部
114、123 障害処理部
115 ステータス情報記憶部
116 保守用プロセッサ通信部
120 診断プロセッサ通信部
121 HW操作部
124 ユーザインタフェース部
125 外部記憶装置

Claims (11)

  1. 複数のノードと、
    前記複数のノードに含まれる任意のノード間でデータ転送用パスを介してデータを転送するスイッチと、
    前記スイッチの異常を検出した場合に、検出した異常を通知する異常通知を前記データ転送用パスに出力するとともに、前記データ転送用パスとは異なる診断用パスに出力するスイッチ診断装置と、
    前記異常通知を前記データ転送用パスもしくは前記診断用パスから取得するノード診断装置を備えたマルチノードシステム。
  2. 前記スイッチ診断装置は、前記スイッチの初期化時のみに前記異常通知を前記診断用パスに出力する請求項1に記載のマルチノードシステム。
  3. 前記マルチノードシステムは、前記診断用パスによって前記ノード及び前記スイッチと接続される保守装置をさらに備え、
    前記保守装置は、前記スイッチの初期化指示を前記スイッチ診断装置に出力し、前記スイッチの初期化指示に応じて、前記スイッチの初期化を実行した前記スイッチ診断装置より、前記スイッチの初期化時の異常通知が出力された場合に、前記異常通知を前記ノードに出力する請求項2に記載のマルチノードシステム。
  4. 前記保守装置は、前記スイッチの初期化指示に応じて、前記スイッチの初期化を実行した前記スイッチ診断装置より、前記スイッチの初期化の成功通知が所定の時間内に出力されなかった場合に、前記異常通知を前記ノードに出力する請求項3に記載のマルチノードシステム。
  5. 前記マルチノードシステムは、前記マルチノードシステムの状態を格納する記憶装置をさらに備え、
    前記ノード診断装置は、前記スイッチのステータスを示す構成情報を格納する記憶部を備え、前記異常通知を取得した場合に、取得した異常通知に基づいて前記構成情報を変更して、変更した構成情報を前記保守装置に出力し、
    前記保守装置は、前記ノード診断装置から出力された構成情報を取得し、取得した構成情報を前記記憶装置に格納する請求項3乃至4のいずれかに記載のマルチノードシステム。
  6. 前記保守装置は、前記保守装置及び前記ノード診断装置が起動した場合に、前記記憶装置に格納している構成情報を前記ノード診断装置に出力し、
    前記ノード診断装置は、前記保守装置から出力された構成情報を取得し、前記記憶部に格納する請求項5に記載のマルチノードシステム。
  7. 前記スイッチ診断装置は、前記スイッチのそれぞれに対応するように備えられ、
    前記ノード診断装置は、前記ノードのそれぞれに対応するように備えられる請求項1乃至6のいずれかに記載のマルチノードシステム。
  8. 複数のノード間でデータ転送用パスを介してデータ転送を行うスイッチの異常処理方法であって、
    前記スイッチの異常を検出するステップと、
    検出した異常を前記ノードに通知する異常通知を前記データ転送用パスに出力するステップと、
    検出した異常を前記ノードに通知する異常通知を前記データ転送用パスとは異なる診断用パスに出力するステップを備えた異常処理方法。
  9. 前記スイッチに対して、前記スイッチの初期化指示を出力するステップをさらに備え、
    前記異常通知を診断用パスに出力するステップは、前記初期化指示に応じた前記スイッチの初期化時のみに前記異常通知を出力する請求項に記載の異常処理方法。
  10. 複数のノードと、データ転送用パスを介して前記ノードから出力された転送データを転送先のノードに出力するスイッチであって、
    前記スイッチの異常を検出した場合に、検出した異常を前記ノードに通知する異常通知を前記データ転送用パスに出力するとともに、前記データ転送用パスとは異なる診断用パスに出力するスイッチ診断装置を備えたスイッチ。
  11. 複数のノードと、データ転送用パスを介して前記ノードから出力された転送データを転送先のノードに出力するスイッチを制御するプログラム、
    前記スイッチの異常を検出するステップと、
    検出した異常を前記ノードに通知する異常通知を前記データ転送用パスに出力するステップと、
    検出した異常を前記ノードに通知する異常通知を前記データ転送用パスとは異なる診断用パスに出力するステップをコンピュータに実行させるプログラム。
JP2009029752A 2009-02-12 2009-02-12 マルチノードシステム、異常処理方法、スイッチ、ノード及びプログラム Expired - Fee Related JP5470884B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009029752A JP5470884B2 (ja) 2009-02-12 2009-02-12 マルチノードシステム、異常処理方法、スイッチ、ノード及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009029752A JP5470884B2 (ja) 2009-02-12 2009-02-12 マルチノードシステム、異常処理方法、スイッチ、ノード及びプログラム

Publications (2)

Publication Number Publication Date
JP2010186302A JP2010186302A (ja) 2010-08-26
JP5470884B2 true JP5470884B2 (ja) 2014-04-16

Family

ID=42766927

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009029752A Expired - Fee Related JP5470884B2 (ja) 2009-02-12 2009-02-12 マルチノードシステム、異常処理方法、スイッチ、ノード及びプログラム

Country Status (1)

Country Link
JP (1) JP5470884B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5549855B2 (ja) * 2010-02-12 2014-07-16 日本電気株式会社 SerDesプリエンファシス調整自動化システム、その方法及びそのプログラム
JP5685993B2 (ja) * 2011-03-04 2015-03-18 日本電気株式会社 障害処理回路を含むマルチノードシステム及び障害処理方法
WO2012127629A1 (ja) * 2011-03-22 2012-09-27 富士通株式会社 サーバシステム及びクロスバボードの活性保守方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02168335A (ja) * 1988-12-22 1990-06-28 Nec Corp データ処理システム
JPH04241044A (ja) * 1991-01-24 1992-08-28 Nec Corp 障害情報収集方式
JPH05324950A (ja) * 1992-05-21 1993-12-10 Nec Field Service Ltd 情報処理装置の論理カード
JPH10333932A (ja) * 1997-05-28 1998-12-18 Kofu Nippon Denki Kk 障害処理方法およびマルチノードシステム
JP4081258B2 (ja) * 2001-10-26 2008-04-23 株式会社キューディファクトリ 管理サーバシステム
JP3880482B2 (ja) * 2002-08-14 2007-02-14 エヌイーシーコンピュータテクノ株式会社 二重化ネットワーク計算機システム及び計算機システムのネットワーク二重化方法
JP3988146B2 (ja) * 2004-07-27 2007-10-10 日本電気株式会社 マルチノードシステム、ノード間クロスバスイッチ、ノード、スイッチプログラム及びノードプログラム
JP2006146685A (ja) * 2004-11-22 2006-06-08 Nec Corp マルチノードシステム及び障害復旧方法

Also Published As

Publication number Publication date
JP2010186302A (ja) 2010-08-26

Similar Documents

Publication Publication Date Title
JP5623593B2 (ja) ベーシック・インプット/アウトプット・システムを同時に更新するためのラックおよびその方法
JP5470884B2 (ja) マルチノードシステム、異常処理方法、スイッチ、ノード及びプログラム
JP2005251188A (ja) 冗長パス制御装置及び冗長パス制御方法
US8560867B2 (en) Server system and method for processing power off
US8005357B2 (en) Optical transmission apparatus
JP2006285384A (ja) プロセッサ障害処理方式、管理プロセッサ及びプロセッサ障害処理方法
JP2016167203A (ja) 情報処理装置、情報処理装置の制御方法
JP5299283B2 (ja) 情報処理装置及び情報処理システム並びにそれらの制御方法
JP4507875B2 (ja) 多重化装置及びレガシーデバイス多重化方法
JP5651004B2 (ja) 計算機切替システム、計算機切替プログラム、および計算機切替方法
JP2008046684A (ja) ネットワークシステム及び情報処理方法
JP2015053555A (ja) データ転送装置、およびデータ転送方法
JP5223612B2 (ja) ディスク制御装置およびファームウェアの更新方法
US11853175B2 (en) Cluster system and restoration method that performs failover control
JP6554801B2 (ja) 冗長通信装置及びその制御方法
JP5763030B2 (ja) 二重化ネットワーク制御システムおよび二重化ネットワーク制御方法
JP6227909B2 (ja) 代替制御装置、代替制御方法及び代替制御プログラム
JP6048089B2 (ja) 情報処理装置、及びプログラム
JP5488693B2 (ja) マルチクラスタシステム
JP2009157731A (ja) 仮想計算機システムおよび仮想計算機システムの制御方法
JP2013200805A (ja) 信号振り分けシステム、信号振り分け方法及びコンピュータ・プログラム
JP5968254B2 (ja) 無線装置
JP4872934B2 (ja) コンピュータシステム、クライアントコンピュータ、os終了方法およびos終了プログラム
JP2008072494A (ja) 情報処理装置および情報処理方法
JP2007074252A (ja) 高可用性通信装置、障害管理方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120911

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130409

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130910

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131202

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20131209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140120

R150 Certificate of patent or registration of utility model

Ref document number: 5470884

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees