JP4863095B2 - マルチノードコンピュータシステム及びノード間接続装置 - Google Patents
マルチノードコンピュータシステム及びノード間接続装置 Download PDFInfo
- Publication number
- JP4863095B2 JP4863095B2 JP2009030717A JP2009030717A JP4863095B2 JP 4863095 B2 JP4863095 B2 JP 4863095B2 JP 2009030717 A JP2009030717 A JP 2009030717A JP 2009030717 A JP2009030717 A JP 2009030717A JP 4863095 B2 JP4863095 B2 JP 4863095B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- code
- connection device
- inter
- disconnection request
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Hardware Redundancy (AREA)
- Multi Processors (AREA)
Description
図1及び図2は、本実施の形態に係るマルチノードコンピュータシステム1の構成例を示している。マルチノードコンピュータシステム1は、複数のノードNDと、少なくとも1つのノード間接続装置IXSを備えている。ノード間接続装置IXSは、複数のノードNDに接続されており、それら複数のノードND間のデータ転送を制御する。
図3は、本実施の形態に係るノード間接続装置IXSの構成例を示している。ノード間接続装置IXSは、入力手段10、出力手段20、クロスバースイッチ30、コード検出手段40、変換手段50、監視手段60、及びコード送信手段70を備えている。以下、ノード間接続装置IXSが3つのノードND1〜ND3に接続されている場合を考える。
次に、ノード切り離し時の処理例を説明する。図4は、ノード切り離し処理を示すフローチャートである。図5は、ノード切り離し処理を説明するための概念図である。例として、ノードND2がノードND1に対する命令を発行し、また、ノードND1が障害発生ノードとなる場合を考える。また、マルチノードコンピュータシステム1は、図2で示されたような複数レーン構成を有しているとする。
ノードND1にて障害が発生すると、ノードND1は、ノード間接続装置IXSに切り離し要求コードCREQを送信する。
ノード間接続装置IXSがノードND1から切り離し要求コードCREQを受け取ると、特殊コード検出回路40−1が、その切り離し要求コードCREQを検出(認識)する。そして、特殊コード検出回路40−1は、切り離し要求受信通知を、変換回路50−1〜50−3の全てと特殊コード送信回路70−1に送信する。その切り離し要求受信通知は、ノードND1を識別するための情報を含んでいる。
ステップS200の後、ノードND2(送信元ノード)は、「ノードND1への命令」をノード間接続装置IXSに送信する。ノードND2につながる入力バッファ10−2は、その命令を受け取り、変換回路50−2に出力する。変換回路50−2は、ノードND1の識別情報を含む切り離し要求受信通知を既に受け取っている。従って、変換回路50−2は、受け取った「ノードND1への命令」を、「ノードND2(送信元ノード)への応答」に変換する。そして、変換回路50−2は、「ノードND2への応答」をクロスバースイッチ30に出力する。クロスバースイッチ30は、「ノードND2への応答」を、対応する出力バッファ20−2に出力する。出力バッファ20−2は、受け取った応答をノードND2に送信する。このように、ステップS200以降、障害発生ノードであるノードND1に新たな命令が転送されることが防止される。
その一方で、ステップS200の前に、ノード間接続装置IXSがノードND2から「ノードND1への命令」を受け取っている場合もあり得る。その「ノードND1への命令」は、クロスバースイッチ30を通って出力バッファ20−1に格納される。ステップS200の段階で出力バッファ20−1に既に格納されている命令は、全てノードND1に送信される。そして、出力バッファ20−1が空になるまで、ノード間接続装置IXSは切り離し応答コードCRESを発行しない。すなわち、ノード間接続装置IXSは、既に出力バッファ20−1に格納されている命令の送信完了を待つ。
監視回路60−1は、出力バッファ20−1における命令の残存状況を監視する。出力バッファ20−1が空になると、監視回路60−1は、「完了通知」を特殊コード送信回路70−1に送信する。特殊コード送信回路70−1は、ステップS200において既に「切り離し要求受信通知」を受け取っている。従って、特殊コード送信回路70−1は、切り離し応答コードCRESをノードND1に送信する。
ノードND1が切り離し応答コードCRESを受信した後、ノードND1(障害発生ノード)は、マルチノードコンピュータシステム1から切り離される。
図6は、ノード切り離し処理の比較例を示している。ここでは、図2で示された複数レーン構成において、あるノードのあるCPUにて障害が発生した場合を考える。
本実施の形態によれば、図5で示されたように、障害発生ノード以外の運用ノードに対して障害発生を通知する必要はない。それは、切り離し要求コードCREQの検出後、変換手段50が、「障害発生ノードへの命令」を「送信元ノードへの応答」に変換するからである。変換手段50により得られた「送信元ノードへの応答」は、ノード間接続装置IXSから送信元ノードへ返信される。これにより、障害発生ノードに新たな命令が転送されることと、送信元ノードにおいてタイムアウトが発生することが防止される。言い換えれば、障害発生ノード以外の運用ノードに対して障害発生を通知しなくても、問題は発生しない。レーン数に拘わらず、障害発生を運用ノードに通知する必要がないため、運用ノードにかかる負荷が軽減される。すなわち、本実施の形態によれば、障害発生ノードの切り離し処理において、正常な運用ノードへの影響を抑えることが可能となる。
10 入力手段
10−1〜10−3 入力バッファ
20 出力手段
20−1〜20−3 出力バッファ
30 クロスバースイッチ
40 コード検出手段
40−1〜40−3 特殊コード検出回路
50 変換手段
50−1〜50−3 変換回路
60 監視手段
60−1〜60−3 監視回路
70 コード送信手段
70−1〜70−3 特殊コード送信回路
ND ノード
IXS ノード間接続装置
CREQ 切り離し要求コード
CRES 切り離し応答コード
Claims (10)
- 複数のノードと、
前記複数のノードに接続され、前記複数のノード間のデータ転送を制御するノード間接続装置と
を備え、
前記複数のノードの各々は、障害が発生した場合に、切り離し要求コードを前記ノード間接続装置へ送信し、
前記ノード間接続装置は、
前記複数のノードのうち障害発生ノードから送信された前記切り離し要求コードを検出するコード検出手段と、
前記切り離し要求コードの検出後に送信元ノードから受け取る前記障害発生ノードへの命令を、前記送信元ノードへの応答に変換する変換手段と
を備える
マルチノードコンピュータシステム。 - 請求項1に記載のマルチノードコンピュータシステムであって、
前記ノード間接続装置は、更に、コード送信手段を備え、
前記切り離し要求コードが検出された場合、前記コード送信手段は、前記切り離し要求コードに対する切り離し応答コードを前記障害発生ノードへ送信する
マルチノードコンピュータシステム。 - 請求項2に記載のマルチノードコンピュータシステムであって、
前記コード送信手段は、前記切り離し要求コードの検出前に受け取った前記障害発生ノードへの命令が全て前記障害発生ノードへ転送された後に、前記切り離し応答コードを前記障害発生ノードへ送信する
マルチノードコンピュータシステム。 - 請求項3に記載のマルチノードコンピュータシステムであって、
前記ノード間接続装置は、更に、前記障害発生ノードに出力される命令の残存状況を監視する監視手段を備え、
前記切り離し要求コードが検出され、且つ、前記障害発生ノードに出力される前記命令が無くなった場合、前記コード送信手段は、前記切り離し応答コードを前記障害発生ノードへ送信する
マルチノードコンピュータシステム。 - 請求項1乃至4のいずれか一項に記載のマルチノードコンピュータシステムであって、
前記ノード間接続装置は、更に、
前記複数のノードのそれぞれからデータを受け取る複数の入力バッファと、
前記複数のノードのそれぞれへデータを出力する複数の出力バッファと、
受け取るデータを前記複数の出力バッファのうち対応するものへ振り分けるクロスバースイッチと
を備え、
前記変換手段は、前記複数の入力バッファと前記クロスバースイッチとの間に介在し、前記複数の入力バッファからデータを受け取り、
前記切り離し要求コードの検出後に前記障害発生ノードへの前記命令を受け取った場合、前記変換手段は、前記障害発生ノードへの前記命令を前記送信元ノードへの前記応答に変換し、前記送信元ノードへの前記応答を前記クロスバースイッチへ出力し、
前記切り離し要求コードの検出後に前記障害発生ノードへの前記命令を受け取る場合以外の場合、前記変換手段は、前記複数の入力バッファから受け取るデータをそのまま前記クロスバースイッチへ出力する
マルチノードコンピュータシステム。 - マルチノードコンピュータシステムにおいて複数のノード間のデータ転送を制御するノード間接続装置であって、
前記複数のノードの各々は、障害が発生した場合に、切り離し要求コードを前記ノード間接続装置へ送信し、
前記ノード間接続装置は、
前記複数のノードのうち障害発生ノードから送信された前記切り離し要求コードを検出するコード検出手段と、
前記切り離し要求コードの検出後に送信元ノードから受け取る前記障害発生ノードへの命令を、前記送信元ノードへの応答に変換する変換手段と
を備える
ノード間接続装置。 - 請求項6に記載のノード間接続装置であって、
更に、コード送信手段を備え、
前記切り離し要求コードが検出された場合、前記コード送信手段は、前記切り離し要求コードに対する切り離し応答コードを前記障害発生ノードへ送信する
ノード間接続装置。 - 請求項7に記載のノード間接続装置であって、
前記コード送信手段は、前記切り離し要求コードの検出前に受け取った前記障害発生ノードへの命令が全て前記障害発生ノードへ転送された後に、前記切り離し応答コードを前記障害発生ノードへ送信する
ノード間接続装置。 - 請求項6乃至8のいずれか一項に記載のノード間接続装置であって、
更に、
前記複数のノードのそれぞれからデータを受け取る複数の入力バッファと、
前記複数のノードのそれぞれへデータを出力する複数の出力バッファと、
受け取るデータを前記複数の出力バッファのうち対応するものへ振り分けるクロスバースイッチと
を備え、
前記変換手段は、前記複数の入力バッファと前記クロスバースイッチとの間に介在し、前記複数の入力バッファからデータを受け取り、
前記切り離し要求コードの検出後に前記障害発生ノードへの前記命令を受け取った場合、前記変換手段は、前記障害発生ノードへの前記命令を前記送信元ノードへの前記応答に変換し、前記送信元ノードへの前記応答を前記クロスバースイッチへ出力し、
前記切り離し要求コードの検出後に前記障害発生ノードへの前記命令を受け取る場合以外の場合、前記変換手段は、前記複数の入力バッファから受け取るデータをそのまま前記クロスバースイッチへ出力する
ノード間接続装置。 - マルチノードコンピュータシステムにおけるノード切り離し方法であって、
前記マルチノードコンピュータシステムは、複数のノード間のデータ転送を制御するノード間接続装置を備え、
前記ノード切り離し方法は、
前記複数のノードのうち障害発生ノードから前記ノード間接続装置へ、切り離し要求コードを送信するステップと、
前記ノード間接続装置において、前記切り離し要求コードを検出するステップと、
前記切り離し要求コードの検出後に、前記ノード間接続装置が送信元ノードから受け取る前記障害発生ノードへの命令を、前記送信元ノードへの応答に変換するステップと、
前記切り離し要求コードに対する切り離し応答コードを、前記ノード間接続装置から前記障害発生ノードへ送信するステップと、
前記障害発生ノードが前記切り離し応答コードを受信した後に、前記障害発生ノードを切り離すステップと
を含む
ノード切り離し方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009030717A JP4863095B2 (ja) | 2009-02-13 | 2009-02-13 | マルチノードコンピュータシステム及びノード間接続装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009030717A JP4863095B2 (ja) | 2009-02-13 | 2009-02-13 | マルチノードコンピュータシステム及びノード間接続装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010186365A JP2010186365A (ja) | 2010-08-26 |
JP4863095B2 true JP4863095B2 (ja) | 2012-01-25 |
Family
ID=42766978
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009030717A Expired - Fee Related JP4863095B2 (ja) | 2009-02-13 | 2009-02-13 | マルチノードコンピュータシステム及びノード間接続装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4863095B2 (ja) |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4982187A (en) * | 1989-11-28 | 1991-01-01 | International Business Machines Corporation | Low-end high-performance switch subsystem architecture |
JP3363579B2 (ja) * | 1994-04-25 | 2003-01-08 | 沖電気工業株式会社 | 監視装置及び監視システム |
JPH08147250A (ja) * | 1994-09-20 | 1996-06-07 | Hitachi Ltd | 相互結合網及びその通信方法 |
JP3500561B2 (ja) * | 1997-09-19 | 2004-02-23 | 日本電気エンジニアリング株式会社 | 共有データバッファ |
JP2000181890A (ja) * | 1998-12-15 | 2000-06-30 | Fujitsu Ltd | マルチプロセッサ交換機及びその主プロセッサ切替方法 |
JP2000242520A (ja) * | 1999-02-19 | 2000-09-08 | Nec Eng Ltd | マルチノードコンピュータシステムおよび障害発生原因箇所特定方法 |
JP3434735B2 (ja) * | 1999-06-23 | 2003-08-11 | エヌイーシーコンピュータテクノ株式会社 | 情報処理システム及びそれに用いる障害処理方式 |
JP2004013723A (ja) * | 2002-06-10 | 2004-01-15 | Nec Computertechno Ltd | 共有メモリを使ったクラスタ構成を採用した情報処理システムの障害処理装置と方法 |
JP4131263B2 (ja) * | 2004-12-22 | 2008-08-13 | 日本電気株式会社 | マルチノードシステム、ノード装置、ノード間クロスバスイッチ及び障害処理方法 |
-
2009
- 2009-02-13 JP JP2009030717A patent/JP4863095B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010186365A (ja) | 2010-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4776374B2 (ja) | 二重化監視制御システム、及び同システムの冗長化切替え方法 | |
US6658595B1 (en) | Method and system for asymmetrically maintaining system operability | |
JP4772920B2 (ja) | 試験装置および送信装置 | |
US5923840A (en) | Method of reporting errors by a hardware element of a distributed computer system | |
US20060159010A1 (en) | Information processing system, information processing device, and information processing method and program therefor | |
JP5480778B2 (ja) | 2重化コンピュータネットワークシステム、ネットワーク接続装置および障害検知・対処方法 | |
JP4344333B2 (ja) | パケット転送装置、パケット転送ネットワークシステムおよびパケット転送方法 | |
JP5168499B2 (ja) | 通信ネットワークシステム及びパスの高信頼化方法 | |
JP4863095B2 (ja) | マルチノードコンピュータシステム及びノード間接続装置 | |
JP4287734B2 (ja) | ネットワーク装置 | |
JP5548160B2 (ja) | 障害監視用ノード装置および障害検知回復方法 | |
JP6134720B2 (ja) | 接続方法 | |
EP1988469B1 (en) | Error control device | |
JP2004007930A (ja) | 電力系統監視制御システムおよびプログラム | |
JP6394727B1 (ja) | 制御装置、制御方法、及び、フォールトトレラント装置 | |
JP2010136038A (ja) | 伝送装置及び冗長構成部の系切替え方法 | |
JP2002027025A (ja) | データ伝送システム | |
JP4765982B2 (ja) | 光ネットワークのドメイン間接続における障害特定方法及び該方法を実行可能な光ネットワークシステム | |
JP5459117B2 (ja) | データ伝送装置及びデータ伝送方法 | |
JP5964682B2 (ja) | 伝送装置、伝送装置の制御方法及び伝送システム | |
JP5061739B2 (ja) | データ処理装置、二重化装置、その障害時系切替方法および障害時系切替プログラム | |
JP3691679B2 (ja) | 二重伝送路を有するネットワーク | |
JP2606130B2 (ja) | ループ型ネットワーク | |
JP5602071B2 (ja) | Cpu2重化制御システム | |
WO2010070713A1 (ja) | 情報処理装置、制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110629 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110815 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110922 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111013 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111026 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141118 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4863095 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |