JP5096799B2 - クラスタシステム、計算機、および障害対処方法 - Google Patents
クラスタシステム、計算機、および障害対処方法 Download PDFInfo
- Publication number
- JP5096799B2 JP5096799B2 JP2007141432A JP2007141432A JP5096799B2 JP 5096799 B2 JP5096799 B2 JP 5096799B2 JP 2007141432 A JP2007141432 A JP 2007141432A JP 2007141432 A JP2007141432 A JP 2007141432A JP 5096799 B2 JP5096799 B2 JP 5096799B2
- Authority
- JP
- Japan
- Prior art keywords
- success
- failure
- information storage
- survival
- storage device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Hardware Redundancy (AREA)
Description
1.一方の生存情報記憶装置20に対する生存情報の記録に失敗したノード数が3以上であること。
2.一方の生存情報記憶装置20に対する生存情報の記録に失敗したノード数が2以上であること。
3.クラスタシステムの全ノード数における、一方の生存情報記憶装置20に対する生存情報の記録に失敗したノード数の割合が50%より大きいこと。
このように、切替条件44の内容に制限はなく、クラスタシステムのノード数等の構成や運転条件や可用性の要件等に応じ、システムの総合試験等を実施する中で、適切な切替条件が定められてよい。なお、以下の例では、切替条件44として、「一方の生存情報記憶装置20に対する生存情報の記録に失敗したノード数が3以上であること。」が定められているものとする。
Claims (6)
- 相互に稼働状態を監視しつつ動作する複数の計算機と、
前記計算機が正常動作中である旨を示す生存情報を記憶する第1および第2の生存情報記憶装置と、
成否情報記憶装置と、を備え
前記複数の計算機においては、前記第1および第2の生存情報記憶装置のうちの一方の生存情報記憶装置が参照先として共通設定され、かつ、前記複数の計算機から参照される生存情報記憶装置が同一となるように参照先を変更するための共通の切替条件が設定されており、
前記複数の計算機のそれぞれは、前記第1および第2の生存情報記憶装置のうち、参照先として設定された生存情報記憶装置にだけアクセスでき、
前記複数の計算機のそれぞれは、
正常動作中において、参照先の生存情報記憶装置に自計算機が正常動作中である旨を示す生存情報を記録する生存通知部と、
前記参照先の生存情報記憶装置と前記生存情報の記録の成否とを示す成否情報を他の計算機に通知する成否通知部と、
他の計算機から通知された成否情報を参照し、前記参照先の生存情報記憶装置に対する前記複数の計算機による生存情報の記録の成否に基づいて、前記切替条件の成否を判定する切替判定部と、
前記切替条件が成立したとき、前記第1および第2の生存情報記憶装置のうちの他方の生存情報記録装置を参照先として設定変更する参照先変更部と、を備え、
前記成否通知部は、前記成否情報を他の計算機に通知するために、前記成否情報を、前記複数の計算機の成否情報を保持するための前記成否情報記憶装置に記録し、
前記切替判定部は、前記成否情報記憶装置から他の計算機の成否情報を読み出すことにより、他の計算機の成否情報を参照することを特徴とするクラスタシステム。 - 前記切替条件は、前記参照先の生存情報記憶装置に対する生存情報の記録に失敗した計算機の数が、所定の数以上となった時に成立する条件であることを特徴とする請求項1に記載のクラスタシステム。
- 前記切替判定部は、過去の所定時点以降に他の計算機から通知された成否情報に基づいて、前記切替条件の成否を判定することを特徴とする請求項1または2に記載のクラスタシステム。
- 他の計算機と相互に稼働状態を監視しつつ動作する計算機であって、
自計算機が正常動作中である旨を示す生存情報を記録する第1および第2の生存情報記憶装置と、成否情報記憶装置とに接続され、
前記第1および第2の生存情報記憶装置のうちの一方の生存情報記憶装置が、前記他の計算機と共通の参照先として設定され、かつ、前記他の計算機と同一の生存情報記憶装置を参照するように参照先を変更するための切替条件が、前記他の計算機と共通に設定され、
前記第1および第2の生存情報記憶装置のうち、参照先として設定された生存情報記憶装置にだけアクセスでき、
正常動作中において、参照先の生存情報記憶装置に自計算機が正常動作中である旨を示す生存情報を記録する生存通知部と、
前記参照先の生存情報記憶装置と前記生存情報の記録の成否とを示す成否情報を他の計算機に通知する成否通知部と、
他の計算機から通知された成否情報を参照し、前記参照先の生存情報記憶装置に対する自計算機および前記他の計算機による生存情報の記録の成否に基づいて、前記切替条件の成否を判定する切替判定部と、
前記切替条件が成立したとき、前記第1および第2の生存情報記憶装置のうちの他方の生存情報記録装置を参照先として設定変更する参照先変更部と、を備え、
前記成否通知部は、前記成否情報を他の計算機に通知するために、前記成否情報を、複数の計算機の成否情報を保持するための前記成否情報記憶装置に記録し、
前記切替判定部は、前記成否情報記憶装置から他の計算機の成否情報を読み出すことにより、他の計算機の成否情報を参照することを特徴とする計算機。 - 他の計算機と相互に稼働状態を監視しつつ動作する計算機における障害対処方法であって、
正常動作中において、前記計算機が正常動作中である旨を示す生存情報を記録する第1および第2の生存情報記憶装置のうちの一方の生存情報記憶装置を参照するように前記他の計算機と共通に設定された参照先の生存情報記憶装置に、参照先として設定された生存情報記憶装置にだけアクセスできる自計算機が正常動作中である旨を示す生存情報を記録する生存通知ステップと、
前記参照先の生存情報記憶装置と前記生存情報の記録の成否とを示す成否情報を他の計算機に通知する成否通知ステップと、
他の計算機から通知された成否情報を参照し、前記参照先の生存情報記憶装置に対する自計算機および前記他の計算機による生存情報の記録の成否に基づいて、自計算機から参照する生存情報記憶装置が前記他の計算機から参照する生存情報記憶装置と同一となるように参照先を変更するために前記他の計算機と共通に設定された切替条件の成否を判定する切替判定ステップと、
前記切替条件が成立したとき、前記第1および第2の生存情報記憶装置のうちの他方の生存情報記録装置を参照先として設定変更する参照先変更ステップと、を備え、
前記成否通知ステップは、前記成否情報を他の計算機に通知するために、前記成否情報を、複数の計算機の成否情報を保持するための成否情報記憶装置に記録し、
切替判定ステップは、前記成否情報記憶装置から他の計算機の成否情報を読み出すことにより、他の計算機の成否情報を参照することを特徴とする障害対処方法。 - 他の計算機と相互に稼働状態を監視しつつ動作する計算機に、
正常動作中において、前記計算機が正常動作中である旨を示す生存情報を記録する第1および第2の生存情報記憶装置のうちの一方の生存情報記憶装置を参照するように前記他の計算機と共通に設定された参照先の生存情報記憶装置に、参照先として設定された生存情報記憶装置にだけアクセスできる自計算機が正常動作中である旨を示す生存情報を記録する生存通知機能と、
前記参照先の生存情報記憶装置と前記生存情報の記録の成否とを示す成否情報を他の計算機に通知する成否通知機能と、
他の計算機から通知された成否情報を参照し、前記参照先の生存情報記憶装置に対する自計算機および前記他の計算機による生存情報の記録の成否に基づいて、自計算機から参照する生存情報記憶装置が前記他の計算機から参照する生存情報記憶装置と同一となるように参照先を変更するために前記他の計算機と共通に設定された切替条件の成否を判定する切替判定機能と、
前記切替条件が成立したとき、前記第1および第2の生存情報記憶装置のうちの他方の生存情報記録装置を参照先として設定変更する参照先変更機能と、を実現させ、
成否通知機能は、前記成否情報を他の計算機に通知するために、前記成否情報を成否情報記憶装置に記録し、
切替判定機能は、前記成否情報記憶装置から他の計算機の成否情報を読み出すことにより、他の計算機の成否情報を参照することを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007141432A JP5096799B2 (ja) | 2007-05-29 | 2007-05-29 | クラスタシステム、計算機、および障害対処方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007141432A JP5096799B2 (ja) | 2007-05-29 | 2007-05-29 | クラスタシステム、計算機、および障害対処方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008299369A JP2008299369A (ja) | 2008-12-11 |
JP5096799B2 true JP5096799B2 (ja) | 2012-12-12 |
Family
ID=40172882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007141432A Expired - Fee Related JP5096799B2 (ja) | 2007-05-29 | 2007-05-29 | クラスタシステム、計算機、および障害対処方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5096799B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015162634A1 (en) * | 2014-04-21 | 2015-10-29 | Hitachi, Ltd. | Information storage system |
US11119870B2 (en) | 2016-09-21 | 2021-09-14 | Nec Corporation | Calculator, cluster management system, method, and non-transitory computer readable medium |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS567154A (en) * | 1979-06-27 | 1981-01-24 | Hitachi Ltd | Double system |
JPS62179044A (ja) * | 1986-01-31 | 1987-08-06 | Toshiba Corp | 複合計算機システム |
JPH01195544A (ja) * | 1988-01-29 | 1989-08-07 | Nec Corp | デュプレックス構成システムのダウン監視方式 |
JPH05250195A (ja) * | 1992-02-20 | 1993-09-28 | Nec Corp | 情報処理システムのヘルスチェック制御方式 |
JP2000020336A (ja) * | 1998-06-29 | 2000-01-21 | Nec Corp | 二重化通信システム |
JP3545252B2 (ja) * | 1999-03-30 | 2004-07-21 | 富士通株式会社 | 情報処理装置 |
JP4039794B2 (ja) * | 2000-08-18 | 2008-01-30 | 富士通株式会社 | マルチパス計算機システム |
JP3573092B2 (ja) * | 2000-12-15 | 2004-10-06 | 日本電気株式会社 | コンピュータシステムにおける共有資源の排他利用方式 |
US7003645B2 (en) * | 2002-12-18 | 2006-02-21 | International Business Machines Corporation | Use of a storage medium as a communications network for liveness determination in a high-availability cluster |
-
2007
- 2007-05-29 JP JP2007141432A patent/JP5096799B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008299369A (ja) | 2008-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11182075B1 (en) | Storage system having cross node data redundancy and method and computer readable medium for same | |
US20070101186A1 (en) | Computer platform cache data remote backup processing method and system | |
JP4415610B2 (ja) | 系切替方法、レプリカ作成方法、及びディスク装置 | |
JP4939174B2 (ja) | ミラーリングされたシステム内の障害を管理するための方法 | |
KR101547719B1 (ko) | 데이터 센터들에 걸쳐 데이터 서버들내 데이터 무결정의 유지 | |
EP2672387B1 (en) | A distributed object storage system | |
US8832372B2 (en) | Network storage systems having clustered raids for improved redundancy and load balancing | |
US7536586B2 (en) | System and method for the management of failure recovery in multiple-node shared-storage environments | |
CN100368976C (zh) | 盘阵列设备和数据备份方法 | |
CN102411639B (zh) | 元数据的多副本存储管理方法和系统 | |
KR100711165B1 (ko) | 기억 제어 장치, 제어 방법 및 기록 매체 | |
CN104994168A (zh) | 分布式存储方法及分布式存储系统 | |
US7356728B2 (en) | Redundant cluster network | |
US20110219263A1 (en) | Fast cluster failure detection | |
US10180871B2 (en) | Storage failure processing in a shared storage architecture | |
US20070101188A1 (en) | Method for establishing stable storage mechanism | |
JP2011170589A (ja) | ストレージ制御装置、ストレージ装置およびストレージ制御方法 | |
US20130086413A1 (en) | Fast i/o failure detection and cluster wide failover | |
US20100082793A1 (en) | Server-Embedded Distributed Storage System | |
JP5096799B2 (ja) | クラスタシステム、計算機、および障害対処方法 | |
CN110941397A (zh) | 存储集群bbu故障时的节点模式调整方法及相关组件 | |
JP2009069963A (ja) | マルチプロセッサシステム | |
US20080250421A1 (en) | Data Processing System And Method | |
CN107111459B (zh) | 存储系统及其控制方法 | |
US9153347B2 (en) | Method and system for reliable big capacity storage system protected by triple protection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100315 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120911 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120921 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5096799 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150928 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |