JP2010055509A - 障害復旧システム、方法及びプログラム、並びにクラスタシステム - Google Patents
障害復旧システム、方法及びプログラム、並びにクラスタシステム Download PDFInfo
- Publication number
- JP2010055509A JP2010055509A JP2008221839A JP2008221839A JP2010055509A JP 2010055509 A JP2010055509 A JP 2010055509A JP 2008221839 A JP2008221839 A JP 2008221839A JP 2008221839 A JP2008221839 A JP 2008221839A JP 2010055509 A JP2010055509 A JP 2010055509A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- error information
- recovery
- application process
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Hardware Redundancy (AREA)
Abstract
【解決手段】本発明の障害復旧システムは、障害発生時にエラー情報を記憶手段に保存するアプリケーションプロセスを生成起動させるプロセス生成起動手段と、記憶手段に記憶されるエラー情報の保存の有無を監視するエラー情報監視手段と、エラー情報監視手段によりエラー情報の保存が検出されると、当該アプリケーションプロセスの障害を検出するプロセス障害検出手段と、プロセス障害検出手段によりアプリケーションプロセスの障害が検出されると、当該障害の復旧処理を行う障害復旧手段とを備えることを特徴とする。
【選択図】 図1
Description
以下では、本発明の障害復旧システム、方法及びプログラム、並びにクラスタシステムの第1の実施形態を図面を参照しながら説明する。
図5は、第1の実施形態のクラスタシステム50の構成及びサーバの機能構成を示す構成図である。なお、図5は、クラスタ構成の一例であり、共有ディスクタイプのクラスタ構成を例示するが、ミラーリングタイプのクラスタ構成であってもよい。
次に、第1の実施形態のクラスタ切替処理の動作について図1を参照しながら説明する。
以上のように、第1の実施形態によれば、アプリケーションプロセスが出力するcoreファイルをHAクラスタシステムにて定期的に監視することで、早期にアプリケーションの障害を検出することができる。
次に、本発明の障害復旧システム、方法及びプログラム、並びにクラスタシステムの第2の実施形態について説明する。
第1の実施形態では、HAクラスタプロセス4が、coreファイル出力を契機にハートビート通信を停止する場合の実施形態を説明した。
以上のように、第2の実施形態によれば、クラスタシステム構成でない場合にも、第1の実施形態と同様に、アプリケーション障害の早期検出、早期サービス復旧、確実なcoreファイルの収集を行うことができる。
第1及び第2の実施形態で説明した各サーバ10A及び10Bのクラスタシステムの機能は、ソフトウェア処理により実現されるものである。つまり、各サーバのハードウェア構成として、例えばCPU、ROM、RAM、EEPROM等を有して構成されるものであり、CPUが、ROMに格納される処理プログラムを実行することにより第1及び第2の実施形態で説明した機能を実現することができる。
Claims (7)
- 障害発生時にエラー情報を記憶手段に保存するアプリケーションプロセスを生成起動させるプロセス生成起動手段と、
上記記憶手段に記憶される上記エラー情報の保存の有無を監視するエラー情報監視手段と、
上記エラー情報監視手段により上記エラー情報の保存が検出されると、当該アプリケーションプロセスの障害を検出するプロセス障害検出手段と、
上記プロセス障害検出手段により上記アプリケーションプロセスの障害が検出されると、当該障害の復旧処理を行う障害復旧手段と
を備えることを特徴とする障害復旧システム。 - 上記障害復旧手段が、他のサーバとの間で定期的に生存確認通信を行うものであって、上記プロセス障害検出手段により上記アプリケーションプロセスの障害が検出されると、他のサーバとの間の上記生存確認通信を停止させる生存確認通信部を有することを特徴とする請求項1に記載の障害復旧システム。
- 上記障害復旧手段が、上記記憶手段から上記エラー情報の取得完了後に、稼動系から待機系への切り替えを行うクラスタ切替部をさらに備える請求項2に記載に障害復旧システム。
- 上記プロセス生成起動手段が、上記プロセス障害検出手段により上記アプリケーションプロセスの障害が検出されると、当該アプリケーションプロセスを別プロセスとして生成起動するものであることを特徴とする請求項1に記載の障害復旧システム。
- 障害復旧システムの障害復旧方法において、
プロセス生成起動手段が、障害発生時にエラー情報を記憶手段に保存するアプリケーションプロセスを生成起動させるプロセス生成起動工程と、
エラー情報監視手段が、上記記憶手段に記憶される上記エラー情報の保存の有無を監視するエラー情報監視工程と、
プロセス障害検出手段が、上記エラー情報監視手段により上記エラー情報の保存が検出されると、当該アプリケーションプロセスの障害を検出するプロセス障害検出工程と、
障害復旧手段が、上記プロセス障害検出手段により上記アプリケーションプロセスの障害が検出されると、当該障害の復旧処理を行う障害復旧工程と
を有することを特徴とする障害復旧方法。 - コンピュータを、
障害発生時にエラー情報を記憶手段に保存するアプリケーションプロセスを生成起動させるプロセス生成起動手段、
上記記憶手段に記憶される上記エラー情報の保存の有無を監視するエラー情報監視手段、
上記エラー情報監視手段により上記エラー情報の保存が検出されると、当該アプリケーションプロセスの障害を検出するプロセス障害検出手段、
上記プロセス障害検出手段により上記アプリケーションプロセスの障害が検出されると、当該障害の復旧処理を行う障害復旧手段
として機能させることを特徴とする障害復旧プログラム。 - 稼動系サーバ装置と少なくとも1以上の待機系サーバ装置とを有して構成されるクラスタシステムにおいて、上記各サーバ装置が請求項1〜4のいずれかに記載の障害復旧システムを備えることを特徴とするクラスタシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008221839A JP2010055509A (ja) | 2008-08-29 | 2008-08-29 | 障害復旧システム、方法及びプログラム、並びにクラスタシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008221839A JP2010055509A (ja) | 2008-08-29 | 2008-08-29 | 障害復旧システム、方法及びプログラム、並びにクラスタシステム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010055509A true JP2010055509A (ja) | 2010-03-11 |
Family
ID=42071330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008221839A Pending JP2010055509A (ja) | 2008-08-29 | 2008-08-29 | 障害復旧システム、方法及びプログラム、並びにクラスタシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010055509A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012075009A (ja) * | 2010-09-29 | 2012-04-12 | Oki Networks Co Ltd | 冗長化装置及び冗長化プログラム |
JP2020173743A (ja) * | 2019-04-15 | 2020-10-22 | 明京電機株式会社 | 障害監視復旧システム、その方法、およびそのプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1124966A (ja) * | 1997-07-02 | 1999-01-29 | Nec Corp | 障害情報管理システム |
WO1999026138A1 (fr) * | 1997-11-14 | 1999-05-27 | Hitachi, Ltd. | Procede de permutation dans un systeme multiplex |
JP2007080012A (ja) * | 2005-09-15 | 2007-03-29 | Hitachi Ltd | 再起動方法、システム及びプログラム |
JP2007265137A (ja) * | 2006-03-29 | 2007-10-11 | Oki Electric Ind Co Ltd | マルチタスク処理方法及びマルチタスク処理装置 |
-
2008
- 2008-08-29 JP JP2008221839A patent/JP2010055509A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1124966A (ja) * | 1997-07-02 | 1999-01-29 | Nec Corp | 障害情報管理システム |
WO1999026138A1 (fr) * | 1997-11-14 | 1999-05-27 | Hitachi, Ltd. | Procede de permutation dans un systeme multiplex |
JP2007080012A (ja) * | 2005-09-15 | 2007-03-29 | Hitachi Ltd | 再起動方法、システム及びプログラム |
JP2007265137A (ja) * | 2006-03-29 | 2007-10-11 | Oki Electric Ind Co Ltd | マルチタスク処理方法及びマルチタスク処理装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012075009A (ja) * | 2010-09-29 | 2012-04-12 | Oki Networks Co Ltd | 冗長化装置及び冗長化プログラム |
JP2020173743A (ja) * | 2019-04-15 | 2020-10-22 | 明京電機株式会社 | 障害監視復旧システム、その方法、およびそのプログラム |
JP7288662B2 (ja) | 2019-04-15 | 2023-06-08 | 明京電機株式会社 | 障害監視復旧システム、その方法、およびそのプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6622261B1 (en) | Process pair protection for complex applications | |
US9164864B1 (en) | Minimizing false negative and duplicate health monitoring alerts in a dual master shared nothing database appliance | |
US20050283636A1 (en) | System and method for failure recovery in a cluster network | |
JP4491482B2 (ja) | 障害回復方法、計算機、クラスタシステム、管理計算機及び障害回復プログラム | |
US7373542B2 (en) | Automatic startup of a cluster system after occurrence of a recoverable error | |
CN108737153A (zh) | 区块链灾备系统、方法、服务器和计算机可读存储介质 | |
JP5285045B2 (ja) | 仮想環境における故障復旧方法及びサーバ及びプログラム | |
CN103902401A (zh) | 基于监控的虚拟机容错方法及装置 | |
CN118018463A (zh) | 一种故障处理方法、装置、设备及可读存储介质 | |
CN107038095B (zh) | 用于冗余地处理数据的方法 | |
CN117435405A (zh) | 双机热备和故障切换系统和方法 | |
JP2010055509A (ja) | 障害復旧システム、方法及びプログラム、並びにクラスタシステム | |
JP5285044B2 (ja) | クラスタシステム復旧方法及びサーバ及びプログラム | |
KR20140140719A (ko) | 가상 머신 동기화 장치 및 시스템과 이를 이용한 장애 처리 방법 | |
JP2007280155A (ja) | 分散システムにおける信頼性向上方法 | |
JP2004258936A (ja) | モバイル通信端末及びそれに用いるフェイルセーフ方法並びにそのプログラム | |
JP3325785B2 (ja) | 計算機の故障検出・回復方式 | |
JP2006229512A (ja) | サーバ切替方法,サーバ及びサーバ切替プログラム | |
US11010269B2 (en) | Distributed processing system and method for management of distributed processing system | |
JP2015106226A (ja) | 二重化システム | |
JP3022768B2 (ja) | 仮想計算機システム | |
US20140297724A1 (en) | Network element monitoring system and server | |
JP7056868B2 (ja) | システム、計算機、システム制御方法及びプログラム | |
JP2011028481A (ja) | フォールトトレラントサーバ、プロセッサ切り替え方法およびプロセッサ切り替えプログラム | |
CN117785568B (zh) | 一种双主双机热备方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110322 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120829 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120911 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121109 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130423 |