JP2011253231A - 分散・並列処理システムの障害監視装置と方法およびプログラム - Google Patents
分散・並列処理システムの障害監視装置と方法およびプログラム Download PDFInfo
- Publication number
- JP2011253231A JP2011253231A JP2010124858A JP2010124858A JP2011253231A JP 2011253231 A JP2011253231 A JP 2011253231A JP 2010124858 A JP2010124858 A JP 2010124858A JP 2010124858 A JP2010124858 A JP 2010124858A JP 2011253231 A JP2011253231 A JP 2011253231A
- Authority
- JP
- Japan
- Prior art keywords
- server
- automatic scale
- event
- failure
- scale
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】監視対象となる各サーバ103〜105が、常時稼動するのか、あるいは、スケールアウト時のみ稼動するのかを示すサーバ用途情報と、各サーバが待機中であるか稼働中かを示す稼動状態情報を記憶して管理し(111,112)、監視システム107が検知したイベントについて、イベント発生元のサーバのサーバ用途情報と稼動状態情報を確認することにより、当該イベントが障害により発生したものなのか、自動スケールアウトおよび自動スケールインにより発生したものなのかを判定する(108,110)。
【選択図】図1
Description
Claims (3)
- 複数のサーバコンピュータによる分散・並列処理を行うと共に、サーバコンピュータの自動スケールアウトと自動スケールインを行う分散・並列処理システムにおける障害イベントの発生を監視する装置であって、
上記サーバコンピュータでのイベントの発生を検知する監視手段と、
該監視手段が検知したイベントを受信し、当該イベントが障害により発生したイベントであるか自動スケールアウトもしくは自動スケールインにより発生したイベントであるかを判定する判定手段と
を有し、
該判定手段は、
各サーバコンピュータが上記自動スケールアウト用および上記自動スケールイン用のサーバであるか否かを示すサーバ用途情報を収集して記憶装置に記憶するサーバ用途情報収集手段と、
各サーバコンピュータが稼働中であるか停止中であるかを示す稼動状態情報を収集して記憶装置に記憶する稼動状態情報収集手段と、
上記自動スケールアウト用および上記自動スケールイン用のサーバコンピュータの自動スケールアウトもしくは自動スケールインが実行される際に、当該サーバコンピュータに関する上記稼動状態情報を変更する変更手段と、
上記監視手段が検知したイベントについて、イベント発生元のサーバコンピュータの上記サーバ用途情報と上記稼動状態情報を参照して、当該イベントが、障害により発生したものであるか、自動スケールインにより発生したものであるかを判定する障害判定手段と
を有することを特徴とする分散・並列処理システムの障害監視装置。 - コンピュータを、請求項1記載の分散・並列処理システムの障害監視装置における各手段として機能させるためのプログラム。
- 複数のサーバコンピュータによる分散・並列処理を行うと共に、サーバコンピュータの自動スケールアウトと自動スケールインを行う分散・並列処理システムにおける障害イベントの発生を、プログラムされたコンピュータ処理によって監視する装置の障害監視方法であって、
プログラムされたコンピュータ処理を実行する手段として、監視手段と、サーバ用途情報収集手段、稼動状態情報収集手段、変更手段、障害判定手段を有し、
上記監視手段は、サーバコンピュータでのイベントの発生を検知し、
上記サーバ用途情報収集手段は、各サーバコンピュータが上記自動スケールアウト用および上記自動スケールイン用のサーバであるか否かを示すサーバ用途情報を収集して記憶装置に記憶し、
上記稼動状態情報収集手段は、各サーバコンピュータが稼働中であるか停止中であるかを示す稼動状態情報を収集して記憶装置に記憶し、
上記変更手段は、上記自動スケールアウト用および上記自動スケールイン用のサーバコンピュータの自動スケールアウトもしくは自動スケールインが実行される際に、当該サーバコンピュータに関する上記稼動状態情報を変更し、
上記障害判定手段は、上記監視手段が検知したイベントについて、イベント発生元のサーバコンピュータの上記サーバ用途情報と上記稼動状態情報を参照して、当該イベントが、障害により発生したものであるか、自動スケールインにより発生したものであるかを判定する
ことを特徴とする分散・並列処理システムの障害監視方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010124858A JP5467936B2 (ja) | 2010-05-31 | 2010-05-31 | 分散・並列処理システムの障害監視装置と方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010124858A JP5467936B2 (ja) | 2010-05-31 | 2010-05-31 | 分散・並列処理システムの障害監視装置と方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011253231A true JP2011253231A (ja) | 2011-12-15 |
JP5467936B2 JP5467936B2 (ja) | 2014-04-09 |
Family
ID=45417147
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010124858A Expired - Fee Related JP5467936B2 (ja) | 2010-05-31 | 2010-05-31 | 分散・並列処理システムの障害監視装置と方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5467936B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9244723B2 (en) | 2013-11-13 | 2016-01-26 | Fujitsu Limited | Medium, method, and apparatus |
KR102393183B1 (ko) * | 2021-09-29 | 2022-05-02 | (주)로그스택 | 기업 서버의 로그 데이터 관리 및 처리 방법, 장치 및 시스템 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11194961A (ja) * | 1998-01-05 | 1999-07-21 | Toshiba Corp | 遠方監視制御装置および遠方監視制御システム |
JP2006277278A (ja) * | 2005-03-29 | 2006-10-12 | Nec Corp | 自律型コンピュータシステムおよびその自動整合方法 |
JP2010113495A (ja) * | 2008-11-06 | 2010-05-20 | Nomura Research Institute Ltd | クラスタシステムおよびクラスタ制御方法 |
-
2010
- 2010-05-31 JP JP2010124858A patent/JP5467936B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11194961A (ja) * | 1998-01-05 | 1999-07-21 | Toshiba Corp | 遠方監視制御装置および遠方監視制御システム |
JP2006277278A (ja) * | 2005-03-29 | 2006-10-12 | Nec Corp | 自律型コンピュータシステムおよびその自動整合方法 |
JP2010113495A (ja) * | 2008-11-06 | 2010-05-20 | Nomura Research Institute Ltd | クラスタシステムおよびクラスタ制御方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9244723B2 (en) | 2013-11-13 | 2016-01-26 | Fujitsu Limited | Medium, method, and apparatus |
KR102393183B1 (ko) * | 2021-09-29 | 2022-05-02 | (주)로그스택 | 기업 서버의 로그 데이터 관리 및 처리 방법, 장치 및 시스템 |
Also Published As
Publication number | Publication date |
---|---|
JP5467936B2 (ja) | 2014-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9367379B1 (en) | Automated self-healing computer system | |
EP2523115B1 (en) | Operation management device, operation management method, and program storage medium | |
JP5643321B2 (ja) | 仮想コンピューティング環境における障害管理のための方法、システム、およびコンピュータ・プログラム | |
JP5440273B2 (ja) | スナップショット管理方法、スナップショット管理装置、及びプログラム | |
EP2972870B1 (en) | Coordinating fault recovery in a distributed system | |
WO2009110111A1 (ja) | サーバ装置及びサーバ装置の異常検知方法及びサーバ装置の異常検知プログラム | |
US20140019807A1 (en) | Transaction server performance monitoring using component performance data | |
CN103607297A (zh) | 一种计算机集群系统的故障处理方法 | |
US20210133054A1 (en) | Prioritized transfer of failure event log data | |
CN111880906A (zh) | 虚拟机高可用性管理方法、系统以及存储介质 | |
US10353786B2 (en) | Virtualization substrate management device, virtualization substrate management system, virtualization substrate management method, and recording medium for recording virtualization substrate management program | |
US20160036654A1 (en) | Cluster system | |
JP2010086364A (ja) | 情報処理装置、動作状態監視装置および方法 | |
US20170039118A1 (en) | Cluster system, server device, cluster system management method, and computer-readable recording medium | |
JP5467936B2 (ja) | 分散・並列処理システムの障害監視装置と方法およびプログラム | |
JPWO2013124947A1 (ja) | 情報システム管理装置及び情報システム管理方法及びプログラム | |
JP2010231293A (ja) | 監視装置 | |
US20140164851A1 (en) | Fault Processing in a System | |
CN112069032A (zh) | 一种虚拟机的可用性检测方法、系统及相关装置 | |
US20080216057A1 (en) | Recording medium storing monitoring program, monitoring method, and monitoring system | |
CN116149932A (zh) | 软件系统状态的检测方法、装置及电子设备 | |
JP7044971B2 (ja) | クラスタシステム、オートスケールサーバ監視装置、オートスケールサーバ監視プログラムおよびオートスケールサーバ監視方法 | |
JP2014178832A (ja) | サービス提供システム、サーバ装置、クライアント端末、障害検知方法、及びプログラム | |
JP6674916B2 (ja) | 通信障害管理装置、及び通信システム | |
JP5655639B2 (ja) | 監視装置、監視方法、プログラム及び監視システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20111227 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120926 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131023 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5467936 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |