JP4941439B2 - クラスタシステムにおける性能低下の原因箇所の特定方法、クラスタシステム - Google Patents
クラスタシステムにおける性能低下の原因箇所の特定方法、クラスタシステム Download PDFInfo
- Publication number
- JP4941439B2 JP4941439B2 JP2008243100A JP2008243100A JP4941439B2 JP 4941439 B2 JP4941439 B2 JP 4941439B2 JP 2008243100 A JP2008243100 A JP 2008243100A JP 2008243100 A JP2008243100 A JP 2008243100A JP 4941439 B2 JP4941439 B2 JP 4941439B2
- Authority
- JP
- Japan
- Prior art keywords
- resource
- performance
- monitoring
- resources
- performance degradation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
Description
以下、図2乃至9を参照して、実施の形態1に係るクラスタシステム、及び、クラスタにおける性能低下の原因箇所の特定方法について説明する。
本実施の形態では、実施の形態1に比べて、各サーバのCPUおよびメモリの使用率をトリガーとして指定することを可能とする。これにより、CPUおよびメモリの使用率の変動の影響が、リソースや、さらにはサービスのパフォーマンスに影響を与えているかの判断が可能となる。なお、以下に特に説明する点を除いて、他の構成、及び処理については、実施の形態1と同様であるため、説明を省略する。
また、第2の効果として、サービスの特性を考慮して原因箇所特定の条件を設定可能な点が挙げられる。その理由は、サービスのパフォーマンスに影響する性能低下を察知する条件をカスタマイズできるためである。
さらに、第3の効果として、サービスの性能低下を同様の原因で起こさないように、フェイルオーバを実施可能な点が挙げられる。その理由は、特定した原因箇所において、性能低下の原因排除にフェイルオーバが有効であるか判断した上でフェイルオーバの実施を決定するためである。
11 可用性確保手段、
12 リソース監視手段、
13 原因箇所特定手段、
14 フェイルオーバ判断手段、
15 リソーストリガーテーブル、
16 サービスグループ情報テーブル、
17 原因箇所リスト、
171 一次原因箇所リスト、
18 レポート、
19 性能情報データベース、
20 サーバ(稼動系)、
21 クラスタソフトウェア、
22 サービス1、
23 サービス2、
30 サーバ(待機系)、
31 クラスタソフトウェア、
32 サービス2(データベースサービス)、
321 ネットワークインタフェース(Network Interface)、
322 IPアドレス(IP address)、
323 ストレージ・デバイス(Disk)、
324 ファイルシステム(FileSystem)、
325 データベースソフトウェア(Database)、
326 アプリケーション(Application:Webサーバなど)、
40 性能監視項目の動向調査処理、
41、42 リソース、
50 測定情報、
70 サーバ群、
91 サービスグループ1(レポート)、
92 サービスグループ3(レポート)、
100 パブリックネットワーク、
Claims (9)
- サービスの提供に必要な複数のサーバを含む複数種類のリソースにより構成されるクラスタシステムにおける性能低下の原因箇所の特定方法であって、
前記複数のサーバのそれぞれが実行するクラスタソフトウェアが有するリソース監視手段が、前記リソースの稼働状況を監視すると共に、当該リソースの性能低下を示唆する性能監視項目を監視するステップと、
前記クラスタソフトウェアが有する原因箇所特定手段が、当該監視結果に基づいて前記複数種類のリソースのそれぞれについて性能低下を判断し、当該性能低下と判断された全てのリソースの中に、性能監視項目の変動が他の種類のリソースの性能監視項目の変動により影響を受ける被影響リソースと、当該他の種類のリソースである影響リソースとが含まれる場合には、当該影響リソースを性能低下の原因であるリソースとして特定するステップと、
を有するクラスタシステムにおける性能低下の原因箇所の特定方法。 - 前記複数種類のリソースのうち性能低下の判断対象とするリソースと、当該リソースの性能低下を判断するための条件とを前記クラスタソフトウェアにおいて指定可能とする
ことを特徴とする請求項1に記載のクラスタシステムにおける性能低下の原因箇所の特定方法。 - 前記原因箇所特定手段が、前記監視結果の変動から前記リソースの性能低下を判断し、前記複数種類のリソースのうち少なくとも1つの前記リソースが性能低下を示す状態となった場合には、当該性能低下と判断された全てのリソースの中から前記性能低下の原因であるリソースを特定する
ことを特徴とする請求項1又は2に記載のクラスタシステムにおける性能低下の原因箇所の特定方法。 - 前記クラスタソフトウェアが有するCPU監視手段が、前記複数のサーバのそれぞれが備えるCPUの使用率を監視するステップ又は当該クラスタソフトウェアが有するメモリ監視手段が、当該複数のサーバのそれぞれが備えるメモリの使用率を監視するステップの少なくとも一つを更に有し、
前記原因箇所特定手段が、当該CPU及びメモリ使用率に基づいて前記複数種類のリソースのそれぞれについて性能低下を判断し、当該CPU使用率又はメモリ使用率のいずれかについて性能低下と判断された場合に、前記リソースの監視結果に基づいて前記複数種類のリソースのそれぞれについて性能低下を判断し、当該性能低下と判断された全てのリソースの中に、性能監視項目の変動が他の種類のリソースの性能監視項目の変動により影響を受ける被影響リソースと、当該他の種類のリソースである影響リソースとが含まれる場合には、当該影響リソースを前記性能低下の原因であるリソースとして特定する
ことを特徴とする請求項1乃至3いずれか1項に記載のクラスタシステムにおける性能低下の原因箇所の特定方法。 - サービスの提供に必要な複数のサーバを含む複数種類のリソースにより構成されるクラスタシステムであって、
前記複数のサーバのそれぞれが実行するクラスタソフトウェアは、
前記リソースの稼働状況を監視すると共に、当該リソースの性能低下を示唆する性能監視項目を監視して当該監視情報を性能情報データベースに格納するリソース監視手段と、
前記複数種類のリソースのうち、性能監視項目の変動が他の種類のリソースの性能監視項目の変動により影響を受ける被影響リソースと、当該他の種類のリソースである影響リソースとを関連付けて定義したサービスグループ情報テーブルと、
前記性能情報データベースに格納した監視情報に基づいて前記複数種類のリソースのそれぞれについて性能低下を判断し、前記サービスグループ情報テーブルを参照して、当該性能低下と判断された全てのリソースの中に、前記被影響リソースと、当該被影響リソースに関連付けられた前記影響リソースとが含まれている場合には、当該影響リソースを性能低下の原因であるリソースとして特定する原因箇所特定手段と、
を有するクラスタシステム。 - 前記クラスタソフトウェアは、前記複数種類のリソースのうち性能低下の判断対象とするリソースと、当該リソースの性能低下を判断するための条件とを記述するトリガーテーブルを更に有し、
前記原因箇所特定手段は、当該トリガーテーブルを参照して、前記性能情報データベースに格納した監視情報に基づいて前記リソースの性能低下を判断する
ことを特徴とする請求項5に記載のクラスタシステム。 - 前記原因箇所特定手段は、前記性能情報データベースに格納した監視情報の変動から前記リソースの性能低下を判断し、前記複数種類のリソースのうち特定のリソースが性能低下を示す状態となった場合には、当該性能低下と判断された全てのリソースの中から前記性能低下の原因であるリソースを特定する
ことを特徴とする請求項5又は6に記載のクラスタシステム。 - 前記クラスタソフトウェアは、前記複数のサーバのそれぞれが備えるCPUの使用率を監視するCPU監視手段とメモリの使用率を監視するメモリ監視手段の少なくとも一つを更に有し、
前記原因箇所特定手段は、当該CPU監視手段及びメモリ監視手段によるCPU使用率及びメモリ使用率に基づいて前記リソースの性能低下を判断し、当該CPU使用率又はメモリ使用率のいずれかについて性能低下と判断された場合に、前記サービスグループ情報テーブルを参照して、前記性能情報データベースに格納した監視情報から前記性能低下の原因であるリソースを特定する
ことを特徴とする請求項5乃至7いずれか1項に記載のクラスタシステム。 - 前記クラスタソフトウェアは、
前記サービスの可用性を確保するための処置を行う可用性確保手段と、
前記原因箇所特定手段により特定されたリソースがフェイルオーバにより原因解消可能であるか否かの判断を行い、原因解消が可能である場合には、前記可用性確保手段にフェイルオーバの実施を指示するフェイルオーバ判断手段と、を更に有する
ことを特徴とする請求項5乃至7いずれか1項に記載のクラスタシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008243100A JP4941439B2 (ja) | 2008-09-22 | 2008-09-22 | クラスタシステムにおける性能低下の原因箇所の特定方法、クラスタシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008243100A JP4941439B2 (ja) | 2008-09-22 | 2008-09-22 | クラスタシステムにおける性能低下の原因箇所の特定方法、クラスタシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010073151A JP2010073151A (ja) | 2010-04-02 |
JP4941439B2 true JP4941439B2 (ja) | 2012-05-30 |
Family
ID=42204828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008243100A Expired - Fee Related JP4941439B2 (ja) | 2008-09-22 | 2008-09-22 | クラスタシステムにおける性能低下の原因箇所の特定方法、クラスタシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4941439B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5425720B2 (ja) * | 2010-06-21 | 2014-02-26 | 株式会社日立システムズ | 仮想化環境監視装置とその監視方法およびプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002342182A (ja) * | 2001-05-21 | 2002-11-29 | Hitachi Ltd | ネットワークシステムにおける運用管理の支援システム |
US6928589B1 (en) * | 2004-01-23 | 2005-08-09 | Hewlett-Packard Development Company, L.P. | Node management in high-availability cluster |
JP4308086B2 (ja) * | 2004-05-31 | 2009-08-05 | 富士通株式会社 | 自律制御プログラム及びその記録媒体、自律制御装置並びに自律制御方法 |
JP2006277690A (ja) * | 2005-03-30 | 2006-10-12 | Nec Corp | クラスタシステム、クラスタ切り替え方法、クラスタ切り替え制御プログラム |
-
2008
- 2008-09-22 JP JP2008243100A patent/JP4941439B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010073151A (ja) | 2010-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11290360B2 (en) | Analyzing resource placement fragmentation for capacity planning | |
JP5948257B2 (ja) | 情報処理システム監視装置、監視方法、及び監視プログラム | |
JP6248560B2 (ja) | 管理プログラム、管理方法、および管理装置 | |
US10462027B2 (en) | Cloud network stability | |
JP4374378B2 (ja) | 運用実績評価装置、運用実績評価方法、およびプログラム | |
JP5267736B2 (ja) | 障害検出装置、障害検出方法およびプログラム記録媒体 | |
US20070168696A1 (en) | System for inventing computer systems and alerting users of faults | |
US20180032574A1 (en) | Dynamic Streaming of Results of Multi-Leveled Queries | |
US20180032387A1 (en) | Predictive Analytics on Database Wait Events | |
CN108633311A (zh) | 一种基于调用链的并发控制的方法、装置及控制节点 | |
US10318399B2 (en) | Using canary instances for software analysis | |
EP3449437A1 (en) | Dynamic streaming of query responses | |
US10339131B1 (en) | Fault prevention | |
US10474954B2 (en) | Feedback and customization in expert systems for anomaly prediction | |
KR20150118963A (ko) | 큐 모니터링 및 시각화 | |
US9021078B2 (en) | Management method and management system | |
JP5779548B2 (ja) | 情報処理システム運用管理装置、運用管理方法及び運用管理プログラム | |
JP4941439B2 (ja) | クラスタシステムにおける性能低下の原因箇所の特定方法、クラスタシステム | |
US20180219752A1 (en) | Graph search in structured query language style query | |
US10223189B1 (en) | Root cause detection and monitoring for storage systems | |
CN111309515A (zh) | 一种容灾控制方法、装置及系统 | |
US9898357B1 (en) | Root cause detection and monitoring for storage systems | |
JP2007265244A (ja) | ウェブシステムの性能監視装置 | |
JP2015056087A (ja) | サーバ負荷分散方法およびプログラム | |
CN106953759B (zh) | 集群控制方法和集群控制设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110616 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110705 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110809 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111115 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120131 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120213 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150309 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |