JP2011180805A - 運用管理装置、運用管理方法、運用管理プログラム - Google Patents
運用管理装置、運用管理方法、運用管理プログラム Download PDFInfo
- Publication number
- JP2011180805A JP2011180805A JP2010043881A JP2010043881A JP2011180805A JP 2011180805 A JP2011180805 A JP 2011180805A JP 2010043881 A JP2010043881 A JP 2010043881A JP 2010043881 A JP2010043881 A JP 2010043881A JP 2011180805 A JP2011180805 A JP 2011180805A
- Authority
- JP
- Japan
- Prior art keywords
- node
- rate
- healthy
- service system
- impact value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
【解決手段】サービスシステムを構成する各ノード40の健全動作率を用いて、ネットワークシステムの論理トポロジに基づく演算を行うことにより、直属関係にあるノードそれぞれの健全動作率の算出する健全動作率算出部11と、各ノードで動作障害が生じた場合に最上位ノードの健全動作率を低下させる影響の度合いを示す各ノードのインパクト値を健全動作率に基づき算出するインパクト値算出部12を備えた運用管理装置20。
【選択図】図1
Description
また、このネットワークシステム(以下「サービスシステム」)における運用状態(動作状態)を管理する運用管理システムでは、一般に、監視対象であるサービスシステムの構成要素(ノード)の動作異常をアラートとして取得し、このアラートの内容や予め設定されたサービスシステム内における各ノードの重要度に基づき、動作異常に対する対処(処理)が行われるノードの優先度が決定され、この優先度に基づき動作異常に対する処理が行われる。
しかしながら、ビジネスサービスシステムを構成する各ノードの優先度は、ビジネスサービスシステム全体の動作状態に与える影響の度合い(インパクト値)を考慮して決定されることが望ましい。
例えば、ウェブ(Web)サーバとAP(アクセスポイント)サーバを含むサービスシステムを監視している場合、各サーバにおける動作停止などの動作異常が異なるサーバで同時に発生した場合、動作異常に対するノードの対処優先順位は、ネットワークシステムの接続構成により確保されている冗長度に応じて決定されることが望ましい。
また、この関連技術として、故障率を変動させて重要度分析を行い、予め設定された閾値以上の値を示す事象をリスク表示する手法が開示されている(特許文献2)。
[発明の目的]
本発明は、上記関連技術の有する不都合を改善し、異なるノードからなるネットワークシステム全体の動作状態を監視すると共に各ノードのネットワークシステムにおける重要度を提示し得る運用管理装置、運用管理方法、運用管理プログラムを提供することを、その目的とする。
次に、本発明の実施形態について、その基本的構成内容を説明する。
尚、この被監視サーバ40および50は、それぞれが設置されたサービスシステムを構成する各ノードの動作異常の検出を行うものとする。
ここでは、ビジネスサービスシステムを構成する子ノードは親ノードに対する接続の仕方を示す接続属性として、AND依存またはOR依存の何れかの属性を有するものとする。
一方、Webグループサーバ、APグループサーバ、およびDBグループサーバは、これら3要素でビジネス1サーバに対して機能的にAND依存であるものとする。
尚、本実施形態の監視制御サーバ20では、ビジネスサービスシステムの論理構成に変更があった場合に、この変更に追随して新たに設定されたシステム論理構成を取得することが可能であるものとする。
動作状態計算本体部10は、システム監視管理部02により取得されたアラートに基づきサービスシステムにおけるノードが健全に動作する割合を示す健全動作率を計算する健全率計算部11と、サービスシステム全体の健全動作率に与える各ノードの影響の度合い(ビジネスインパクト)をインパクト値として算出するインパクト値計算部12と、算出されたインパクト値を記憶保持するインパクト値情報記憶部13を備えている。
まず、末端ノード(Host:ホスト端末)それぞれにおける健全率を算出する健全率演算機能について、説明する。
尚、検知されたどのアラートに対して、どのような重要度を割り当てるか(重み付けを行うか)は、監視制御サーバ20のオペレータが手動により予め設定するものとする。
具体的には、健全率計算部11は、子ノードである末端ノード(Host)に対する親ノードとしてのWebサーバ(1〜5)、APサーバ1〜2、DBサーバ1それぞれにおける健全率を算出する。
また、健全率計算部11は、子ノードとしてのWebサーバ(1〜5)、APサーバ1〜2、DBサーバ1それぞれに対するWebグループサーバ、APグループサーバ、DBグループサーバそれぞれにおける健全率と、子ノードとしてのWebグループサーバ、APグループサーバ、DBグループサーバに対する親ノードであるビジネス1サーバの健全率の算出を行う。
また、動作状態計算本体部10は、サービスシステムにおけるノードの接続関係が変更された場合に、システム監視管理部02が取得した接続ノード特定情報に基づき論理トポロジ記憶部内に記憶された論理トポロジの更新を行う(論理トポロジ更新機能)。
ここで、インパクト値とは、上述のように、ビジネスサービスシステム全体の健全動作率(健全率)に与える各ノードの影響の度合いを数値化した値を示す。
尚、ビジネスサービスシステム(図2)に含まれる、あるノード(例えば、Webグループサーバ)には、n個の子ノードが接続されており、各子ノードの健全率はそれぞれ、A1,A2,...,Anであるものとする。このとき、j番目の子ノードのインパクト値Pjは、以下に示す[式1]により算出されるものとする。
Pj=P×(1−Aj)÷{Σ(−Ai)}
ここでは、APグループサーバのインパクト値は0.66D、AP1サーバおよびAP2サーバそれぞれのインパクト値は0.33Dに設定される。
尚、Webグループサーバにおける健全率(0.5)およびインパクト値(0.33)は、図3に示すように、このWebグループサーバに対して子ノードであるWeb1サーバとWeb2サーバそれぞれの健全率(0と1.0)およびインパクト値(共に0.33)に基づき算出される。
また、ビジネス1サーバにおける健全率(0.0)およびインパクト値(1.00)も同様に、Webグループサーバ、APグループサーバ、およびDB1グループサーバそれぞれの健全率およびインパクト値に基づき算出される(図3)。
そのインパクト値を基にすれば、システム管理者は、ビジネスサービスシステムにおけるノードに対する適切な対処優先度を判断することが可能になる。
また、一般に信頼性工学では、各ノードの故障率は静的に定まっており、それらに基づいて系全体の故障率を求めるが、本実施形態では故障率を求めるのではなく、各ノードの稼働状況が動的に変化するシステムにおいて、ある時点でのビジネスサービスがどの程度の割合でサービスを提供できるかの健全性を求めるものである。
これにより、ノードの健全率が低いものは、系全体に対してより多くのインパクトを与えていると考えられる。
また、本実施形態では、予め取得したビジネスサービスシステムの論理構成を利用することにより、ビジネスサービスシステムを構成する各ノードの健全率とビジネスサービスシステム全体の健全動作に対するインパクト値の算出することができる。
次に、本実施形態の動作について、その概略を説明する。
まず、健全率計算部11は、ビジネスサービスシステムから取得したアラートに基づき、ビジネスサービスシステムを構成する各ノードにおける健全動作率を算出する(健全動作率取得工程)。
次いで、健全率計算部11は、予め取得された前記ビジネスサービスシステムの論理トポロジに基づき、下位ノードと直属関係にある上位ノードの健全動作率の算出することにより、最上位ノードの健全動作率をビジネスサービスシステム全体の健全動作率として決定する(健全動作率算出行程)。
次いで、インパクト値計算部12は、各ノードで動作障害が生じた場合に各ノードが最上位ノードの健全動作率に対して及ぼす影響の度合いを示すインパクト値を前記前記各ノードの健全動作率に基づき算出する(インパクト値算出行程)。
まず、システム監視管理部02が、被監視サーバ40のシステム監視部01を介して、ビジネスサービスシステム(図2)を構成する各ノードにおける動作状態を示す動作情報(アラート)を取得し、アラートストア04に格納する。
また、健全率計算部11は、算出したホスト端末の健全率を用いて、予め設定された論理トポロジに基づき、下位ノード(ここでは、ホスト端末)と直属関係にある親ノードの健全率を算出する。
ここで、各ノードのインパクト値は、例えば、最上位ノード(ビジネス1サーバ)の健全動作率を低下させる割合を示す値であってもよい。
つまり、ビジネスサービスを構成する論理トポロジを活用して、アラート発生時における各ノードの健全性と系全体へのインパクトを数値化して提示することができる。
02 システム監視管理部
03 運用管理画面
04 アラートストア
05 論理トポロジ
10 動作状態計算本体部
11 健全率計算部
12 インパクト値計算部
13 インパクト値情報記憶部
20 監視制御サーバ
30 監視端末
40、50 被監視サーバ
Claims (6)
- 異なる複数のノード間の接続関係が階層構造を有し前記各ノードで行われる実行処理によりサービス提供を行うサービスシステムにおける動作異常を検知するシステム動作監視部と、前記サービスシステムにおけるノードの接続関係を論理トポロジとして記憶する論理構成記憶部とを備えた運用管理装置であって、
前記システム動作監視部は、
前記サービスシステムからの動作異常を示すアラートを取得すると共にこのアラートに基づき各ノードそれぞれにおける健全動作率を算出する健全動作率取得手段と、
前記下位ノードの健全動作率を用いて前記論理トポロジに基づく演算を行うことにより前記下位ノードと直属関係にある前記上位ノードの健全動作率を算出すると共に前記サービスシステムにおける最上位ノードの健全動作率を算出する健全動作率算出手段と、
前記各ノードで動作障害が生じた場合に前記最上位ノードの健全動作率に対する影響の度合いを前記各ノードのインパクト値として算出するインパクト値算出手段とを備えたことを特徴とする運用管理装置。 - 請求項1に記載の運用管理装置において、
前記健全率算出手段は、
前記論理トポロジにおける上位ノードおよび下位ノード間の接続状態が直列である場合に前記上位ノードにおける健全動作率を下位ノードの健全動作率の積として算出し、上位および下位ノード間の接続状態が並列である場合に前記上位ノードにおける健全動作率を下位ノードの健全動作率の相加平均として算出する演算機能を備えたことを特徴とする運用管理装置。 - 請求項1または2に記載の運用管理装置において、
前記論理構成記憶部は、システム動作監視部により取得された前記各ノード直属のノードを示す接続ノード特定情報を記憶するノード特定情報記憶機能を備え、
前記健全率算出手段は、前記サービスシステムにおけるノードの接続関係が変更された場合に、前記接続ノード特定情報に基づき前記サービスシステムの論理トポロジを更新する論理トポロジ更新手段を備えたことを特徴とする運用管理装置。 - 請求項1または2に記載の運用管理装置において、
前記インパクト値算出手段は、前記ノードの健全動作率が検知されないことにより前記各ノードのインパクト値が算出できない場合に、前記各ノードのインパクト値として予め設定された値より大きい値を前記インパクト値として設定する暫定インパクト値設定機能を備えたことを特徴とする運用管理装置。 - 異なる複数のノード間の接続関係が階層構造を有し前記ノード間で通信が行われることによりサービス提供を行うサービスシステムの動作異常を検知するシステム動作監視部と、前記サービスシステムにおけるノードの接続関係を論理トポロジとして記憶する論理構成記憶部とを備えた運用管理装置にあって、前記動作異常に対する前記各ノードの処理優先度を決定する運用管理方法であって、
前記サービスシステムからの動作異常を示すアラートを取得すると共にこのアラートに基づき各ノードそれぞれにおける健全動作率を算出し、
前記下位ノードの健全動作率を用いて前記論理トポロジに基づく演算を行うことにより前記下位ノードと直属関係にある前記上位ノードの健全動作率を算出すると共に、前記サービスシステムにおける最上位ノードの健全動作率を算出し、
前記各ノードで動作障害が生じた場合に前記最上位ノードの健全動作率に対する影響の度合いを前記各ノードのインパクト値として算出することを特徴とした運用管理方法。 - 異なる複数のノード間の接続関係が階層構造を有し前記ノード間で通信が行われることによりサービス提供を行うサービスシステムの動作異常を検知するシステム動作監視部と、前記サービスシステムにおけるノードの接続関係を論理トポロジとして記憶する論理構成記憶部とを備えた運用管理装置にあって、前記動作異常に対する前記各ノードの処理優先度を決定するための運用管理プログラムであって、
前記サービスシステムからの動作異常を示すアラートを取得すると共にこのアラートに基づき各ノードそれぞれにおける健全動作率を算出する健全動作率取得機能と、
前記下位ノードの健全動作率を用いて前記論理トポロジに基づく演算を行うことにより前記下位ノードと直属関係にある前記上位ノードの健全動作率を算出すると共に、前記サービスシステムにおける最上位ノードの健全動作率を算出する健全動作率算出機能と、
前記各ノードで動作障害が生じた場合に前記最上位ノードの健全動作率に対する影響の度合いを前記各ノードのインパクト値として算出するインパクト値算出機能とをコンピュータに実行させることを特徴とした運用管理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010043881A JP5544929B2 (ja) | 2010-03-01 | 2010-03-01 | 運用管理装置、運用管理方法、運用管理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010043881A JP5544929B2 (ja) | 2010-03-01 | 2010-03-01 | 運用管理装置、運用管理方法、運用管理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011180805A true JP2011180805A (ja) | 2011-09-15 |
JP5544929B2 JP5544929B2 (ja) | 2014-07-09 |
Family
ID=44692246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010043881A Expired - Fee Related JP5544929B2 (ja) | 2010-03-01 | 2010-03-01 | 運用管理装置、運用管理方法、運用管理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5544929B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014002557A1 (ja) * | 2012-06-29 | 2014-01-03 | 日本電気株式会社 | 共有リスク影響度評価システム、共有リスク影響度評価方法、およびプログラム |
WO2014115504A1 (ja) * | 2013-01-23 | 2014-07-31 | 日本電気株式会社 | 情報処理装置及び影響判定方法 |
JP2016170579A (ja) * | 2015-03-12 | 2016-09-23 | 日本電気株式会社 | 情報表示装置、情報表示方法及び情報表示プログラム |
WO2021060465A1 (ja) * | 2019-09-27 | 2021-04-01 | 株式会社サタケ | 籾摺装置及び籾摺制御システム |
JP7537119B2 (ja) | 2019-09-27 | 2024-08-21 | 株式会社サタケ | 籾摺装置及び籾摺制御システム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000235507A (ja) * | 1999-02-16 | 2000-08-29 | Toshiba Corp | システムの信頼性設計装置及び方法並びにシステムの信頼性設計用ソフトウェアを記録した記録媒体 |
JP2005031893A (ja) * | 2003-07-10 | 2005-02-03 | Hitachi Ltd | 運用管理方法及び装置 |
JP2005316696A (ja) * | 2004-04-28 | 2005-11-10 | Toshiba Corp | Itシステムの設計支援システムおよび設計支援方法 |
JP2008217285A (ja) * | 2007-03-02 | 2008-09-18 | Hitachi Ltd | 情報処理システムの運用管理装置および運用管理方法 |
-
2010
- 2010-03-01 JP JP2010043881A patent/JP5544929B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000235507A (ja) * | 1999-02-16 | 2000-08-29 | Toshiba Corp | システムの信頼性設計装置及び方法並びにシステムの信頼性設計用ソフトウェアを記録した記録媒体 |
JP2005031893A (ja) * | 2003-07-10 | 2005-02-03 | Hitachi Ltd | 運用管理方法及び装置 |
JP2005316696A (ja) * | 2004-04-28 | 2005-11-10 | Toshiba Corp | Itシステムの設計支援システムおよび設計支援方法 |
JP2008217285A (ja) * | 2007-03-02 | 2008-09-18 | Hitachi Ltd | 情報処理システムの運用管理装置および運用管理方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014002557A1 (ja) * | 2012-06-29 | 2014-01-03 | 日本電気株式会社 | 共有リスク影響度評価システム、共有リスク影響度評価方法、およびプログラム |
WO2014115504A1 (ja) * | 2013-01-23 | 2014-07-31 | 日本電気株式会社 | 情報処理装置及び影響判定方法 |
JPWO2014115504A1 (ja) * | 2013-01-23 | 2017-01-26 | 日本電気株式会社 | 情報処理装置及び影響判定方法 |
JP2016170579A (ja) * | 2015-03-12 | 2016-09-23 | 日本電気株式会社 | 情報表示装置、情報表示方法及び情報表示プログラム |
WO2021060465A1 (ja) * | 2019-09-27 | 2021-04-01 | 株式会社サタケ | 籾摺装置及び籾摺制御システム |
CN114514072A (zh) * | 2019-09-27 | 2022-05-17 | 株式会社佐竹 | 稻谷脱壳装置以及稻谷脱壳控制系统 |
CN114514072B (zh) * | 2019-09-27 | 2023-05-09 | 株式会社佐竹 | 稻谷脱壳装置以及稻谷脱壳控制系统 |
JP7537119B2 (ja) | 2019-09-27 | 2024-08-21 | 株式会社サタケ | 籾摺装置及び籾摺制御システム |
Also Published As
Publication number | Publication date |
---|---|
JP5544929B2 (ja) | 2014-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021129367A1 (zh) | 一种监控分布式存储系统的方法及装置 | |
CN113328872B (zh) | 故障修复方法、装置和存储介质 | |
US10462027B2 (en) | Cloud network stability | |
US9106518B1 (en) | Network failure detection | |
EP2685380B1 (en) | Operations management unit, operations management method, and program | |
TW202009705A (zh) | 用以自動管理發生於資料中心系統的硬體錯誤事件的方法及其系統 | |
EP3338191B1 (en) | Diagnostic framework in computing systems | |
WO2009110111A1 (ja) | サーバ装置及びサーバ装置の異常検知方法及びサーバ装置の異常検知プログラム | |
US7987394B2 (en) | Method and apparatus for expressing high availability cluster demand based on probability of breach | |
JP5544929B2 (ja) | 運用管理装置、運用管理方法、運用管理プログラム | |
US10587655B1 (en) | Compliance management system and method for an integrated computing system | |
US10068058B2 (en) | Method and apparatus for improved clinical system performance | |
US8949653B1 (en) | Evaluating high-availability configuration | |
KR20170040210A (ko) | 분산 시스템에서 결함을 분석하기 위한 비주얼 툴 | |
US20180241835A1 (en) | Monitoring highly distributed computer systems | |
JP5162582B2 (ja) | 推定原因分析のための因果関係モデルの宣言及び消費 | |
JP6002856B2 (ja) | 監視システム、及び、監視方法 | |
US20210399953A1 (en) | Tail-based span data sampling | |
JP6482984B2 (ja) | クラウド管理方法及びクラウド管理システム | |
CN110245052B (zh) | 一种数据系统的热点组件确定方法、装置、电子设备及存储介质 | |
JP6317074B2 (ja) | 障害通知装置、障害通知プログラムならびに障害通知方法 | |
WO2017018435A1 (ja) | リソース監視装置、仮想ネットワークファンクション管理システム、リソース監視方法及びプログラム | |
JP2006092053A (ja) | システム使用率管理装置及びそれに用いるシステム使用率管理方法並びにそのプログラム | |
US8812916B2 (en) | Failure data management for a distributed computer system | |
US10157116B2 (en) | Window deviation analyzer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140107 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140415 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140428 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5544929 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |