JP2011146074A - 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム - Google Patents
運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム Download PDFInfo
- Publication number
- JP2011146074A JP2011146074A JP2011098809A JP2011098809A JP2011146074A JP 2011146074 A JP2011146074 A JP 2011146074A JP 2011098809 A JP2011098809 A JP 2011098809A JP 2011098809 A JP2011098809 A JP 2011098809A JP 2011146074 A JP2011146074 A JP 2011146074A
- Authority
- JP
- Japan
- Prior art keywords
- information
- performance
- performance information
- correlation
- operation management
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】運用管理装置は、性能情報の時系列変化を示す性能系列情報から性能情報間の複数の相関関数および各相関関数の予測誤差を示す重み情報を含む相関モデルを生成する相関モデル生成部123と、性能情報のうちの第1の性能情報から第2の性能情報を予測しうる相関関数またはその組み合わせによる経路が相関モデルの中に複数存在する場合に、重み情報の数値が最大となる経路を利用して第2の性能情報を予測するモデル探索部124を含む。
【選択図】図5
Description
障害箇所が報告された場合、それがメモリ容量不足が原因なのか、CPU負荷が原因なのか、ネットワーク負荷が原因なのか等、解決のために原因を絞り込む必要がある。一般に原因の解明には関係がありそうな計算機のシステムログやパラメータの調査、さらにはシステムエンジニアの経験と勘に頼る必要があり、解決に時間と労力を要する。
前処理部は、稼働情報DBに格納されている各構成要素の稼働情報間の統計的分析値を求める統計処理を行う。前処理部は、例えば、各稼働情報間の相関係数を求めたり、各稼働情報間で主成分分析を行ったりして、統計的分析値を求める。この統計的分析値は、所定時刻における各装置の稼働情報間の関連度を示す値となっている。例えば特許文献5の図2では、「サーバ1のCPU使用率」と「サーバ2のCPU使用率」との相関係数が「0.93」等となっている。相関係数は、2つの変量間の相関関係の程度を表す数値である。
このような運用管理装置では、まず、監視対象となるサーバ、ネットワーク機器等から、CPU使用率のようなハードウェア稼動情報、またWebサーバであれば、アクセスの状況といったアプリケーションレベルの情報を定期的に取得するようにし、正常なアクセス時や、障害発生時といった各状況における稼動情報から、各状況を特徴付ける“取得値間の関連”を相関分析・主成分分析といった統計的手法を用いて算出し、各状況のモデルを定義してモデル情報DBに保持しておく。
そして、運用時には、定期的に、あるいは障害のアラートや、提供サービスのレスポンス低下などをトリガとして、現在の稼働情報に対して定義したモデルと同様の統計的手法を行い、モデル情報DBに定義したモデルと比較して、マッチしたモデルの状況を現在置かれている状況として識別する。
モデル抽出部は、時間に対するCPUの使用率の関係を表す座標系において、時間1〜時間3の監視データをプロットし、プロットした各監視データの線形近似式(fa(x)=αx+β)を求めることによって、CPU使用率の時系的変化を表すモデルを抽出する。モデル抽出部は、抽出したモデルを知識情報蓄積部に対して蓄積する。
同様にして、時間に対するスループットの関係を表す座標系においてもモデルを求める。
そして、モデル抽出部は、これらの2つのモデルに対して相関分析及び多変量解析を行うことで、処理Aと処理Bとの夫々について、CPU使用率とスループットとの相関を表す線形近似式(fTA(x)=ρ1x+θ1、fTB(x)=ρ2x+θ2)を求め、CPU使用率とスループットとの相関を示すモデルを抽出する。モデル診断部は、各モデルに該当するポリシーを夫々参照し診断を実行する(特許文献6の段落番号0060〜0062)。
このため、正確な予測には、データ収集および分析の負荷が大きく、それを分析するための高度な知識も必要となる、という不具合があった。また、特定の処理だけから予測された負荷では信頼性が低く、正確なボトルネック解析ができない、という不具合があった。
また、関係の大きさを定量化するために、1つの要素毎に他の要素のすべてとの重回帰分析する処理が必要となるため、システムが大規模化して要素が増えると負荷が膨大になってしまうという不具合があった。
さらに、ある1つの要素の値に対して他の要素の値を算出することが困難であるため、将来発生しうる負荷に対してどの要素がボトルネックとなり得るかといった解析ができないという不具合があった。
すなわち、CPU使用率とスループットとの相関は、一の要素と他の要素との間の相関のみであるため、システムを構成する全要素についてのそれぞれ相関が不明であるため、システムのボトルネックがどの要素に最も生じやすくなるかを予測することができない、という不具合があった。
すなわち、第1に、将来発生しうる状況を事前にすべて想定することは困難であり、結果的に、想定外の利用状況で予期せぬ要素がボトルネックになってしまうことを避けられないという不具合があった。
第2に、正確な予測には、データ収集および分析の負荷が大きく、それを分析するための高度な知識も必要となるという不具合があった。また、特定に処理だけから予測された負荷では信頼性が低く、正確なボトルネック解析ができないという不具合があった。
第3に、ボトルネックとなる要素を正確に判定するために、管理者に多くの知識が要求され、検証の作業負担も大きくなるという不具合があった。
第4に、システムが大規模化して要素が増えると負荷が膨大になってしまうという問題があった。さらに、ある1つの要素の値に対して他の要素の値を算出することが困難であるため、将来発生しうる負荷に対してどの要素がボトルネックとなり得るかといった解析ができない、という不具合があった。
これにより、各要素の性能情報間の相関関係を適切に抽出してモデル化することで、実際の運用状況で発生するボトルネックを正確に予測できるとともに、管理者の負担が少なく、大規模環境においても分析に必要となる処理負荷を増大させないボトルネック解析を実現できるという、関連技術にない優れた運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラムを提供することができる。
先ず、運用管理装置の基本的構成について説明する。本発明の運用管理装置(例えば図5に示す符号100など)は、システムを構成する複数の被管理装置から複数種の性能種目毎の性能情報を取得して、前記被管理装置を運用管理するものを対象とするものである。
(運用管理システムの全体構成)
先ず、本実施の形態の運用管理システムの具体的構成について、全体構成から説明し、続いて各部の詳細構成について説明することとする。
図1は、本発明における第1実施の形態の運用管理装置を含む運用管理システムの全体の概略構成の一例を示すブロック図である。
ここで、本実施の形態の特徴的構成を説明する前に、本実施の形態の前提となる運用管理装置の構成について、図2、図3、図4を用いて説明する。
図2を参照すると、本実施の形態の前提となる構成を示す運用管理装置3は、サービス実行部21と、性能情報蓄積処理部12と、情報収集部22と、分析設定蓄積処理部14と、障害分析部26と、管理者対話部27と、対処実行部28と、を含んで構成される。
性能情報蓄積処理部12は、サービス実行部21の各々の要素の性能情報を蓄積する。
情報収集部22は、サービス実行部21の動作状態を検出して出力するとともに、動作状態に含まれる性能情報を性能情報蓄積処理部12に蓄積する。
障害分析部26は、情報収集部22から動作状態を受け取って分析設定蓄積処理部14の分析設定に従って障害分析を行う。
対処実行部28は、管理者対話部27の指示に応じてサービス実行部21上で障害の対処となる処理を実行する。
図3の性能情報12aは、このようにして検出された性能情報の例である。例えば、「SV1.CPU」は、1つのサーバのCPU利用率の値を示し、2007年10月5日の17時25分の値が12である。さらに、1分間隔で17時26分から15、34、63といった値が検出されている。同様に、「SV1.MEM」は同じサーバのメモリ残量の値を、「SV2.CPU」は別のサーバのCPU利用率の値を、それぞれ同時刻に検出したものである。
例えば、管理者は、CPU負荷が高くなっていることを知って、業務量を減らしたり、負荷分散を行うための構成変更を行ったりすることができる。
例えば、WEBサービスの多数のクライアントからのアクセスを擬似的に発生させる等である。この状態で、運用管理装置3の情報収集部22に相当する機能により、サービス実行部21に相当する機能から性能情報を収集し、障害分析部26に相当する機能によって分析を行えば、想定される高負荷状態において、システムのどの要素が異常となるかが把握できる。
例えば、図4のグラフG101に示すような負荷が得られ、そのピーク値が閾値を超えて予め判明している危険域に達することがわかれば、「SV1」の処理能力が不足することがわかる。逆に、すべての性能情報が閾値以内であることがわかれば、想定される負荷に対してシステムが安全であることがわかる。
例えば、予めCPU負荷との関係がわかっている処理の詳細な実行履歴を収集することで、いつどの処理が実行されるとどの程度のCPU利用率になるのかを算出することができる。図4のグラフG101におけるピーク値が、どの処理によって引き起こされたのかがわかれば、その処理がいつ行われる予定であるかによって、将来の「SV1.CPU」の負荷を予測することができる。
特に、近年ITシステムは社会インフラとしての重要性が増しており、システムが大規模化し、他システムと連携する場合が多い。このような状況では、膨大な処理履歴を収集する負荷が発生し、複雑な因果関係を分析する高度な知識も必要となってしまう、という不具合があった。
例えば、図4のグラフG101のような時系列変化から、グラフG201のように「SV1.CPU」の値が単調増加の傾向にあることを導出し、その増加割合からCPU負荷が危険域になる時期を予測することができる。同様に、他の要素に対しても危険域になる時期を予測すれば、システム全体として最も早く危険域に達すると予想される要素を発見することができる。
例えば、メモリ残量が一定以下になれば、新たな処理は開始できずにメモリ量の回復を待つ場合がある。メモリ残量の変化を考慮しなければ、CPU負荷がある時点の傾向と同様に将来も単調増加するかどうかは明確ではない。
管理者は、傾向予測の結果の妥当性を判断するために、実際にシステムに存在する要素間の相関関係を正確に理解しなければならず、管理者への負担が大きい、という不具合があった。
例えば、図3の性能情報12aにおける「SV1.CPU」の異常を発見した場合に、「SV1.MEM」や「SV2.CPU」の値と「SV1.CPU」の値の重回帰分析を行って、相関が高いとみなされたものを列挙する。
これにより、管理者は、「SV1.CPU」の異常が「SV2.MEM」よって引き起こされているといった可能性を考慮することができる。
そこで、本実施の形態では、以下に示す特徴的構成を有する。
ここで、本発明の第1の実施の形態の運用管理装置の特徴的構成について、図5を参照しつつ説明する。図5は、本発明の第1の実施の形態の運用管理装置の特徴的構成の一例を示すブロック図である。
モデル探索部124は、相関モデル蓄積処理部116に蓄積される相関モデルの各々の性能情報間の変換関数を順次辿ることで、1つの性能情報の値を仮定した場合に他の性能情報の値を算出する。また、1つの性能情報に対して複数の変換関数によって異なった値が算出された場合に、重み情報に基づいて1つの値を選択あるいは算出する。
ボトルネック解析部125は、モデル探索部124が算出した他の性能情報の値を受け取って、リソース情報蓄積処理部118に蓄積されるリソース情報と比較する。
ボトルネック解析部125は、性能値がリソース情報に示す範囲を超える要素を検出する。
ボトルネック解析部125は、その性能情報とその時点の入力性能情報の値を含む解析結果を生成し、管理者対話部127に出力する。
ここで、相関モデル生成部123による相関モデル生成の概要について、図7を参照して説明する。図7は、本実施の形態にかかる運用管理装置の相関関数生成の概要の一例を示す説明図である。
この変換関数G300を、システム同定処理G301に示す処理によって算出する。
一例として、「y=Ax+B」の式で示される変換関数では、「A=−0.6」、「B=100」の値が算出される。
さらに、グラフG302で示すように、この変換関数でグラフG101から生成された性能値の予測値の系列と、グラフG102で示される実際の性能値の差分から重みwが生成される。
続いて、モデル探索部124によるモデル探索の概要について、図9を参照して説明する。図9は、本実施の形態にかかる運用管理装置の重み情報を利用したモデル探索の概要の一例を示す説明図である。
さらに、ボトルネック解析部125によるボトルネック解析では、リソース情報に基づいて、モデル探索部124にて予測された性能情報が限界を超えたか否かの判定が行われる。
図10は、本実施の形態にかかる運用管理装置のリソース情報の一例である。リソース情報118aは、システムの性能情報の要素の名称と、性能値の単位と、性能値の最小値と、性能値の最大値と、を含んで構成される。
図15は、運用管理装置の表示部に表示される表示画面の一例が示されている。同図では、ボトルネック解析における表示画面の一例が示されている。
表示画面U100は、図15に示すように、ボトルネック解析の結果として、システムへの入力が「600/sec」の値である場合に、要素「SV2.CPU」の性能が限界値を超えることを提示する。
また、その時点での要素の一覧を、利用率の大きい順に一覧表示される。
さらに、一覧表示で選択された「SV2.CPU」の性能値とシステムへの入力の値との関係を示すグラフとして、変換関数で表現される予測線と検出された性能値を示す点が表示される。
さらに、表示画面U100は、利用率の高い要素を順にリストアップした要素リスト表示部U120を有する。要素リスト表示部U120は、要素(性能種目)、その要素の利用率、その他の情報などを表示することができる。
さらに、表示画面U100は、要素リスト表示部U120の要素リストのうち、選択された要素に関するグラフを表示するグラフ表示部U130を有する。グラフ表示部U130は、性能値と入力の値との関係を示すグラフを表示することができる。グラフ表示部U130は、変換関数で表現される予測線、検出された性能値を示す点、100%のライン、などを表示することができる。
またさらに、表示画面U100は、相関モデルの詳細情報を表示するための第1の表示操作部U142を有する。表示画面U100は、リソース情報の詳細情報を表示するための第2の表示操作部U144を有する。表示画面U100は、ボトルネック解析画面の表示を終了するための第3の表示操作部U146を有する。
管理者は、このようなユーザーインタフェースを利用して、ボトルネックがどこにあるのかを正確に解析できる。
(全体処理)
次に、上述のような構成を有する運用管理装置における各部の処理は、方法としても実現可能であり、情報処理方法としての各種の処理手順について、図11乃至図14を参照しつつ説明する。
図11は、本発明の第1の実施の形態による運用管理装置における処理手順の一例を示すフローチャートである。
図12は、本発明の第1の実施の形態による運用管理装置における相関モデル生成の詳細処理手順の一例を示すフローチャートである。
ここで、相関モデル生成部123は、性能情報蓄積処理部112から性能情報12aを読み込む(図12に示すステップS101)。
相関モデルが生成されていない状態では、未分析の性能情報があるため、性能情報間の変換関数を算出する処理(ステップS103)に移る。
図7を参照すると、「SV1.CPU」を入力xとし、「SV2.MEM」を出力yとする変換関数G300を、システム同定処理G301によって決定することになる。
以下では、説明を簡略化するために、式「y=Ax+B」のAとBを決定する形で説明するが、その例に限定されるものではなく、他のシステム同定手法を用いても1つの性能値の系列から他の性能値の系列が算出できる変換関数であれば同様の効果が得られるものである。
図8は、このようにして追加された相関モデルの例であり、「SV1.CPU」と「SV2.MEM」の相関として、A、B、Wの値が蓄積されている。
以降、同様にして、ステップS103からステップS105の処理を、性能情報12aに含まれる性能値の系列のすべての組合せに対して行うことで、相関モデル蓄積処理部116に現在のシステムの性能情報に関する相関モデルが完成する。
次に、本実施の形態におけるモデル探索の詳細処理について、図5、図13、図9を参照して説明する。図13は、本実施の形態にかかる運用管理装置のモデル探索の詳細処理手順の一例を示すフローチャートである。
そして、運用管理装置が備えたコンピュータ(のモデル探索部124)が、未探索の相関があると判定した場合には、受け取った1つの要素の値から他の要素の性能値を算出し、その算出に用いた変換関数の重みを記録する(ステップS204)。
最初に受け取った性能値は決定しているので、それ以外の性能値の1つを選択し、他の性能値を算出する。
同様に、出力となる性能値と重みを算出する(ステップS204)。この場合、前回算出済みの性能値があるので、ステップS205の判定処理では、性能値があると判定される。
そして、前回の算出値と、今回の算出値の重み情報を比較し、重みに応じて性能値を選択する処理を行う(S206)。
次に、本実施の形態におけるボトルネック解析の詳細処理について、図5、図14、図10、図15を参照しつつ説明する。図14は、本実施の形態にかかる運用管理装置のボトルネック解析動作のフローチャートを示す。
入力となる要素は、例えば、WEB、AP、DBで構成される3Tierのシステムであれば、WEBサーバへの入力トラフィック等が挙げられる。性能値としては、例えば、現在検出されている最大値等が挙げられる。
モデル探索では、与えられた性能値から、相関モデルを探索して他の性能値を算出する。
この後、ボトルネック解析部125は、この算出された性能値を受け取り、リソース情報蓄積処理部118に蓄積されるリソース情報118aと比較して、性能情報に含まれる要素の利用率を算出する(ステップS303)。
ステップS304にて、性能容量が不足していると判定した場合には、運用管理装置が備えたコンピュータ(のボトルネック解析部125)は、管理者に解析結果を提示する(ステップS306)。
これにより、管理者は、現状のサービス実行部121は、入力性能値が「600/sec」以上になる状況に耐えられないことがわかり、それ以上の負荷が予想される場合は、「SV2」の処理能力が向上するように設定変更や設備増強を行わなければならないことがわかる。
これに対して本実施の形態では、2つの性能情報の間の変換関数としてモデルを生成し、1つの性能情報の値が増えた場合の、他の要素の性能値を算出でき、システムを構成する各要素について全体としての正確な性能情報の予測を行うことができ、正確なボトルネックの要素の解析を行うことができる。
次に、本発明にかかる第2の実施の形態について、図16、図17、図18、図19、図20、図21に基づいて説明する。以下には、前記第1の実施の形態の実質的に同様の構成に関しては説明を省略し、異なる部分についてのみ述べる。図16は、本発明の運用管理装置の第2の実施の形態の一例を示すブロック図である。
具体的には、本実施の形態の運用管理装置200は、図16に示すように、前記第1の実施の形態の構成である、サービス実行部221、性能情報蓄積処理部212、情報収集部222、分析設定蓄積処理部214、障害分析部226、管理者対話部227、対処実行部228、相関モデル生成部223、相関モデル情報蓄積処理部216、モデル探索部224、リソース情報蓄積処理部218、ボトルネック解析部225に加えて、総計性能値管理部231と、を含んで構成される。
リソース情報118bは、図10に示すリソース情報118aの情報に加えて、「グループ」という新たな属性が追加されている。
総計性能情報X、総計性能情報Yでは、グループ情報として総計性能値の算出に必要な性能情報の要素が列挙されている。
リソース情報118aのテーブルにグループ情報の項目を設けることで、各要素の性能値をグループ化して、総計性能情報を管理することができる。
次に、上述のような構成を有する運用管理装置における各部の処理は、方法としても実現可能であり、運用管理方法としての各種の処理手順について、図20乃至図21を参照しつつ説明する。
図20は、本実施の形態にかかる運用管理装置の相関モデル生成の詳細処理手順の一例を示すフローチャートである。
図20では、第1の実施の形態で図12を用いて説明したステップS101〜S105と同様のステップであるステップS401〜S405に加えて、総計性能情報を生成するステップS406が追加されている。
相関モデル生成部223は、この指示に従って、性能情報の要素A、B、Cの同時刻の性能値を加算して総計性能情報Xの性能値の時系列を生成する。
同様に、性能情報の要素D、Eから総計性能情報Yの時系列を生成する。
構成グラフG320は、図18に示すように、WEB、AP、DBの3層構成で、それぞれのサーバが3台、2台、1台で構成されるシステムである。
各サーバの性能情報の相関関係をモデル化した場合、相関グラフG321に示すように、各層の間の相関関係は、適切に生成できない場合がある。あるいは、各層の間の相関関係は生成できるが、極めて誤差の大きい場合がある。
ここで、要素Dと要素Fの相関関係を考えると、要素Fの性能値は、要素Dと要素Eの両方の性能値の和に依存する。要素Dと要素Eが全く均等に処理を分散している場合には、要素Dの性能値の2倍が要素Fと相関することになるが、処理に偏りがあった場合、要素Dの性能値だけからは要素Fの性能値が正確に特定できない。
同様に、要素Eと要素Fの間の相関も希薄となる。同じ問題がWEB層とAP層の間にも発生し、要素A、B、Cから要素D、Eへの相関は希薄となる。この結果、相関グラフ821に示すような部分的な相関関係しか抽出できない状態が発生する。
この結果、AP層全体の処理負荷を示す要素Yと、DB層全体の処理負荷を示す要素Fには明確な相関関係ができる。同様にして、WEB層全体を示す要素XとAP層全体を示す要素Yにも相関関係ができる。
図21は、本実施の形態にかかる運用管理装置のモデル探索の詳細処理手順の一例を示すフローチャートである。
図21では、第1の実施の形態で図13を用いて説明したステップS201〜S206と同様のステップであるステップS501〜S506に加えて、グループ指定を判定するステップS507と総計性能情報を再計算するステップS408が追加されている。
図21を参照すると、本実施の形態におけるモデル探索の動作は、第1の実施の形態で説明したものと同様であり、性能値を決定するステップS506の後に、決定した性能値が総計性能情報に使われているかを判定するステップS507と、総計性能情報を再計算するステップS508が追加されている点が異なる。
図19を参照すると、リソース情報118bには、ボトルネック解析部225が総計性能情報の利用率を判定するための属性が記述されている。
例えば、総計性能情報Xは、最大値が100%である要素A、B、Cの3個の値の総和であるため、最大値が300%となっている。また、総計性能情報Yでは、最大値が1000Mbpsの要素D、Eの2個の総和であるが、ネットワークの帯域は、足し算にはならない場合があるため、最大値が1000Mbpsとなっている。このようなリソース情報302を元に、どの要素がボトルネックになるかを解析できる。
さらに、要素Yの算出値から、グループである要素D、Eの性能値も算出できる。
この結果、要素Aの負荷が増加する場合に、DBサーバである要素Fにどのような負荷がかかるかを正確に算出することができる。
次に、本発明にかかる第3の実施の形態について、図22に基づいて説明する。以下には、前記第1の実施の形態の実質的に同様の構成に関しては説明を省略し、異なる部分についてのみ述べる。図22は、本発明の運用管理装置の第3の実施の形態の一例を示すブロック図である。
次に、上述のような構成を有する運用管理装置における各部の処理は、方法としても実現可能であり、情報処理方法としての各種の処理手順について、図24乃至図26を参照しつつ説明する。図24は、本発明の第3の実施の形態による運用管理装置における処理手順の一例であり、運用管理装置の分析設定生成の詳細処理手順の一例を示すフローチャートである。
また、以前に追加したボトルネック要素が、今回のボトルネック解析で安全と判断されていれば(ステップS604)、その分析設定を削除する(ステップS605)。
これらのステップS601乃至ステップS605により、「設定追加ステップ」を行うことができる。この設定追加ステップでは、コンピュータが、前記ボトルネック解析ステップにて解析された前記要素について障害分析の監視対象として監視設定を追加することができる。
表示画面U200は、図15に示す表示画面U100と同様の構成である、解析結果表示部U210、要素リスト表示部U220、グラフ表示部U230、相関モデルの詳細情報を表示するための第1の表示操作部U242、リソース情報の詳細情報を表示するための第2の表示操作部U244、ボトルネック解析画面の表示を終了するための第3の表示操作部U248に加え、「分析設定」の操作ボタンである第4の表示操作部U246が追加されている。
表示画面U300(分析ルール設定画面)では、分析ルールを設定するための分析ルール表示設定部U320、現在の設定されている分析ルールを一覧表示した分析ルール一覧表示部U330、分析ルールを追加するか否かのメッセージを表示したメッセージ表示部U310、分析ルール設定画面での設定完了の確認を行うための各表示操作部U342、U344が表示形成されている。
また、本発明にかかる装置及び方法は、そのいくつかの特定の実施の形態に従って説明してきたが、本発明の主旨および範囲から逸脱することなく本発明の本文に記述した実施の形態に対して種々の変形が可能である。
と特徴とする。
また、前述した実施形態の機能を実現する本発明のソフトウエアのプログラムは、前述した各実施の形態における各種ブロック図などに示された処理部(処理手段)、機能などに対応したプログラムや、フローチャートなどに示された処理手順、処理手段、機能などに対応したプログラムなどにおいて各々処理される各処理プログラム、本明細書で全般的に記述される方法(ステップ)、説明された処理、データの全体もしくは各部を含む。
この運用管理プログラムは、前記性能種目又は前記被管理装置を要素とした場合に、少なくとも第1の要素に関する性能情報の時系列変化を示す第1の性能系列情報と、第2の要素に関する性能情報の時系列変化を示す第2の性能系列情報との相関関数を導出し、この相関関数に基づいて相関モデルを生成し、この相関モデルを前記各要素間の組み合わせについて求める相関モデル生成機能(例えば図5に示す符号123などの構成、図11に示すステップS11の機能など)と、前記各要素間の前記各相関モデルを順次探索して最適な相関モデルを決定し、この決定された相関モデルに基づいて少なくとも前記第1の要素の性能情報から前記第2の要素の性能情報を予測するモデル探索機能(例えば図5に示す符号124などの構成、図11に示すステップS12の機能など)と、を含む機能をコンピュータに実現させることができる。
この場合、前記モデル探索機能では、少なくとも1つの前記要素に対して複数の前記相関関数によって異なる前記性能情報が算出され得る場合に、前記重み情報に基づいて一つの前記相関モデルを決定する機能をコンピュータに実現させることができる。
この場合、前記モデル探索機能では、前記第2の重み情報と前記第3の重み情報との合成重みと、前記第1の重み情報とを比較して、前記相関モデルを決定する機能をコンピュータに実現させることができる。
また、上述のプログラムを、情報記録媒体に記録した構成であってもよい。情報記録媒体には、上述のプログラムを含むアプリケーションプログラムが格納されており、コンピュータが当該情報記録媒体からアプリケーションプログラムを読み出し、当該アプリケーションプログラムをハードディスクにインストールすることが可能である。これにより、上述のプログラムは、磁気記録媒体、光記録媒体あるいはROMなどの情報記録媒体に記録してプログラムを提供することができる。そのようなプログラムが記録された情報記録媒体を、コンピュータにおいて使用することは、好都合な情報処理装置を構成する。
さらに、上記各実施の形態には種々の段階が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。つまり、上述の各実施の形態同士、あるいはそれらのいずれかと各変形例のいずれかとの組み合わせによる例をも含む。この場合において、本実施形態において特に記載しなくとも、各実施の形態及びそれらの変形例に開示した各構成から自明な作用効果については、当然のことながら実施の形態の作用効果として含めることができる。逆に、本実施の形態に記載されたすべての作用効果を奏することのできる構成が、本発明の本質的特徴部分の必須構成要件であるとは限らない。また、実施の形態に示される全構成要件から幾つかの構成要件が削除された構成による実施の形態並びにその構成に基づく技術的範囲も発明になりうる。
従って、上記に開示された各要素は、本発明の技術的範囲に属する全ての設計変更や均等物を含む趣旨である。
2 コンピュータ(被管理装置)
3、100、200、300 運用管理装置
12、112、212、312 性能情報蓄積処理部
14、114、214、314 分析設定蓄積処理部
21、121、221、321 サービス実行部
22、122、222、322 情報収集部
26、126、226、326 障害分析部
27、127、227、327 管理者対話部
28、128、228、328 対処実行部
116、216、316 相関モデル蓄積処理部
118、218、318 リソース情報蓄積処理部
123、223、323 相関モデル生成部
124、224、324 モデル探索部
125、225、325 ボトルネック解析部
231、331 総計性能値管理部
332 分析設定生成部
Claims (12)
- システムを構成する被管理装置から複数種の性能種目に関わる性能情報を取得する運用管理装置であって、
前記性能情報の時系列変化を示す性能系列情報から前記性能情報間の複数の相関関数および前記各相関関数の予測誤差を示す重み情報を含む相関モデルを生成する相関モデル生成部と、
前記性能情報のうちの第1の性能情報から第2の性能情報を予測しうる前記相関関数またはその組み合わせによる経路が前記相関モデルの中に複数存在する場合に、前記重み情報の数値が最大となる前記経路を利用して前記第2の性能情報を予測するモデル探索部と
を備える運用管理装置。 - 前記相関モデル生成部が、前記性能系列情報のうちの2項目についての前記相関関数の係数および前記重み情報を算出する処理を前記性能系列情報の全ての組み合わせについて行って前記相関モデルを生成する、請求項1に記載の運用管理装置。
- 前記モデル探索部が、少なくとも1つの前記第1の性能情報に対して複数の前記経路によって異なる前記第2の性能情報が算出され得る場合に、前記重み情報の数値が最大となる前記経路を利用すべき経路として決定する、請求項1に記載の運用管理装置。
- 前記モデル探索部が、前記相関モデルに含まれる前記各相関関数を順次探索して、前記各性能情報間の利用すべき経路を決定する処理を行う、請求項3に記載の運用管理装置。
- 前記モデル探索部が、決定された前記経路に基づいて前記第1の性能情報から前記第2の性能情報を予測する機能を備える、請求項4に記載の運用管理装置。
- 複数のコンピュータ装置である被管理装置と、
前記複数の被管理装置から該装置の動作に関する複数種の性能種目に関わる性能情報を取得する運用管理装置と、
を含み、
前記運用管理装置は、
前記性能情報の時系列変化を示す性能系列情報から前記性能情報間の複数の相関関数および前記各相関関数の予測誤差を示す重み情報を含む相関モデルを生成する相関モデル生成部と、
前記性能情報のうちの第1の性能情報から第2の性能情報を予測しうる前記相関関数の組み合わせによる経路が前記相関モデルの中に複数存在する場合に、前記重み情報の数値が最大となる前記経路を利用して前記第2の性能情報を予測するモデル探索部と
を備えることを特徴とする運用管理システム。 - システムを構成する複数のコンピュータ装置である被管理装置から取得される該装置の動作に関する複数種の性能種目に関わる性能情報に基づいて、前記被管理装置を運用管理する情報処理方法であって、
前記性能情報の時系列変化を示す性能系列情報から前記性能情報間の複数の相関関数および前記各相関関数の予測誤差を示す重み情報を含む相関モデルを生成する相関モデル生成ステップと、
前記性能情報のうちの第1の性能情報から第2の性能情報を予測しうる前記相関関数の組み合わせによる経路が前記相関モデルの中に複数存在する場合に、前記重み情報の数値が最大となる前記経路を利用して前記第2の性能情報を予測するモデル探索ステップと
を含むことを特徴とする運用管理方法。 - 前記相関モデル生成ステップが、前記性能系列情報のうちの2項目についての前記相関関数の係数および前記重み情報を算出する処理を前記性能系列情報の全ての組み合わせについて行って前記相関モデルを生成する、請求項7に記載の運用管理方法。
- 前記モデル探索ステップが、少なくとも1つの前記第1の性能情報に対して複数の前記相関関数によって異なる前記第2の性能情報が算出され得る場合に、前記重み情報の数値が最大となる前記経路を利用すべき経路として決定する、請求項8に記載の運用管理方法。
- 前記モデル探索ステップが、前記相関モデルに含まれる前記各相関関数を順次探索して、前記各性能情報間の利用すべき経路を決定する、請求項9に記載の運用管理方法。
- 前記モデル探索ステップが、決定された前記経路に基づいて前記第1の性能情報から前記第2の性能情報を予測する、請求項10に記載の運用管理方法。
- システムを構成する複数のコンピュータ装置である被管理装置から該装置の動作に関する複数種の性能種目に関わる性能情報を取得して、前記被管理装置を運用管理する運用管理装置が備えたコンピュータに諸機能を実現させることが可能な運用管理プログラムであって、
前記性能情報の時系列変化を示す性能系列情報から前記性能情報間の複数の相関関数および前記各相関関数の予測誤差を示す重み情報を含む相関モデルを生成する相関モデル生成機能と、
前記性能情報のうちの第1の性能情報から第2の性能情報を予測しうる前記相関関数の組み合わせによる経路が前記相関モデルの中に複数存在する場合に、前記重み情報の数値が最大となる前記経路を利用して前記第2の性能情報を予測するモデル探索機能と、
を含む機能をコンピュータに実現させることを特徴とする運用管理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011098809A JP5141789B2 (ja) | 2011-04-26 | 2011-04-26 | 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011098809A JP5141789B2 (ja) | 2011-04-26 | 2011-04-26 | 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008043047A Division JP4872945B2 (ja) | 2008-02-25 | 2008-02-25 | 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011146074A true JP2011146074A (ja) | 2011-07-28 |
JP5141789B2 JP5141789B2 (ja) | 2013-02-13 |
Family
ID=44460811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011098809A Active JP5141789B2 (ja) | 2011-04-26 | 2011-04-26 | 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5141789B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013099019A1 (ja) * | 2011-12-28 | 2013-07-04 | 株式会社日立製作所 | 複数の物理マシンで動作する複数の仮想マシンの再配置を制御する管理計算機 |
US11042463B2 (en) | 2017-11-14 | 2021-06-22 | Hitachi, Ltd. | Computer, bottleneck identification method, and non-transitory computer readable storage medium |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6213665B2 (ja) | 2014-03-18 | 2017-10-18 | 日本電気株式会社 | 情報処理装置、及び、クラスタリング方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004021756A (ja) * | 2002-06-19 | 2004-01-22 | Hitachi Ltd | 情報システム性能の統計的予測方法 |
JP2004088153A (ja) * | 2002-08-22 | 2004-03-18 | Nippon Telegr & Teleph Corp <Ntt> | ネットワークのボトルネック特定方法 |
JP2005327261A (ja) * | 2004-04-16 | 2005-11-24 | Ns Solutions Corp | 性能監視装置、性能監視方法及びプログラム |
JP2006011902A (ja) * | 2004-06-28 | 2006-01-12 | Hitachi Ltd | 運用管理支援システムおよび性能情報表示方法 |
JP2006146668A (ja) * | 2004-11-22 | 2006-06-08 | Ntt Data Corp | 運用管理支援装置及び運用管理支援プログラム |
-
2011
- 2011-04-26 JP JP2011098809A patent/JP5141789B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004021756A (ja) * | 2002-06-19 | 2004-01-22 | Hitachi Ltd | 情報システム性能の統計的予測方法 |
JP2004088153A (ja) * | 2002-08-22 | 2004-03-18 | Nippon Telegr & Teleph Corp <Ntt> | ネットワークのボトルネック特定方法 |
JP2005327261A (ja) * | 2004-04-16 | 2005-11-24 | Ns Solutions Corp | 性能監視装置、性能監視方法及びプログラム |
JP2006011902A (ja) * | 2004-06-28 | 2006-01-12 | Hitachi Ltd | 運用管理支援システムおよび性能情報表示方法 |
JP2006146668A (ja) * | 2004-11-22 | 2006-06-08 | Ntt Data Corp | 運用管理支援装置及び運用管理支援プログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013099019A1 (ja) * | 2011-12-28 | 2013-07-04 | 株式会社日立製作所 | 複数の物理マシンで動作する複数の仮想マシンの再配置を制御する管理計算機 |
US11042463B2 (en) | 2017-11-14 | 2021-06-22 | Hitachi, Ltd. | Computer, bottleneck identification method, and non-transitory computer readable storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP5141789B2 (ja) | 2013-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4872945B2 (ja) | 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム | |
JP4872944B2 (ja) | 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム | |
US10210036B2 (en) | Time series metric data modeling and prediction | |
US20110307742A1 (en) | Method and apparatus for cause analysis involving configuration changes | |
WO2012157471A1 (ja) | 複数の制御システムの異常を検知する異常検知システム | |
JP5434562B2 (ja) | 運用管理プログラム、運用管理装置および運用管理方法 | |
Malik et al. | Pinpointing the subsystems responsible for the performance deviations in a load test | |
JPWO2011099341A1 (ja) | 障害原因抽出装置、障害原因抽出方法およびプログラム記憶媒体 | |
JP2022033685A (ja) | 堅牢性を確定するための方法、装置、電子機器、コンピュータ可読記憶媒体、及びコンピュータプログラム | |
JP5141789B2 (ja) | 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム | |
Gallet et al. | A model for space-correlated failures in large-scale distributed systems | |
JP2016099938A (ja) | イベント分析システムおよび方法 | |
JP5979185B2 (ja) | 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム | |
JP6168209B2 (ja) | 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム | |
Zhao et al. | Extracting log patterns from system logs in large | |
US20230004487A1 (en) | System and method for anomaly detection and root cause automation using shrunk dynamic call graphs | |
JP5590196B2 (ja) | 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム | |
JP5516494B2 (ja) | 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム | |
US9229898B2 (en) | Causation isolation using a configuration item metric identified based on event classification | |
WO2022168269A1 (ja) | 情報処理装置、情報処理方法、及び、情報処理プログラム | |
JP2018160020A (ja) | 監視システム、プログラムおよび監視方法 | |
Islam et al. | Minimizing electricity cost for geo-distributed interactive services with tail latency constraint | |
JP2015106329A (ja) | 運用作業の履歴を検索する情報処理装置、情報処理システム、運用作業履歴検索方法及びそのためのプログラム | |
Bhavsar et al. | A Holistic Approach to Autonomic Self-Healing Distributed Computing System | |
KR20110076453A (ko) | 유비쿼터스 서비스 모니터링 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110426 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121023 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121105 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151130 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5141789 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |