JP5590196B2 - 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム - Google Patents

運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム Download PDF

Info

Publication number
JP5590196B2
JP5590196B2 JP2013152070A JP2013152070A JP5590196B2 JP 5590196 B2 JP5590196 B2 JP 5590196B2 JP 2013152070 A JP2013152070 A JP 2013152070A JP 2013152070 A JP2013152070 A JP 2013152070A JP 5590196 B2 JP5590196 B2 JP 5590196B2
Authority
JP
Japan
Prior art keywords
correlation
performance information
information
operation management
performance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013152070A
Other languages
English (en)
Other versions
JP2013242902A (ja
Inventor
清志 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2013152070A priority Critical patent/JP5590196B2/ja
Publication of JP2013242902A publication Critical patent/JP2013242902A/ja
Application granted granted Critical
Publication of JP5590196B2 publication Critical patent/JP5590196B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラムに関し、特に、情報通信サービスを提供するシステムの性能劣化を正確に検知および局所化する運用管理装置などに関する。
企業情報システムやIDC(Internet Data Center)など比較的大規模なシステムなどにおいて、WEBサービスや業務サービスといった情報通信サービスの社会インフラとしての重要性が高まるにつれて、そのサービスを提供するサーバなどの装置の安定稼動が重要となっている。このような装置の運用管理は、管理者が手作業で行っていた。装置が大規模・複雑化するにつれて、管理者には知識および操作の面での負担が飛躍的に増大し、判断ミスや操作ミスによるサービス停止といった事態も発生している。
このような事態に対処するため、システムを構成するハードウェアあるいはソフトウェアを一元的に状態監視し制御する統合運用管理システムが提供されている。
この統合管理システムでは、管理対象となる複数のハードウェアまたはソフトウェアの稼動状況に関する情報をオンラインで取得し、統合管理システムに接続した運用管理装置に出力する。管理対象となるシステムの障害を判別するには、あらかじめ稼動情報に閾値を設定しておく方法や、平均値からのずれを評価する方法などがあり、障害と判定された場合、該箇所が報告される。
例えば、このような統合運用管理システムの運用管理装置では、性能情報毎に閾値を設定し、各々の性能情報が閾値越えしたことを検出して障害を検知する。予め異常であることが明確な値を閾値に設定して、個々の要素の性能の異常を検出する。
異常検出が報告された場合、それがメモリ容量不足が原因なのか、CPU負荷が原因なのか、ネットワーク負荷が原因なのか等、解決のために原因を絞り込む必要がある。一般に原因の解明には関係がありそうな計算機のシステムログやパラメータの調査、さらにはシステムエンジニアの経験と勘に頼る必要があり、解決に時間と労力を要する。
このため、統合運用管理システムでは、複数の機器から収集したイベントデータ(状態通知)に基づいて異常状態の組み合わせ等の分析を自動的に行い、大局的な問題点や原因を推定して管理者に通知し、対処支援を行うことが重要となる。
特に、サービスの長期連続運用での信頼性確保には、発生した異常だけでなく、明確な異常になっていない性能劣化や将来発生が予想される障害の兆候といった状態を検出し、計画的な設備増強を行うことが求められている。
このような統合運用管理システムに関連する技術として、例えば以下に示す特許文献1乃至特許文献7などが挙げられる。
特許文献1では、システム要素の処理の履歴と性能情報の変化の履歴とを比較することによって、特定の処理に起因する負荷量を特定し、将来の処理量での負荷を分析する。この運用管理装置では、予め処理と負荷との関係が把握できている場合には、システムの挙動を特定することができる。
特許文献2では、システムの構成要素間の関係の大きさを稼動情報を元に定量化することにより障害の原因となる構成要素を特定する。この運用管理装置では、異常となった要素に対して、その時点で性能値に相関のある要素が重み付けされて一覧表示されることで、原因の候補を列挙する。
すなわち、特許文献2では、管理対象システムと、ネットワークと、運用管理サーバを備え、管理対象システムから稼動情報収集アダプタを介して収集された各構成要素の稼動情報は稼動情報格納部に格納される。分析演算部では、任意の、もしくはあらかじめ設定した値の範囲を越えた稼動情報を1つ選択し、それ以外の稼動情報との関連の大きさを定量化する。定量化の演算の際には、稼動情報収集部から逐次必要な稼動情報を抽出する。演算の対象となった稼動情報のうち、定量化された関連の値があらかじめ設定した値の範囲を越えたものについて、性能のボトルネックや障害の原因となっている可能性が高いとし、入出力部に報告する。
特許文献3では、稼働情報収集部は、監視対象システム内の複数の装置から、ICMP、SNMP、rshなどを利用して、CPU、Network IO(ネットワークInput/Output)などのハードウェア稼動情報、Webサーバのアクセス量、DBサーバの処理クエリ量などのアプリケーション稼動情報を一定時間間隔で取得し、稼動情報DBに保存する。
前処理部は、稼働情報DBに格納されている各構成要素の稼働情報間の統計的分析値を求める統計処理を行う。前処理部は、例えば、各稼働情報間の相関係数を求めたり、各稼働情報間で主成分分析を行ったりして、統計的分析値を求める。この統計的分析値は、所定時刻における各装置の稼働情報間の関連度を示す値となっている。例えば特許文献5の図2では、「サーバ1のCPU使用率」と「サーバ2のCPU使用率」との相関係数が「0.93」等となっている。相関係数は、2つの変量間の相関関係の程度を表す数値である。
このような運用管理装置では、まず、監視対象となるサーバ、ネットワーク機器等から、CPU使用率のようなハードウェア稼動情報、またWebサーバであれば、アクセスの状況といったアプリケーションレベルの情報を定期的に取得するようにし、正常なアクセス時や、障害発生時といった各状況における稼動情報から、各状況を特徴付ける“取得値間の関連”を相関分析・主成分分析といった統計的手法を用いて算出し、各状況のモデルを定義してモデル情報DBに保持しておく。
そして、運用時には、定期的に、あるいは障害のアラートや、提供サービスのレスポンス低下などをトリガとして、現在の稼働情報に対して定義したモデルと同様の統計的手法を行い、モデル情報DBに定義したモデルと比較して、マッチしたモデルの状況を現在置かれている状況として識別する。
特許文献4では、モニタ部は、AC環境及び非AC環境の状態に係る状態情報を取得し、分析部又はモデル診断部は、取得された状態情報に基づいて、AC環境の装置の状態を判定する。シミュレーション部は、その判定結果に対応する対策リストを参照し、対策リストに含まれる少なくとも一つの対策夫々によるシミュレーション処理を実行し、各対策の効果を評価する。
モデル抽出部は、時間に対するCPUの使用率の関係を表す座標系において、時間1〜時間3の監視データをプロットし、プロットした各監視データの線形近似式(fa(x)=αx+β)を求めることによって、CPU使用率の時系的変化を表すモデルを抽出する。モデル抽出部は、抽出したモデルを知識情報蓄積部に対して蓄積する。
同様にして、時間に対するスループットの関係を表す座標系においてもモデルを求める。
そして、モデル抽出部は、これらの2つのモデルに対して相関分析及び多変量解析を行うことで、処理Aと処理Bとの夫々について、CPU使用率とスループットとの相関を表す線形近似式(fTA(x)=ρ1x+θ1、fTB(x)=ρ2x+θ2)を求め、CPU使用率とスループットとの相関を示すモデルを抽出する。モデル診断部は、各モデルに該当するポリシーを夫々参照し診断を実行する(特許文献6の段落番号0060〜0062)。
特許文献5では、コンピュータ上でどのようなワークロードが稼動中かを判断し、ワークロードのタイプに基づいてコレクタを始動し、ワークロード・ミックスに基づいてメトリックスのためのしきい値を設定し、メトリックスがしきい値を超えるときを(現在のワークロードおよび予測されるワークロードの両方で)判断し、メトリックスの相関をとってハードウェア・キャパシティが問題の原因かどうかを判断する。
特開2006−024017号公報 特開2002−342182号公報 特開2006−146668号公報 特開2007−207117号公報 特表2005−524886号公報
しかしながら、関連技術の運用管理装置においては、次のような不具合がある。
すなわち、関連技術の運用管理装置では、閾値を低く設定してしまうと、性能情報の変動が大きい場合などに誤報が多発して管理者が混乱する、という不具合があった。また、閾値を高く設定してしまうと、重大な障害以外検出できなくなり、システムは動作しているものの応答速度が劣化しているなどの性能異常の検出が困難となる、という不具合があった。
さらに、個々の要素毎の異常値は検出できるものの、ボトルネックなど入出力の関係にある他の要素の性能値との関係に起因する異常を検出することができない、という不具合があった。
このように、関連技術の性能情報の閾値監視では、応答劣化などの性能異常を正確に検出し場所を特定することができない、という不具合があった。
さらに、異常時に性能情報の相関関係を算出する手法では、その相関関係が異常時のみ発生するものなのか平常時にも存在するものなのかを判断することが困難である、という不具合があった。
また、特許文献1では、正確な負荷を予測するためには、関係しうるすべての処理の履歴を収集して分析しなければならず、システムが大規模化したり、他システムと連携したりする場合には、処理と負荷の関係が極めて複雑になり、データ収集および分析の負荷が大きく、それを分析するための高度な知識も必要となる、という不具合があった。
さらに、特許文献2では、障害が発生した時点の性能情報間の関係を提示するものであるため、ある異常と因果関係があり得る性能情報の中から、実際にどれが原因なのかを管理者が検証しなければならない、という不具合があった。
また、これらの相関関係が、異常時のみ発生するものなのか、平常時にも存在するものなのかを判断することが困難である、という不具合があった。
特許文献3では、相関係数は値であるため、ある時点(異常時)の値の相関から、関係する異常原因を提示できるが、実在しない将来値の相関を算出することはできないので、ある異常と因果関係があり得る性能情報の中から、実際にどれが原因なのかを管理者が検証しなければならない、という不具合があった。また、障害の予兆を検出できない、という不具合があった。
特許文献4では、個々の性能情報の関数を推定するもの(第3の関連技術と同様)である。そして、y=f(x)の式において、xは時間で、1つのyの時間変化を表す。この式を2つ用意して、別途与えた相関関係ルールで2つの関係を判定する。ルールは、自動生成されるわけではないので、システムを構成する各要素について全ての性能情報間のルールを別途与えなければ、ある異常と因果関係があり得る性能情報の中から、実際にどれが原因の要素なのかを正確に予測できない、という不具合があった。
すなわち、CPU使用率とスループットとの相関は、一の要素と他の要素との間の相関のみであるため、システムを構成する全要素についてのそれぞれ相関が不明であるため、ある異常と因果関係があり得る性能情報の中から、実際にどれが原因なのかをシステムの要素の中から管理者が検証しなければならない、という不具合があった。
特許文献5では、ワークロードやメトリックスの変換は行われるが、いずれも値を算出しているものであるため、モデルを用いないため、ある異常と因果関係があり得る性能情報の中から、実際にどれが原因の要素なのかを正確に予測できず、検証には、これらの変換方法の全てを手作業で入力しなければならない、という不具合があった。
本発明は、上記した技術の不具合を解決することを課題としてなされたものであって、その目的とするところは、障害の予兆を検出し、発生場所の特定が可能な運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラムを提供することにある。
上記目的を達成するため、本発明の運用管理装置は、システムを構成する被管理装置から複数種の性能種目に関わる性能情報を取得する運用管理装置であって、前記性能情報の時系列変化を示す性能系列情報から前記性能情報間の相関関数を含む相関モデルを生成する相関モデル生成部と、新たに検出された性能情報のうちの1項目を該性能情報に関連する相関関数に適用して予測性能情報を算出し、この予測性能情報と同一の項目について実際に検出された性能情報とを比較して予測誤差を算出し、この予測誤差に基づいて当該相関関数で示される相関関係が維持されているか否かを分析して該分析結果に関する情報を出力する相関変化分析部と、前記出力を分析して一定期間破壊されている相関関係があるか否かを判定し、一定期間破壊されている相関関係があると判定されたときは該当する相関モデルを無効化する定常変化分析部とを備えることを特徴としている。
本発明の運用管理システムは、複数のコンピュータ装置である被管理装置と、前記複数の被管理装置から該装置の動作に関する複数種の性能種目に関わる性能情報を取得する運用管理装置と、を含み、前記運用管理装置は、前記性能情報の時系列変化を示す性能系列情報から前記性能情報間の相関関数を含む相関モデルを生成する相関モデル生成部と、新たに検出された性能情報のうちの1項目を該性能情報に関連する相関関数に適用して予測性能情報を算出し、この予測性能情報と同一の項目について実際に検出された性能情報とを比較して予測誤差を算出し、この予測誤差に基づいて当該相関関数で示される相関関係が維持されているか否かを分析して該分析結果に関する情報を出力する相関変化分析部と、前記出力を分析して一定期間破壊されている相関関係があるか否かを判定し、一定期間破壊されている相関関係があると判定されたときは該当する相関モデルを無効化する定常変化分析部とを備えることを特徴としている。
本発明の情報処理方法は、システムを構成する複数のコンピュータ装置である被管理装置から取得される該装置の動作に関する複数種の性能種目に関わる性能情報に基づいて、前記被管理装置を運用管理する制御する情報処理を行う情報処理方法であって、前記性能情報の時系列変化を示す性能系列情報から前記性能情報間の相関関数を含む相関モデルを生成する相関モデル生成ステップと、新たに検出された性能情報のうちの1項目を該性能情報に関連する相関関数に適用して予測性能情報を算出し、この予測性能情報と同一の項目について実際に検出された性能情報とを比較して予測誤差を算出し、この予測誤差に基づいて当該相関関数で示される相関関係が維持されているか否かを分析して該分析結果に関する情報を出力する相関変化分析ステップと、前記出力を分析して一定期間破壊されている相関関係があるか否かを判定し、一定期間破壊されている相関関係があると判定されたときは該当する相関モデルを無効化する定常変化分析ステップとを含むことを特徴としている。
本発明の運用管理プログラムは、システムを構成する複数のコンピュータ装置である被管理装置から該装置の動作に関する複数種の性能種目に関わる性能情報を取得する運用管理装置が備えたコンピュータに諸機能を実現させることが可能な運用管理プログラムであって、前記性能情報の時系列変化を示す性能系列情報から前記性能情報間の相関関数を含む相関モデルを生成する相関モデル生成機能と、新たに検出された性能情報のうちの1項目を該性能情報に関連する相関関数に適用して予測性能情報を算出し、この予測性能情報と同一の項目について実際に検出された性能情報とを比較して予測誤差を算出し、この予測誤差に基づいて当該相関関数で示される相関関係が維持されているか否かを分析して該分析結果に関する情報を出力する相関変化分析機能と、前記出力を分析して一定期間破壊されている相関関係があるか否かを判定し、一定期間破壊されている相関関係があると判定されたときは該当する相関モデルを無効化する定常変化分析機能と、を含む機能をコンピュータに実現させることを特徴としている。
本発明によれば、相関モデル生成部が、任意の2つの各要素の各性能情報の各時系列(性能系列情報)に対して相関関数を導出することで相関モデルを生成すし、相関変化分析部が、新たに性能情報を検出した場合に、この相関モデルの相関関数に従った性能情報であるか否か変化を分析し、相関モデルの相関関係の変化(相関関係の維持ないしは崩壊)を分析する。
これにより、正常時に生成した相関関係が崩れているかどうかで異常の発生場所(異常のある要素)を特定でき、検出された性能情報の相関関係をモデル化し、そのモデルの変化を監視することで、応答劣化などの性能異常、障害の予兆を正確に検出し発生場所を特定できるという、関連技術にない優れた運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラムを提供することができる。
本発明の第1の実施の形態による運用管理装置を含む運用管理システムの全体構成の一例を示すブロック図である。 本発明の第1の実施の形態による運用管理装置の前提となる構成の一例を示すブロック図である。 本発明の第1の実施の形態による運用管理装置で利用する性能情報の一例を示す説明図である。 本発明の第1の実施の形態による運用管理装置の全体構成の一例を示すブロック図である。 本発明の第1の実施の形態による運用管理装置の全体構成の一例を示すブロック図である。 本発明の第1の実施の形態による運用管理装置において、変換関数同定を説明するための一例を示す説明図である。 本発明の第1の実施の形態による運用管理装置において、相関モデルのデータ構造の一例を示す説明図である。 本発明の第1の実施の形態による運用管理装置において、相関モデルの他のデータ構造の一例を示す説明図である。 本発明の第1の実施の形態による運用管理装置において、相関モデル選別の一例を示す説明図である。 本発明の第1の実施の形態による運用管理装置において、相関変化検出の一例を示す説明図である。 本発明の第1の実施の形態による運用管理装置において処理される全体の処理手順の一例を示すフローチャートである。 本発明の第1の実施の形態による運用管理装置において、相関モデル生成の詳細処理手順の一例を示すフローチャートである。 本発明の第1の実施の形態による運用管理装置において、相関変化分析の詳細処理手順の一例を示すフローチャートである。 本発明の第1の実施の形態による運用管理装置において、表示される表示画面の一例を説明するための説明図である。 本発明の第2の実施の形態による運用管理装置の全体構成の一例を示すブロック図である。 本発明の第2の実施の形態による運用管理装置の全体構成の一例を示すブロック図である。 本発明の第2の実施の形態による運用管理装置において、相関モデル無効化の一例を示す説明図である。 本発明の第2の実施の形態による運用管理装置において、相関モデルのデータ構造の一例を示す説明図である。 本発明の第2の実施の形態による運用管理装置において処理される全体の処理手順の一例を示すフローチャートである。 本発明の第2の実施の形態による運用管理装置において、定常変化分析の詳細処理手順の一例を示すフローチャートである。 本発明の第2の実施の形態による運用管理装置において、表示される表示画面の一例を説明するための説明図である。
〔運用管理装置の基本的構成〕
先ず、運用管理装置の基本的構成について説明する。本発明の運用管理装置(例えば図4に示す符号100など)は、システムを構成する複数の被管理装置から複数種の性能種目毎の性能情報を取得して、前記被管理装置を運用管理するものを対象とするものである。
この運用管理装置は、前記性能情報の時系列変化を示す性能系列情報から前記性能情報間の相関関数を含む相関モデルを生成する相関モデル生成部(例えば図4に示す符号123など)と、新たに検出された前記性能情報を前記相関関数に適用して当該相関関数で示される相関関係が維持されているか否かを分析して該分析結果に関する情報を出力する相関変化分析部(例えば図4に示す符号124など)と、を含む構成としている。
このような運用管理装置では、前記相関モデル生成部が、前記性能系列情報のうちの一方と他方の相関関数の係数を算出する処理を前記性能系列情報の全ての組み合わせについて行って前記相関モデルを生成する。
また、前記相関変化分析部が、前記新たに検出された性能情報のうちの1項目を該性能情報に関連する前記相関関数に適用して予測性能情報を算出し、この予測性能情報と同一の項目について実際に検出された性能情報とを比較して予測誤差を算出する。そして、前記予測誤差が一定の誤差範囲内を満たす場合に、前記相関関数で示される相関関係が維持されていると判断する処理を、前記新たに検出された性能情報と関係する前記相関モデルに含まれる全ての相関関数について行う。
これにより、正常時に生成した相関関係が崩れているかどうかで異常の発生場所(異常のある要素)を特定でき、検出された性能情報の相関関係をモデル化し、そのモデルの変化を監視することで、応答劣化などの性能異常、障害の予兆を正確に検出し発生場所を特定できる。
以下、このような本発明の「運用管理装置」を、「運用管理システム」に適用した好適な実施の形態の一例について、図面を参照して具体的に説明する。
〔第1の実施の形態〕
(運用管理システムの全体構成)
先ず、本実施の形態の運用管理システムの具体的構成について、全体構成から説明し、続いて各部の詳細構成について説明することとする。
図1は、本発明における第1実施の形態の運用管理装置を含む運用管理システムの全体の概略構成の一例を示すブロック図である。
図1に示すように、本実施の形態の運用管理システム1は、複数の被管理装置の一例である各コンピュータ2と、これらの各コンピュータ2とネットワークNを介して通信可能に形成され各コンピュータ2を運用管理する運用管理装置3と、を含んで構成される。
運用管理装置3は、複数のコンピュータ2から複数種の性能種目毎(例えばCPU利用率やメモリ残量など)の性能情報を取得可能に構成される。
コンピュータ2、運用管理装置3は、プログラム制御により動作するものであり、ネットワーク関連の機能を有していれば、デスクトップ、ラップトップコンピュータ、サーバー、その他無線・有線通信機能を有する情報機器、またはこれに類するコンピュータなどいかなるコンピュータでもよく、移動式・固定式を問わない。
運用管理装置3のハードウエア構成は、種々の情報等を表示するための表示部(スクリーン)、この表示部の表示画面上(の各種入力欄等)にデータを操作入力するための操作入力部(例えばキーボード・マウス等)、各種信号・データを送受信するための送受信部(通信部)、各種プログラム・各種データを記憶しておく記憶部(例えばメモリ、ハードディスク等)、これらの制御を司る制御部(例えばCPU等)などを有している。
また、コンピュータ2は、ネットワーク機器やその他の機器、メインフレームなどであってもよい。
(前提となる構成)
ここで、本実施の形態の特徴的構成を説明する前に、本実施の形態の前提となる運用管理装置の構成について、図2、図3を用いて説明する。
図2を参照すると、本実施の形態の前提となる構成を示す運用管理装置3は、サービス実行部21と、性能情報蓄積処理部12と、情報収集部22と、分析設定蓄積処理部14と、障害分析部26と、管理者対話部27と、対処実行部28と、を含んで構成される。
サービス実行部21は、WEBサービスや業務サービスといった情報通信サービスを提供するものである。このサービス実行部21は、他の独立したコンピュータなどで構成することもできる。
性能情報蓄積処理部12は、サービス実行部21の各々の要素の性能情報を蓄積する。
情報収集部22は、サービス実行部21の動作状態を検出して出力するとともに、動作状態に含まれる性能情報を性能情報蓄積処理部12に蓄積する。
分析設定蓄積処理部14は、サービス実行部21の異常を検出するための分析設定を蓄積する。
障害分析部26は、情報収集部22から動作状態を受け取って分析設定蓄積処理部14の分析設定に従って障害分析を行う。
管理者対話部27は、障害分析部26から障害分析の結果を受け取って管理者に提示し、管理者の入力を受け付け、管理者の入力に従って対処実行部28に対処を指示する。
対処実行部28は、管理者対話部27の指示に応じてサービス実行部21上で障害の対処となる処理を実行する。
図3は、情報収集部22が出力し、性能情報蓄積処理部12に蓄積される性能情報の例を示す。性能情報12aは、サービス実行部28の状態変化に伴って順次収集される性能情報の一覧を示す。性能情報12aを参照すると、個々の性能情報は、同一時刻の各々の性能の値で構成され、それらが一定時間間隔でリストアップされたものとなっている。
上述のような前提となる構成を有する運用管理装置3の動作について、図2、図3を用いて説明する。
まず、図2の情報収集部22がサービス実行部21の動作状態を検出し、性能情報蓄積処理部12に性能情報を蓄積する。例えば、サービス実行部21でWEBサービスが実行されている場合、WEBサービスを提供する各サーバのCPU使用率やメモリ残量を一定時間間隔で検出する。
図3の性能情報12aは、このようにして検出された性能情報の例である。例えば、「SV1.CPU」は、1つのサーバのCPU利用率の値を示し、2007年10月5日の17時25分の値が12である。さらに、1分間隔で17時26分から15、34、63といった値が検出されている。同様に、「SV1.MEM」は同じサーバのメモリ残量の値を、「SV2.CPU」は別のサーバのCPU利用率の値を、それぞれ同時刻に検出したものである。
次に、障害分析部26は、分析設定蓄積処理部14に蓄積されている分析設定に従って障害分析を行う。分析設定としては、例えば、CPU利用率が一定値以上であれば管理者に警告メッセージを提示するといったことが指定されており、これに従って、情報収集部22で検出された性能情報の値から、特定のサーバの負荷が高くなっているかどうかを閾値判定する。
管理者対話部27は、このような障害分析の結果を管理者に提示し、管理者が何らかの対処を指示する入力を行った場合、対処実行部28を介してサービス実行部21上で対処コマンドを実行する。
例えば、管理者は、CPU負荷が高くなっていることを知って、業務量を減らしたり、負荷分散を行うための構成変更を行ったりすることができる。
この後、一定時間間隔で情報収集部22によって収集された性能情報の値が低下していれば、障害分析部26で障害が回復したと判断され、その結果が管理者対話部27を介して管理者に提示されることになる。このような情報収集、分析、対処の処理の繰り返しにより、サービス実行部21の障害対処が継続して行われる。
このような前提となる構成に加えて、本実施の形態では、以下に示す特徴的構成を有する。
(本実施の形態の特徴的構成)
ここで、本発明の第1の実施の形態の運用管理装置の特徴的構成について、図4を参照しつつ説明する。図4は、本発明の第1の実施の形態の運用管理装置の特徴的構成の一例を示すブロック図である。
図4に示すように、本発明の第1の実施の形態の運用管理装置100は、図2に示す運用管理装置3と同様の構成である、サービス実行部121、性能情報蓄積処理部112、情報収集部122、分析設定蓄積処理部114、障害分析部126、管理者対話部127、対処実行部128に加えて、相関モデル生成部123と、相関モデル情報蓄積処理部116と、相関変化分析部124と、を含んで構成される。
相関モデル生成部123は、性能情報蓄積処理部116から一定期間の性能情報を取り出し、任意の2つの性能情報の値の時系列に対して、一方を入力とし他方を出力とした場合の変換関数を導出するとともに、この変換関数で生成された性能値の系列と出力となる性能情報の実際の検出値の系列とを比較し、その値の差から前記変換関数の重み情報を算出する。さらに、これらの処理をすべての性能情報に対して繰り返すことで、サービス実行部121の全体的な稼動状態の相関モデルを生成する。
相関モデル蓄積処理部116は、相関モデル生成部123が生成した相関モデルを蓄積処理する。
相関変化分析部124は、情報収集部122から新たに検出された性能情報を受け取り、この性能情報に含まれる性能値が相関モデル情報蓄積処理部116に蓄積される相関モデルの各々の性能情報間の変換関数で示された関係を一定の誤差範囲内で満たしているかを分析して、その結果を出力する。
障害分析部126は、この相関変化分析部124の分析結果を受け取って、閾値判定などの他の分析とともに障害分析を行う。
ここで、これらの各部は、図5に示すように、制御部が発揮する複数の機能として構成することもできる。
また、前記相関変化分析部124は、前記新たに検出された前記第1の要素に関する性能情報と前記相関関数とに基づいて前記第2の要素に関する予測性能情報を算出し、前記新たに検出された前記第2の要素に関する性能情報と前記予測性能情報とを比較して予測誤差を算出し、この予測誤差が一定の誤差範囲内を満たすか否かを分析することもできる。
さらに、前記相関変化分析部124は、前記予測誤差が前記誤差範囲外となる場合に、前記第1の要素と前記第2の要素との相関関係が破壊されていると判断し、それぞれの要素の異常スコアを算出することもできる。
また、前記相関変化分析部124は、前記異常スコアに基づいて、前記各要素を順位付けして提示可能に制御することもできる。
(相関モデル生成について)
ここで、相関モデル生成部123による相関モデル生成の概要について、図6を参照して説明する。図6は、本実施の形態にかかる運用管理装置の相関関数生成の概要の一例を示す説明図である。
相関関数生成は、図12に示す相関関数(変換関数)を生成するステップS103(相関関数生成機能)および誤差を算出するステップS104(重み情報算出機能)の処理により行うことができる。
図6に示すように、変換関数G300は、グラフG101に示す「SV1.CPU」の性能値の系列(第1の性能系列情報)を入力とした場合に、グラフG101に示す「SV1.MEM」の性能値の系列(第2の性能系列情報)を出力するものである。
この変換関数G300を、システム同定処理G301に示す処理によって算出する。
一例として、「y=Ax+B」の式で示される変換関数では、「A=−0.6」、「B=100」の値が算出される。
さらに、グラフG302で示すように、この変換関数でグラフG101から生成された性能値の予測値の系列と、グラフG102で示される実際の性能値の差分から重みwが生成される。
図7は、本実施の形態にかかる運用管理装置の相関モデルの例である。相関モデル116aは、変換関数の入力となる性能値の系列の名称と、出力となる性能値の系列の名称と、変換関数を特定する各々係数の値と、重み情報と、相関関係が有効か無効かを示す相関関係判定情報と、を含んで構成される。例えば、図6に示す変換関数を算出した結果として、「SV1.CPU」を入力とし、「SV1.MEM」を出力とし、「y=Ax+B」の式で示される変換関数は、係数Aの値が「−0.6」、係数Bの値が「100」、重みが「0.88」となる相関関係が蓄積されている。さらに、相関関係が「有効」となっており、相関関係が破壊されておらず、維持されていることを意味する。
(相関変化分析について)
相関変化分析部124による相関変化分析の概要について、図9を参照して説明する。図9は、本実施の形態にかかる運用管理装置の相関変化分析の概要の一例を示す説明図である。
図9の相関グラフG310は、相関モデル情報蓄積処理部116の相関モデルの例であり、SV1〜SV3の3台のサーバのCPU利用率とCPU負荷を、それぞれ性能情報の要素A〜Fで表している。
例えば、要素Aは、「SV1.CPU」とあり、要素Aに関する性能情報は、第1のサーバのCPU利用率であることを意味する。また、要素Dは、「SV3.MEM」とあり、要素Dに関する性能情報は、第2のサーバのCPU負荷であることを意味する。
そして、それぞれの要素の間を結ぶ線が、相関モデルの変換関数で表される関係であり、0〜1の範囲で表される重み情報が0.5以上の関係を太線で、それ以外のものを細線で表している。
例えば、要素Aと要素Bとの相関関係は、太線となっており、相関モデルの重み情報が0.5以上であることを意味する。また、要素Aと要素Fとの相関関係は、細線となっており、相関モデルの重み情報が0.5未満であることを意味する。
重み情報は、変換関数の誤差によって算出されるため、この線の太さが関係の強さを表している。相関変化分析部124は、例えば、相関グラフG310から重みが0.5以上であるような安定した関係のみを抽出し、相関モデルG311のような関係を得る。
図10は、本実施の形態にかかる運用管理装置において、新たに性能情報が検出された場合に、相関関係が破壊された様子の一例を示す説明図である。図10に示す相関グラフG312では、相関グラフG311に示す相関関係のうち、要素Aと要素C、要素Bと要素Cの相関が破壊(点線で示す)されている。
(処理手順について)
(全体処理)
次に、上述のような構成を有する運用管理装置における各部の処理は、方法としても実現可能であり、情報処理方法としての各種の処理手順について、図11乃至図13を参照しつつ説明する。
図11は、本発明の第1の実施の形態による運用管理装置における処理手順の一例を示すフローチャートである。
本実施の形態に係る情報処理方法は、システムを構成する複数の被管理装置から取得される複数種の性能種目毎の性能情報に基づいて、前記被管理装置を運用管理する制御する情報処理を(例えば1又は複数のコンピュータやその他の装置など)が行うものを対象とするものである。
この情報処理方法は、基本的構成として、前記性能種目又は前記被管理装置を要素とした場合に、少なくとも第1の要素に関する性能情報の時系列変化を示す第1の性能系列情報と、第2の要素に関する性能情報の時系列変化を示す第2の性能系列情報との相関関数を導出し、この相関関数に基づいて相関モデルを生成し、この相関モデルを前記各要素間の組み合わせについて求める相関モデル生成ステップ(例えば図11に示すステップS11など)と、前記被管理装置から新たに検出し取得される前記性能情報に基づいて、前記相関モデルの変化を分析する相関変化分析ステップ(例えば図11に示すステップS12など)と、含むことができる。
以下、これらの「相関モデル生成」、「相関変化分析」の詳細処理について説明する。
(相関モデル生成の詳細処理)
図12は、本発明の第1の実施の形態による運用管理装置における相関モデル生成の詳細処理手順の一例を示すフローチャートである。
本実施の形態における相関モデル生成の詳細処理では、まず、情報収集部122によってサービス実行部121の動作状態が収集され、性能情報蓄積処理部122に図3に示す性能情報12aが蓄積される。
ここで、相関モデル生成部123は、性能情報蓄積処理部112から性能情報12aを読み込む(図12に示すステップS101)。
次に、未分析の性能情報の有無を判定する(ステップS102)。
相関モデルが生成されていない状態では、未分析の性能情報があるため、性能情報間の変換関数を算出する処理(ステップS103)に移る。
最初に、性能情報12aの「SV1.CPU」の性能値の系列と「SV1.MEM」の性能値の系列の変換関数を算出する。
図6を参照すると、「SV1.CPU」を入力xとし、「SV2.MEM」を出力yとする変換関数G300を、システム同定処理G301によって決定することになる。
一般的に、このようなシステム同定にはいくつかの手法があり、例えば、「y=Ax(t)+Bx(t−1)+Cx(t−2)+Dy(t−1)+Ey(t−2)+F」といった式を用いて、xから算出したyの時系列の値が実際に検出された値に最も近くなるように、変数A〜Fの値を決定することで変換関数が算出できる。
以下では、説明を簡略化するために、式「y=Ax+B」のAとBを決定する形で説明するが、その例に限定されるものではなく、他のシステム同定手法を用いても1つの性能値の系列から他の性能値の系列が算出できる変換関数であれば同様の効果が得られるものである。
図6のシステム同定処理G301を参照すると、関数として「y=Ax+B」を選択し、グラフG101からグラフG102を近似できるAとBの値として、それぞれ「−0.6」、「100」を決定する(図12に示すステップS103)。
さらに、グラフG302に示すように、グラフG101をこの変換関数で算出した予測値の系列と、グラフG102の性能値の系列を比較して、その差分である変換誤差から、この変換関数の重み情報を算出する(図12に示すステップS104)<重み情報算出ステップないしは重み情報算出機能>。
この後、算出された変換関数と重み情報を相関モデルに追加する(ステップS105)。
図7は、このようにして追加された相関モデルの例であり、「SV1.CPU」と「SV2.MEM」の相関として、A、B、Wの値が蓄積されている。
以降、同様にして、ステップS103からステップS105の処理を、性能情報12aに含まれる性能値の系列のすべての組合せに対して行うことで、相関モデル蓄積処理部116に現在のシステムの性能情報に関する相関モデルが完成する。
図8の相関モデル116bは、このようにして生成された相関モデルの例であり、図7の相関モデル116aに加えて、「SV3.CPU」や「SV2.CPU」に関する変換関数が追加されている。
(相関変化分析の詳細処理)
次に、本実施の形態における相関変化分析の詳細処理について、図13、図9、図10を参照して説明する。図13は、本実施の形態にかかる運用管理装置の相関変化分析の詳細処理手順の一例を示すフローチャートである。
まず、相関変化分析部124は、図13に示すように、相関モデル情報蓄積処理部116から相関モデルを読み込み(図13に示すステップS201)、相関モデルに含まれる重み情報に応じて相関を選別する(ステップS202)。
図9の相関グラフG310は、相関モデル情報蓄積処理部116の相関モデルの例であり、SV1〜SV3の3台のサーバのCPU利用率とCPU負荷を、それぞれ性能情報の要素A〜Fで表している。
そして、それぞれの要素の間を結ぶ線が、相関モデルの変換関数で表される関係であり、0〜1の範囲で表される重み情報が0.5以上の関係を太線で、それ以外のものを細線で表している。
重み情報は、変換関数の誤差によって算出されるため、この線の太さが関係の強さを表している。相関変化分析部124は、例えば、相関グラフG310から重みが0.5以上であるような安定した関係のみを抽出し、相関モデルG311のような関係を得る。
図10に示す相関グラフG312では、相関グラフG311に示す相関関係のうち、要素Aと要素C、要素Bと要素Cの相関が破壊(点線で示す)されている。
次に、相関変化分析部124は、情報収集部122から新たに検出し取得した性能情報を取得する(ステップS203)。
例えば、図3の性能情報12aにおいて、最下行にある「2007/11/07 8:30」時点の性能情報を得た場合、図8に示す相関モデル116bに記載された変換関数を順次探索する。
すなわち、未探索の相関モデルがあるか否かの判定処理を行う(ステップS204)。この判定処理において、未探索の相関モデルがないと判定された場合には、ステップS208に進み、破壊された相関の詳細を出力する。
一方、この判定処理において、未探索の相関モデルがあると判定された場合には、ステップS205に進み、性能値の変換誤差を算出する。
例えば、「SV1.CPU」の値「20」に対して、(−0.6)*(20)+100を計算して「88」という予測値を算出し、「SV1.MEM」の検出値である「79」と比較して誤差「9」という値を得る(ステップS205)。
続いて、この誤差が検出値に占める割合を算出する。そして、この誤差が一定値以上あるか否か(一定範囲内にあるか否か)判定する処理を行う(ステップS206)。
この判定処理において、この誤差が一定値以上ないと判定された場合には、ステップS204に戻り、以降の処理を繰り返す。
一方、この判定処理において、この誤差が一定値以上あると判定された場合には、ステップS207に進み、相関破壊の異常スコアを算出し、ステップS204に戻る。
例えば、ステップS206で予め決めた値である20%より小さい場合には、相関が維持されているとしてステップS204に戻る。
同様にして、「SV1.CPU」と「SV2.CPU」の予測誤差を算出し(ステップS205)、その値が20%をオーバしていることを検知すると(ステップS206)、相関が崩れていると判断して、それぞれの要素の異常スコアを算出する(ステップS207)。
以降、順次すべての相関関係を探索して(ステップS204)、破壊された相関の一覧や異常スコアを含む分析結果を障害分析部126に出力する(ステップS208)。
図10は、このようにして検出された相関破壊の様子を示す。相関グラフG312では、相関グラフG311に示す相関のうち、要素Aと要素C、要素Bと要素Cの相関が破壊(点線で示す)されている。
障害分析部126は、このような結果を受け取り、他の障害分析の結果と合わせて管理者に提示する。
このような相関変化分析の結果を示す表示画面として、例えば図14に示すものが挙げられる。図14は、運用管理装置の表示部に表示される表示画面の一例が示されている。同図では、相関変化分析における表示画面(相関変化分析結果画面)の一例が示されている。
図14に示すように、表示部に表示される表示画面U100(相関変化分析結果画面)は、相関グラフを表示する相関グラフ表示部U140を有する。相関グラフ表示部U140は、先に述べた図9や図10に示す相関グラフの状態、遷移状況を表示することができる。この例では、相関破壊が太線で、異常スコアの高い要素が太丸で示されている。
さらに、表示画面U100は、異常スコアの高い要素を順にリストアップした異常スコア要素リスト表示部U120を有する。異常スコア要素リスト表示部U120は、要素(性能種目)、その要素の異常スコアの量、その他の情報などを表示することができる。
さらに、表示画面U100は、相関グラフ表示部U140の相関グラフにおいて、相関破壊の割合や、異常スコア要素リスト表示部U120の異常スコア要素リストのうち、異常スコアが最大の要素などの相関変化分析結果を表示する分析結果表示部U110を有する。
さらに、表示画面U100は、相関破壊数の経時変化をグラフ化して表示する相関破壊数変化グラフ表示部U130を有する。
またさらに、表示画面U100は、破壊相関のリストを表示するための第1の表示操作部U152を有する。表示画面U100は、選択要素の詳細情報を表示するための第2の表示操作部U154を有する。表示画面U100は、相関変化分析結果画面の表示を終了するための第3の表示操作部U156を有する。
また、表示画面U100は、図14に示すように、相関変化分析の結果として、相関破壊として、相関グラフG311に示す相関関係の25%である2つの相関が破壊されていることや、その2つの相関はどちらも要素Cに関係するものであることから、異常スコアの順序付け一覧では、要素Cである「SV2.CPU」の異常スコアが高くなっていることが示される。
管理者は、この結果を参照し、性能値の異常が発生していること、および、それが「SV2.CPU」に起因するものであることを知ることができる。
以上のステップS201乃至ステップS208により、前記相関変化分析ステップを行うことができる。
この相関変化分析ステップでは、前記新たに検出された前記第1の要素に関する性能情報と前記相関関数とに基づいて前記第2の要素に関する予測性能情報を算出し、前記新たに検出された前記第2の要素に関する性能情報と前記予測性能情報とを比較して予測誤差を算出し、この予測誤差が一定の誤差範囲内を満たすか否かを分析することができる。
また、前記相関変化分析ステップでは、前記予測誤差が前記誤差範囲外となる場合に、前記第1の要素と前記第2の要素との相関関係が破壊されていると判断し、それぞれの要素の異常スコアを算出することができる。
さらに、前記相関変化分析ステップでは、前記異常スコアに基づいて、前記各要素を順位付けして提示可能に制御することができる。
以上のように本実施の形態によれば、相関モデル生成部が、任意の2つの性能情報の値の時系列に対して、一方を入力とし他方を出力とした場合の変換関数を導出することで相関モデルを生成する。相関変化分析部が、新たに性能情報を検出した場合に、この相関モデルの変換関数に従った性能値であるかどうかを判定し、相関関係の崩れた数と量を含む情報を障害分析部に出力する。このように、正常時に学習した相関関係が崩れているかどうかで異常の発生場所を特定することができる。
これにより、関連技術の性能情報の閾値監視に比べて、応答劣化などの性能異常を正確に検出し場所を特定することができるという効果がある。
また、関連技術の異常時に性能情報の相関関係を算出する手法に比べて、平常時の関係と異常時の関係を区別して提示することができるという効果がある。
さらに、これらの分析には、事前に知識となるデータを用意する必要がなく、性能情報以外の処理履歴等を収集する必要がないことから、管理者の負担を軽減し、システムの処理量の増大を防止しすることができる。
また、関連技術では、1つの性能情報の時間変化関数としてモデルを生成しているため、1つの性能情報が、前回予測された値と同じかどうかを判断するものである。
これに対して本実施の形態は、2つの性能情報の間の変換関数としてモデルを生成することで、任意の2つの性能情報の値の関係が維持されているかを判断できる。
さらに、関連技術では、2つの性能情報の間の「相関ルール」が用いられているが、このルールをどう生成するのかは一切記述されておらず、特異点を発見するためのルール生成の負担が大きい、という不具合があった。
また、関連技術では、相関係数は値であって、2つの性能情報間の変換関数を算出していない。変換関数を導出する手法と、他の分析手法では特性が異なる。関連技術では、演算の結果として、予め用意しておくどのモデルと類似しているかを導出できるが、用意するモデルの中身を決める手法については不明である。
これに対して本実施の形態では、図9に示すように強い相関を抽出することで、誤報の少ないモデルを生成することができる。また、1対1の変換関数から分析することで、図14に示すような要素別の異常度のランキングや異常要素の図示ができる。
ここで、図4に示すブロック図における一部の各ブロック(例えば符号123、124、121、122、126、127、128等)は、コンピュータが適宜なメモリに格納された各種プログラムを実行することにより、該プログラムにより機能化された状態を示すソフトウエアモジュール構成であってもよい。
すなわち、物理的構成は例えば一又は複数のCPU(或いは一又は複数のCPUと一又は複数のメモリ)等ではあるが、各部(回路・手段)によるソフトウエア構成は、プログラムの制御によってCPUが発揮する複数の機能を、それぞれ複数の部(手段)による構成要素として表現したものである。
CPUがプログラムによって実行されている動的状態(プログラムを構成する各手順を実行している状態)を機能表現した場合、CPU内に各部(手段)が構成されることになる。プログラムが実行されていない静的状態にあっては、各手段の構成を実現するプログラム全体(或いは各手段の構成に含まれるプログラム各部)は、メモリなどの記憶領域に記憶されている。
以上に示した各部(手段)の説明は、プログラムにより機能化されたコンピュータをプログラムの機能と共に説明したものと解釈することも出来るし、また、固有のハードウエアにより恒久的に機能化された複数の電子回路ブロックからなる装置を説明したものとも解釈することが出来ることは、当然である。したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現でき、いずれかに限定されるものではない。
また、各部は、通信可能な専用のコンピュータからなる装置としてそれぞれ構成し、これらの各装置により運用管理システムを構成してもよい。
[第2の実施の形態]
次に、本発明にかかる第2の実施の形態について、図15に基づいて説明する。以下には、前記第1の実施の形態の実質的に同様の構成に関しては説明を省略し、異なる部分についてのみ述べる。図15は、本発明の運用管理装置の第2の実施の形態の一例を示すブロック図である。
本実施の形態における構成は、第1の実施の形態の図4を用いて説明した構成に加えて、変化履歴情報蓄積処理部218と、定常変化分析部231とを含む構成としている。
具体的には、本実施の形態の運用管理装置200は、図15に示すように、前記第1の実施の形態の構成である、サービス実行部221、性能情報蓄積処理部212、情報収集部222、分析設定蓄積処理部214、障害分析部226、管理者対話部227、対処実行部228、相関モデル生成部223、相関モデル情報蓄積処理部216、相関変化分析部224に加えて、変化履歴情報蓄積処理部218と、定常変化分析部231とを含んで構成される。
変化履歴情報蓄積処理部218は、相関変化分析部224により分析された相関変化の履歴情報を蓄積処理する。
定常変化分析部231は、変化履歴情報蓄積処理部218から相関破壊の履歴を読み出し、一定期間連続して破壊されている相関関係を発見した場合に、相関モデル情報蓄積処理部216に蓄積される相関モデルの該当する相関関係を無効化する。
また、定常変化分析部231は、無効化された相関関係が一定の割合になった場合に、相関モデル生成部223に相関モデルの再生成を指示する。
ここで、これらの各部は、図16に示すように、制御部が発揮する複数の機能として構成することもできる。
また、定常変化分析部231は、前記相関モデルの前記相関関係が定常的に破壊されているか否かを分析することができる。
さらに、前記定常変化分析部231は、前記相関関係が定常的に破壊されている前記相関モデルを無効化することができる。
また、前記定常変化分析部231は、無効化された前記相関モデルが全相関モデルに占める割合が一定以上となった場合に、前記相関モデル生成部に前記相関モデルの再生成を指示することができる。
さらに、前記定常変化分析部231は、無効化された前記相関モデルが全相関モデルに占める割合が一定以上となった場合に、前記相関モデルの再生成が必要である旨を提示可能に制御することができる。
(定常分析における相関破壊について)
ここで、定常変化分析部231による定常分析における相関破壊の概要について、図17を参照して説明する。図17は、本実施の形態にかかる運用管理装置の定常分析における相関破壊の概要の一例を示す説明図である。
図17に示すように、相関グラフG321では、要素Dと要素E、要素Eと要素Fの間の相関が定常的に破壊されている(点線で示す)。
定常変化分析部231が、図8に示す相関モデル116bにおいて、「SV3.CPU」と「SV3.MEM」の間、および、「SV2.MEM」と「SV3.MEM」の間の相関の有効欄を「×」とすることで、図18に示す相関モデル216bに示すような相関モデルに修正される。
この相関モデル216bに対応するグラフとして、例えば図17に示すグラフG322などが挙げられる。
この後、相関変化分析部224がこの相関モデルを読み込み、無効化されていない相関関係のみで分析を行うことにより、これらの相関の破壊が常時検出されるのを防止することができる。
(処理手順について)
次に、上述のような構成を有する運用管理装置における各部の処理は、方法としても実現可能であり、運用管理方法としての各種の処理手順について、図19乃至図20を参照しつつ説明する。図19は、本発明の第2の実施の形態による運用管理装置における処理手順の一例を示すフローチャートである。
本実施の形態に係る情報処理方法は、システムを構成する複数の被管理装置から取得される複数種の性能種目毎の性能情報に基づいて、前記被管理装置を運用管理する制御する情報処理を(例えば1又は複数のコンピュータやその他の装置など)が行うものを対象とするものである。
この情報処理方法は、基本的構成として、前記性能種目又は前記被管理装置を要素とした場合に、少なくとも第1の要素に関する性能情報の時系列変化を示す第1の性能系列情報と、第2の要素に関する性能情報の時系列変化を示す第2の性能系列情報との相関関数を導出し、この相関関数に基づいて相関モデルを生成し、この相関モデルを前記各要素間の組み合わせについて求める相関モデル生成ステップ(例えば図19に示すステップS21など)と、前記被管理装置から新たに検出し取得される前記性能情報に基づいて、前記相関モデルの変化を分析する相関変化分析ステップ(例えば図19に示すステップS22など)と、含むことができる。
さらに、この情報処理方法は、前記相関モデルの前記相関関係が定常的に破壊されているか否かを分析する定常変化分析ステップ(例えば図19に示すステップS23など)を含むことができる。
ここで、これらの「相関モデル生成」、「相関変化分析」の詳細処理については、第1の実施の形態で説明したものと同じであるため、以下には「定常変化分析」の詳細処理について説明する。
(定常変化分析の詳細処理)
図20は、本実施の形態にかかる運用管理装置の定常変化分析の詳細処理手順の一例を示すフローチャートである。
本実施の形態の相関変化分析部224は、相関関係の破壊を検出した場合に、その履歴を変化履歴情報蓄積処理部218に蓄積処理する。
図20に示すように、運用管理装置が備えたコンピュータの定常変化分析部231は、この相関破壊の履歴を読み出して相関破壊の履歴情報を取得する(ステップS301)。
続いて、定常的に破壊される相関があるか否かの判定処理を行う(ステップS302)。
この判定処理において、定常的に破壊される相関がないと判定された場合には、処理を終了する。
一方、この判定処理において、定常的に破壊される相関があると判定された場合には、ステップS303に進む。
すなわち、連続して破壊されている相関関係があった場合に(ステップS302)、相関モデル情報蓄積処理部216に蓄積されている相関モデルのうち、該当する相関関係を無効化する(ステップS303)。
図17は、このような相関破壊の例を示す。図17に示すように、相関グラフG321では、要素Dと要素E、要素Eと要素Fの間の相関が定常的に破壊されている(点線で示す)。
定常変化分析部231が、図8に示す相関モデル116bにおいて、「SV3.CPU」と「SV3.MEM」の間、および、「SV2.MEM」と「SV3.MEM」の間の相関の有効欄を「×」とすることで、図18に示す相関モデル216bに示すような相関モデルに修正される。
これにより、この相関モデル216bに対応するように、例えば図17に示すグラフG322のようなグラフとなる。
この後、相関変化分析部224がこの相関モデルを読み込み、無効化されていない相関関係のみで分析を行うことにより、これらの相関の破壊が常時検出されるのを防止することができる。
さらに、定常変化分析部231は、相関モデル内で、このようにして無効化した相関関係が一定割合以上になったか否かの判定処理を行う(ステップS304)。
この判定処理において、無効化した相関関係が一定割合以上にならないと判定された場合には、処理を終了する。
一方、この判定処理において、無効化した相関関係が一定割合以上になったと判定された場合には、ステップS305に進む。
すなわち、相関モデル内で、このようにして無効化した相関関係が一定割合以上になった場合に(ステップS304)、定常変化分析部231は、相関モデル生成部223に指示することで新たな相関モデルを生成する(ステップS305)。
このように相関モデルの無効化が多くなった場合の対話画面の一例を図21に示す。図21は、運用管理装置の表示部に表示される表示画面の一例が示されている。
図21に示すように、表示部に表示される表示画面U200(モデル再作成画面)は、モデル名、作成日時、相関数、定常破壊などのモデル関連情報を表示するモデル関連情報表示部U220を有する。
さらに、表示画面U200は、モデル作成に関するメッセージを表示した表示部U210を有する。さらに、表示画面U200は、モデルを参照するための第1の表示操作部U242を有する。表示画面U200は、特定の再作成条件にてモデルの再作成を行うための第2の表示操作部U244を有する。表示画面U200は、モデル再作成画面の表示を終了するための第3の表示操作部U246を有する。
このように、管理者は、システムからの情報により、分析に用いている相関モデルが現在の動作状況にそぐわなくなったことを知ることができる。
以上のステップS301乃至ステップS305により、前記定常変化分析ステップを行うことができる。この定常変化分析ステップでは、前記相関関係が定常的に破壊されている前記相関モデルを無効化することができる。
さらに、前記定常変化分析ステップでは、無効化された前記相関モデルが全相関モデルに占める割合が一定以上となった場合に、前記相関モデルの再生成を指示することができる。
また、前記定常変化分析ステップでは、無効化された前記相関モデルが全相関モデルに占める割合が一定以上となった場合に、前記相関モデルの再生成が必要である旨を提示可能に制御することができる。
以上のように本実施の形態によれば、前記第1の実施の形態と同様の作用効果を奏しながらも、定常変化分析部が一度作成した相関モデルで定常的に破壊される要素を無効化する。
これにより、システムの特性が徐々に変化する場合などにおいても、不要な異常検知を抑止して正確な性能異常検出を行うことができる。
また、無効化される要素が多くなった場合に、相関モデルを再作成する必要性を管理者に提示することができるため、常に精度の高い分析を維持することができる。
その他の構成およびその他のステップないしは機能並びにその作用効果については、前述した実施の形態の場合と同一となっている。また、上記の説明において、上述した各ステップの動作内容及び各部の構成要素並びにそれらによる各機能をプログラム化し、コンピュータに実行させてもよい。
[その他の各種変形例]
また、本発明にかかる装置及び方法は、そのいくつかの特定の実施の形態に従って説明してきたが、本発明の主旨および範囲から逸脱することなく本発明の本文に記述した実施の形態に対して種々の変形が可能である。
例えば、上記構成部材の数、位置、形状等は上記実施の形態に限定されず、本発明を実施する上で好適な数、位置、形状等にすることができる。すなわち、上記実施の形態では、相関変化分析における異常スコアを算出する際の相関が崩れているか否かの判断は、予測誤差が20%をオーバする場合を示したが、本発明は、これらの数を制限するものではない。
また、相関破壊あり、相関破壊なしの2分類する場合に限らず、複数段階に分類する場合であってもよい。
本発明の運用管理ソフトウエアは、1台のPCにインストールする場合であっても、クライアント・サーバシステムにおける端末及びサーバ、P2Pで利用可能な構成であっても構わない。また、各種表示画面などはWeb上でアクセス可能な構成であっても構わない。
(プログラム)
また、前述した実施形態の機能を実現する本発明のソフトウエアのプログラムは、前述した各実施の形態における各種ブロック図などに示された処理部(処理手段)、機能などに対応したプログラムや、フローチャートなどに示された処理手順、処理手段、機能などに対応したプログラムなどにおいて各々処理される各処理プログラム、本明細書で全般的に記述される方法(ステップ)、説明された処理、データの全体もしくは各部を含む。
具体的には、本発明の運用管理プログラムは、システムを構成する複数の被管理装置から複数種の性能種目毎の性能情報を取得して、前記被管理装置を運用管理する運用管理装置が備えたコンピュータに諸機能を実現させることが可能なものである。
この運用管理プログラムは、前記性能種目又は前記被管理装置を要素とした場合に、少なくとも第1の要素に関する性能情報の時系列変化を示す第1の性能系列情報と、第2の要素に関する性能情報の時系列変化を示す第2の性能系列情報との相関関数を導出し、この相関関数に基づいて相関モデルを生成し、この相関モデルを前記各要素間の組み合わせについて求める相関モデル生成機能(例えば図4に示す符号123などの構成、図11に示すステップS11の機能など)と、前記被管理装置から新たに検出し取得される前記性能情報に基づいて、前記相関モデルの変化を分析する相関変化分析機能(例えば図4に示す符号124などの構成、図11に示すステップS12の機能など)と、を含む機能をコンピュータに実現させることができる。
また、この運用管理プログラムは、前記相関変化分析機能では、前記新たに検出された前記第1の要素に関する性能情報と前記相関関数とに基づいて前記第2の要素に関する予測性能情報を算出し、前記新たに検出された前記第2の要素に関する性能情報と前記予測性能情報とを比較して予測誤差を算出し、この予測誤差が一定の誤差範囲内を満たすか否かを分析する機能をコンピュータに実現させることができる。
さらに、この運用管理プログラムは、前記相関変化分析機能では、前記予測誤差が前記誤差範囲外となる場合に、前記第1の要素と前記第2の要素との相関関係が破壊されていると判断し、それぞれの要素の異常スコアを算出する機能をコンピュータに実現させることができる。
また、この運用管理プログラムは、前記相関変化分析機能では、前記異常スコアに基づいて、前記各要素を順位付けして提示可能に制御する機能をコンピュータに実現させることができる。
さらに、この運用管理プログラムは、前記相関モデルの前記相関関係が定常的に破壊されているか否かを分析する定常変化分析機能(例えば図15に示す符号231などの構成、図19に示すステップS23の機能など)を含む機能をコンピュータに実現させることができる。
また、この運用管理プログラムは、前記定常変化分析機能では、前記相関関係が定常的に破壊されている前記相関モデルを無効化する機能をコンピュータに実現させることができる。
さらに、この運用管理プログラムは、前記定常変化分析機能では、無効化された前記相関モデルが全相関モデルに占める割合が一定以上となった場合に、前記相関モデルの再生成を指示する機能をコンピュータに実現させることができる。
また、この運用管理プログラムは、前記定常変化分析機能では、無効化された前記相関モデルが全相関モデルに占める割合が一定以上となった場合に、前記相関モデルの再生成が必要である旨を提示可能に制御する機能をコンピュータに実現させることができる。
プログラムは、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。プログラムは、高水準プロシージャ型またはオブジェクト指向プログラミング言語で、あるいは必要に応じてアセンブリまたはマシン言語で実装することができる。いずれの場合も、言語はコンパイラ型またはインタープリタ型言語であってもよい。上述のプログラムを、一般のパソコンや携帯型情報端末などで動作可能なアプリケーションソフトに組み込んだものも含む。
プログラムを供給する手法としては、電気通信回線(有線、無線を問わない)によってコンピュータと通信可能に接続された外部の機器から前記電気通信回線を通じて提供することも可能である。例えば、コンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページからプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、プログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるサーバも、本発明の範囲に含まれるものである。
本発明のプログラムによれば、当該制御プログラムを格納するROM等の記憶媒体から、当該制御プログラムをコンピュータ(CPU)に読み込んで実行させれば、或いは、当該制御プログラムを、通信手段を介してコンピュータにダウンロードさせた後に実行させれば、上述した本発明に係る装置を比較的簡単に実現できる。発明の思想の具現化例として装置のソフトウェアとなる場合には、かかるソフトウェアを記憶した記憶媒体上においても当然に存在し、利用される。
また、プログラムは、一次複製品、二次複製品などの複製段階については全く問う余地無く同等である。プログラムの供給方法として通信回線を利用して行なう場合であれば通信回線が伝送媒体となって本発明が利用されることになる。むろん、プログラムの発明として特定することもできる。さらに、装置における従属請求項は、方法,プログラムにおいて従属請求項に対応した構成にすることも可能である。
(情報記録媒体)
また、上述のプログラムを、情報記録媒体に記録した構成であってもよい。情報記録媒体には、上述のプログラムを含むアプリケーションプログラムが格納されており、コンピュータが当該情報記録媒体からアプリケーションプログラムを読み出し、当該アプリケーションプログラムをハードディスクにインストールすることが可能である。これにより、上述のプログラムは、磁気記録媒体、光記録媒体あるいはROMなどの情報記録媒体に記録してプログラムを提供することができる。そのようなプログラムが記録された情報記録媒体を、コンピュータにおいて使用することは、好都合な情報処理装置を構成する。
プログラムを供給するための情報記録媒体としては、例えばROM、RAM、フラッシュメモリやSRAM等の半導体メモリ並びに集積回路、あるいはそれらを含むUSBメモリやメモリカード、光ディスク、光磁気ディスク、磁気記録媒体等を用いてよく、さらに、フレキシブルディスク、CD−ROM、CD―R、CD―RW、FD、DVDROM、HDDVD(HDDVD−R−SL<1層>、 HDDVD−R−DL<2層>、HDDVD−RW−SL、HDDVD−RW−DL、HDDVD−RAM−SL)、DVD±R−SL、DVD±R−DL、DVD±RW−SL、DVD±RW−DL、DVD−RAM、Blu−Ray Disk<登録商標>(BD−RーSL、BD−R−DL、BD−RE−SL、BD−RE−DL)、MO、ZIP、磁気カード、磁気テープ、SDカード、メモリスティック、不揮発性メモリカード、ICカード、等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置、等に記録して構成して用いてよい。
さらに「情報記録媒体」は、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの(伝送媒体ないしは伝送波)、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。
また、コンピュータ上で稼働しているOS、端末(例えば携帯電話など)上のRTOS等が処理の一部又は全部を行う場合にも、上記実施の形態と同等の機能を実現できると共に、同等の効果を得ることができる。
さらに、プログラムを暗号化してCD−ROM等の記録媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。この場合、本発明の構成は、プログラムの各構成要素(各種の手段、ステップ及びデータ)と、前記プログラム(各種の手段、ステップ及びデータ)を暗号化する暗号化手段と、を含んでよい。
また、上記実施の形態では、クライアントサーバーシステムを例に説明したが、サーバを介さずに端末同士がネットワークを組み、相互にデータを送受信するピアツーピア(Peer To Peer)通信によるシステムであってもよい。その際、管理装置は、ピア・ツゥ・ピア方式におけるマスタ端末であればよいまた、上述の実施の形態の「システム」を、他の「情報処理システム」と統合したシステムとして、これら全体を本発明の「システム」として構成することも一向に構わない。「情報処理システム」には、OSや周辺機器等のハードウェアを含むものとする。
また、前記実施の形態における「システム」とは、複数の装置が論理的に集合した物をいい、各構成の装置が同一筐体中にあるか否かは問わない。このため、本発明は、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。「システム」には、OSや周辺機器等のハードウェアを含んでもよい。
さらに、上述のプログラムなどが搭載される情報処理装置としては、サーバは、例えばパーソナルコンピュータに限らず、各種サーバー、EWS(エンジニアリングワークステーション)、中型コンピュータ、メインフレームなどが挙げられる。情報端末は、以上の例に加えて、携帯型情報端末、各種モバイル端末、PDA、携帯電話機、ウエアラブル情報端末、種々の(携帯型などの)テレビ・DVDレコーダ・各種音響機器及びそのリモコン、各種情報通信機能を搭載した家電機器、ネットワーク機能を有するゲーム機器等からも利用できる構成としても構わない。あるいは、これらの端末に表示されるアプリケーションとして改良されたものも本発明の範囲に含めることができる。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
さらに、本明細書において、フローチャートに示されるステップは、記載された手順に従って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理を含むものである。また、実装では、プログラム手順(ステップ)が実行される順序を変更することができる。さらに、実装の必要に応じて、本明細書で説明した特定の手順(ステップ)を、組み合わされた手順(ステップ)として実装、除去、追加、または再配置することができる。
さらに、装置の各手段、各機能、各ステップの手順の機能などのプログラムの機能を、専用のハードウエア(例えば専用の半導体回路等)によりその機能を達成してもよく、プログラムの全機能のうち一部の機能をハードウエアで処理し、全機能のうちさらに他の機能をソフトウエアで処理するようにしてもよい。専用のハードウエアの場合、各部を集積回路例えばLSIにて形成されてもよい。これらは個別に1チップ化されても良いし、一部または全部を含むように1チップ化されても良い。また、LSIには、ストリーミングエンジンなど他の機能ブロックが含まれていても良い。また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセサで実現してもよい。さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。
さらに、「通信」では、無線通信および有線通信は勿論、無線通信と有線通信とが混在した通信、即ち、ある区間では無線通信が行われ、他の区間では有線通信が行われるようなものであってもよい。さらに、ある装置から他の装置への通信が有線通信で行われ、他の装置からある装置への通信が無線通信で行われるようなものであってもよい。
そして、この通信には通信網が含まれる。通信網を構成するネットワークとしては、例えば携帯電話回線網(基地局及び交換システムを含む)、公衆電話回線網、IP電話網、ISDN回線網などこれに類する各種回線網、インターネット(乃ち、TCP・IPプロトコルを用いた通信態様)やイントラネット、LAN[イーサネット(登録商標)、やギガビットイーサネット(登録商標)などを含む]、WAN、光ファイバー通信網、電力線通信網、ブロードバンド対応可能な各種専用回線網などいずれのハードウエア構成でもよい。さらに、ネットワークは、TCP・IPプロトコルの他、種々の通信プロトコルを用いたネットワークあるいはソフトウエア的に構築された仮想ネットワークやこれに類するあらゆるネットワークを含むネットワークなどいかなる通信プロトコルであってもよい。また、ネットワークは、有線に限らず、無線(衛星通信、各種高周波通信手段等を含む)ネットワーク(例えば、簡易電話システムや携帯電話のようなシングルキャリア通信システム、W―CDMAやIEEE802.11bに準拠した無線LANのようなスペクトラム拡散通信システム、IEEE802.11aやHiperLAN/2のようなマルチキャリア通信システム、などを含むネットワーク)であっても構わず、これらの組み合わせを利用してもよく、他のネットワークと接続されたシステムであってもよい。さらに、ネットワークは、ポイントツーポイント、ポイントツーマルチポイント、マルチポイントツーマルチポイントなど如何なる形態でもよい。
また、運用管理装置と他の被管理装置との間の通信構造に際し、いずれか一方又は双方に形成されるインタフェースの種類は、例えばパラレルインタフェース、USBインタフェース、IEEE1394、LANやWAN等のネットワークやその他これに類するもの、もしくは今後開発される如何なるインタフェースであっても構わない。
さらに、相関モデルを生成し、相関変化分析を行う手法は、必ずしも実体のある装置に限られる必要はなく、その方法としても機能することは容易に理解できる。このため、方法にかかる発明も、必ずしも実体のある装置に限らず、その方法としても有効であることに相違はない。この場合、方法を実現するための一例として運用管理装置、運用管理システムなども含めることができる。
ところで、このような運用管理装置は、単独で存在する場合もあるし、ある機器に組み込まれた状態で利用されることもあるなど、発明の思想としてはこれに限らず、各種の態様を含むものである。従って、ソフトウェアであったりハードウェアであったりするなど、適宜、変更可能である。発明の思想の具現化例として装置のソフトウェアとなる場合には、かかるソフトウェアを記憶した記憶媒体上においても当然に存在し、利用されるといわざるをえない。
さらに、一部がソフトウェアであって、一部がハードウェアで実現されている場合であってもよく、一部を記憶媒体上に記憶しておいて必要に応じて適宜読み込まれるような形態のものとしてあってもよい。本発明をソフトウェアで実現する場合、ハードウェアやオペレーティングシステムを利用する構成とすることも可能であるし、これらと切り離して実現することもできる。
また、発明の範囲は、図示例に限定されないものとする。
さらに、上記各実施の形態には種々の段階が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。つまり、上述の各実施の形態同士、あるいはそれらのいずれかと各変形例のいずれかとの組み合わせによる例をも含む。この場合において、本実施形態において特に記載しなくとも、各実施の形態及びそれらの変形例に開示した各構成から自明な作用効果については、当然のことながら実施の形態の作用効果として含めることができる。逆に、本実施の形態に記載されたすべての作用効果を奏することのできる構成が、本発明の本質的特徴部分の必須構成要件であるとは限らない。また、実施の形態に示される全構成要件から幾つかの構成要件が削除された構成による実施の形態並びにその構成に基づく技術的範囲も発明になりうる。
そして、各実施の形態及びそれらの変形例を含むこれまでの記述は、本発明の理解を容易にするために、本発明の多様な実施の形態のうちの一例の開示、すなわち、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、例証するものであり、制限するものではなく、適宜変形及び/又は変更が可能である。本発明は、その技術思想、またはその主要な特徴に基づいて、様々な形で実施することができ、各実施の形態及びその変形例によって本発明の技術的範囲が限定的に解釈されてはならないものである。
従って、上記に開示された各要素は、本発明の技術的範囲に属する全ての設計変更や均等物を含む趣旨である。
本発明は、コンピュータ全般に適用可能である。
1 運用管理システム
2 コンピュータ(被管理装置)
3、100、200 運用管理装置
12、112、212 性能情報蓄積処理部
14、114、214 分析設定蓄積処理部
21、121、221 サービス実行部
22、122、222 情報収集部
26、126、226 障害分析部
27、127、227 管理者対話部
28、128、228 対処実行部
116、216 相関モデル蓄積処理部
123、223 相関モデル生成部
124、224 相関変化分析部
218 変化履歴情報蓄積処理部
231 定常変化分析部

Claims (8)

  1. システムを構成する被管理装置から複数種の性能種目に関わる性能情報を取得する運用管理装置であって、
    前記性能情報の時系列変化を示す性能系列情報から前記性能情報間の相関関数を含む相関モデルを生成する相関モデル生成部と、
    新たに検出された性能情報のうちの1項目を該性能情報に関連する前記相関関数に適用して予測性能情報を算出し、この予測性能情報と同一の項目について実際に検出された性能情報とを比較して予測誤差を算出し、この予測誤差に基づいて当該相関関数で示される相関関係が維持されているか否かを分析して該分析結果に関する情報を出力する相関変化分析部と、
    前記出力を分析して一定期間破壊されている相関関係があるか否かを判定し、一定期間破壊されている相関関係があると判定されたときは該当する相関モデルを無効化する定常変化分析部と
    を備えることを特徴とする運用管理装置。
  2. 前記定常変化分析部が、無効化された前記相関モデルの全相関モデルに占める割合が一定以上となった場合には前記相関モデル生成部に対して相関モデルを再生成させる機能を備えることを特徴とする、請求項1に記載の運用管理装置。
  3. 前記定常変化分析部が、無効化された前記相関モデルの全相関モデルに占める割合が一定以上となった場合には相関モデルの再生成が必要である旨を表示画面として出力する機能を備えることを特徴とする、請求項1に記載の運用管理装置。
  4. 複数のコンピュータ装置である被管理装置と、
    前記複数の被管理装置から該装置の動作に関する複数種の性能種目に関わる性能情報を取得する運用管理装置と、
    を含み、
    前記運用管理装置は、
    前記性能情報の時系列変化を示す性能系列情報から前記性能情報間の相関関数を含む相関モデルを生成する相関モデル生成部と、
    新たに検出された性能情報のうちの1項目を該性能情報に関連する前記相関関数に適用して予測性能情報を算出し、この予測性能情報と同一の項目について実際に検出された性能情報とを比較して予測誤差を算出し、この予測誤差に基づいて当該相関関数で示される相関関係が維持されているか否かを分析して該分析結果に関する情報を出力する相関変化分析部と、
    前記出力を分析して一定期間破壊されている相関関係があるか否かを判定し、一定期間破壊されている相関関係があると判定されたときは該当する相関モデルを無効化する定常変化分析部と
    を備えることを特徴とする運用管理システム。
  5. システムを構成する複数のコンピュータ装置である被管理装置から取得される該装置の動作に関する複数種の性能種目に関わる性能情報に基づいて、前記被管理装置を運用管理する制御する情報処理を行う情報処理方法であって、
    前記性能情報の時系列変化を示す性能系列情報から前記性能情報間の相関関数を含む相関モデルを生成する相関モデル生成ステップと、
    新たに検出された性能情報のうちの1項目を該性能情報に関連する前記相関関数に適用して予測性能情報を算出し、この予測性能情報と同一の項目について実際に検出された性能情報とを比較して予測誤差を算出し、この予測誤差に基づいて当該相関関数で示される相関関係が維持されているか否かを分析して該分析結果に関する情報を出力する相関変化分析ステップと、
    前記出力を分析して一定期間破壊されている相関関係があるか否かを判定し、一定期間破壊されている相関関係があると判定されたときは該当する相関モデルを無効化する定常変化分析ステップとを含むことを特徴とする運用管理方法。
  6. 前記定常変化分析ステップが、無効化された前記相関モデルの全相関モデルに占める割合が一定以上となった場合には前記相関モデル生成ステップを実行して相関モデルを再生成させることを特徴とする、請求項5に記載の運用管理方法。
  7. 前記定常変化分析ステップが、無効化された前記相関モデルの全相関モデルに占める割合が一定以上となった場合には相関モデルの再生成が必要である旨を表示画面として出力することを特徴とする、請求項5に記載の運用管理方法。
  8. システムを構成する複数のコンピュータ装置である被管理装置から該装置の動作に関する複数種の性能種目に関わる性能情報を取得する運用管理装置が備えたコンピュータに諸機能を実現させることが可能な運用管理プログラムであって、
    前記性能情報の時系列変化を示す性能系列情報から前記性能情報間の相関関数を含む相関モデルを生成する相関モデル生成機能と、
    新たに検出された性能情報のうちの1項目を該性能情報に関連する前記相関関数に適用して予測性能情報を算出し、この予測性能情報と同一の項目について実際に検出された性能情報とを比較して予測誤差を算出し、この予測誤差に基づいて当該相関関数で示される相関関係が維持されているか否かを分析して該分析結果に関する情報を出力する相関変化分析機能と、
    前記出力を分析して一定期間破壊されている相関関係があるか否かを判定し、一定期間破壊されている相関関係があると判定されたときは該当する相関モデルを無効化する定常変化分析機能と
    を含む機能をコンピュータに実現させることを特徴とする運用管理プログラム。
JP2013152070A 2013-07-22 2013-07-22 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム Active JP5590196B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013152070A JP5590196B2 (ja) 2013-07-22 2013-07-22 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013152070A JP5590196B2 (ja) 2013-07-22 2013-07-22 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2011098808A Division JP5516494B2 (ja) 2011-04-26 2011-04-26 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2014145841A Division JP5979185B2 (ja) 2014-07-16 2014-07-16 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム

Publications (2)

Publication Number Publication Date
JP2013242902A JP2013242902A (ja) 2013-12-05
JP5590196B2 true JP5590196B2 (ja) 2014-09-17

Family

ID=49843649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013152070A Active JP5590196B2 (ja) 2013-07-22 2013-07-22 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム

Country Status (1)

Country Link
JP (1) JP5590196B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10693741B2 (en) 2015-09-02 2020-06-23 Kddi Corporation Network monitoring system, network monitoring method, and computer-readable storage medium

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020201638A (ja) 2019-06-07 2020-12-17 京セラドキュメントソリューションズ株式会社 監視システムおよび監視プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004021756A (ja) * 2002-06-19 2004-01-22 Hitachi Ltd 情報システム性能の統計的予測方法
JP2004088153A (ja) * 2002-08-22 2004-03-18 Nippon Telegr & Teleph Corp <Ntt> ネットワークのボトルネック特定方法
JP4980581B2 (ja) * 2004-04-16 2012-07-18 新日鉄ソリューションズ株式会社 性能監視装置、性能監視方法及びプログラム
JP4430989B2 (ja) * 2004-06-28 2010-03-10 株式会社日立製作所 運用管理支援システムおよび性能情報表示方法
JP2006146668A (ja) * 2004-11-22 2006-06-08 Ntt Data Corp 運用管理支援装置及び運用管理支援プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10693741B2 (en) 2015-09-02 2020-06-23 Kddi Corporation Network monitoring system, network monitoring method, and computer-readable storage medium

Also Published As

Publication number Publication date
JP2013242902A (ja) 2013-12-05

Similar Documents

Publication Publication Date Title
JP4872944B2 (ja) 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
JP4872945B2 (ja) 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
US10210036B2 (en) Time series metric data modeling and prediction
EP3821337B1 (en) Methods and apparatus for safe and smart distribution of software patches
US10965541B2 (en) Method and system to proactively determine potential outages in an information technology environment
JP2012198796A (ja) ログ収集システム、装置、方法及びプログラム
WO2012157471A1 (ja) 複数の制御システムの異常を検知する異常検知システム
US20060277440A1 (en) Method, system, and computer program product for light weight memory leak detection
US20130254524A1 (en) Automated configuration change authorization
JP2022033685A (ja) 堅牢性を確定するための方法、装置、電子機器、コンピュータ可読記憶媒体、及びコンピュータプログラム
CN116895046B (zh) 基于虚拟化的异常运维数据处理方法
JP5979185B2 (ja) 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
JP2016146020A (ja) データ分析システム及び分析方法
JP6168209B2 (ja) 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
JP5590196B2 (ja) 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
JP5516494B2 (ja) 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
JP5141789B2 (ja) 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
JP2004348640A (ja) ネットワーク管理システム及びネットワーク管理方法
US11102091B2 (en) Analyzing SCADA systems
CN115098326A (zh) 一种系统异常检测方法及装置、存储介质及电子设备
Tomak et al. RAST: evaluating performance of a legacy system using regression analysis and simulation
Deng et al. An ontology-based framework for model-driven analysis of situations in data centers
KR101943900B1 (ko) 하나 이상의 발전사를 관리하며, 발전사의 이상 여부를 판단하는 발전사 통합 관리 시스템 및 그 방법
JP2018160020A (ja) 監視システム、プログラムおよび監視方法
Mallick et al. An alert prediction model for cloud infrastructure monitoring

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140304

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140416

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140701

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140714

R150 Certificate of patent or registration of utility model

Ref document number: 5590196

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150