JP5546686B2 - 監視システム、及び監視方法 - Google Patents
監視システム、及び監視方法 Download PDFInfo
- Publication number
- JP5546686B2 JP5546686B2 JP2013522393A JP2013522393A JP5546686B2 JP 5546686 B2 JP5546686 B2 JP 5546686B2 JP 2013522393 A JP2013522393 A JP 2013522393A JP 2013522393 A JP2013522393 A JP 2013522393A JP 5546686 B2 JP5546686 B2 JP 5546686B2
- Authority
- JP
- Japan
- Prior art keywords
- monitoring
- time
- change
- information
- predetermined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012544 monitoring process Methods 0.000 title claims description 329
- 238000000034 method Methods 0.000 title claims description 90
- 230000008859 change Effects 0.000 claims description 232
- 230000008569 process Effects 0.000 claims description 73
- 238000003860 storage Methods 0.000 claims description 67
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000012217 deletion Methods 0.000 claims description 12
- 230000037430 deletion Effects 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 230000007423 decrease Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 49
- 238000010586 diagram Methods 0.000 description 43
- 238000004891 communication Methods 0.000 description 13
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000005259 measurement Methods 0.000 description 6
- 230000002776 aggregation Effects 0.000 description 4
- 238000004220 aggregation Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3065—Monitoring arrangements determined by the means or processing involved in reporting the monitored data
- G06F11/3072—Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
- G06F11/3079—Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting the data filtering being achieved by reporting only the changes of the monitored data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/04—Processing captured monitoring data, e.g. for logfile generation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0852—Delays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
- H04L43/0894—Packet rate
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Debugging And Monitoring (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Description
本発明は、ネットワークを介して接続された装置を監視する監視システム、及び監視方法に関する。
従来、複数のホストコンピュータやストレージサブシステムが通信ネットワークに接続された計算機システムが構築されている。このような計算機システムにおいては、一般に、監視システムが設けられる。監視システムは、ネットワークに接続されている種々の装置を監視する。
例えば、ネットワークに接続されている監視対象の装置の性能を収集し、保存する技術が知られている(特許文献1参照)。また、収集した監視対象の装置の性能値をグラフ表示することも知られている。
上記技術によると、監視対象の装置の性能値をグラフ表示して、監視対象の装置を適切に監視することができる。しかしながら、性能値のグラフのみでは、実際の計算機システムにおける構成の変化や状態の変化を把握するのは難しい。
以上を解決するため、監視システムは監視対象(監視対象装置又は監視対象装置のコンポーネントを指す)の構成の変化又は状態の変化を数値化し、この変化値を表示する。
なお、変化値の表示は例えば以下がある(ただし、両方とも同時に実現しなくてもよい)。
(1)変化値を複数の監視対象の各々に対して計算し、画面に表示する。これによって複数の監視対象の構成の変化や状態の変化を容易に把握ができる。また、当該変化値を時間順序軸を持つグラフで時系列表示してもよい。この場合は一つの画面で複数の監視対象の変化の時間的傾向も把握できる。
(2)変化値の時系列を、時間順序軸を持つグラフで、監視対象の計測数値の時系列グラフと同じ画面に表示する。これによって計測数値の分析を構成や状態の変化を考慮しながら行うことが容易になる。
実施例について、図面を参照して説明する。なお、以下に説明する実施例は特許請求の範囲にかかる発明を限定するものではなく、また実施例の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。
なお、以下の説明では、「xxxテーブル」の表現にて各種情報を説明することがあるが、各種情報は、テーブル以外のデータ構造で表現されていてもよい。データ構造に依存しないことを示すために「xxxテーブル」を「xxx情報」と呼ぶことができる。
また、以下の説明では、「プログラム」を主語として処理を説明する場合があるが、プログラムは、コントローラに含まれるプロセッサ(例えばCPU(Central Processing Unit))によって実行されることで、定められた処理を、適宜に記憶資源(例えばメモリ)及び/又は通信インターフェースデバイス(例えば通信ポート)を用いながら行うため、処理の主語がプロセッサとされてもよい。プログラムを主語として説明された処理は、プロセッサ或いはそのプロセッサを有する管理システム(例えば、表示用装置(例えばクライアント)又は管理計算機(例えばサーバ))が行う処理としても良い。また、コントローラは、プロセッサそれ自体であっても良いし、コントローラが行う処理の一部又は全部を行うハードウェア回路を含んでも良い。プログラムは、プログラムソースから各コントローラにインストールされても良い。プログラムソースは、例えば、プログラム配布サーバ又は記憶メディアであっても良い。
なお、管理計算機は入出力デバイスを有する。入出力デバイスの例としてはディスプレイとキーボードとポインタデバイスが考えられるが、これ以外のデバイスであってもよい。また、入出力デバイスの代替としてシリアルインターフェースやイーサーネットインターフェース(イーサーネットは登録商標)を入出力デバイスとし、当該インターフェースにディスプレイ又はキーボード又はポインタデバイスを有する表示用装置を接続し、表示用情報を表示用装置に送信したり、入力用情報を表示用装置から受信することで、表示用装置で表示を行ったり、入力を受け付けることで入力デバイスでの入力及び表示を代替してもよい。
以後、計算機システムを管理する一つ以上の計算機の集合を、監視システムと呼ぶことがある。管理計算機が表示用情報を表示する場合は、管理計算機が監視システムである。また、管理計算機と表示用装置の組み合わせも監視システムである。また、管理処理の高速化や高信頼化のために複数の計算機で管理計算機と同等の処理を実現してもよく、この場合は、当該複数の計算機(表示を表示用装置が行う場合は表示用装置も含め)が監視システムである。
なお、以後の説明では装置や装置に含まれる部品、デバイス、及びプログラムをコンポーネントと呼ぶ。さらに、装置またはコンポーネントの両方を含めて監視する対象として示したい場合は監視対象と呼ぶ。
また、装置監視のために監視システムが監視対象から取得する情報を監視情報と呼ぶ。監視情報には以下のいずれか一つ以上が含まれる。
構成情報:例えば装置又はコンポーネントの識別情報、実装装着位置、設定。より具体的な種別の例としてはIPアドレス、装置のシリアル番号、ネットワークカードの識別子やPCIバス上の装着位置、コンポーネントの型式情報がある。
状態情報:装置又はコンポーネントの状態。より具体的な種別の例としては、コンポーネントの障害の有無がある。なお、ファン等の物理的なコンポーネントの温度は装置障害につながる点に於いては状態情報とも扱っても良い(特に所定の識別子と温度を比較する場合)。しかし、温度は後述する測定数値としても扱っても良い。同様な点はコンポーネントの負荷を示す数値(例えば、CPU利用率、メモリ使用率がある。これらは極端に率が上がると障害に近いほど機能不全になるからである。)
測定数値:装置又はコンポーネントを対象として測定した数値。より具体的な種別の例としてはCPU利用率、メモリ利用率(または使用量)、ディスク利用率(または使用量)又はIOPS又は転送帯域、通信帯域、通信レイテンシ、アプリケーションプログラムの単位時間当たりの処理数、がある。
図1は、実施例に係る計算機システムの構成図である。
計算機システムは、監視システム10、監視対象装置の一例としてのホストコンピュータ300、監視対象装置の一例としてのストレージサブシステム400を有する。計算機システムにおいて、ホストコンピュータ300、ストレージサブシステム400は、それぞれ一台であっても良く、複数台であっても良い。監視システム10は、例えば、ホストコンピュータで構成された管理計算機100と、ホストコンピュータ、又はクライアントPC等で構成された表示用装置200を含む。
監視システム10、ホストコンピュータ300及びストレージサブシステム400は、ネットワーク(例えばLAN(Local Area Network))600を介して接続される。ネットワーク600には、例えば、IP(Internet Protocol)スイッチ等のネットワーク装置500が含まれている。なお、ネットワーク装置500も監視対象装置の一例である。
この計算機システムにおいては、監視システム10の管理計算機100が、監視対象装置の一例であるホストコンピュータ300、ストレージサブシステム400、またはネットワーク装置500から、監視情報の一例としての監視数値、状態情報、及び構成情報を収集する。なお、図1のシステムに於いて、監視数値、状態情報、構成情報の一例は以下の通りである。
ネットワーク装置500がIPスイッチである場合には、状態情報としては、例えばIPスイッチのポートが正常な状態である正常状態、警告が必要な状態である警告状態、緊急な対処が必要な緊急状態、リンクダウンが発生しているリンクダウン状態等がある。
監視数値は、例えばコンポーネントの通信量、使用量等の性能についての情報である。例えば、ネットワーク装置500がIPスイッチである場合には、監視数値としては、IPスイッチのポートのネットワーク送信量や、パケット送信量等がある。また、ホストコンピュータ300の監視数値としては、CPUの使用量等がある。
構成情報とは、例えばノード(ホストコンピュータ300、ストレージサブシステム400、ネットワーク装置500等の監視対象装置)やコンポーネントのバージョン、名前等の構成についての情報である。例えば、ネットワーク装置500がIPスイッチである場合には、構成情報としては、IPスイッチを構成するポート、電源等の名前である。
表示用装置200は、管理計算機100から表示するための情報を受け付けて、監視対象装置についての性能、状態、構成等について監視画面を表示する。
なお、以下の説明では管理計算機100による監視情報の取得はポーリングと呼ばれる、情報取得要求を監視対象の装置に送信することで監視情報を取得する処理で行われる。しかし、監視情報の少なくとも一部の情報はポーリング以外の処理で取得されてもよい。
なお、監視情報の取得をポーリングで行う場合でも、以下のいずれかの理由によって、全ての監視対象を同じ時間間隔で取得するとは限らない。
(1)管理計算機100の負荷によって間隔を守れない場合。
(2)ユーザ指示によって一定間隔以外に追加でポーリングを実行した場合。
(3)構成情報の具体的な各種情報は、状態情報又は測定数値に属する具体的な情報よりも、変化が起きない傾向にある。そのため、管理計算機100、ネットワーク、又は監視対象のポーリング負荷を軽減したり、又は構成情報を履歴で持つ場合のコストを削減するため、構成情報のポーリング間隔を状態情報・測定数値のポーリング間隔よりも長くした場合。
(4)上記(3)のような情報の種類以外にも、特定の装置やコンポーネントの構成、状態、測定数値の変化が他の装置やコンポーネントよりも穏やかであることが分かっている場合もある。この場合は変化が穏やかな装置やコンポーネントに対して(3)と同様に長いポーリング間隔を適用する場合もありえる。
なお、ポーリングによって監視対象の構成や状態の変化を特定する場合、変化を特定したポーリングの時間と、前回変化を特定できなかったポーリングの時間と、の間(時間間隔)でこの変化が発生したと特定される。本実施例の変化値はこの時間間隔が長くなると値の絶対値が小さくなる特徴を持たせ、より短い取得時間間隔内で発生した変化が分析上有益であることをアピールした。これは変化値と測定数値の時系列的な変化を比較分析する時に特に有益である。しかし、時系列変化を分析しない場合でも、前述の時間間隔と変化値の関係は有用である。例えば、ある時間における複数の監視対象の変化値を比較すれば、変化値が小さい監視対象の変化は比較的昔に起きた可能性があることを示唆している。
なお、以後の説明ではその一例として監視情報の種類によってポーリング間隔を変える場合を説明しているが、監視情報の種類以外でもポーリング間隔を変える場合にも適用できることは言うまでもない。
図2は、実施例に係るホストコンピュータの構成図である。
ホストコンピュータ300は、ポート310と、プロセッサ320と、メモリ330とを有する。ポート310は、ネットワーク600を介しての通信を仲介する。メモリ330は、プロセッサ320によって実行されるプログラム及びプロセッサ320によって必要とされる情報等を記憶する。本実施例では、メモリ330は、アプリケーション331、オペレーティングシステム332、装置管理プログラム333等のプログラムを記憶する。装置管理プログラム333は、管理計算機100にホストコンピュータ300の構成情報、監視数値、状態情報を送信するためのプログラムである。プロセッサ320は、メモリ330に格納されたプログラムを実行することにより各種処理を実行する。例えば、プロセッサ320は、装置管理プログラム333を実行することにより、管理計算機100からのポーリングがあると、ポーリングで要求されたホストコンピュータ300の情報(監視情報:構成情報、監視数値、又は状態情報)を管理計算機100にポート310を介して送信する。
図3は、実施例に係るストレージサブシステムの構成図である。
ストレージサブシステム400は、ストレージコントローラ410と、複数のディスク装置420とを有する。
ストレージコントローラ410は、I/Oポート411と、管理ポート412と、プロセッサ413と、メモリ及び/又はディスク装置で構成される記憶資源414とを有する。I/Oポート411は、ネットワーク600を介してホストコンピュータ300等との通信を仲介する。管理ポート412は、ネットワーク600を介して管理計算機100との通信を仲介する。記憶資源414は、プロセッサ413によって実行されるプログラム及びプロセッサ413によって必要とされる情報等を記憶する。本実施例では、記憶資源414は、装置管理プログラム415等のプログラムを記憶する。装置管理プログラム415は、管理計算機100にストレージサブシステム400の構成情報、監視数値、状態情報を送信するためのプログラムである。プロセッサ413は、記憶資源414に格納されたプログラムを実行することにより各種処理を実行する。例えば、プロセッサ413は、装置管理プログラム415を実行することにより、管理計算機100からのポーリングがあると、ポーリングで要求されたストレージサブシステム400の情報(構成情報、監視数値、又は状態情報)を管理計算機100に管理ポート412を介して送信する。
本実施例では、複数のディスク装置420の記憶領域によりRAID(Redundant Array of Independent (or Inexpensive) Disksの略))グループ421が構成されている。RAIDグループ421の記憶領域は、ボリューム422の記憶領域として割り当てられる。
ストレージサブシステム400においては、ディスク装置420に加えて、又は、ディスク装置420に代えて、他種の記憶メディアを有する記憶デバイス(例えばフラッシュメモリドライブ)を備えても良い。
図4は、実施例に係るネットワーク装置の構成図である。
ネットワーク装置500は、例えば、IPスイッチであり、複数のポート501と、管理ポート502と、プロセッサ503と、メモリ及び/又はディスク装置で構成される記憶資源504とを有する。
ポート501は、ネットワーク600を介してホストコンピュータ300、ストレージサブシステム400等との通信を仲介する。管理ポート502は、ネットワーク600を介して管理計算機100との通信を仲介する。記憶資源504は、プロセッサ503によって実行されるプログラム及びプロセッサ503によって必要とされる情報等を記憶する。本実施例では、記憶資源504は、装置管理プログラム505等のプログラムを記憶する。装置管理プログラム505は、管理計算機100にネットワーク装置500の構成情報、監視数値、状態情報を送信するためのプログラムである。プロセッサ503は、記憶資源504に格納されたプログラムを実行することにより各種処理を実行する。例えば、プロセッサ503は、装置管理プログラム505を実行することにより、管理計算機100からのポーリングがあると、ポーリングで要求されたネットワーク装置500の情報(構成情報、監視数値、又は状態情報)を管理計算機100に管理ポート502を介して送信する。なお、監視対象装置は管理ポート以外から監視情報を送信してもよい。
図5は、実施例に係る管理計算機の構成図である。
管理計算機100は、ポート101と、プロセッサ102と、入力/出力デバイス103と、メモリ及び/又はディスク装置で構成される記憶資源104とを有する。
ポート101は、ネットワーク600を介して、複数の監視対象装置(ホストコンピュータ300、ストレージサブシステム400、ネットワーク装置500等)との通信を仲介する。入力/出力デバイス103は、例えば、マウス、キーボード等の入力デバイスや、液晶ディスプレイ等の出力デバイス(表示デバイス)を含み、管理計算機100のオペレータからの入力を受け付けるとともに、オペレータへの情報を表示出力する。
記憶資源104は、プロセッサ102によって実行されるプログラム及びプロセッサ102によって必要とされる情報等を記憶する。本実施例では、記憶資源104は、オペレーティングシステム110と、管理プログラム140等のプログラムを記憶する。管理プログラム140は、監視対象装置(ノード)及び/又は監視対象装置の構成部品(コンポーネント)の構成情報、監視数値、状態情報を収集し、また、監視対象装置の構成、性能、状態等に関するグラフや情報を含む監視画面を表示用装置200に表示させるためのプログラムである。
また、計算資源104は、構成情報管理テーブル(ノード)121と、構成情報管理テーブル(コンポーネント)122と、グループテーブル123と、表示条件・フィルタ条件定義テーブル124と、イベントテーブル125と、イベント集計テーブル126と、イベント検索結果テーブル127と、イベント集計結果テーブル128と、ポーリング(Polling)タイマーテーブル129と、変更種別テーブル130と、時間幅Aテーブル131と、表示条件・フィルタ条件テーブル132と、フィルタテーブル133と、収集情報テーブル134と、監視数値管理テーブル139と、を記憶する。収集情報テーブル134は、監視対象を特定する情報と、監視対象装置の監視数値種別を識別する情報と、監視対象から収集した監視数値と、収集した時刻とを対応付けて記憶する。例えば、収集情報テーブル134は、監視対象装置のCPUを特定する情報と、監視対象装置の監視数値の一例であるCPUの使用率を示す情報と,監視数値値(CPU使用率の値)と、ポーリングを開始した時刻とを対応付けて記憶する。
プロセッサ102は、記憶資源104に格納されたプログラムを実行することにより各種処理を実行する。例えば、プロセッサ102は、管理プログラム140を実行し、各テーブル121〜134、139等を利用することで、監視対象装置の監視処理を実行する。
図6は、実施例に係るポーリングタイマーテーブルの構成図である。
Pollingタイマーテーブル(TBL_POLLING)129は、各監視対象装置に対して情報を収集するためのポーリングを実行する時刻を管理するためのテーブルである。
Pollingタイマーテーブル129は、情報種類と、間隔と、次回情報収集開始時刻とを含む。情報種類は、Pollingで取得する情報の種類であり、本実施例では、状態情報、監視数値、及び構成情報がある。間隔は、対応する種類の情報を取得するためのPollingを実行する間隔である。本実施例では、状態情報については、15分間隔でPollingを実行し、監視数値については、5分間隔でPollingを実行し、構成情報については、1日間隔でPollingするように設定されている。すなわち、本実施例では、状態情報、監視数値、構成情報については、異なる時間間隔でPollingを行うように設定されている。なぜなら、状態情報、監視数値及び構成情報は、それぞれの情報を必要とする頻度、何らかの変化が生じてから次に何らかの変化が生じると考えられる平均的な時間、及び、それぞれの情報のサイズ、のうちの少なくとも1つが、情報の種類によって異なるからである。次回情報収集開始時刻は、次回の情報を収集するPollingを開始する時刻である。
図7は、実施例に係るノードについての構成情報管理テーブルの構成図である。
ノード(監視対象装置)についての構成情報管理テーブル(TBL_NODE)121は、ノードIDと、ノードタイプと、ノード名と、IPアドレスと、認証情報(ID/パスワード)と、情報収集開始時刻と、グループIDとを含む。
ノードIDは、ノードを一意に識別する識別子である。ノードタイプは、ノードの種類である。ノードの種類としては、例えば、サーバ(SERVER)、ストレージ(STORAGE)、ファイバチャネルスイッチ(FC-Switch)等がある。ノード名は、ノードに対して与えられた名称である。IPアドレスは、ノードに対して割り当てられているIPアドレスである。情報収集開始時刻は、その情報を収集した際のPolling開始時刻(情報収集開始時刻)である。グループIDは、複数のノードにより構成されたグループについての一意な識別子である。グループを用いることで、複数のノードを、グループを単位として各種処理に利用することができる。
例えば、同図の1番目のレコードによると、ノードIDが“Server1”のノードは、ノードの種類が“SERVER”であり、ノード名が“Server1”であり、IPアドレスが“111.112.113.101”であり、認証情報のIDが“Administrator”であり、パスワードが“AdminPW1”であり、その情報を収集した際のPolling開始時刻は、“2010/6/8 18:20”であり、当該ノードのグループIDは“Server1”であることがわかる。
図8は、実施例に係るコンポーネントについての構成情報管理テーブルの構成図である。
コンポーネントについての構成情報管理テーブル(TBL_COMPO)122は、コンポーネントIDと、コンポーネントタイプと、コンポーネント名と、親ノードIDとを含む。
コンポーネントIDは、ノードを構成するコンポーネント(構成部品)を一意に識別する識別子である。コンポーネントタイプは、コンポーネントの種類である。コンポーネントの種類としては、LANアダプター(LAN_ADAPTER)、ISCSIディスク(ISCSI_DISK)、アプリケーション(APPLICATION)、ファイルシステム(FILE_SYSTEM)、ストレージディスク(STORAGE_DISK)、ストレージボリューム(STORAGE_VOLIME)、ストレージ論理ユニット(STORAGE_LU)、ファイバチャネルポート(FC_PORT)等がある。コンポーネント名は、コンポーネントに対して与えられた名称である。親ノードIDは、対応するコンポーネントの親となるノードの識別子である。
例えば、同図の1番目のレコードによると、コンポーネントIDが“Server1/LAN_Adapter1”のコンポーネントは、種類が“LAN_ADAPTER”であり、コンポーネント名が“LAN_Adapter1”であり、親ノードのIDが“Server1”であることがわかる。
図9は、実施例に係るグループテーブルの構成図である。
グループテーブル123(GRP_NODE)は、監視対象装置のグループを管理するためのテーブルである。グループテーブル123は、グループIDと、グループ名と、ノード名とを含む。
グループIDは、グループを一意に識別する識別子である。グループ名は、グループに対して与えられた名称である。ノード名は、対応するグループに所属するノードの名称である。
例えば、同図の1番目のレコードによると、グループIDが“Server1”のグループは、グループ名が“SERVER1”であり、Server1,Server2,Server3のノードが所属していることがわかる。
図10は、実施例に係るイベントテーブルの構成図である。
イベントテーブル125(TBL_EVT)は、前回情報を収集した時点の後から今回情報を収集した時点までの間に発生した構成変更や、状態変更等のイベントを管理するテーブルである。イベントテーブル(TBL_EVT)125は、イベントIDと、ノードIDと、コンポーネントIDと、イベント又は状態の種類と、前回情報収集開始時刻と、カテゴリと、情報収集開始時刻と、ノード変更種別と、コンポーネント変更種別とを含む。
イベントIDは、イベントを一意に識別する識別子である。ノードIDは、対応するイベントに関連するノードの識別子である。コンポーネントIDは、対応するイベントに関連するコンポーネントの識別子である。イベント又は状態の種類は、対応するイベントの種類又は状態である。前回情報収集開始時刻は、当該イベントに対応する情報についての収集を前回開始した時刻(前回の取得時の基準時刻)である。カテゴリは、収集した情報の種類である。したがって、カテゴリは例えば構成(Configuration)、状態(Status)をとることが考えられるが、監視数値(monitoring numeric value)といった値をとってもよい。情報収集開始時刻は、今回の情報の収集を開始した時刻(今回の取得時の基準時刻)である。ノード変更種別は、ノードについての変更種別である。変更種別としては、ノードを変更したことを示す変更(Changed)、ノードを追加したことを示す追加(Added)、ノードを削除したことを示す削除(Removed)等がある。コンポーネント変更種別は、コンポーネントについての変更種別である。変更種別としては、コンポーネントを変更したことを示す変更(Changed)、コンポーネントを追加したことを示す追加(Added)、コンポーネントを削除したことを示す削除(Removed)、コンポーネントの変更をしていないことを示す変更なし(Not
Changed)等がある。
Changed)等がある。
図11は、実施例に係るイベント集計テーブルの構成図である。
イベント集計テーブル126(TBL_EVTTOTAL)は、時刻と、変化値と、ノード変更種別と、コンポーネント変更種別と、ノードIDと、コンポーネントIDとを含む。
ノード変更種別は、ノードについての変更種別である。コンポーネント変更種別は、コンポーネントについての変更種別である。ノードIDは、ノードの識別子である。コンポーネントIDは、コンポーネントの識別子である。変化値は、対応するノードのコンポーネントにおける変更種別に対応する変更のイベントの発生回数を、当該時刻が示す所定の時間単位(本実施例では、単位時間、例えば1分)の量(変化値)に変換したものである。ここで、本実施例では、変化値は、イベントの回数を、イベントが発生したと考えられる時間幅(ポーリング間隔、より具体的には、前回情報収集開始時刻と今回の情報収集開始時刻との時間幅)で除算することにより得られる。ただし、この変化値を求めるための変換処理は一例である。このイベント集計テーブル126においては、ポーリング間隔内の各所定の時間単位に対して、イベントの回数に対応する変化値が対応付けられて記憶される。すなわち、ポーリング間隔よりも短い時間を単位として、イベントの発生に関する値を管理することができる。これにより、このイベント集計テーブル126のレコードを用いることにより、ポーリング間隔よりも細かい時間幅で、イベントの発生のグラフを適切に表示することができる。
例えば、同図の1番目のレコードによると、”6/8 18:10”が示す単位時間において、ノードIDが“Server2”のノードの、コンポーネントIDが“Server2/Application1”のコンポーネントにおける追加(Added)のイベントの変化値は、0.01であることがわかる。
図12は、実施例に係る表示条件・フィルタ条件テーブル、表示条件・フィルタ条件定義テーブル及びフィルタテーブルの構成図である。
表示条件・フィルタ条件テーブル132(TBL_EVTFILTER)は、表示用装置200における監視画面で選択されている表示条件及びフィルタ条件を格納する。設定可能な条件としては、ノードIDと、コンポーネントIDと、ノード変更種別と、コンポーネント変更種別と、時間幅Aと、時間幅B(対象時間幅)とがある。時間幅Aは、監視画面に表示されるグラフの時間軸の全体の幅であり、時間幅Bは、時間幅Aの中でユーザが選択した時間幅である。同図においては、ノードIDが“Server1”のノードの、コンポーネントIDが“Server1/CPU”のコンポーネントについての、すべてのノード変更種別を対象とし、すべてのコンポーネント変更種別を対象とし、時間幅Aを12時間とし、時間幅Bを6時間とすることが選択されていることを示している。
表示条件・フィルタ条件定義テーブル124(TBL_EVTFILTERDEFINE)は、監視画面に表示するグラフ(マップ)等の種類毎に、当該マップ等の作成に必要となるイベントを検索する条件を検出するためのフィルタを示すテーブルである。同図においては、検索に必要な条件を白色で表示し、不必要な条件を灰色で表示している。例えば、イベントリストを表示するための条件としては、ノード変更種別と、時間幅Bと、ノードIDと、コンポーネントIDとである。また、ノードマップを表示するための条件としては、ノード変更種別と、時間幅Aと、ノードIDとである。
フィルタテーブル133(TBL_FILTER)は、表示条件・フィルタ条件テーブル132の内容に対して、表示条件・フィルタ条件定義テーブル124のフィルタを適用した際におけるフィルタの名称を格納する。本実施例では、表示条件・フィルタ条件テーブル132の内容から、表示条件・フィルタ条件定義テーブル124の各フィルタにおいて必要な条件の内容を取り出して組み合わせたものをフィルタ名としている。フィルタテーブル133のイベントリストのフィルタに対するフィルタ名Aは、表示条件・フィルタ条件テーブル132の内容のうちで、イベントリストのフィルタに必要なノード変更種別、時間幅B、ノードID、コンポーネントIDについて抽出した“全て、なし、なし、6時間、Server1、CPU”である。
図13は、実施例に係るイベント集計結果テーブルの構成図である。
イベント集計結果テーブル128(TBL_EVTTOTALRESULT)は、表示条件・フィルタ条件テーブル132に指定された内容により検索した際におけるフィルタ名と、当該フィルタを用いてイベント集計テーブル126から検索された検索結果とを格納するテーブルである。
イベント集計結果テーブル128は、フィルタ名と、時刻と、変化値と、ノード変更種別と、コンポーネント変更種別と、ノードIDと、コンポーネントIDとを含む。フィルタ名は、検索した際に利用したフィルタ名である。時刻、変化値、ノード変更種別、コンポーネント変更種別、ノードID、及びコンポーネントIDは、検索条件を用いてイベント集計テーブル126から得られたイベント(イベントのレコード)について集計したものである。このイベント集計結果テーブル128によると、条件に合致するイベントについての所定の単位の時間幅を示すレコードを適切に管理することができる。
図14Aは、実施例に係るイベント検索結果テーブルの構成図である。図14Bは、実施例に係る変更種別テーブルの構成図である。図14Cは、時間幅Aテーブルの構成図である。
イベント検索結果テーブル127(TBL_EVTRESULT)は、表示条件・フィルタ条件テーブル132に指定された条件に合致し、時間幅Bで指定された時間内に発生した可能性のあるイベントを格納するテーブルである。イベント検索テーブル127は、イベントIDと、ノードIDと、コンポーネントIDと、イベント又は状態の種類と、前回情報収集開始時刻と、カテゴリと、情報収集開始時刻と、ノード変更種別と、コンポーネント変更種別と、確率とを含む。イベントID、ノードID、コンポーネントID、イベント又は状態の種類、前回情報収集開始時刻、カテゴリ、情報収集開始時刻、ノード変更種別、及びコンポーネント変更種別は、イベントテーブル125から特定されたイベントのレコードの内容である。確率は、対応するイベントが時間幅Bにおいて生じる確率(発生確率)である。本実施例では、イベントが発生した可能性のある時間幅に占める、イベントが発生した可能性のある時間幅と時間幅Bとの重複する時間の割合である。
変更種別テーブル130(TBL_EVTPAT)は、ノード変更種別及びコンポーネント変更種別についての選択候補を格納する。選択候補としては、ノード変更種別及びコンポーネント変更種別がいずれでもいいことを示す“Any”、ノード変更種別がノードの追加であることを示す“Added node”、ノード変更種別がノードを取り除いたことを示す“Removed node”、ノード変更種別がノードの変更であり、且つコンポーネント変更種別がコンポーネントの追加であることを示す“changed node - Added component”等がある。
時間幅Aテーブル131(TBL_TIMEPAT)は、時間幅Aの選択候補を格納する。選択候補としては、1時間、6時間、12時間、24時間、7日等がある。
図29は、実施例に係る監視数値管理テーブルの構成図である。
監視数値管理テーブル139(TBL_MONITORVAL)は、時刻と、ノードIDと、コンポーネントIDと、監視数値種別と、監視数値とを含む。
時刻は、情報収集開始時刻である。ノードIDは、ノードの識別子である。コンポーネントIDは、コンポーネントの識別子である。監視数値種別は、監視数値の種別である。監視数値は、監視数値である。
図15は、実施例に係る管理プログラムの構成図である。
管理プログラム140は、Pollingタイマー141と、構成情報収集部142と、状態情報収集部143と、監視数値収集部144と、DB格納部145と、イベント作成部146と、イベント集計登録部147と、イベント登録部148と、イベント集計結果作成部149と、イベント検索結果作成部150とを有する。
Pollingタイマー141は、Pollingタイマーテーブル129を用いて、状態情報、監視数値、構成情報の収集を開始する時間を計測し、構成情報収集部142、状態情報収集部143、監視数値収集部144に通知する。構成情報収集部142は、構成情報を監視対象装置から収集する。状態情報収集部143は、状態情報を監視対象装置から収集する。監視数値収集部144は、監視数値を監視対象装置から収集する。DB格納部145は、収集した各種情報を、前回収集している各種情報と比較する。イベント作成部146は、イベント作成処理を実行する。イベント作成処理については後述する。イベント集計登録部147は、イベント集計処理を実行する。イベント集計処理については、後述する。イベント登録部148は、イベント作成部146により作成されたイベントを登録する処理を実行する。イベント集計結果作成部149は、イベント集計結果処理を実行する。イベント集計結果処理については後述する。イベント検索結果作成部150は、イベント検索結果処理を実行する。イベント検索結果処理については、後述する。
図16は、実施例に係る表示用装置の構成図である。
表示用装置200は、ポート201と、プロセッサ202と、メモリ及び/又はディスク装置で構成される記憶資源204とを有する。
ポート201は、ネットワーク600を介して、管理計算機100との通信を仲介する。入力/出力デバイス203は、例えば、マウス、キーボード等の入力デバイスや、液晶ディスプレイ等の出力デバイスを含み、表示用装置200のオペレータからの入力を受け付けるとともに、オペレータへの情報を表示出力する。記憶資源204は、プロセッサ202によって実行されるプログラム及びプロセッサ202によって必要とされる情報等を記憶する。本実施例では、記憶資源204は、表示プログラム205等を記憶する。表示プログラム205は、管理計算機100から送信される情報に基づいて、監視対象装置の構成、性能、状態等を含む監視画面を入力/出力デバイス203に表示させるためのプログラムである。プロセッサ202は、記憶資源204に格納されたプログラムを実行することにより各種処理を実行する。例えば、プロセッサ202は、表示プログラム205を実行することにより、入力/出力デバイス203からオペレータの各種入力を受け付けるとともに、管理計算機100からの情報に基づいて、監視対象装置についての構成、性能、状態に関する監視画面を入力/出力デバイス203に表示させる。
図17は、実施例に係る表示プログラムの構成図である。
表示プログラム205は、イベント表示部206と、イベントマップ表示部207と、監視数値表示部とを有する。イベント表示部206は、監視対象装置に発生したイベントの情報を表示させる。イベントマップ表示部207は、監視対象装置に発生したイベントについてのマップ、すなわち、時間変化に対するイベントの発生のグラフを表示させる。監視数値表示部は、監視対象から取得した監視数値を表示させる。
なお、表示プログラム205の記憶資源204への格納は、表示用装置からのリクエストに応じて管理計算機100が当該プログラムを表示用装置に送信されることで行われても良い。表示プログラム205と管理プログラム140は元々は同じ記憶媒体に格納されていてもよく、別々な記憶媒体に格納されていてもよい。同様に、表示プログラム205と管理プログラム140は元々は同じプログラム配布計算機に格納されていてもよく、別々なプログラム配布計算機に格納されていてもよい。
次に、実施例に係る計算機システムの処理を説明する。
図18は、実施例に係る計算機システムにおける全体の処理を説明する図である。
管理計算機100のプロセッサ102が管理プログラム140を実行することにより、Pollingタイマー処理を実行し、所定の時間になった際に、情報収集処理を実行する。そして、プロセッサ102は、収集した情報と、構成DB135(構成情報管理テーブル(ノード)121、構成情報管理テーブル(コンポーネント)122)の情報とを用いてDB格納処理を実行する。次いで、プロセッサ102は、DB格納処理により変更があった情報について、イベント作成処理を実行し、イベントをイベントDB136(イベントテーブル125)に登録する。また、プロセッサ102は、イベント集計処理を実行し、集計結果をイベント集計DB137(イベント集計テーブル126)に格納する。DB格納処理はまた、監視数値を監視数値DB138(監視数値管理テーブル139)に格納する。
一方、表示用装置200のプロセッサ202が表示プログラム205を実行することにより、イベントマップ表示処理を実行し、管理計算機100にイベント集計結果処理を実行させる。管理計算機100のプロセッサ102は、イベント集計結果処理を実行し、イベント集計DB137(イベント集計結果テーブル128)に格納するとともに、集計結果を表示用装置200に送信する。表示用装置200は、集計結果を用いて入力/出力デバイス203に監視画面を表示する。
また、表示用装置200のプロセッサ202がイベント表示処理を実行し、管理計算機100にイベント検索結果処理を実行させる。管理計算機100のプロセッサ102は、イベント検索結果処理を実行し、イベント集計DB137(イベント検索結果テーブル127)に格納するとともに、検索結果を表示用装置200に送信する。表示用装置200は、検索結果を用いて入力/出力デバイス203に監視画面を表示する。
管理プログラム205はまた、管理プログラム140から監視数値DB138に格納された値を取得し、監視数値を入力/出力デバイス203に表示する(監視数値表示処理)。
図19Aは、実施例に係るポーリングタイマー処理のフローチャートである。図19Bは、実施例に係る情報収集処理のフローチャートである。
ポーリングタイマー処理においては、管理計算機100のプロセッサ102は、ステップS1〜S6のステップを繰り返し実行する。まず、プロセッサ102は、ポーリングタイマーテーブル129の各情報種別の次回情報収集開始時刻を取り出し(ステップS2)、次回情報収集開始時刻に来るまで待機し(ステップS3)、次回情報収集開始時刻になった場合には、情報収集処理を実行する(ステップS4)。次いで、プロセッサ102は、ポーリングタイマーテーブル129の情報収集処理を行った対象情報についての次回情報収集開始時刻に、間隔を加算することにより、次回情報収集開始時刻を更新する(ステップS5)。そして、ステップS1〜S6の処理を繰り返すことにより、各情報種類の情報についての情報収集処理が行われる。
情報収集処理において、プロセッサ102は、構成情報管理テーブル121の各ノードIDのノードに対して、ステップS11〜S14の処理を繰り返し実行する。
まず、プロセッサ102は、構成情報管理テーブル121のIPアドレス、認証情報を用いて対応するノードから、今回収集すべき情報(構成情報、状態情報、又は監視数値)を収集し(ステップS12)、DB格納処理を実行する(ステップS13)。そして、プロセッサ102は、すべてのノードに対して処理を終えた後に、情報収集処理を終えて、ポーリングタイマー処理に戻る。
図20Aは、実施例に係るDB格納処理のフローチャートである。図20Bは、実施例に係るイベント作成処理のフローチャートである。
DB格納処理では、プロセッサ102は、収集した監視情報に監視数値が含まれる場合は監視数値管理テーブル139に収集した監視数値を格納する(ステップS200)。プロセッサ102は、収集情報テーブル134から前回収集した情報を取得し(ステップS21)、今回収集した情報と比較する(ステップS22)。
この結果、今回収集した情報が前回収集した情報と一致する場合(例えば、収集した情報が状態情報であれば、状態が一致する場合であり、収集した情報が構成情報であれば、監視対象装置の構成が一致する場合である)(ステップS23でYes)には、構成の変更、状態の変更のイベントが発生していないので、プロセッサ102は、処理をステップS26に進める。
一方、今回収集した情報が前回収集した情報と一致しない場合には、前回収集した時点から今回収集するまでの間に、状態を変更するイベントや、構成が追加、変更、削除等されたイベントが発生したことを意味しているので、プロセッサ102は、イベント作成処理を実行する(ステップS24)。次いで、プロセッサ102は、構成情報管理テーブル(ノード)121と、構成情報管理テーブル(コンポーネント)122とについて新たな情報を反映させ(ステップS25)、ステップS26に処理を進める。
ステップS26では、プロセッサ102は、構成情報管理テーブル(ノード)121の情報収集開始時刻を今回の情報収集開始時刻に更新し、DB格納処理を終えて、情報収集処理に戻る。
イベント作成処理では、プロセッサ102は、発生したイベントに対応するレコードを作成し(ステップS31)、当該イベントのレコードをイベントテーブル125に追加する(ステップS32)。ここで、構成変更についてのイベントのレコードの前回情報収集開始時刻は、構成情報管理テーブル(ノード)121の情報収集開始時刻とし、情報収集開始時刻は、今回の情報収集開始時刻とする。
次いで、プロセッサ102は、イベント集計処理を実行し(ステップS33)、DB格納処理に戻る。
図21は、実施例に係るイベント集計処理のフローチャートである。
イベント集計処理では、プロセッサ102は、イベントに対応するレコードの前回情報収集開始時刻と情報収集開始時刻とからイベントが発生した時間幅を特定し(ステップS41)、イベントの発生回数を特定した時間幅で除算して、単位時間当たりの発生回数である変化値を算出する(ステップS42)。次いで、プロセッサ102は、イベント集計テーブル126における前回情報収集開始時刻と情報収集開始時刻との間に含まれる時間のレコードであって、イベントに対応するノード及びコンポーネントのレコードについての変化値に対して算出した変化値を加算し(ステップS43)、イベント作成処理に戻る。なお、ステップS43において、特定した時間幅に含まれる複数の時間単位に対応するレコードであって、イベントに対応するノード及びコンポーネントについてのレコードがない場合には、当該レコードをイベント集計テーブル126に作成する。
図22Aは、実施例に係るイベントマップ表示処理のフローチャートである。図22Bは、実施例に係るイベント表示処理のフローチャートである。図22Cは、実施例に係る監視数値表示処理のフローチャートである。
イベントマップ表示処理では、表示用装置200のプロセッサ202は、監視画面上で選択された表示条件を取得し(ステップS51)、管理計算機100に送信する。管理計算機100では、プロセッサ102が表示条件を受信し、イベント集計結果処理を実行する(ステップS52)。表示用装置200のプロセッサ202は、管理計算機100からイベント集計結果処理により返されたイベント集計結果に基づいた監視画面(図25参照)を生成し、表示する(ステップS53)。ここで、プロセッサ202は、性能を示すチャートと、変更イベントのマップとの時間軸を合わせて表示する。なお、イベントマップ表示処理は、例えば、監視画面(図25参照)を表示させる要求を表示用装置から受信した場合に実行が開始される。
イベント表示処理は、例えば、監視画面(図25参照)において、Changeタブ705が押下された場合に実行が開始され、表示用装置200のプロセッサ202は、監視画面上で選択された表示条件を取得し(ステップS71)、管理計算機100に送信する。管理計算機100では、プロセッサ102が表示条件を受信し、イベント検索結果処理を実行する(ステップS72)。表示用装置200のプロセッサ202は、管理計算機100からイベント検索結果処理により返されたイベント検索結果に基づいた監視画面(図26参照)を生成し、表示する(ステップS73)。
監視数値表示処理は、例えば、監視画面(図25参照)を表示させる要求を表示用装置から受信した場合に実行が開始される。その他の処理開始例としては、監視画面(図25参照)において、監視数値タブ705が押下された場合に実行が開始され、表示用装置200のプロセッサ202は、監視画面上で選択された表示条件を取得し、管理計算機100に送信する(ステップS75)。管理計算機100では、プロセッサ102が表示条件を受信し、表示条件に該当する監視数値を、監視数値管理テーブル139から読み出し、表示用装置200に送信する(図示は省略)。表示用装置200のプロセッサ202は、管理計算機100から受信した監視数値を表示する(ステップS76)。
図23は、実施例に係るイベント集計結果処理のフローチャートである。
イベント集計結果処理では、管理計算機100のプロセッサ102が、受信した条件を表示条件・フィルタ条件テーブル132に登録し、当該条件を表示条件・フィルタ条件定義テーブル124に当てはめて、各マップに対応するフィルタ名を導き出し、フィルタテーブル133に登録する(ステップS61)。
次いで、プロセッサ102は、イベント集計結果テーブル128の全レコードに対して、ステップS62〜S65の処理を実行する。
まず、プロセッサ102は、導き出したフィルタ名と、レコードのフィルタ名が一致するか否かを判定し(ステップS63)、一致するものがあった場合(ステップS63でYes)には、イベント集計結果テーブル128のフィルタ名が一致するすべてのレコードをイベント集計結果として表示用装置200に返す(ステップS64)。
一方、一致するものがなかった場合(ステップS63でNo)には、イベント集計テーブル126の全レコードに対して、ステップS66〜S69の処理を実行する。
プロセッサ102は、処理対象のレコードが表示条件・フィルタ条件に一致するか否かを判定し(ステップS67)、一致する場合(ステップS67でYes)には、導き出したファイル名をもったレコードをイベント集計結果テーブル128に追加し、当該レコードを表示用装置200に返す。一方、一致しない場合(ステップS67でNo)には、次のレコードに対しての処理に進む。
このイベント集計結果処理によると、条件に合ったイベント集計テーブル126のレコードが表示用装置200にイベント集計結果として返されることとなり、表示用装置200においては、図25に示すように、このレコードに基づいて、監視数値用表示領域704dには、監視対象装置に関する性能変化のグラフにおける時間軸と対応する時間軸(たとえば、共通する時間軸)をもつ、対象範囲におけるイベントの変化値のグラフが表示される。これにより、オペレータは、性能変化に関連するイベントの発生を容易かつ適切に把握することができる。
図24は、実施例に係るイベント検索結果処理のフローチャートである。
イベント検索結果処理では、管理計算機100のプロセッサ102が、受信した条件を表示条件・フィルタ条件テーブル132に登録し、イベントテーブル125の全レコードに対して、ステップS81〜S86の処理を実行する。
プロセッサ102は、処理対象のレコードの前回情報収集開始時刻が時間幅Bで指定した終了時刻より前であり、かつ今回の情報収集開始時刻が時間幅Bで指定した開始時刻よりも後であるか否かを判定する(ステップS82)。
この結果、処理対象のレコードの前回情報収集開始時刻が時間幅Bで指定した終了時刻より前であり、かつ今回情報収集開始時刻が時間幅Bで指定した開始時刻よりも後である場合(ステップS82でYes)には、プロセッサ102は、処理対象のレコードが、表示条件・フィルタ条件テーブル132の条件に該当するか否かを判定する(ステップS83)。この結果、処理対象のレコードが条件に該当する場合(ステップS83でYes)には、(Min(Ee,Ue)−Max(Eb,Ub))/(Ee−Eb)を計算することにより、時間幅Bにおいて当該レコードに対応するイベントが発生している確率を算出する(ステップS84)。ここで、Ebは、前回情報収集開始時刻を示し、Eeは、今回の情報収集開始時刻を示し、Ubは、時間幅Bの開始時刻を示し、Ueは、時間幅Bの終了時刻を示し、Min(X,Y)は、X,Yの内の小さいほうを示し、Max(X,Y)は、X,Yの内の大きいほうを示している。
次いで、プロセッサ102は、条件に該当したイベントのレコードの情報と、算出した確率をイベント検索結果テーブル127のレコードとして登録する(ステップS85)。なお、処理対象のレコードの前回情報収集開始時刻が時間幅Bで指定した終了時刻より前であり、かつ今回情報収集開始時刻が時間幅Bで指定した開始時刻よりも後でない場合(ステップS82でNo)、又は、処理対象のレコードが条件に該当しない場合(ステップS83でNo)には、プロセッサ102は、次のレコードへの処理に進む。
そして、すべてのレコードに対して処理を終えた場合には、プロセッサ102は、イベント検索結果テーブル127のレコードをイベント検索結果として表示用装置200に送信する。これにより、監視画面のChange表示領域705dには、時間幅Bにおいて発生した可能性のあるイベントについての情報(当該イベントの確率を含む)が表示される。したがって、オペレータは、監視画面により、時間幅Bにおいて発生した可能性のあるイベントを適切に把握することができる。また、時間幅Bにおけるイベントの発生確率を適切に把握することができる。
図25は、実施例に係る監視画面の表示例である。
監視画面700は、表示用装置200の表示プログラム250をプロセッサ202が実行することにより表示される。
監視画面700には、表示対象種別選択領域701と、表示対象選択領域702とが表示される。また、監視画面700には、選択されたタブの表示領域が表示される。タブとしては、監視数値タブ704tと、Changeタブ705tとがある。監視数値タブ704tが選択されている場合には、監視数値表示領域704dが表示され、Changeタブ705tが選択されている場合には、Change表示領域705dが表示される。同図においては、監視数値タブ704tが選択されて監視数値表示領域704dが表示されている。
表示対象種類選択領域701には、情報を表示させる対象となる種類の候補を選択可能に表示する。同図においては、グループ、サーバ、ストレージ、スイッチ等が候補として表示されており、グループAに属するサーバが選択されている状態を示している。
表示対象選択領域702は、表示対象種類選択領域701により選択された種類に属する装置(ノード)の候補を選択可能に表示する。同図においては、グループAのサーバである各Server1、Server2が表示され、Server1が表示対象として選択されている。
監視数値表示領域704dは、表示対象選択領域702において選択された対象についての各種情報を表示する。監視数値表示領域704dには、表示させるイベント種別を選択するイベント種別選択領域706と、表示させるグラフの全体の時間幅(時間幅A)を選択するための時間幅A選択領域707とが表示される。
また、監視数値表示領域704dには、監視数値の表示対象が選択可能に表示され、選択された対象の監視数値のグラフ710が表示される。監視数値のグラフ710は、例えば、管理計算機100のプロセッサ102により送信される収集情報テーブル134の情報に基づいて表示される。また、監視数値表示領域704dには、コンポーネントの構成変更イベントについてのグラフ(イベントマップ)711と、ノードの構成変更イベントについてのグラフ(イベントマップ)712と、グループの構成変更イベントについてグラフ(イベントマップ)713と、全デバイスの構成変更イベントのグラフ(イベントマップ)714とが表示される。監視数値のグラフ710と、グラフ711〜714とは、同一の時間軸(図中横軸)を用いて表示されている。したがって、監視数値の変化が起こっている時点における構成変更イベントの発生をグラフから容易かつ適切に把握することができる。グラフ711〜714においては、追加、変更、削除のそれぞれの構成変更イベントについて異なる態様(例えば、異なる色)で表示している。また、グラフ710、グラフ711〜714に対して、オペレータが注目する一部の時間幅(時間幅B)を指定することができるように、時間幅Bの開始時刻を指定する開始時刻指定バー725bと、時間幅Bの終了時刻を指定する終了時刻指定バー725eとが表示される。開始時刻指定バー725bと、終了時刻指定バー725eとは、入力/出力デバイス203によりドラッグすることにより移動可能となっている。
グラフ711〜714のそれぞれには、Changeタブ705tが選択された際に、グラフが表示している対象についてのChangeイベントを表示させるか否かを選択するための選択ボタン721〜724が表示される。なお、選択ボタン721〜724は、時間幅Bにおいて変更イベントが発生しているグラフでのみ指定できるように制御される。
なお、スペースの都合で図示は省略したが、グラフ711から714の時間軸にも目盛りを表示させてもよい。ただし、グラフ710も含め、完全に同じ目盛り単位である必要はない。例えば、グラフ710が5分単位の目盛りを備える一方でグラフ711から714が15分単位の目盛りであってもよい。つまり、共通の時間帯を示す目盛りの対(隣り合わなくてもいい)が各グラフに存在していればよいとも言える。
なお、変化値又は監視数値の両方を所定の期間を単位としたヒストグラムで表現する場合、変化値グラフの時間軸における所定の期間を示す軸上の長さと、監視数値グラフの時間軸における所定の期間を示す軸上の長さと、が同じであってもよい。この場合はヒストグラムでも両値の時間的推移が確認しやすい。
なお、変化値又は監視数値の片方が所定の期間を単位としたヒストグラムで表現し、残りの片方を通常のグラフで表示してもよい。この場合、ヒストグラム形式のグラフのヒストグラムの所定の期間を示す時間軸上の長さと、通常グラフの所定の期間を示す時間軸上の長さが同じであってもよい。この場合も両値の時間的推移が確認しやすい。
図26は、実施例に係る時間幅Bにおける変更イベントを示す監視画面の表示例である。
同図に示す監視画面は、Changeタブ705tが選択されてChange表示領域705dが表示されている場合の表示例である。Change表示領域705dには、監視数値表示領域704dにおいて指定された時間幅Bにおいて発生したイベントの情報が表示される。イベントの情報としては、例えば、機器名、変更部品、機種変更種別、部品変更種別、日時、状態、詳細情報、確率がある。確率は、時間幅Bにおいて、対応するイベントが発生した可能性を示す確率である。
次に、変形例について説明する。
本変形例は、上記実施例における監視画面を別の態様としたものである。
図27は、変形例に係る監視画面の表示例である。
変形例に係る監視画面700の監視数値表示領域704dには、変更イベントの履歴を表示させるためのChange Historyボタン730が表示される。また、監視数値表示領域704dには、監視数値の表示対象が選択可能に表示され、選択された対象の監視数値のグラフ710が表示されるとともに、時間幅Bの開始時刻を指定する開始時刻指定バー725bと、時間幅Bの終了時刻を指定する終了時刻指定バー725eとが表示される。
図28は、変形例に係るイベント発生履歴のグラフを含む監視画面の表示例である。図28は、図27に示す監視画面700で、Change Historyボタン730が押下された場合の監視画面の一例を示している。
図27に示す監視画面でChange Historyボタン730が押下されると、表示用装置200のプロセッサ202は、表示対象選択領域702において、イベントの発生履歴のグラフ(イベント発生履歴グラフ)を表示する。プロセッサ202は、イベント発生履歴グラフにおいて、構成変更に係るイベント(Change events)と、障害に係るイベント(Critical events)とを別の態様によって表示する。また、プロセッサ202は、イベント発生履歴グラフにおいて、監視数値表示領域705dにおいて指定された時間幅Bを特定できるように、時間幅Bの開始時刻を示す開始時刻バー730bと、時間幅Bの終了時刻を示す終了時刻バー730eを表示する。このように、イベント発生履歴グラフにおいて、時間幅Bを特定できるので、性能変化に対して関係しているイベントをイベント発生履歴グラフから適切に把握することができる。
以上、実施例を説明したが、本願請求項は、この実施例に限定されるものでなく、その趣旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
例えば、上記実施例では、図25に示す監視画面700において、小さい範囲であるコンポーネントのイベントマップから、より広い範囲のイベントマップへと、画面の上から順に配置するようにしていたが、本発明はこれに限られず、広い範囲のイベントマップから小さい範囲のイベントマップへと画面の上から順に配置するようにしてもよい。
また、上記実施例では、イベント集計テーブル126では、各レコードの時間幅を単位時間としていたが、本発明はこれに限られず、単位時間でなくてもよく、要は、所定の時間単位であればよい。
また、上記実施例では、情報取得時の基準時刻として、情報の取得を開始した時刻としていたが、上記実施例はこれに限られず、情報の取得を終了した時刻、または取得開始から取得終了までの間の時刻としてもよい。また、情報取得処理と時刻計測処理は同時に処理されるわけではなく、リアルタイム処理のようにアトミック処理が保証されているわけではないので、例え情報取得処理の前後で時刻計測をしたとしてもずれを生じるものである。実施例及び請求項にて取得時間または取得時刻とした場合は、これらの変形例が含まれているものとする。したがって、「xxx情報の取得時間(又は取得時刻)」と表記した場合の時間は、(1)当該時間を監視システムの利用者に表示した場合に、十分にxxx情報が取得できる時間を特定できる精度である、又は(2)当該時間に基づいて前回のxxx情報の取得時間との時間差又は時間間隔を計算できる精度である、を満たせば良い。この点は情報に限らず各種時間・時刻が関連する処理に共通である。当然ながら、開始時刻(開始時間)と終了時刻(終了時間)も同様である。
以上の説明では、1つ以上のプロセッサと1つ以上の記憶資源とを含み、監視対象装置又は/及び前記監視対象装置に含まれるコンポーネントを監視対象として監視する監視システムとして、前記1つ以上の記憶資源は、監視対象の監視情報を取得する第1の時間間隔及び第2の時間間隔とを格納し、前記第1の時間間隔と前記第2の時間間隔は、異なる監視対象又は監視情報の種類を適用対象とする。前記1つ以上のプロセッサは以下を実行することを説明した。
(A1)前記第1の時間間隔に従って、第1の監視対象の第1の種類の監視情報である第1監視情報を取得する。(A2)前記第2の時間間隔に従って、第2の監視対象の第2の種類の監視情報である第2監視情報を取得する。(B1)前記第1監視情報について前回からの変化を特定し、前記特定した変化及び前記第1の時間間隔に基づいて第1変化値を計算する。(B2)前記第2監視情報について前回からの変化を特定し、前記特定した変化及び前記第2の時間間隔に基づいて第2変化値を計算する。(C)前記第1変化値と前記第2変化値を同じ画面に表示させる。
なお、前記第1変化値及び前記第2変化値の計算は、計算の元とした時間間隔が長くなると変化値の絶対値が小さくなる特性を持つ所定の変換処理に基づいて生成される。この所定の変換処理の一例として、イベントの回数を前回の監視情報収集時間と今回の監視収集時間との時間間隔で除算した値を説明してきた。しかし、所定の変換処理は時間間隔が長くなると変化値の絶対値が小さくなる特性を持てば他の式であってもよい。これは、変化値が常に正の値である場合は、この特性は「時間間隔が長くなると変化値が小さくなる特性」であることを指し、変化値が常に負の値である場合は、この特性は「時間間隔が長くなると変化値が大きくなる」を指すとも言える。また、この所定の変換処理は「時間間隔が長くなると変化値がゼロに近づく」と言っても良い。
このような所定の変換処理は例えば、削除を意味するイベントの場合はイベントの回数をマイナスで扱うようにする例がある。その他イベントの回数を、時間間隔のn乗、またはlog関数、エクスポネンシャル関数で変換した値で除算してもよい。また、所定の変換処理はMax(イベントの回数×定数1−時間間隔×定数2, 0)のように、時間間隔がある一定値(定数1/定数2)を越えるとゼロになるものであってもよい。
なお、第1と第2の時間間隔は監視情報の種類によって使い分けてもよく、監視対象によって使い分けても良い。
なお、監視システムは、前記第1変化値の元となった第1監視情報の取得時間及び前回の取得時間の期間(第1期間)と、前記第2変化値の元となった第2監視情報の取得時間及び前回の取得時間の期間(第2期間)と、は少なくとも部分的には重複しており、前記第1変化値の表示は、前記第2変化値と時間的に関連しているように表示させてもよいことも説明した。この関連表示は例えば図25の画面がある(ただし、時系列表示をしない場合はグラフ表示である必要はない)。他の関連表示としては、表形式である時間枠に対応する第1変化値と第2変化値を行又は列で並べることも考えられるし、第1変化値と第2変化値とを直線などで結んで表示することも考えられる。なお、第1期間は典型的には第1の時間間隔であり、第2期間は典型的には第2の時間間隔である。そのため、例えば第1の時間間隔が1日で0時1分に取得し、第2の時間間隔が1時間おきで、0分ちょうどに取得する場合、第1期間は例えば2011/03/01 00:01:00から2011/03/02 00:01:00未満(1秒刻みの管理であれば00:00:59)であり、第2期間は例えば2011/03/01 00:00:00から01:00:00未満(1秒刻みの管理であれば00:59:59)である。したがって、重複する期間は2011/03/01の00:01:00から01:00:00未満(1秒刻みの管理であれば00:59:59)である(図30参照)。
なお、前記(C)は、(C1)時間順序を示す第1軸を基準に前記第1変化値を時系列に表示する第1グラフと、時間順序を示す第2軸を基準に前記第2変化値を時系列に表示する第2グラフと、を表示し、(C2)前記第1軸と前記第2軸は同じ方向を向き、(C3)前記重複期間を示す前記第1軸上の部分は、前記第1軸と所定の角度方向に移動すると、前記重複期間を示す前記第2軸上の部分と重ねてもよい。なお、図25ではグラフは堆積グラフを例としたが変化値を時系列に表示できるのであれば、他のグラフであってもよい。また、第1の変化値と第2の変化値は同じグラフに表示させてもよい。
なお、変化値の時系列表示は、時間順序を示す所定の行又は列を基準に前記第1変化値及び前記第2変化値を時系列に表示する表形式で表示してもよい。
なお、前記1つ以上の記憶資源は、前記第1の監視対象に関する第1の監視数値を含む監視数値時系列情報(例えば監視数値管理テーブルのような時系列情報)を格納し、前記1つ以上のプロセッサは、(D)時間順序を表す第3軸を基準に、前記第1の監視数値を時系列に表示する第3グラフを表示し、(D1)前記第1軸と前記第3軸は同じ方向を向き、(D2)前記重複期間を示す前記第1軸上の部分は、前記第1軸と前記所定の角度方向に移動すると、前記重複期間を示す前記第3軸上の部分と重ならせるようにしてもよい。なお、所定の角度方向とは典型的には図25の通り、横方向に延びた時間軸と直行した90度上である。しかし、ほぼ90度、45度、いずれの角度でもよい。これは表示用装置が3次元表示装置をそなえる場合も共通である。
なお、変化値の表示は図28に記したとおり所定の期間ごとのヒストグラムであってもよい。仮に図28の欄705dに図25の711から714のような変化値の時系列グラフを表示する場合でもヒストグラムと変化値グラフの開始日時と終了日時を縦にそろえておけば(つまり所定の角度が90度)、変化値同時の比較が行いやすい。これは、図28のケースで変化値をヒストグラム形式で表し、計測数値をグラフ形式で表した場合も同様である。
なお、前記1つ以上のプロセッサは、(E)所定の表示時間帯を指定した表示要求を受信し、(F)前記所定の表示時間帯内に発生した前記第1監視情報の変化を、前記所定の表示時間帯内に発生した確率と共に表示し、前記(F)の確率とは、前記第1監視情報の変化の元となった第1監視情報の取得時間及び前回の取得時間の期間が、前記所定の表示時間帯に含まれる比率によって計算されてもよい。なお、計算方法は前述の(Min(Ee,Ue)−Max(Eb,Ub))/(Ee−Eb)以外でもよい。典型的には他の数値が同じであれば、前述の期間(つまりEbからEe)と時間幅B(つまりUbからUe)の重なり度合いが多ければ値が高くなる傾向にある関数を用いればよい。
なお、前記第1の監視対象は所定の監視対象装置に含まれる所定のコンポーネントであって、前記第1監視情報についての前回からの変化とは、前記所定のコンポーネントの追加、変更、または削除であり、前記第2の監視対象は、前記所定の監視対象装置であって、前記第2監視情報についての前回からの変化とは、少なくとも前記所定のコンポーネント以外の前記所定の監視対象装置に含まれるコンポーネントの追加、変更、または削除であってもよい。
以上の説明は見方を変えると、監視対象装置又は/及び監視対象装置に含まれるコンポーネントを監視対象として監視する方法であって、(a0)複数の前記監視対象について監視情報を取得する複数の時間間隔を格納し、(A)前記複数の時間間隔に従って、複数の前記監視対象から複数の前記監視情報を取得し、(B)複数の前記監視情報の各々について、前回からの変化と時間間隔に基づいて変化値を計算し、(C)複数の前記監視情報に対応する複数の前記変化値を同じ画面に表示させ、前記変化値の計算は、計算の元とした時間間隔が長くなると前記変化値の絶対値が小さくなる特性を持つ所定の変換処理に基づいて生成される、とも言える。
また、複数の前記変化値の各々は、計算の元となった監視情報の取得時間と前回の取得時間の期間が他の変化値の期間と少なくとも部分的に重複しており、(C)の表示は、ある前記変化値と他の前記変化値とが時間的に関連していることを示す、とも言える。
また、前記(C)の変化値の表示は、時間順序を示す第1軸を基準に複数の前記変化値を時系列に表示する複数の変化値グラフを表示し、複数の前記第1軸は、同じ方向を向き、同じ時間目盛り間隔である、とも言える。
また、所定の監視対象に関する所定の監視数値を含む監視数値時系列情報を格納し、時間順序を示す第2軸を規準に前記監視数値を時系列に表示する数値グラフを表示し、前記第1軸と前記第2軸は、同じ方向を向き、前記第1軸の所定の期間を示す第1の部分の長さと、前記第2軸の前記所定の期間を示す第2の部分の長さと、は等しい、とも言える。
また、(E)所定の表示時間帯を指定した表示要求を受信し、(F)前記所定の表示時間帯内に発生した前記監視情報の変化を、前記所定の表示時間内に発生した確率と共に表示し、前記(F)の確率とは、前記変化の元となった監視情報の取得時間及び前回の取得時間の期間が、前記所定の表示時間帯に含まれる比率によって計算される、とも言える。
また、複数の前記監視対象は少なくとも所定の監視対象装置及び前記所定の監視対象装置に含まれる所定のコンポーネントを含み、前記所定のコンポーネントに関する前記監視情報の前回からの変化とは、前記所定のコンポーネントの追加、変更、または削除である、とも言える。
前記所定の監視対象装置に関する前記監視情報の前回からの変化とは、少なくとも前記所定のコンポーネント以外の前記所定の前記監視対象装置に含まれるコンポーネントの追加、変更、または削除である、とも言える。
さらにこれまでの説明は複数の時間間隔にこだわらない視点では、前記1つ以上のプロセッサは:(1)第1の監視対象の第1の種類の監視情報を繰り返し取得し、監視情報の時系列情報を格納し、(2)第2の監視対象の第2の種類の測定数値を繰り返し取得し、測定数値の時系列情報を格納し、(3)前記監視情報の時系列情報に含まれる所定の監視情報について、前記所定の監視情報の前回の監視情報からの変化を特定し、前記前回の監視情報の取得時間と前記所定の監視情報の取得時間との時間間隔を特定し、前記変化及び前記時間間隔に基づいて変化値を測定し、(4)時間順序を示す第1軸を基準に前記変化値を時系列に表示する第1グラフと、時間順序を示す第2軸を基準に前記測定数値を時系列に表示する測定数値グラフと、を同じ画面に表示させ、前記変化値の計算は、計算の元とした前記時間間隔が長くなると前記変化値の絶対値が小さくなる特性を持つ所定の変換処理に基づいて生成され、前記第1軸と前記第2軸は、同じ方向を向き、前記第1軸の所定の期間を示す第1の部分の長さと、前記第2軸の前記所定の期間を示す第2の部分の長さと、は等しい、と言うこともできる。
10…監視システム、100…管理計算機、200…表示用装置、300…ホストコンピュータ、400…ストレージサブシステム、500…ネットワーク装置、600…ネットワーク
Claims (14)
- 1つ以上のプロセッサと1つ以上の記憶資源とを含み、監視対象装置又は/及び前記監視対象装置に含まれるコンポーネントを監視対象として監視する監視システムであって、
前記1つ以上の記憶資源は、監視対象の監視情報を取得する第1の時間間隔及び第2の時間間隔とを格納し、前記第1の時間間隔と前記第2の時間間隔は、異なる監視対象又は監視情報の種類を適用対象とし、
前記1つ以上のプロセッサは:
(A1)前記第1の時間間隔に従って、第1の監視対象の第1の種類の監視情報である第1監視情報を取得し、
(A2)前記第2の時間間隔に従って、第2の監視対象の第2の種類の監視情報である第2監視情報を取得し、
(B1)前記第1監視情報について前回からの変化を特定し、前記特定した変化及び前記第1の時間間隔に基づいて第1変化値を計算し、
(B2)前記第2監視情報について前回からの変化を特定し、前記特定した変化及び前記第2の時間間隔に基づいて第2変化値を計算し、
(C)前記第1変化値と前記第2変化値を同じ画面に表示させ、
前記第1変化値及び前記第2変化値の計算は、計算の元とした時間間隔が長くなると変化値の絶対値が小さくなる特性を持つ所定の変換処理に基づいて生成される、
監視システム。 - 請求項1記載の監視システムであって、
前記第1変化値の元となった第1監視情報の取得時間及び前回の取得時間の期間と、前記第2変化値の元となった第2監視情報の取得時間及び前回の取得時間の期間と、は少なくとも部分的には重複しており、
前記第1変化値の表示は、前記第2変化値と時間的に関連しているように表示する、
監視システム。 - 請求項2記載の監視システムであって、
前記(C)は、
(C1)時間順序を示す第1軸を基準に前記第1変化値を時系列に表示する第1グラフと、時間順序を示す第2軸を基準に前記第2変化値を時系列に表示する第2グラフと、を表示し、
(C2)前記第1軸と前記第2軸は同じ方向を向き、
(C3)前記重複期間を示す前記第1軸上の部分は、前記第1軸と所定の角度方向に移動すると、前記重複期間を示す前記第2軸上の部分と重なる、
監視システム。 - 請求項2記載の監視システムであって、
前記(C)は、
(C4)時間順序を示す第1軸を基準に前記第1変化値及び前記第2変化値を時系列に表示する第3グラフを表示する、
監視システム。 - 請求項2記載の監視システムであって、
前記(C)は、
(C5)時間順序を示す所定の行又は列を基準に前記第1変化値及び前記第2変化値を時系列に表示する第1表を表示する、
監視システム。 - 請求項3記載の監視システムであって、
前記1つ以上の記憶資源は、前記第1の監視対象に関する第1の監視数値を含む監視数値時系列情報を格納し、
前記1つ以上のプロセッサは、
(D)時間順序を表す第3軸を基準に、前記第1の監視数値を時系列に表示する第3グラフを表示し、
(D1)前記第1軸と前記第3軸は同じ方向を向き、
(D2)前記重複期間を示す前記第1軸上の部分は、前記第1軸と前記所定の角度方向に移動すると、前記重複期間を示す前記第3軸上の部分と重なる、
監視システム。 - 請求項6記載の監視システムであって、
前記1つ以上のプロセッサは、
(E)所定の表示時間帯を指定した表示要求を受信し、
(F)前記所定の表示時間帯内に発生した前記第1監視情報の変化を、前記所定の表示時間帯内に発生した確率と共に表示し、
前記(F)の確率とは、前記第1監視情報の変化の元となった第1監視情報の取得時間及び前回の取得時間の期間が、前記所定の表示時間帯に含まれる比率によって計算される、
監視システム。 - 請求項7記載の監視システムであって、
前記第1の監視対象は所定の監視対象装置に含まれる所定のコンポーネントであって、
前記第1監視情報についての前回からの変化とは、前記所定のコンポーネントの追加、変更、または削除であり、
前記第2の監視対象は、前記所定の監視対象装置であって、
前記第2監視情報についての前回からの変化とは、少なくとも前記所定のコンポーネント以外の前記所定の監視対象装置に含まれるコンポーネントの追加、変更、または削除である、
監視システム。 - 監視対象装置又は/及び監視対象装置に含まれるコンポーネントを監視対象として監視する方法であって、
(A)複数種類の監視情報がそれぞれ対応付けられた複数の時間間隔の各々の時間間隔に従って、複数の前記監視対象の各々から対応する種類の監視情報を取得し、
(B)複数の前記監視情報の各々について、前回からの変化と時間間隔に基づいて変化値を計算し、
(C)複数の前記監視情報に対応する複数の前記変化値を同じ画面に表示させ、
前記変化値の計算は、計算の元とした時間間隔が長くなると前記変化値の絶対値が小さくなる特性を持つ所定の変換処理に基づいて生成される、
方法。 - 請求項9記載の方法であって、
複数の前記変化値の各々は、計算の元となった監視情報の取得時間と前回の取得時間の期間が他の変化値の期間と少なくとも部分的に重複しており、
(C)の表示は、ある前記変化値と他の前記変化値とが時間的に関連していることを示す、
方法。 - 請求項10記載の方法であって、
前記(C)の変化値の表示は、時間順序を示す第1軸を基準に複数の前記変化値を時系列に表示する複数の変化値グラフを表示し、
複数の前記第1軸は、同じ方向を向き、同じ時間目盛り間隔である、
方法。 - 請求項11記載の方法であって、
所定の監視対象に関する所定の監視数値を含む監視数値時系列情報を格納し、
時間順序を示す第2軸を規準に前記監視数値を時系列に表示する数値グラフを表示し、
前記第1軸と前記第2軸は、同じ方向を向き、
前記第1軸の所定の期間を示す第1の部分の長さと、前記第2軸の前記所定の期間を示す第2の部分の長さと、は等しい、
方法。 - 請求項9記載の方法であって、
(E)所定の表示時間帯を指定した表示要求を受信し、
(F)前記所定の表示時間帯内に発生した前記監視情報の変化を、前記所定の表示時間内に発生した確率と共に表示し、
前記(F)の確率とは、前記変化の元となった監視情報の取得時間及び前回の取得時間の期間が、前記所定の表示時間帯に含まれる比率によって計算される、
方法。 - 請求項9記載の方法であって、
複数の前記監視対象は少なくとも所定の監視対象装置及び前記所定の監視対象装置に含まれる所定のコンポーネントを含み、
前記所定のコンポーネントに関する前記監視情報の前回からの変化とは、前記所定のコンポーネントの追加、変更、または削除であり、
前記所定の監視対象装置に関する前記監視情報の前回からの変化とは、少なくとも前記所定のコンポーネント以外の前記所定の前記監視対象装置に含まれるコンポーネントの追加、変更、または削除である、
方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2011/064830 WO2013001609A1 (ja) | 2011-06-28 | 2011-06-28 | 監視システム、及び監視方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5546686B2 true JP5546686B2 (ja) | 2014-07-09 |
JPWO2013001609A1 JPWO2013001609A1 (ja) | 2015-02-23 |
Family
ID=47391806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013522393A Expired - Fee Related JP5546686B2 (ja) | 2011-06-28 | 2011-06-28 | 監視システム、及び監視方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9075850B2 (ja) |
JP (1) | JP5546686B2 (ja) |
WO (1) | WO2013001609A1 (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012029290A1 (ja) * | 2010-09-03 | 2012-03-08 | 日本電気株式会社 | 表示処理システム、表示処理方法、およびプログラム |
US9817739B1 (en) * | 2012-10-31 | 2017-11-14 | Veritas Technologies Llc | Method to restore a virtual environment based on a state of applications/tiers |
US9438495B2 (en) * | 2013-04-02 | 2016-09-06 | Amazon Technologies, Inc. | Visualization of resources in a data center |
US10073754B2 (en) | 2013-09-13 | 2018-09-11 | Assurant, Inc. | Systems and methods for collecting, tracking, and storing system performance and event data for computing devices |
US9973392B2 (en) * | 2013-10-18 | 2018-05-15 | Microsoft Technology Licensing, Llc | Hierarchical network analysis service |
JP2016024736A (ja) * | 2014-07-23 | 2016-02-08 | 富士通株式会社 | 情報処理装置、情報処理システム、情報処理方法およびプログラム |
WO2016016690A1 (en) | 2014-07-31 | 2016-02-04 | Pismo Labs Technology Limited | Systems and methods for changing the frequency of retrieving monitoring data |
US10516594B2 (en) * | 2014-12-21 | 2019-12-24 | Pismo Labs Technology Limited | Systems and methods for changing the frequency of monitoring data |
US20160134486A1 (en) * | 2014-11-07 | 2016-05-12 | Itamar Haber | Systems, methods, and media for presenting metric data |
US10573190B2 (en) | 2015-02-16 | 2020-02-25 | International Business Machines Corporation | Iterative deepening knowledge discovery using closure-based question answering |
US10572806B2 (en) | 2015-02-17 | 2020-02-25 | International Business Machines Corporation | Question answering with time-based weighting |
WO2016203543A1 (ja) * | 2015-06-16 | 2016-12-22 | 株式会社日立製作所 | データ収集装置及び方法 |
KR20170087602A (ko) * | 2016-01-21 | 2017-07-31 | 현대자동차주식회사 | 네트워크에서 동작 모드의 전환 방법 |
US10521261B2 (en) * | 2016-03-07 | 2019-12-31 | Hitachi, Ltd. | Management system and management method which manage computer system |
US20180123924A1 (en) * | 2016-10-31 | 2018-05-03 | Hongfujin Precision Electronics (Tianjin) Co.,Ltd. | Cluster server monitoring system and method |
WO2018131100A1 (ja) * | 2017-01-11 | 2018-07-19 | 株式会社日立製作所 | 計算機システムを管理する管理システム |
JP6972735B2 (ja) | 2017-07-26 | 2021-11-24 | 富士通株式会社 | 表示制御プログラム、表示制御方法及び表示制御装置 |
US11502917B1 (en) * | 2017-08-03 | 2022-11-15 | Virtustream Ip Holding Company Llc | Virtual representation of user-specific resources and interactions within cloud-based systems |
JP7020323B2 (ja) * | 2018-07-09 | 2022-02-16 | 日本電信電話株式会社 | 伝送システム、装置管理サーバ、故障管理方法およびプログラム |
CN110347546B (zh) * | 2019-05-23 | 2022-05-17 | 平安科技(深圳)有限公司 | 监控任务动态调整方法、装置、介质及电子设备 |
JP7517070B2 (ja) | 2020-10-21 | 2024-07-17 | 富士通株式会社 | 性能情報可視化装置、性能情報可視化方法及び性能情報可視化プログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05173853A (ja) * | 1991-12-25 | 1993-07-13 | Hitachi Ltd | 計算機の運用性能評価支援装置 |
US5483468A (en) * | 1992-10-23 | 1996-01-09 | International Business Machines Corporation | System and method for concurrent recording and displaying of system performance data |
JP2005257416A (ja) * | 2004-03-10 | 2005-09-22 | Internatl Business Mach Corp <Ibm> | 診断装置、検出装置、制御方法、検出方法、プログラム、及び記録媒体 |
JP2008276279A (ja) * | 2007-04-25 | 2008-11-13 | Hitachi Ltd | 装置性能管理方法、装置性能管理システム、および管理プログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3996010B2 (ja) | 2002-08-01 | 2007-10-24 | 株式会社日立製作所 | ストレージネットワークシステム、管理装置、管理方法及びプログラム |
JP4421230B2 (ja) | 2003-08-12 | 2010-02-24 | 株式会社日立製作所 | 性能情報分析方法 |
JP4560367B2 (ja) | 2004-10-05 | 2010-10-13 | 株式会社日立製作所 | ストレージネットワーク性能情報の収集・保存方法及び計算機システム並びにプログラム |
US20080250341A1 (en) * | 2006-04-06 | 2008-10-09 | Ethicon Endo-Surgery, Inc. | Gui With Trend Analysis for an Implantable Restriction Device and a Data Logger |
EP2273252A1 (de) | 2009-07-10 | 2011-01-12 | Krause & Maier GbR | Verfahren zur zerstörungsfreien Innendruckprüfung von Hohlkörpern sowie Prüf-Vorrichtung |
US8407080B2 (en) * | 2010-08-23 | 2013-03-26 | International Business Machines Corporation | Managing and monitoring continuous improvement in information technology services |
US9495270B2 (en) * | 2011-05-31 | 2016-11-15 | Vmware, Inc. | User interface for monitoring the status of an object in a virtual computing environment |
-
2011
- 2011-06-28 US US13/318,576 patent/US9075850B2/en not_active Expired - Fee Related
- 2011-06-28 WO PCT/JP2011/064830 patent/WO2013001609A1/ja active Application Filing
- 2011-06-28 JP JP2013522393A patent/JP5546686B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05173853A (ja) * | 1991-12-25 | 1993-07-13 | Hitachi Ltd | 計算機の運用性能評価支援装置 |
US5483468A (en) * | 1992-10-23 | 1996-01-09 | International Business Machines Corporation | System and method for concurrent recording and displaying of system performance data |
JP2005257416A (ja) * | 2004-03-10 | 2005-09-22 | Internatl Business Mach Corp <Ibm> | 診断装置、検出装置、制御方法、検出方法、プログラム、及び記録媒体 |
JP2008276279A (ja) * | 2007-04-25 | 2008-11-13 | Hitachi Ltd | 装置性能管理方法、装置性能管理システム、および管理プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20130007262A1 (en) | 2013-01-03 |
US9075850B2 (en) | 2015-07-07 |
WO2013001609A1 (ja) | 2013-01-03 |
JPWO2013001609A1 (ja) | 2015-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5546686B2 (ja) | 監視システム、及び監視方法 | |
US10303533B1 (en) | Real-time log analysis service for integrating external event data with log data for use in root cause analysis | |
Sukhija et al. | Towards a framework for monitoring and analyzing high performance computing environments using kubernetes and prometheus | |
EP2523115B1 (en) | Operation management device, operation management method, and program storage medium | |
JP5914669B2 (ja) | サービス性能監視方法 | |
US9507686B2 (en) | System, method, and computer program product for monitoring health of computer system assets | |
US20160378583A1 (en) | Management computer and method for evaluating performance threshold value | |
JP4516306B2 (ja) | ストレージネットワークの性能情報を収集する方法 | |
US7184935B1 (en) | Determining and annotating a signature of a computer resource | |
JP4990018B2 (ja) | 装置性能管理方法、装置性能管理システム、および管理プログラム | |
EP3798848B1 (en) | Analyzing large-scale data processing jobs | |
CN105122733B (zh) | 队列监控和可视化 | |
EP3384391B1 (en) | Real-time change data from disparate sources | |
US20150370619A1 (en) | Management system for managing computer system and management method thereof | |
Sukhija et al. | Event management and monitoring framework for HPC environments using ServiceNow and Prometheus | |
US9881056B2 (en) | Monitor system and monitor program | |
JP2019095822A (ja) | パラメータ設定方法、データ分析装置、データ分析システム及びプログラム | |
JP2013054402A (ja) | 運用監視装置、運用監視プログラム及び記録媒体 | |
US11438239B2 (en) | Tail-based span data sampling | |
US9021078B2 (en) | Management method and management system | |
JP6252309B2 (ja) | 監視漏れ特定処理プログラム,監視漏れ特定処理方法及び監視漏れ特定処理装置 | |
CN111061588A (zh) | 一种定位数据库异常来源的方法及装置 | |
CN117203620A (zh) | 存储阵列错误缓解 | |
JP5974905B2 (ja) | 応答時間監視プログラム、方法および応答時間監視装置 | |
JP2020035297A (ja) | 機器状態監視装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140415 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140513 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5546686 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |