JP2006338543A - 監視システムおよび監視方法 - Google Patents

監視システムおよび監視方法 Download PDF

Info

Publication number
JP2006338543A
JP2006338543A JP2005164630A JP2005164630A JP2006338543A JP 2006338543 A JP2006338543 A JP 2006338543A JP 2005164630 A JP2005164630 A JP 2005164630A JP 2005164630 A JP2005164630 A JP 2005164630A JP 2006338543 A JP2006338543 A JP 2006338543A
Authority
JP
Japan
Prior art keywords
monitoring
group
interval
program
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005164630A
Other languages
English (en)
Other versions
JP4313336B2 (ja
Inventor
Mineyoshi Masuda
峰義 増田
Norihiro Kobayashi
紀浩 小林
Tomohiro Morimura
知弘 森村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005164630A priority Critical patent/JP4313336B2/ja
Priority to US11/194,614 priority patent/US7890620B2/en
Publication of JP2006338543A publication Critical patent/JP2006338543A/ja
Application granted granted Critical
Publication of JP4313336B2 publication Critical patent/JP4313336B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/12Network monitoring probes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3447Performance evaluation by modeling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/042Network management architectures or arrangements comprising distributed management centres cooperatively managing the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/046Network management architectures or arrangements comprising network management agents or mobile agents therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/815Virtual
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/86Event-based monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/885Monitoring specific for caches

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

【課題】 大規模なサービスシステムの構成に合わせて、監視能力を下げずにトータルでの監視コストを低減することができ、また、構成変更後のサービスシステムの状態を早期に把握することができる監視技術を提供する。
【解決手段】 サービスシステムを構成する情報処理装置を監視対象とする監視システムにおいて、監視マネージャプログラム0002および複数個の監視エージェントプログラム0011を備え、監視対象0010を性能特性が同じものを同一のグループに分けた各グループ内において、監視対象0010を、短い監視間隔で監視する群と、長い監視間隔で監視する群に分ける。長い監視間隔で監視する群に含まれる監視対象の性能状況は、短い監視間隔で監視する群に含まれる監視対象の性能状況から推測する。
【選択図】 図20

Description

本発明は、監視技術に関し、特に、情報処理システムの性能を監視する監視システム、および、その監視方法に適用して有効な技術に関する。
例えば、高い性能品質が求められる情報サービス、殊に不特定多数の利用者へのサービスを提供する情報処理システム(以下、サービスシステムと呼ぶ)において、高い性能品質のサービスを提供することは、事業成功に向けた必須要件である。そのため、このようなサービスシステムでは、一般に性能監視を行い性能品質の低下を早期に検出するよう努める。性能監視を行うことで、性能品質の低下を早期に検出し、性能品質低下に対する適切な対処を実施する。これにより、重大な事故を未然に防止する。
性能監視を行うための情報処理システム(以下、性能監視システムと呼ぶ)は、サービスシステムを構成する要素(以下、監視対象と呼ぶ)それぞれの性能情報を定期的にチェックし、システムの性能が不足していないか、想定通りの性能が出ているか、を確認する。
性能監視システムの一般的な構成について説明する。性能監視システムは、監視マネージャプログラム、および複数の監視エージェントプログラムから構成される。監視エージェントプログラムは、一つ以上の監視対象の状態を定期的に監視、分析し、異状があれば監視マネージャプログラムへ通知する。監視マネージャプログラムは、これら監視エージェントプログラムを統括管理する。監視マネージャプログラムは、サービスシステムとは別の管理用情報処理装置上で動作する。監視エージェントプログラムは、サービスシステムを構成する計算機(監視対象)上で動作する。
性能監視システムにおける監視処理の流れを以下に示す。(1)監視エージェントプログラムは、(1−1)監視対象から性能情報を監視間隔1で定期的に取得し、(1−2)上記監視間隔1よりも長い監視間隔2で、定期的に取得した性能情報を分析し、(1−3)上記分析の結果、監視対象の状態が異状であると判断した場合、監視マネージャプログラムへその旨を通知する。
(2)監視マネージャプログラムは、(2−1)監視エージェントプログラムからの通知を受け、サービスシステム全体の状態を分析し、(2−2)上記分析の結果、何らかの対処が必要である場合、管理者への連絡などにより対処実行を指示する。
性能監視システムの第1の課題は、大規模なサービスシステムの監視における監視コストの低減である。監視コストとは、監視システムのプログラムの監視処理、すなわち、前述の性能監視システムの監視処理の実行に使用する、CPU、メモリ、ネットワーク帯域、ディスク領域等の計算リソースである。
大規模なサービスシステムの監視では、前述の監視処理の中でも、特に、(1−1)(1−2)および、(2−1)におけるコストが大きくなる。(1−1)および(1−2)の処理は、サービスシステムを構成する情報処理装置の数、すなわち、監視エージェントプログラムの数に比例して増大する。また、(2−1)の処理についても、異状通知元となる監視エージェントプログラムの数が増えるため、同処理による監視コストが増大する。更に、異状通知は、複数の監視エージェントプログラムから同時に送られる傾向にあるため、(2−1)の処理が急激に増加してしまう。
監視コストを単純に低減させるのであれば、監視間隔を長くして単位時間あたりの監視回数を減らせばよい。監視回数を減らすことで、監視処理で使用する計算リソースの消費を少なくでき、監視コストを低減できる。
しかし、この方法には、監視能力が低下するデメリットがある。監視間隔を長くすると、監視と監視の間に発生した異状を見逃し、異状の検出が遅れる、あるいは、検出できない恐れがある。つまり、監視間隔の長さと検出能力はトレードオフの関係がある。
そこで、上記の方法を改良し、動的に監視間隔を調整することで、監視コストを低減しつつ、検出遅れを防ぐ方法が、特許文献1〜4において提案されている。
特許文献1の技術は、監視エージェントプログラムが監視する監視項目が複数あり、その内の一つの項目の監視間隔を短くする際に、それ以外の監視項目の監視間隔を長くする。これにより、監視コストのトータルでの増加を防ぐ。
特許文献2の技術は、監視マネージャプログラムが監視エージェントプログラムから測定データを収集する間隔を動的に変更し、監視エージェントプログラムによる監視コスト、および通信量を低減する。監視間隔の変更タイミングは、測定したデータが予め設定した条件を満たした場合である。
特許文献3の技術は、監視エージェントプログラムがCPU使用率を計測し、前回測定時からの変化が大きい場合、監視マネージャプログラムへの報告頻度を増やす。
特許文献4の技術は、監視エージェントプログラムが測定した測定データが、前回測定したデータと比べて変化がない場合に、測定データを監視マネージャプログラムへ送信しない。
性能監視システムの第2の課題は、サービスシステムの構成変更への対応である。サービスシステムの構成は運用中に変更されうる。例えば、障害を起こした情報処理装置をサービスシステムから分離する場合、サービスシステムの構成は変更される。
また、近年「ワークロード管理システム」と呼ばれる、サービスシステムの構成を自律的に変更するシステムが多数提案されている。このシステムは、サービスシステムへの負荷を監視し、その負荷量に応じて、このサービスシステムへ情報処理装置を増強、あるいは逆にこのサービスシステムから情報処理装置を減らす。
このように、サービスシステムの構成が変更された場合、その変更に合わせて、性能監視システムも設定を変更する必要がある。サービスシステムの構成変更に追随して監視システムの設定を自動的に変更する方法に、特許文献5,6の技術がある。
特許文献5の技術は、サービスシステムを構成する情報処理装置をいくつかのグループに分ける。また、一つのサービスシステムに対して一つ以上の監視マネージャプログラムが存在する。各情報処理装置は、情報処理装置と監視マネージャプログラムとの対応関係を記述したテーブルを持つ。構成変更時、例えば、情報処理装置の台数が増減した場合や、監視マネージャプログラムの数、すなわち、監視マネージャプログラムが動作する情報処理装置の数が増減した場合には、前記テーブルを更新する。
特許文献6の技術は、サービスシステムを構成する情報処理装置をいくつかのグループに分ける。グループごとに、そのグループに含まれる情報処理装置のアドレスリストが作成され、全ての情報処理装置は、全てのグループのアドレスリストを保持する。また、全ての情報処理装置は、関連するグループ同士をリンクで結んだ木構造を保持する。サービスシステムの構成が変更された場合、前述の木構造を順に参照して、それぞれのグループに含まれる情報処理装置へ、構成変更の内容が伝達され、前述のアドレスリストおよび木構造へ変更が反映される。
特開2004−178118号公報 特開平5−205074号公報 特開平7−152706号公報 特開平8−275060号公報 特開2000−92091号公報 特開2003−271471号公報
ところで、前述した性能監視システムにおいて、第1の課題は、大規模なサービスシステムの構成に合わせて、トータルでの監視コストを低減することである。前記特許文献1〜4記載の技術は、サービスシステムを構成する個々の情報処理装置内における監視コストの低減に関する技術ではあるが、サービスシステム全体の構成を参照して、監視コストを低減する手法についての言及はない。
また、第2の課題は、構成変更後のサービスシステムの状態を早期に把握することである。サービスシステムの構成変更には何らかの目的がある。例えば、サービスシステムへの情報処理装置の増強は、サービス品質の改善を目的とする。サービスシステムの構成変更後は、その構成変更の効果の有無を早急に確認する必要がある。なぜなら、効果がない場合には、別の対応を行う必要があるためである。前記特許文献5,6に記載された技術は、サービスシステムの構成が変更された場合に、監視システムの設定を自動的に追随できる効果があるが、構成変更後のサービスシステムの状態認識を早める効果については考慮されていない。
そこで、本発明の目的は、大規模なサービスシステムの構成に合わせて、監視能力を下げずにトータルでの監視コストを低減することができ、また、構成変更後のサービスシステムの状態を早期に把握することができる監視技術を提供することにある。
本発明の前記ならびにその他の目的と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、次のとおりである。
本発明における監視システム、および、その監視方法は、サービスシステムを構成する情報処理装置(監視対象、具体的には監視対象に含まれる監視エージェントプログラム)を複数の群に分け、その内のいくつかの群に含まれる情報処理装置を強く監視、すなわち短い監視間隔で監視し、その他の群に含まれる情報処理装置は弱く監視、すなわち長い監視間隔で監視する。このように、監視間隔を群別に行うことで、監視システム全体での監視コストを低減することができるようになる。
また、本発明における監視システム、および、その監視方法は、サービスシステムを構成する情報処理装置を複数のグループに分け、かつ、それらのグループごとに前述の群による監視間隔の管理を行う。グループは、複数の「同質」な情報処理装置ごとに作成される。すなわち、性能特性が同じ情報処理装置を同一グループに含める。グループ内では情報処理装置の性能特性が同じであるため、グループ内で強い監視を行う群に含まれる情報処理装置の性能状況を把握していれば、弱い監視を行っている群に含まれる情報処理装置についても、高い精度で性能状況を推測できる。したがって、性能コストを低減しながら、監視による性能状況を把握する能力も保つことができるようになる。
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。
本発明によれば、大規模なサービスシステムの構成に合わせて、監視能力を下げずにトータルでの監視コストを低減することができる。また、構成変更後のサービスシステムの状態を早期に把握することができる。
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一の部材には原則として同一の符号を付し、その繰り返しの説明は省略する。
本発明の各実施の形態においては、これに限定されるものではないが、サービスシステムを構成する計算機、サーバなどの情報処理装置を監視対象として説明する。
図1に、本発明の第1の実施の形態である監視システムのブロック図を示す。
この監視システムは、一つの監視マネージャプログラム0002およびN個の監視エージェントプログラム0011から構成され、第i番目の監視エージェントプログラム0011は第i番目の監視対象0010を監視する。監視マネージャプログラム0002は、監視装置0001上で動作し、監視エージェントプログラム0011は、それぞれの監視対象0010上で動作する。監視装置0001と各監視対象0010はLAN0009で接続され、相互に通信可能である。
監視エージェントプログラム1および監視エージェントプログラム2は第1群0012に含まれ、残りの監視エージェントプログラム3から監視エージェントプログラムNは第2群0013に含まれる。
監視マネージャプログラム0002は、詳細は後述するが、監視エージェントプログラム0011を各群に分ける機能、各群に含まれる監視エージェントプログラム0011を群間で入れ替える機能や、イベントの内容を分析し、各群に含まれる監視エージェントプログラム0011の数、および各群における監視エージェントプログラム0011が監視対象0010を監視する監視間隔を計算し、この計算の結果、監視する間隔を変更する監視エージェントプログラム0011へ変更を指示する各機能などを備える。
さらに、監視マネージャプログラム0002は、監視対象0010が構成変更されたイベントを受信し、このイベントを受信したのち、計算された監視間隔を短縮させる機能や、もし、監視対象0010において障害が発生した場合、その旨を障害イベントとして受信し、この障害イベントを受信したのち、障害イベントに対応する監視エージェントプログラム0011が短い監視間隔の群に含まれる場合、短い監視間隔の群よりも監視間隔が長い群に含まれる監視エージェントプログラム0011を短い監視間隔の群へ変更する各機能などを備える。
監視エージェントプログラム0011は、詳細は後述するが、監視対象0010を所定の監視間隔で監視する機能や、監視対象0010を監視することで得られた情報が所定の条件を満たした場合、監視マネージャプログラム0002へイベントを通知する機能などを備える。
監視マネージャプログラム0002には、イベント受信部0003、監視間隔管理部0004、監視エージェントプログラム管理部0005、および記憶装置0006が含まれる。記憶装置0006には、監視間隔情報0007、群情報0008が格納される。
監視間隔情報0007、群情報0008の格納例である、群管理テーブル0100を図2に示す。群管理テーブル0100には、各群に含まれる監視エージェントプログラム0011とその監視間隔が格納される。また、別の群管理テーブル0101の構成例を図3に示す。図2の群管理テーブル0100では、監視間隔が監視エージェントプログラム0011ごとに記録されているが、図3の群管理テーブル0101では、群ごとに監視間隔が記録される構成としている。
図4に、監視マネージャプログラム0002における、群に含まれる監視エージェントプログラム0011を群間で入れ替える処理のフロー図を示す。スタートは、イベント受信部0003が入れ替え指示のイベントを受信する、あるいは、監視マネージャプログラム0002内部のタイマーによって起動されるものとする。
まず、監視間隔管理部0004が記憶装置0006から群情報を取得し(S0001)、入れ替える二つの群を選択する。次いで、各群に含まれる監視エージェントプログラムの情報を取得し(S0002)、群ごとに一つの監視エージェントプログラム0011を選択する。続いて、選択した各監視エージェントプログラム0011に設定されている監視間隔を記憶装置0006から取得する(S0003)。次いで、監視エージェントプログラム0011の間で互いの監視間隔を交換し、監視エージェントプログラム管理部0005が、それぞれの監視エージェントプログラム0011に監視間隔変更を指示して新しい監視間隔を設定する(S0004)。最後に、変更した監視間隔を記憶装置0006へ記憶する(S0005)。
図5に、監視マネージャプログラム0002における、監視強化/弱化処理のフロー図を示す。監視強化処理は、群に含まれる監視エージェントプログラム0011が監視対象0010を監視する間隔を短縮する処理である。逆に、監視弱化処理は、監視間隔を伸長する処理である。
スタートは、イベント受信部0003がイベントを受信することで開始される(S0101)。イベントは、例えば、監視エージェントプログラム0011が監視対象0010の負荷増加、負荷減少を検出した際に監視マネージャプログラムへ通知するイベント、あるいは、システム管理者が監視マネージャプログラム0002へ与える指示イベントなどである。
次いで、イベント内容を評価し、それにより処理を振り分ける(S0102)。イベントの内容が監視の強化を指示するものであれば、監視強化アクションを行い、イベントの内容が監視の弱化を指示するものであれば、監視弱化アクションを行う。
監視強化アクションでは、群内の監視エージェントプログラム0011に設定されている監視間隔を短く、ここでは半分にする。まず、監視間隔管理部0004が、記憶装置0006から群情報を取得し(S0103)、次いで群に含まれる監視エージェントプログラム情報を取得する(S0104)。次に、各監視エージェントプログラムに対して設定されている現在の監視間隔を取得し(S0105)、その値の半分を計算して監視間隔を1/2へ変更する(S0106)。続いて、監視エージェントプログラム管理部0005が、変更後の監視間隔を監視エージェントプログラム0011へ通知し、監視間隔変更を指示することで監視間隔が変更される(S0111)。最後に、変更した監視間隔を記憶装置0006へ記憶する(S0112)。監視弱化アクションの流れ(S0107〜S0110)は、監視間隔を半分ではなく二倍とする点を除いて、監視強化アクションと同じである。
図13に、監視エージェントプログラム0011、もしくは、監視対象0010に障害が発生した際の、監視マネージャプログラム0002における対応処理のフロー図を示す。このフロー図では、障害が発生した群が若い番号の群、すなわち強い監視を行っている群であれば、弱い監視を行っている群から代替の監視エージェントプログラム0011を割り当てる処理である。
はじめに、イベント受信部0003が障害イベントを受信する(S0301)。次いで、障害が発生した群についての情報を記憶装置0006から取得する(S0302)。続いて、障害が発生した群の番号を評価し、群番号がKよりも大きければ、処理を終了し、K以下であれば次のステップへ進む(S0303)。次のステップでは、第K+1番以上の群に含まれる監視エージェントプログラム0011を一つ選択し(S0304)、続く二つのステップにて、その監視エージェントプログラム0011が障害を発生した群に含める処理を行う。すなわち、この監視エージェントプログラム0011へ、障害を発生した群に対する監視間隔へ変更するように指示を出す(S0305)。続いて、変更した監視間隔を記憶装置0006へ記憶する(S0306)。
図6に、本発明の第2の実施の形態である監視システムのブロック図を示す。本実施の形態の監視システムは、前記図1に示した第1の実施の形態に、監視強度情報0014を加えた構成である。
監視強度情報0014とは、監視の強度と監視間隔を対応付ける情報であり、高い監視強度ほど監視間隔が短くなる。図9に、監視強度情報の具体例である、記憶装置0006へ格納される監視強度テーブル0104を示す。図9に示す通り、監視強度に対する監視間隔の形式で記憶される、マッピングテーブルの構造となっている。
監視間隔が監視強度として表現されることにともない、群管理テーブル0102の構造も図7のようになる。すなわち、前記図2に示した群管理テーブルでは、監視エージェントプログラム0011ごとに監視間隔が記憶されていたが、図7の群管理テーブル0102では、監視エージェントプログラム0011ごとに監視強度が記憶される。また、前記図3に示した群管理テーブルの監視間隔を、監視強度で示した群管理テーブル0103を図8に示す。
図10は、本発明の第2の実施の形態の監視システムにおける、監視強化/弱化処理のフロー図を示す。このフローは、前記図5に示した監視強化/弱化処理のフローと監視間隔を変更する処理が異なる。すなわち、前記図5に示したフローでは、監視間隔を直接扱っているのに対して、図10のフローでは、監視強度の増減によって監視間隔を変更している。
図10のフローにおける、イベント受信(S0201)、イベント種別の評価によるアクションの振り分け(S0202)後の監視強化アクション(S0203〜S0206)では、監視を強化する監視エージェントプログラム0011の監視強度を取得し(S0205)、次いで監視強度を一つ増加させる(S0206)。続いて、監視強度テーブルを参照し、該当する監視強度に対応する監視間隔を取得し、監視エージェントプログラム0011に、取得した監視間隔を通知し、監視間隔を変更するように指示を出す(S0211)。最後に、変更した監視強度を記憶装置0006へ記憶する(S0212)。監視弱化アクション(S0207〜S0210)では、監視強度を一つ増加させずに、逆に監視強度を一つ減少させる。それ以外の処理は監視強化アクションと同じである。
図11に、本発明の第3の実施の形態である監視システムにおける監視エージェントプログラム0011内のブロック図を示す。監視エージェントプログラム0011以外の要素についての構造は、前記図6に示した監視システムのブロック図と同じである。
図11に示す監視エージェントプログラム0011は、統計処理部0015、性能情報取得部0016、性能情報一時記憶0017を含む。監視エージェントプログラム0011は、性能情報取得部0016の機能により、第1の監視間隔(以下、監視間隔1)で、定期的に監視対象0010から性能情報を取得し(0020)、取得した性能情報を性能情報一時記憶0017へ格納する。監視エージェントプログラム0011は、統計処理部0015の機能により、第2の監視間隔(以下、監視間隔2)で、定期的に性能情報一時記憶0017から性能情報を取得し、取得した性能情報に対して統計処理を行い(0019)、統計処理の結果が所定の条件を満たす場合、その旨を監視マネージャプログラム0002へイベントとして送信する(0018)。つまり、監視エージェントプログラム0011は、二種類の監視間隔、監視間隔1、監視間隔2を有する。
監視エージェントプログラム0011が二種類の監視間隔を持つことにともない、監視強度と監視間隔のマッピングテーブルである監視強度テーブル0105は、図12のようになる。すなわち、監視強度に対して、監視間隔のカラムが、監視間隔1、監視間隔2の二つになる。
図14に、本発明の第4の実施の形態である監視システムのブロック図を示す。本実施の形態の監視システムは、前記図1に示した第1の実施の形態の監視システムに、負荷量管理部0021、負荷量情報0022、および負荷分散装置0024を加えた構成である。負荷分散装置0024は、監視対象1からNへ負荷の割り振りを行う。すなわち、エンドユーザからのリクエストは、はじめに負荷分散装置が受け付け、その後、監視対象1からNへ、それぞれの“設定負荷量”の割合に応じた数のリクエストが送られる。
本実施の形態における監視マネージャプログラム0002は、負荷分散装置に設定された、前述の設定負荷量を変更する機能を持つ。監視マネージャプログラム0002は、負荷量管理部0021、および記憶装置0006内に格納された負荷量情報0022を用いて、設定負荷量を変更する。
負荷量情報0022は、例えば、図15に示す、群および負荷量管理テーブル0106のように、群管理テーブルに負荷量についてのカラムを付け加えることで記憶される。図15は、第1群に含まれる監視エージェントプログラム1および監視エージェントプログラム2がそれぞれ監視する監視対象1および監視対象2への設定負荷量が15であることを示している。同様に、第2群に含まれる監視エージェントプログラムの監視対象への設定負荷量が20であることを示している。
負荷量管理部0021は、図17に示す、負荷量設定処理のフロー図にしたがい、設定負荷量を負荷分散装置0024へ設定する。はじめに、負荷量管理部0021は、記憶装置0006から群情報を取得し(S0401)、次いで各群に含まれる監視エージェントプログラム0011についての負荷量情報を取得する(S0402)。続いて、各監視エージェントプログラム0011が監視する監視対象0010の負荷量を負荷分散装置0024へ通知し、その値を設定負荷量とするように指示を出す(S0403)。
さて、設定負荷量の値について、次の二つのパターンがある。すなわち、パターン1:群番号が若いほど設定負荷量を小さくする、パターン2:群番号が若いほど設定負荷量を大きくする、の2パターンである。前記図15に示した群および負荷量管理テーブルは、パターン1の場合に相当する。パターン2の場合の群および負荷量管理テーブル0107を図16に示す。
パターン1では、群番号が若い、すなわち、監視間隔が短く監視が強い監視対象0010ほど負荷量が小さくなる。このパターンのメリットは、監視による負荷も考慮に入れて群間の負荷量の均衡を図ることができる点である。短い監視間隔で監視を行うと、監視による負荷が大きくなる。つまり、群間で監視による負荷量に格差が発生する。そこで、その分だけ設定負荷量を小さくすることで、トータルの負荷を群間で均等にできる。
パターン2では、群番号が若い、すなわち、監視間隔が短く監視が強い監視対象0010ほど負荷量が大きくなる。このパターンのメリットは、監視エージェントプログラム0011から監視マネージャプログラム0002へ通知される負荷増大イベントの回数を抑制できる点である。このパターンでは、監視が強い群に含まれる監視対象0010ほど負荷量が大きいため、負荷増大イベントが発生する可能性が、他の群に比べて高い。つまり、他群よりも早く負荷増大を検出できる。
図18に、本発明の第5の実施の形態である監視システムのブロック図を示す。本実施の形態の監視システムは、前記図14に示した第4の実施の形態の監視システムに対して、負荷分散装置0024上で動作する監視エージェントプログラムL(0023)を追加した構成である。監視エージェントプログラムLは、監視対象1からNの全ての監視を担当する。監視エージェントプログラムLは、負荷分散装置0024が監視対象1からNへのリクエスト振り分け状況を、監視対象ごとに監視する。
図19に、本実施の形態の監視システムにおける群管理テーブル0108を示す。図19に示す通り、全ての監視対象0010の監視を監視エージェントプログラムLが担当する。
図20に、本発明の第6の実施の形態である監視システムのブロック図を示す。本実施の形態の監視システムは、監視対象0010を複数のグループに分け、グループごとに群管理するシステムである。
この監視システムは、前記図1に示した第1の実施の形態である監視システムに、グループ管理部0025、およびグループ情報0026を加えた構成である。すなわち、監視マネージャプログラム0002は、監視エージェントプログラム0011を複数のグループに分割し、各グループに含まれる監視エージェントプログラム0011を各群に分ける機能を備える。
M個の監視対象0010は、監視対象1から監視対象Nまでを含むグループ1(0027)と、監視対象N+1から監視対象Mまでを含むグループ2(0028)にグループ分けされている。グループ1は、監視対象1と監視対象2を含む第1群0012、監視対象3から監視対象Nまでを含む第2群0013、を含む。グループ2は、監視対象Mを含む第1群0029、監視対象N+1から監視対象M−1までを含む第2群0030、を含む。
この監視システムにおけるグループテーブル0109を図21に示す。このグループテーブル0109は、群情報、監視間隔情報の他に、グループについての情報が記憶される。つまり、グループと群、群と監視エージェントプログラム0011の対応関係が記憶される。
図22に、本発明の第7の実施の形態である監視システムのブロック図を示す。本実施の形態の監視システムは、前記図20に示した第6の実施の形態である監視システムに、グループ間の関連付けを管理する機能を加えた構成である。
グループ間の関連付けの管理は、関連付け管理部0031、および関連付け情報0032によって行われる。関連付け情報0032は、例えば、図23に示す関連付けテーブル0110によって表現される。この図23は、グループ1(0027)とグループ2(0028)の間に関連付けがあることを示している。具体的な関連付けの内容、関連付けを使用した各種の処理フローについては後述する。
図24に、本発明の第8の実施の形態である監視システムのブロック図を示す。本実施の形態の監視システムは、前記図22に示した第7の実施の形態である監視システムに、構成情報記憶装置0033を加えた構成である。構成情報記憶装置0033には、監視対象0010の構成についての情報が記憶される。監視対象0010の構成についての情報は、監視対象の属性情報0034として記憶される。
図29に、グループ分割処理のフロー図を示す。この処理は、複数の監視対象0010を含むグループと、一つ以上の評価条件を入力として、そのグループを評価条件によって評価し、複数のグループへ分割していく処理である。
まず、入力グループについてのグループ情報を記憶装置0006に格納されたグループ情報0026から取得する(S0501)。次いで、入力された評価条件の列を取得し(S0502)、その中から未処理の評価条件を取得する(S0503)。次いで、グループに含まれる監視対象をこの評価条件によって評価し、評価が同一である監視対象ごとにグループを分割する(S0504)。次に、分割したグループを新たな入力グループとして、S0503のステップを繰り返す。最後に、未評価の評価条件がなくなった時点で処理を終了する。
ここで、具体的なグループ分割の説明を行うために、複数の監視対象0010から構成されるシステムの例を示す。このグループ分割例によるシステムの構成を図25に示す。このシステムは、1台の負荷分散サーバ1(0307)、4台のWebサーバ1〜4(0308〜0311)、1台のNFSサーバ1(0312)から構成され、各サーバは、LAN1(0313)、およびLAN2(0314)で接続されている。
監視対象の構成情報は、図27に示す属性テーブル0111に記憶される。属性テーブル0111には、監視対象ごとに、監視対象が持つ属性およびその属性値が記憶される。図27は、図25で示すシステムの各監視対象の属性および属性値を示している。
図25に示すシステムを、図29に示すグループ分割処理のフロー図にしたがって、グループ分割する。なお、このシステムのユーザを「ユーザ1」とし、システムに含まれる全監視対象からなるグループをユーザ1グループ0301とする。
グループ分割処理への入力グループをユーザ1グループ0301とする。また、評価条件列を、評価条件1「アプリケーションについての属性値が一致しているか」、評価条件2「計算機のスペックについての属性値が一致しているか」、とする。
まず、ユーザ1グループ0301を評価条件1によってグループ分割する。図27の属性テーブル0111によると、アプリケーションについての属性は、「アプリケーション名」、「アプリケーションバージョン」の2属性がある。この値が同一である監視対象をグループとしてまとめると、負荷分散サーバのみを含むグループ、Webサーバ1から4を含むグループ、NFSサーバのみを含むグループ、の3グループに分割できる。次に、これら3グループを評価条件2によってグループ分割する。図27の属性テーブル0111によると、計算機のスペックについての属性は、「CPU数」のみである。したがって、評価条件2によって、さきほどの3グループを分割すると、Webサーバ1から4を含むグループが、CPU数が1であるWebサーバ1および2を含むグループと、CPU数が2であるWebサーバ3および4を含むグループのグループに分けられる。
したがって、図25に示すシステムは、ユーザ1グループ0301、負荷分散グループ0302、Webグループ0303、Webグループ1(0304)、Webグループ2(0305)、およびNFSグループ0306に分けられる。
グループ分割前のグループと、そのグループを複数のグループに分けた際、それらのグループの間に関連付けを作成し、また、それらのグループと分割前のグループとの間に関連付けを作成した場合、グループ間の関連付け0315は図26のようになる。このとき、関連付けテーブル0112は、図28のようになる。
図30に、本発明の第9の実施の形態である監視システムのブロック図を示す。本実施の形態の監視システムは、前記図24に示した第8の実施の形態である監視システムに、グループ間の相関度を管理する機能を加えた構成である。
相関度は、相関計算部0035および相関度情報0036によって管理される。相関度情報0036は、関連付けを持つグループ間の相関度を記憶する。図31に、グループ間の相関度についての情報を持つ、相関度つき関連付けテーブル0113を示す。このテーブルには、関連付けを持つ二つのグループ、およびその間の相関度(図中では70)が記憶される。
以下では、相関度情報を用いた各種処理のフローについて説明する。はじめに、あるグループで発生したイベントを、そのグループと、所定以上の相関度の関連付けを持つグループへ伝播する処理のフローについて説明する。このフロー図を図32に示す。
まず、イベント受信部0018がイベントを受信する(S0601)。次いで、そのイベントを発生させたグループについての情報を取得する(S0602)。続いて、このグループについての関連付け情報を取得する(S0603)。次に、関連付け情報に付随する相関度情報を取得し(S0604)、相関度がS以上であるか否かを評価する(S0605)。相関度がS以上であれば、グループ情報を取得し(S0606)、イベントを関連先のグループに伝播させる。相関度がS未満であれば、伝播させずに処理を終了する。
図33に、二つのグループ間の相関度を更新する処理のフロー図を示す。入力は、二つのグループとする。まず、各グループに含まれる監視エージェントプログラム0011から性能情報を取得する(S0701)。次いで、取得した性能情報について、グループ間の相関性を分析し、相関度を計算する(S0702)。最後に、計算した相関度を記憶装置0006へ記憶する(S0703)。
図34に、相関度が高い二つのグループを併合する処理のフロー図を示す。入力は、合併候補の二つのグループとする。まず、各グループの情報を取得し(S0801)、次いでグループ間の関連付け情報を取得し(S0802)、関連付けに付随する相関度を取得する(S0803)。続いて、取得した相関度を評価し(S0804)、相関度がS未満であれば、合併せずに処理を終了する。相関度がS以上であれば、二つのグループを同一のグループとなるように併合し、記憶装置0006の記憶内容を変更する(S0805)。
前述した、第8の実施の形態の説明の中で、構成情報記憶装置0033中の属性情報0034を参照して、グループを作成する例について述べた。以下では、第8の実施の形態とは別の属性情報0034をいくつか示し、それぞれについてグループを作成する例について説明する。なお、以下に説明する各実施の形態における監視システムのブロック図は、前記第8の実施の形態の構成と同じ、すなわち図24のブロック図とし、また、グループ分割フローについても図29に記載のフローにしたがうものとする。
本発明の第10の実施の形態について説明する。本実施の形態において、属性情報0034に含まれる属性テーブル0201を図35に示す。図35に示す属性テーブル0201には、14台のWebサーバ(すなわち、14個の監視対象0010)についての属性情報が格納されている。属性「サーバ名」には、各サーバの名称が記載される。属性「アプリケーション名」には、各サーバ上で動作するアプリケーション名、すなわち、この例では全て“Webサーバ”と記載される。これら以外の属性は、全てサーバのハードウェアスペックに関する属性である。
これら14台のWebサーバを、ハードウェアスペックに関する属性値によって、いくつかのグループに分割する。どの属性を参照してグループを分割するのか、つまり、評価条件列をどのように設定するのかは、Webサーバの処理性能がどの属性に影響されるのか、によって決まる。ここでは、次の3つの場合、すなわち、(1)CPU性能の影響大、(2)メモリ性能の影響大、(3)HDD性能の影響大、についての評価条件列の例を示す。
(1)CPU性能の影響が大きい場合
Webサーバ上で、CGIなどのプログラムを頻繁に動作する場合、Webサーバの処理性能はCPU性能に強く依存する。そのため、CPU性能に関する属性で評価条件列を構成することが妥当である。評価条件列の例は、条件1:CPU個数が等しい、条件2:CPU名が等しい、条件3:CPU動作周波数が等しい、の通りである。
サーバ1〜14からなるグループを初期グループとして、上記評価条件列によってグループ分割を行うと、グループは図36に示すように分割される。まず、条件1によって、初期グループが、CPU個数が2のグループ(サーバ1〜2)と、CPU個数が1のグループ(サーバ3〜14)に分割される。同様に、条件2のCPU名属性、および条件3のCPU動作周波数属性による分割を行うと、最終的に6個のグループが作成される。
(2)メモリ性能の影響が大きい場合
Webサーバの処理性能がメモリ性能に強く依存する場合、メモリ性能に関する属性で評価条件列を構成することが妥当である。評価条件列の例は、条件1:2次キャッシュサイズが等しい、条件2:メモリバス動作周波数が等しい、の通りである。
サーバ1〜14からなるグループを初期グループとして、上記評価条件列によってグループ分割を行うと、グループは図37に示すように分割される。まず、条件1によって、初期グループが、2次キャッシュサイズが2MBのグループ(サーバ1〜4)と、2次キャッシュサイズが512KBのグループ(サーバ5〜12)と、2次キャッシュサイズが1MBのグループ(サーバ13〜14)に分割される。同様に、条件2のメモリバス動作周波数属性による分割を行うと、最終的に4個のグループが作成される。
(3)HDD性能の影響が大きい場合
Webサーバの処理性能がHDD性能に強く依存する場合、例えばサイズの大きい画像ファイルを大量に配信する場合、HDD性能に関する属性で評価条件列を構成することが妥当である。評価条件列の例は、条件1:HDDシークタイムが等しい、条件2:HDDバッファサイズが等しい、の通りである。
サーバ1〜14からなるグループを初期グループとして、上記評価条件列によってグループ分割を行うと、グループは図38に示すように分割される。まず、条件1によって、初期グループが、HDDシークタイムが0.8msのグループ(サーバ1〜4)と、HDDシークタイムが1.5msのグループ(サーバ5〜6)と、HDDシークタイムが1.2msのグループ(サーバ7〜9)と、HDDシークタイムが1.0msのグループ(サーバ10〜14)に分割される。同様に、条件2のHDDバッファサイズによる分割を行うと、最終的に4個のグループが作成される。
本発明の第11の実施の形態について説明する。本実施の形態において、属性情報0034に含まれる属性テーブル0202を図39に示す。図39に示す属性テーブル0202には、6台のWebサーバと、8台のJava(登録商標)アプリケーションサーバについての属性情報が格納されている。属性「サーバ名」には、各サーバの名称が記載される。属性「アプリケーション名」には、各サーバ上で動作するアプリケーション名、すなわち、この例では“Webサーバ”と、“Java(登録商標)アプリ”が記載される。「Webキャッシュサイズ」属性は、Webサーバのみに対する属性であり、Webサーバが使用するキャッシュメモリの容量を示す。「JVM(Java(登録商標) Virtual Machine)最大使用メモリ量」属性は、Java(登録商標)アプリケーションサーバのみに対する属性であり、Java(登録商標)アプリケーションが動作するJVMが使用するメモリの最大容量を示す。
Webサーバ、Java(登録商標)アプリケーション、双方とも使用できるメモリ量が処理性能に大きく影響するため、それらの属性を評価条件列に入れることは妥当である。評価条件列の例を下記に示す。
Webサーバに対する評価条件列の例は、条件1:アプリケーション名が等しい、条件2:Webキャッシュサイズが等しい、の通りである。
Java(登録商標)アプリケーションサーバに対する評価条件列の例は、条件1:アプリケーション名が等しい、条件3:JVM最大使用メモリ量が等しい、の通りである。
サーバ1〜14からなるグループを初期グループとして、上記評価条件列によってグループ分割を行うと、グループは図40に示すように分割される。まず、条件1によって、初期グループが、Webサーバのグループ(サーバ1〜6)と、Java(登録商標)アプリケーションのグループ(サーバ7〜14)に分割される。次いで、Webサーバのグループに対しては、条件2のWebキャッシュサイズ属性による分割が行われ、Webキャッシュサイズが1GBのグループ(サーバ1〜3)と、Webキャッシュサイズが512MBのグループ(サーバ4〜6)に分割される。同様に、Java(登録商標)アプリケーションのグループに対しては、条件3のJVM最大使用メモリ量属性による分割が行われ、JVM最大使用メモリ量が512MBのグループ(サーバ7〜10)と、JVM最大使用メモリ量が256MBのグループ(サーバ11〜14)に分割され、最終的に4個のグループが作成される。
本発明の第12の実施の形態について説明する。本実施の形態において、属性情報0034に含まれる属性テーブル0203を図41に示す。図41に示す属性テーブル0203には、6台のサーバと、その上で生成された14個の仮想計算機についての属性情報が格納されている。各サーバのハードウェアスペックは同等とする。「仮想計算機名」属性には、各仮想計算機の名称が記載され、「CPU割り当て率」属性および「メモリ割り当て率」属性には、各サーバにおいてそれぞれの仮想計算機が使用できるCPU使用率、およびメモリ使用量が記載される。つまり、これら二つの属性によって、仮想計算機の性能が定義される。
仮想計算機の性能は、上記二つの属性に強く依存するため、仮想計算機をグループ分割するための評価条件列に、これらの属性を含めることは妥当である。評価条件列の例は、条件1:CPU割り当て率が等しい、条件2:メモリ割り当て量が等しい、の通りである。
仮想計算機1〜14からなるグループを初期グループとして、上記評価条件列によってグループ分割を行うと、グループは図42に示すように分割される。まず、条件1によって、初期グループが、CPU割り当て率が70%のグループ(仮想計算機1、3)と、CPU割り当て率が30%のグループ(仮想計算機2、4)と、CPU割り当て率が50%のグループ(仮想計算機5〜10)と、CPU割り当て率が25%のグループ(仮想計算機11〜14)に分割される。続いて、条件2によって、CPU割り当て率が50%のグループ(仮想計算機5〜10)が、メモリ割り当て量が512MBのグループ(仮想計算機5〜6)と、メモリ割り当て量が256MBのグループ(仮想計算機7〜10)に分割され、最終的に5個グループが作成される。
本発明の第13の実施の形態について説明する。本実施の形態において、属性情報0034に含まれる属性テーブル0204を図43に示す。図43に示す属性テーブル0204には、1台の負荷分散サーバ(サーバ1)と、10台のWebサーバ(サーバ2〜11)と、3台のNFSサーバ(サーバ12〜14)についての属性情報が格納されている。図44に、システム構成図を示す。
属性「サーバ名」には、各サーバの名称が記載される。属性「アプリケーション名」には、各サーバ上で動作するアプリケーション名が記載される。「共有ファイル配置先」属性は、Webサーバ固有の属性であり、各Webサーバが配信するファイルの配置先が記載される。「提供ファイル種別」属性は、NFSサーバ固有の属性であり、各NFSサーバが保持するファイルの種別が記載される。ここでは、サーバ12がHTMLファイルを提供し、サーバ13がjpeg、png等の画像ファイルを提供し、サーバ14が映像ファイルを提供している。
これら14台のサーバを、以下の評価条件列の例、すなわち、条件1:アプリケーション名が等しい、条件2:共有ファイル配置先が等しい、条件3:提供ファイル種別が等しい、によって、グループに分割する。なお、条件2はWebサーバに対してのみ適用され、条件3はNFSサーバに対してのみ適用される。
サーバ1〜14からなるグループを初期グループとして、上記評価条件列によってグループ分割を行うと、グループは図45に示すように分割される。まず、条件1によって、初期グループが、負荷分散サーバのグループ(サーバ1)と、Webサーバのグループ(サーバ2〜11)と、NFSサーバのグループ(サーバ12〜14)に分割される。次いで、Webサーバのグループに対しては、条件2の共有ファイル配置先属性による分割が行われ、共有ファイル配置先がサーバ12のグループ(サーバ2〜3)と、共有ファイル配置先がサーバ13のグループ(サーバ4〜7)と、共有ファイル配置先がサーバ14のグループ(サーバ8〜11)に分割される。同様に、NFSサーバのグループに対しては、条件3の提供ファイル種別属性による分割が行われ、提供ファイル種別がHTMLファイルのグループ(サーバ12)と、提供ファイル種別が画像ファイルのグループ(サーバ13)と、提供ファイル種別が映像ファイルのグループ(サーバ14)に分割され、最終的に7個のグループが作成される。
以上説明したように、前記実施の形態によれば、監視システムのコストを低減することができる。具体的には、処理性能が似通った複数の監視対象を複数の群に分け、短い監視間隔で監視する群と長い監視間隔で監視する群を設けることで、全ての監視対象について短い監視間隔で監視する場合と比較して、監視能力を低下させることなく、監視エージェント側での監視コストを低減することができる。同時に、監視マネージャ側においても、監視エージェントからの情報を集約する頻度が小さくなるため、監視コストを低減することができる。
更に、処理性能が似通った監視対象を一つのグループとして、負荷変動に関するグループ間の相関度が強い場合、グループ間で監視間隔の変更情報を伝達させることで、システム状態を迅速に把握することができる。
また、監視対象のシステム構成が変更された場合、監視対象の監視間隔を短い監視間隔に変更することで、構成変更後のシステム状態を迅速に把握することができる。
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
本発明は、情報処理システムの性能を監視する監視システム、および、その監視方法に適用して有効であり、システム監視を行うソフトウェア製品、あるいは、システム監視を行う監視装置などに適用可能である。
本発明の第1の実施の形態である監視システムを示すブロック図である。 本発明の第1の実施の形態である監視システムにおいて、群管理テーブルを示す図である。 本発明の第1の実施の形態である監視システムにおいて、別の群管理テーブルを示す図である。 本発明の第1の実施の形態である監視システムにおいて、群に含まれる監視エージェントプログラムを群間で入れ替える処理を示すフロー図である。 本発明の第1の実施の形態である監視システムにおいて、監視強化/弱化処理を示すフロー図である。 本発明の第2の実施の形態である監視システムを示すブロック図である。 本発明の第2の実施の形態である監視システムにおいて、群管理テーブルを示す図である。 本発明の第2の実施の形態である監視システムにおいて、別の群管理テーブルを示す図である。 本発明の第2の実施の形態である監視システムにおいて、監視強度テーブルを示す図である。 本発明の第2の実施の形態である監視システムにおいて、監視強化/弱化処理を示すフロー図である。 本発明の第3の実施の形態である監視システムにおいて、監視エージェントプログラムを示すブロック図である。 本発明の第3の実施の形態である監視システムにおいて、監視強度テーブルを示す図である。 本発明の第1の実施の形態である監視システムにおいて、障害が発生した際の対応処理を示すフロー図である。 本発明の第4の実施の形態である監視システムを示すブロック図である。 本発明の第4の実施の形態である監視システムにおいて、群および負荷量管理テーブルの設定例(パターン1)を示す図である。 本発明の第4の実施の形態である監視システムにおいて、群および負荷量管理テーブルの設定例(パターン2)を示す図である。 本発明の第4の実施の形態である監視システムにおいて、負荷量設定処理を示すフロー図である。 本発明の第5の実施の形態である監視システムを示すブロック図である。 本発明の第5の実施の形態である監視システムにおいて、群管理テーブルを示す図である。 本発明の第6の実施の形態である監視システムを示すブロック図である。 本発明の第6の実施の形態である監視システムにおいて、グループテーブルを示す図である。 本発明の第7の実施の形態である監視システムを示すブロック図である。 本発明の第7の実施の形態である監視システムにおいて、関連付けテーブルを示す図である。 本発明の第8の実施の形態である監視システムを示すブロック図である。 本発明の第8の実施の形態である監視システムにおいて、グループ分割例を示す図である。 本発明の第8の実施の形態である監視システムにおいて、グループ間の関連付けの例を示す図である。 本発明の第8の実施の形態である監視システムにおいて、属性テーブルを示す図である。 本発明の第8の実施の形態である監視システムにおいて、関連付けテーブルを示す図である。 本発明の第8の実施の形態である監視システムにおいて、グループ分割処理を示すフロー図である。 本発明の第9の実施の形態である監視システムを示すブロック図である。 本発明の第9の実施の形態である監視システムにおいて、相関度つき関連付けテーブルを示す図である。 本発明の第9の実施の形態である監視システムにおいて、相関度によるイベント伝播処理を示すフロー図である。 本発明の第9の実施の形態である監視システムにおいて、相関度を更新する処理を示すフロー図である。 本発明の第9の実施の形態である監視システムにおいて、グループを併合する処理を示すフロー図である。 本発明の第10の実施の形態である監視システムにおいて、属性テーブルを示す図である。 本発明の第10の実施の形態である監視システムにおいて、グループ分割(CPU性能)を示す模式図である。 本発明の第10の実施の形態である監視システムにおいて、グループ分割(メモリ性能)を示す模式図である。 本発明の第10の実施の形態である監視システムにおいて、グループ分割(HDD性能)を示す模式図である。 本発明の第11の実施の形態である監視システムにおいて、属性テーブルを示す図である。 本発明の第11の実施の形態である監視システムにおいて、グループ分割を示す模式図である。 本発明の第12の実施の形態である監視システムにおいて、属性テーブルを示す図である。 本発明の第12の実施の形態である監視システムにおいて、グループ分割を示す模式図である。 本発明の第13の実施の形態である監視システムにおいて、属性テーブルを示す図である。 本発明の第13の実施の形態である監視システムにおいて、システム構成を示す図である。 本発明の第13の実施の形態である監視システムにおいて、グループ分割を示す模式図である。
符号の説明
0001…監視装置、0002…監視マネージャプログラム、0003…イベント受信部、0004…監視間隔管理部、0005…監視エージェントプログラム管理部、0006…記憶装置、0007…監視間隔情報、0008…群情報、0009…LAN、0010…監視対象、0011…監視エージェントプログラム、0012…第1群、0013…第2群、0014…監視強度情報、0015…統計処理部、0016…性能情報取得部、0017…性能情報一時記憶、0018…イベント送信、0019…性能情報取得・統計処理、0020…性能情報取得、0021…負荷量管理部、0022…負荷量情報、0023…監視エージェントプログラムL、0024…負荷分散装置、0025…グループ管理部、0026…グループ情報、0027…グループ1、0028…グループ2、0029…第1群、0030…第2群、0031…関連付け管理部、0032…関連付け情報、0033…構成情報記憶装置、0034…属性情報、0035…相関計算部、0036…相関度情報、0100…群管理テーブル、0101…群管理テーブル、0102…群管理テーブル、0103…群管理テーブル、0104…監視強度テーブル、0105…監視強度テーブル、0106…群および負荷量管理テーブル、0107…群および負荷量管理テーブル、0108…群管理テーブル、0109…グループテーブル、0110…関連付けテーブル、0111…属性テーブル、0112…関連付けテーブル、0113…相関度つき関連付けテーブル、0201…属性テーブル、0202…属性テーブル、0203…属性テーブル、0204…属性テーブル、0301…ユーザ1グループ、0302…負荷分散グループ、0303…Webグループ、0304…Webグループ1、0305…Webグループ2、0306…NFSグループ、0307…負荷分散サーバ1、0308…Webサーバ1、0309…Webサーバ2、0310…Webサーバ3、0311…Webサーバ4、0312…NFSサーバ1、0313…LAN1、0314…LAN2、0315…関連付け。

Claims (20)

  1. 監視対象を所定の監視間隔で監視する、複数の監視エージェントプログラムと、
    前記複数の監視エージェントプログラムを制御する監視マネージャプログラムと、からなる監視システムであって、
    前記監視マネージャプログラムは、前記複数の監視エージェントプログラムを複数の各群に分ける機能を備え、
    第1の群に含まれる監視エージェントプログラムは、第2の群に含まれる監視エージェントプログラムよりも短い監視間隔で監視対象を監視する機能を備える、ことを特徴とする監視システム。
  2. 請求項1記載の監視システムにおいて、
    前記監視マネージャプログラムは、前記各群に含まれる監視エージェントプログラムを群間で入れ替える機能を備える、ことを特徴とする監視システム。
  3. 請求項1記載の監視システムにおいて、
    前記監視エージェントプログラムは、監視対象を監視することで得られた情報が所定の条件を満たした場合、前記監視マネージャプログラムへイベントを通知する機能を備え、
    前記監視マネージャプログラムは、イベントの内容を分析し、前記各群に含まれる監視エージェントプログラムの数、および各群における監視エージェントプログラムが監視対象を監視する監視間隔を計算する監視間隔計算機能と、計算の結果、監視する間隔を変更する前記監視エージェントプログラムへ変更を指示する機能とを備える、ことを特徴とする監視システム。
  4. 請求項3記載の監視システムにおいて、
    前記監視エージェントプログラムは、第1の間隔で監視対象を監視して情報を取得し、第2の間隔で取得した情報が所定の条件を満たすか否かを判定し、条件を満たす場合、前記監視マネージャプログラムへイベントを通知する機能を備え、
    前記監視マネージャプログラムは、イベントの内容を分析し、前記各群に含まれる監視エージェントプログラムの数、および各群における監視エージェントプログラムが持つ前記第1の間隔および第2の間隔を計算する監視間隔計算機能と、計算の結果、監視する間隔を変更する前記監視エージェントプログラムへ変更を指示する機能とを備える、ことを特徴とする監視システム。
  5. 請求項3記載の監視システムにおいて、
    前記監視マネージャプログラムは、監視対象が構成変更されたイベントを受信する機能と、前記機能によってイベントを受信したのち、前記監視間隔計算機能によって計算された監視間隔を短縮させる機能とを備える、ことを特徴とする監視システム。
  6. 請求項1記載の監視システムにおいて、
    前記監視マネージャプログラムは、監視対象において障害が発生した場合、その旨を障害イベントとして受信する機能と、前記障害イベントを受信したのち、前記障害イベントに対応する監視エージェントプログラムが短い監視間隔の群に含まれる場合、前記短い監視間隔の群よりも監視間隔が長い群に含まれる監視エージェントプログラムを、前記短い監視間隔の群へ変更する代替機能とを備える、ことを特徴とする監視システム。
  7. 請求項1記載の監視システムにおいて、
    前記監視マネージャプログラムは、前記監視エージェントプログラムが監視する監視対象への負荷量を設定する負荷量設定機能を備え、前記負荷量設定機能を用いて、前記各群ごとに、その群に含まれる監視エージェントプログラムが監視する監視対象への負荷量を設定する、ことを特徴とする監視システム。
  8. 請求項1記載の監視システムにおいて、
    前記監視マネージャプログラムは、前記監視エージェントプログラムを複数のグループに分割し、各グループに含まれる監視エージェントプログラムを前記各群に分ける機能を備える、ことを特徴とする監視システム。
  9. 請求項8記載の監視システムにおいて、
    前記監視対象の構成情報を記憶した構成情報記憶装置を備え、
    前記監視マネージャプログラムは、前記構成情報記憶装置から監視対象ごとに前記監視対象の構成情報を取得し、前記構成情報を所定の評価条件で評価し、その結果が同一、もしくは所定の範囲内である監視対象同士を同一のグループとする機能を備える、ことを特徴とする監視システム。
  10. 請求項9記載の監視システムにおいて、
    前記監視対象が情報処理装置である場合、監視対象のスペック情報の同一性を評価する条件を、前記評価条件としてグループを作成する、ことを特徴とする監視システム。
  11. 請求項9記載の監視システムにおいて、
    前記監視対象がアプリケーションが動作している情報処理装置である場合、監視対象のアプリケーションの同一性を評価する条件を、前記評価条件としてグループを作成する、ことを特徴とする監視システム。
  12. 請求項9記載の監視システムにおいて、
    前記構成情報記憶装置は、前記グループ間の関連付け情報を記憶し、前記関連付けごとに、前記関連付けによって関連付けられているグループ間の相関性を示す相関度を記憶する、ことを特徴とする監視システム。
  13. 請求項12記載の監視システムにおいて、
    前記監視マネージャプログラムは、前記監視エージェントプログラムからイベントを受信したのち、前記監視エージェントプログラムが含まれるグループと関連付けを持つグループへ、前記イベントを伝播させるか否かの判断を、前記関連付けに対応する相関度が所定の条件を満たすか否かで判断する、ことを特徴とする監視システム。
  14. 請求項12記載の監視システムにおいて、
    前記監視エージェントプログラムは、監視対象を監視して取得した情報を記憶する性能情報記憶装置を備え、
    前記監視マネージャプログラムは、所定のスケジュールにしたがって、前記関連付けによって関連付けられたグループに含まれる監視対象の性能情報の相関性を計算する相関性計算機能を備え、前記相関性計算機能による計算結果を前記相関度に記憶する、ことを特徴とする監視システム。
  15. 請求項14記載の監視システムにおいて、
    前記相関性計算機能による計算結果が、所定の条件を満たす場合、前記関連付けられたグループを併合して一つのグループとする、ことを特徴とする監視システム。
  16. 監視対象を所定の監視間隔で監視する、複数の監視エージェントプログラムと、
    前記複数の監視エージェントプログラムを制御する監視マネージャプログラムと、からなる監視システムにおける監視方法であって、
    前記複数の監視エージェントプログラムを複数の各群に分け、第1の群に含まれる監視エージェントプログラムは、第2の群に含まれる監視エージェントプログラムよりも短い監視間隔で監視対象を監視する、ことを特徴とする監視方法。
  17. 請求項16記載の監視方法において、
    前記監視エージェントプログラムは、第1の間隔で監視対象を監視して情報を取得し、第2の間隔で取得した情報が所定の条件を満たすか否かを判定し、条件を満たす場合、前記監視マネージャプログラムへイベントを通知し、
    前記監視マネージャプログラムは、イベントの内容を分析し、前記各群に含まれる監視エージェントプログラムの数、および各群における監視エージェントプログラムが持つ前記第1の間隔および第2の間隔を計算し、計算の結果、監視する間隔を変更する前記監視エージェントプログラムへ変更を指示する、ことを特徴とする監視方法。
  18. 請求項16記載の監視方法において、
    前記監視エージェントプログラムを複数のグループに分割し、各グループに含まれる監視エージェントプログラムを前記各群に分ける、ことを特徴とする監視方法。
  19. 請求項18記載の監視方法において、
    前記構成情報記憶装置から監視対象ごとに前記監視対象の構成情報を取得し、前記構成情報を所定の評価条件で評価し、その結果が同一、もしくは所定の範囲内である監視対象同士を同一のグループとする、ことを特徴とする監視方法。
  20. 請求項19記載の監視方法において、
    前記監視対象が情報処理装置である場合、監視対象のスペック情報の同一性を評価する条件を、前記評価条件としてグループを作成する、ことを特徴とする監視方法。
JP2005164630A 2005-06-03 2005-06-03 監視システムおよび監視方法 Expired - Fee Related JP4313336B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005164630A JP4313336B2 (ja) 2005-06-03 2005-06-03 監視システムおよび監視方法
US11/194,614 US7890620B2 (en) 2005-06-03 2005-08-02 Monitoring system and monitoring method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005164630A JP4313336B2 (ja) 2005-06-03 2005-06-03 監視システムおよび監視方法

Publications (2)

Publication Number Publication Date
JP2006338543A true JP2006338543A (ja) 2006-12-14
JP4313336B2 JP4313336B2 (ja) 2009-08-12

Family

ID=37495430

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005164630A Expired - Fee Related JP4313336B2 (ja) 2005-06-03 2005-06-03 監視システムおよび監視方法

Country Status (2)

Country Link
US (1) US7890620B2 (ja)
JP (1) JP4313336B2 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008234520A (ja) * 2007-03-23 2008-10-02 Toyota Central R&D Labs Inc ソフトウェア挙動監視装置、ソフトウェア挙動監視システム及びそのプログラム
JP2009171265A (ja) * 2008-01-17 2009-07-30 Nec Corp 監視制御方法および監視制御装置
JP2009251890A (ja) * 2008-04-04 2009-10-29 Nec Corp サーバ監視システム及びサーバ監視方法
JP2010066967A (ja) * 2008-09-10 2010-03-25 Nec Corp サーバ監視システム及びその方法
JP2010277349A (ja) * 2009-05-28 2010-12-09 Toshiba Corp 情報処理装置および環境設定方法
JP2011505043A (ja) * 2007-11-30 2011-02-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 関連のネットワーク・トポロジを有する指定のトランザクション・サーバの動作をモニターするための方法、コンピュータ・プログラム、および装置(e‐ビジネス・システムのパフォーマンスおよび可用性をモニターするために動的にスケジュールされた合成トランザクションを使用するための方法)
WO2011043447A1 (ja) * 2009-10-08 2011-04-14 日本電気株式会社 運用監視装置、運用監視方法及びプログラム記憶媒体
WO2011077533A1 (ja) * 2009-12-24 2011-06-30 富士通株式会社 性能データ収集方法、性能データ収集装置及び性能データ管理システム
US8705082B2 (en) 2007-12-13 2014-04-22 Canon Kabushiki Kaisha Image forming apparatus monitoring system and method therefor
JP2015154301A (ja) * 2014-02-17 2015-08-24 日本電気株式会社 ネットワーク監視装置、システム、方法及びプログラム
JP2015536117A (ja) * 2012-10-04 2015-12-17 ステイトレス ネットワークス インコーポレイテッド ネットワーク装置データを動的に管理するシステム及び方法
JP2016522947A (ja) * 2013-05-21 2016-08-04 アマゾン・テクノロジーズ・インコーポレーテッド コンピュータリソースサービスの性能能力の決定及び監視

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4123914B2 (ja) 2002-11-26 2008-07-23 株式会社日立製作所 プログラムの動作状態の監視方法及び監視プログラム
US20060004917A1 (en) * 2004-06-30 2006-01-05 Wang Winston L Attribute grouping for management of a wireless network
GB0516554D0 (en) * 2005-08-11 2005-09-21 Ibm Method, apparatus and computer program for enabling monitoring of a resource
US8504679B2 (en) * 2006-05-09 2013-08-06 Netlq Corporation Methods, systems and computer program products for managing execution of information technology (IT) processes
JP4751265B2 (ja) * 2006-08-01 2011-08-17 株式会社日立製作所 リソース管理システム及びその方法
US8112378B2 (en) * 2008-06-17 2012-02-07 Hitachi, Ltd. Methods and systems for performing root cause analysis
WO2010001481A1 (ja) * 2008-07-04 2010-01-07 富士通株式会社 情報収集装置、情報収集プログラム及び方法
US8789071B2 (en) 2008-10-09 2014-07-22 International Business Machines Corporation Integrated extension framework
US20100094988A1 (en) * 2008-10-09 2010-04-15 International Business Machines Corporation automatic discovery framework for integrated monitoring of database performance
US8516099B1 (en) * 2009-01-26 2013-08-20 Hewlett-Packard Development Company, L.P. Scaling management tasks performed by a management system according to a determined size of a managed environment
US8910153B2 (en) * 2009-07-13 2014-12-09 Hewlett-Packard Development Company, L. P. Managing virtualized accelerators using admission control, load balancing and scheduling
US9665461B2 (en) 2009-12-04 2017-05-30 Red Hat, Inc. Obtaining application performance data for different performance events via a unified channel
US8286192B2 (en) * 2009-12-04 2012-10-09 Red Hat, Inc. Kernel subsystem for handling performance counters and events
US8954996B2 (en) * 2009-12-11 2015-02-10 Red Hat, Inc. Profiling the system providing performance statistics in real time
US8935703B2 (en) * 2009-12-11 2015-01-13 Red Hat, Inc. Performance counter inheritance
US8171340B2 (en) * 2009-12-11 2012-05-01 Red Hat, Inc. Software performance counters
US20140355453A1 (en) * 2011-12-21 2014-12-04 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for fault analysis in a multi-layer network
KR101212497B1 (ko) * 2012-05-02 2012-12-14 주식회사 팀스톤 컴퓨팅 장치에서 수행되는 자원 모니터링 방법 및 컴퓨팅 장치
TWI497968B (zh) 2012-12-25 2015-08-21 Wistron Neweb Corp 網路傳輸檢查裝置以及網路傳輸檢查方法
US9632803B2 (en) * 2013-12-05 2017-04-25 Red Hat, Inc. Managing configuration states in an application server
CN106201846B (zh) * 2016-06-30 2019-07-12 微梦创科网络科技(中国)有限公司 自动化测试中的性能监控方法及装置
US11586524B1 (en) 2021-04-16 2023-02-21 Vignet Incorporated Assisting researchers to identify opportunities for new sub-studies in digital health research and decentralized clinical trials
US11281553B1 (en) 2021-04-16 2022-03-22 Vignet Incorporated Digital systems for enrolling participants in health research and decentralized clinical trials
US11789837B1 (en) 2021-02-03 2023-10-17 Vignet Incorporated Adaptive data collection in clinical trials to increase the likelihood of on-time completion of a trial

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05205074A (ja) 1992-01-27 1993-08-13 Nec Corp 情報処理システムのデータ収集方式
JPH07152706A (ja) 1993-11-30 1995-06-16 Fuji Xerox Co Ltd ネットワーク・コンピュータ
JPH08275260A (ja) 1995-03-29 1996-10-18 Mitsubishi Electric Corp 状態監視制御システム
JP3513027B2 (ja) 1998-09-08 2004-03-31 富士通株式会社 監視システム及びその監視方法
US6397359B1 (en) * 1999-01-19 2002-05-28 Netiq Corporation Methods, systems and computer program products for scheduled network performance testing
US7725571B1 (en) * 1999-05-24 2010-05-25 Computer Associates Think, Inc. Method and apparatus for service analysis in service level management (SLM)
US6505244B1 (en) * 1999-06-29 2003-01-07 Cisco Technology Inc. Policy engine which supports application specific plug-ins for enforcing policies in a feedback-based, adaptive data network
US6763380B1 (en) * 2000-01-07 2004-07-13 Netiq Corporation Methods, systems and computer program products for tracking network device performance
US6625648B1 (en) * 2000-01-07 2003-09-23 Netiq Corporation Methods, systems and computer program products for network performance testing through active endpoint pair based testing and passive application monitoring
JP2001282554A (ja) 2000-03-29 2001-10-12 Hitachi Ltd 監視方法および監視装置
US7181743B2 (en) * 2000-05-25 2007-02-20 The United States Of America As Represented By The Secretary Of The Navy Resource allocation decision function for resource management architecture and corresponding programs therefor
US6681232B1 (en) * 2000-06-07 2004-01-20 Yipes Enterprise Services, Inc. Operations and provisioning systems for service level management in an extended-area data communications network
US7917647B2 (en) * 2000-06-16 2011-03-29 Mcafee, Inc. Method and apparatus for rate limiting
US7287063B2 (en) * 2001-10-05 2007-10-23 International Business Machines Corporation Storage area network methods and apparatus using event notifications with data
US6801940B1 (en) * 2002-01-10 2004-10-05 Networks Associates Technology, Inc. Application performance monitoring expert
JP4313978B2 (ja) 2002-03-19 2009-08-12 日本電気株式会社 計算機監視方式、計算機監視方法および計算機監視用プログラム
US7246159B2 (en) * 2002-11-01 2007-07-17 Fidelia Technology, Inc Distributed data gathering and storage for use in a fault and performance monitoring system
JP4123914B2 (ja) 2002-11-26 2008-07-23 株式会社日立製作所 プログラムの動作状態の監視方法及び監視プログラム
US7685269B1 (en) * 2002-12-20 2010-03-23 Symantec Operating Corporation Service-level monitoring for storage applications
JP4089427B2 (ja) * 2002-12-26 2008-05-28 株式会社日立製作所 管理システム、管理計算機、管理方法及びプログラム
US7246156B2 (en) * 2003-06-09 2007-07-17 Industrial Defender, Inc. Method and computer program product for monitoring an industrial network
US7454496B2 (en) * 2003-12-10 2008-11-18 International Business Machines Corporation Method for monitoring data resources of a data processing network
JP4244319B2 (ja) * 2003-12-17 2009-03-25 株式会社日立製作所 計算機システム管理プログラム,記録媒体,ならびに計算機システム管理システムおよびそのための管理装置および記憶装置
US20050216585A1 (en) * 2004-03-26 2005-09-29 Tsvetelina Todorova Monitor viewer for an enterprise network monitoring system
US7742436B2 (en) * 2004-09-02 2010-06-22 General Dynamics C4 Systems, Inc. Distributed networking agent and method of making and using the same
EP1790130B1 (en) * 2004-09-15 2019-02-27 Cisco Technology, Inc. Agile information technology infrastructure management system
US20060064481A1 (en) * 2004-09-17 2006-03-23 Anthony Baron Methods for service monitoring and control
US7822849B2 (en) * 2006-11-16 2010-10-26 Path Solutions, Inc. Apparatus and method for measuring and using response to SNMP requests to provide real-time network parameter estimates in a network management zone

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008234520A (ja) * 2007-03-23 2008-10-02 Toyota Central R&D Labs Inc ソフトウェア挙動監視装置、ソフトウェア挙動監視システム及びそのプログラム
JP4618263B2 (ja) * 2007-03-23 2011-01-26 株式会社豊田中央研究所 ソフトウェア挙動監視装置及びソフトウェア挙動監視システム
JP2011505043A (ja) * 2007-11-30 2011-02-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 関連のネットワーク・トポロジを有する指定のトランザクション・サーバの動作をモニターするための方法、コンピュータ・プログラム、および装置(e‐ビジネス・システムのパフォーマンスおよび可用性をモニターするために動的にスケジュールされた合成トランザクションを使用するための方法)
US8705082B2 (en) 2007-12-13 2014-04-22 Canon Kabushiki Kaisha Image forming apparatus monitoring system and method therefor
JP2009171265A (ja) * 2008-01-17 2009-07-30 Nec Corp 監視制御方法および監視制御装置
US8331237B2 (en) 2008-01-17 2012-12-11 Nec Corporation Supervisory control method and supervisory control device
JP2009251890A (ja) * 2008-04-04 2009-10-29 Nec Corp サーバ監視システム及びサーバ監視方法
JP2010066967A (ja) * 2008-09-10 2010-03-25 Nec Corp サーバ監視システム及びその方法
US8074233B2 (en) 2009-05-28 2011-12-06 Kabushiki Kaisha Toshiba Information processing apparatus and configuring method
JP4660604B2 (ja) * 2009-05-28 2011-03-30 株式会社東芝 情報処理装置および環境設定方法
JP2010277349A (ja) * 2009-05-28 2010-12-09 Toshiba Corp 情報処理装置および環境設定方法
WO2011043447A1 (ja) * 2009-10-08 2011-04-14 日本電気株式会社 運用監視装置、運用監視方法及びプログラム記憶媒体
JPWO2011043447A1 (ja) * 2009-10-08 2013-03-04 日本電気株式会社 運用監視装置、運用監視方法及びプログラム記憶媒体
JP5527324B2 (ja) * 2009-10-08 2014-06-18 日本電気株式会社 運用監視装置、運用監視方法及びプログラム記憶媒体
WO2011077533A1 (ja) * 2009-12-24 2011-06-30 富士通株式会社 性能データ収集方法、性能データ収集装置及び性能データ管理システム
JP5267681B2 (ja) * 2009-12-24 2013-08-21 富士通株式会社 性能データ収集方法、性能データ収集装置及び性能データ管理システム
US9396087B2 (en) 2009-12-24 2016-07-19 Fujitsu Limited Method and apparatus for collecting performance data, and system for managing performance data
JP2015536117A (ja) * 2012-10-04 2015-12-17 ステイトレス ネットワークス インコーポレイテッド ネットワーク装置データを動的に管理するシステム及び方法
JP2016522947A (ja) * 2013-05-21 2016-08-04 アマゾン・テクノロジーズ・インコーポレーテッド コンピュータリソースサービスの性能能力の決定及び監視
JP2015154301A (ja) * 2014-02-17 2015-08-24 日本電気株式会社 ネットワーク監視装置、システム、方法及びプログラム

Also Published As

Publication number Publication date
US7890620B2 (en) 2011-02-15
US20060277295A1 (en) 2006-12-07
JP4313336B2 (ja) 2009-08-12

Similar Documents

Publication Publication Date Title
JP4313336B2 (ja) 監視システムおよび監視方法
US8589923B2 (en) Preprovisioning virtual machines based on request frequency and current network configuration
US9535752B2 (en) Systems and methods of host-aware resource management involving cluster-based resource pools
US8881165B2 (en) Methods, computer systems, and physical computer storage media for managing resources of a storage server
Veeraraghavan et al. Kraken: Leveraging live traffic tests to identify and resolve resource utilization bottlenecks in large scale web services
JP4912401B2 (ja) パフォーマンス情報およびイベント情報を適応的に収集するシステムおよび方法
JP6233413B2 (ja) タスク割り当て判定装置、制御方法、及びプログラム
US9172646B2 (en) Dynamic reconfiguration of network devices for outage prediction
CN112162865A (zh) 服务器的调度方法、装置和服务器
WO2012167378A1 (en) System and method of optimization of in-memory data grid placement
US20080148272A1 (en) Job allocation program, method and apparatus
US9396087B2 (en) Method and apparatus for collecting performance data, and system for managing performance data
US20170048352A1 (en) Computer-readable recording medium, distributed processing method, and distributed processing device
JP4117299B2 (ja) サーバの多重度の上限値を制御するための方法、管理サーバ、サーバ、およびプログラム
US11438271B2 (en) Method, electronic device and computer program product of load balancing
US20030014507A1 (en) Method and system for providing performance analysis for clusters
JP2012198724A (ja) 情報処理プログラム及び方法、転送処理装置
JP5879117B2 (ja) 情報処理システムおよび運用管理方法
JP2007179246A (ja) 計算機管理方法、計算機管理プログラム、および、計算機管理サーバ
US10375161B1 (en) Distributed computing task management system and method
CN111158896A (zh) 一种分布式进程调度方法及系统
JP2019179487A (ja) 情報処理装置、制御方法、及びプログラム
JP5803655B2 (ja) データ転送のためのプログラム、情報処理方法及び転送装置、転送処理の割り当てを管理するためのプログラム、情報処理方法及び管理装置、並びに情報処理システム
US10296493B2 (en) Distributed data processing system and distributed data processing method
JP2009020736A (ja) サーバアプリケーション監視システム及び監視方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090325

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090421

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090514

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120522

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4313336

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120522

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130522

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130522

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees