JP2006011902A - 運用管理支援システムおよび性能情報表示方法 - Google Patents

運用管理支援システムおよび性能情報表示方法 Download PDF

Info

Publication number
JP2006011902A
JP2006011902A JP2004189267A JP2004189267A JP2006011902A JP 2006011902 A JP2006011902 A JP 2006011902A JP 2004189267 A JP2004189267 A JP 2004189267A JP 2004189267 A JP2004189267 A JP 2004189267A JP 2006011902 A JP2006011902 A JP 2006011902A
Authority
JP
Japan
Prior art keywords
performance information
performance
information
types
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004189267A
Other languages
English (en)
Other versions
JP4430989B2 (ja
JP2006011902A5 (ja
Inventor
Yoko Shiga
陽子 志賀
Kimitoku Sugauchi
公徳 菅内
Takeshi Ishizaki
健史 石▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004189267A priority Critical patent/JP4430989B2/ja
Publication of JP2006011902A publication Critical patent/JP2006011902A/ja
Publication of JP2006011902A5 publication Critical patent/JP2006011902A5/ja
Application granted granted Critical
Publication of JP4430989B2 publication Critical patent/JP4430989B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】 管理対象システムの性能情報を収集する運用管理支援システムにおいて、ある性能情報種類についての性能劣化を、その性能情報種類から影響を受ける他の性能情報種類についての性能情報の変化によって判断する。
【解決手段】 メトリック相関400は、性能情報種類間の依存関係について影響を与える性能情報種類と影響を受ける性能情報種類とを示す依存関係情報を格納する。性能情報収集部105は、性能情報種類全体のうち選択された性能情報種類について管理対象システムから周期的に性能情報を収集して性能情報履歴を記録する。検索部101は、選択されない性能情報種類の1つが指定されたとき、メトリック相関400を検索し、指定された性能情報種類から影響を受けかつ選択済の複数の性能情報種類を取得し、取得した性能情報種類について性能情報履歴を表示する。
【選択図】 図1

Description

本発明は、管理対象システムから性能情報を収集する運用管理支援システムに関する。
従来専用システムとして構築されていた企業情報システムは、Webサーバなどのインターネットサービスのサーバ、データベースサーバなど、汎用のコンポーネントによって実現されるようになった。このような企業情報システムは、独立した複数の要素から構成されているため、システムの性能低下の原因を特定することが難しい。
特に比較的大規模なシステムにおいては、膨大な管理情報を一元的に管理することが性能監視および性能低下の原因分析のために重要であるため、システムの構成情報、システムの提供するサービスの応答時間などを集中管理する運用管理支援システムが開発されている。このような運用管理支援システムは、サービスの応答性能や構成要素のCPU使用率、メモリ使用率などの性能情報を収集し、しきい値監視によって異常を検出し、検出した異常の原因を解析する(特許文献1参照)。
次に運用管理支援システムの持つ従来の性能低下原因を解析する方法について述べる。まずシステムの構成要素の性能情報をサービスごとにグループ化し、サービスの応答性能が低下した場合には、グループの中から応答性能に影響を与えたと考えられる性能情報を絞り込み、問題のある構成要素を特定する。この絞込みには、性能情報間の相関分析が利用されることが多い。相関分析とは、変数Xと変数Yとの間の相関関係を示すものである。変数Xが増加すると変数Yも増加する場合に、変数Xと変数Yの間には正の相関関係があると言うことができる。一方、変数Xが増加すると変数Yは減少する場合に、変数Xと変数Yの間には負の相関関係があると言うことができる。相関関係は、相関係数によって定量的に表され、相関係数は公式によって算出することが可能である。この相関分析によって、変数Xを基準として変数Yとの相関係数を求めるとき、変数Xを目的変数、変数Yを説明変数と呼ぶ。
以上述べたように、運用管理支援システムの性能低下原因を解析する機能を用いることにより、あるサービスの応答性能に影響を与えたと考えられる要素を洗い出すことが可能であり、根本的な原因の発見に役立てることができる。このような解析機能を持つ運用管理支援システムは既に市販されている(非特許文献1参照)。
なお多くのサーバやネットワーク機器は、CPU使用率や回線稼働率などの性能情報をMIB(Management Information Base)として保持している。MIBは、分散システムの管理情報の構造を規定したものであり、管理情報をオブジェクトIDと呼ばれる一意な識別子で指定することができる。サーバやネットワーク機器が持つMIBの値を、ネットワークを介して外部から取得可能にするプロトコルがSNMP(Simple Network Management Protocol)である。運用管理支援システムは、一般にこのSNMPを利用してMIB形式の性能情報を収集する。ただし直接サーバにリモートログインして性能情報を収集する機能をもつシステムも存在する。
特開2002−342182号公報 「日経ビジネス」2002年3月18日号
上記従来技術を利用すると、システムの管理者は、システムの性能情報を監視し、性能低下を早期発見し、性能低下原因の解析を行うことができる。しかし従来技術には次のような問題点がある。
構成要素によっては性能情報を提供していなかったり、提供手段が固有であったりするため、運用管理支援サーバが性能情報を収集できない場合がある。しかし従来技術では、構成要素が性能劣化を招いた性能情報を収集していない場合には、その原因を特定できない。
本発明は、少なくとも1台の計算機が稼動し、受信したリクエストの処理を行ってその応答を返す管理対象システムと、管理対象システムの稼動状態や処理性能を示す性能情報を収集する運用管理支援システムとを有するシステムにおいて運用管理支援システムによる性能情報表示技術であって、管理対象システムの性能情報の種別を示す複数の性能情報種類が設定されており、運用管理支援システムは、性能情報種類のうち選択された性能情報種類について管理対象システムから周期的に性能情報を収集して性能情報履歴を記録し、選択されない性能情報種類の1つが指定されたとき、性能情報種類間の依存関係について影響を与える性能情報種類と影響を受ける性能情報種類との関係を示す依存関係情報を検索して、指定された性能情報種類から影響を受けかつ選択済の複数の性能情報種類を取得し、取得した性能情報種類について性能情報履歴を表示する技術を特徴とする。
本発明の運用管理支援システムによれば、ある性能情報種類についての性能劣化を、その性能情報種類から影響を受ける他の性能情報種類についての性能情報の変化によって判断するので、その性能情報種類についての性能情報を収集していない場合でも、その性能情報種類に関する性能劣化を判断することが可能になり、管理対象システム全体の性能劣化の原因特定に有効である。
図1は、本発明の一実施例のシステムの構成図である。本実施例のシステムは、1つの運用管理支援サーバ100と、複数の管理対象サーバ222からなる管理対象システム200から構成される。運用管理支援サーバ100は、IPネットワーク120を介して管理対象サーバ222と接続される。
運用管理支援サーバ100は、CPU、メモリ、外部記憶装置などを備えた計算機である。運用管理支援サーバ100は、そのメモリにGUI(Graphical User Interface)のほかに、構成情報・収集条件登録部104、分析・検索指示部103、性能情報収集部105、しきい値監視部102、相関分析部107、検索部101の各プログラムを格納し、そのCPUによって実行する。構成情報・収集条件登録部104は、管理対象システム200の構成を示す構成定義情報600と性能情報の収集条件112とを入力し、データベース106に登録する。分析・検索指示部103は、性能劣化原因の分析実行指示を受け付ける。性能情報収集部105は、管理対象サーバ222から性能情報を収集する。しきい値監視部102は、収集した性能情報が予め決められたしきい値を超過していないか判定し、超過する場合はポップアップウィンドウを表示して管理者に通知する。相関分析部107は、相関分析により性能情報種類間の関連の強さを算出する。検索部101は、ある性能情報から影響を受ける関連性能情報を検索する。外部記憶装置上に記憶されるデータベース106は、管理対象システム200についての構成情報500と、性能情報の収集条件112と、収集した性能情報113とを格納する。
構成情報500は、構成情報テンプレート110と構成定義情報600とを含む。構成情報テンプレート110は、構成情報のひな型となる情報であり、オブジェクト定義300と、メトリック相関400とから成る。構成定義情報600は、管理者によって入力される情報であり、構成情報テンプレート110に基づいて作成される。
管理対象サーバ222は、CPU、メモリ、外部記憶装置などを備えた計算機である。管理対象サーバ222は、そのメモリに管理対象サーバプログラム221およびエージェント201の各プログラムを格納し、そのCPUによって実行する。
エージェント201は、管理対象サーバプログラム221が稼動する管理対象サーバ222上で稼動し、プロセス間通信などの手段により、管理対象サーバ222のCPU使用率、メモリ使用率、管理対象サーバの待ちリクエスト数などの性能情報を収集するプログラムである。本実施例では、エージェント201は管理対象サーバプログラム221から独立したプログラムであるが、管理対象サーバプログラム221が性能情報を提供するインタフェースを備えており、性能情報収集部105が直接管理対象サーバプログラム221から性能情報を取得できる場合には、エージェント201は不要である。
性能情報収集部105は、管理対象サーバプログラム221に擬似的なリクエストを送信し、レスポンスを得るまでの応答時間を収集する。また性能情報収集部105は、エージェント201へSNMPによる性能情報収集リクエストを送信する。エージェント201は、性能情報収集部105から性能情報収集リクエストを受け取り、当該エージェントが稼動する管理対象サーバ222のCPU使用率や管理対象サーバプログラムの待ちリクエスト数などの性能情報を性能情報収集部105に送信する。
図2は、管理対象システム200の実施例の構成を示す図である。管理対象システム200は、複数の管理対象サーバ222、ストレージ装置1(207)およびストレージ装置2(208)を有する。各管理対象サーバ222は、各々管理対象サーバプログラム221として、Webサーバ1(202)、Webサーバ2(203)、アプリケーションサーバ1(以後、APサーバ1という)(204)、アプリケーションサーバ2(以後、APサーバ2という)(205)、およびデータベースサーバ(以後、DBサーバという)206を有する。
Webサーバ1(202)、Webサーバ2(203)、APサーバ1(204)、APサーバ2(205)、およびDBサーバ206は、同一の管理対象サーバ222上で動作してもよいし、それぞれネットワークによって接続された別の管理対象サーバ222上で動作してもよい。本実施例では、各サーバプログラムはそれぞれ別の管理対象サーバ222上で動作し、各管理対象サーバ222はIPネットワーク210によって接続されているものとする。なおWebサーバ1(202)、Webサーバ2(203)、APサーバ1(204)、またはAPサーバ2(205)が稼動する管理対象サーバ222上には、エージェント201も稼動しており、CPU使用率やメモリ使用率などの管理対象サーバ222自体の性能情報と、Webサーバの受信リクエスト数など、サーバプログラムの性能情報を取り出し、運用管理支援サーバ100へ送信する。
またストレージ装置1(207)は、FC(Fiber Channel)ネットワーク220を介してDBサーバ206およびストレージ装置2(208)と接続している。このストレージ装置1(207)は、仮想ストレージ機能を備えており、DBサーバ206から自ストレージ装置上の記憶領域と同様にストレージ装置2(208)上の記憶領域を利用可能とする。
この管理対象システム200は、A社が提供する会員制のショッピングサイトを実現する。A社ショッピングサイトが提供するサービスは、会員情報管理サービスとオンラインショッピングの2つのサービスである。管理対象システム200は、この会員情報管理サービスと、オンラインストアとをそれぞれ別サービスとして監視している。Webサーバ1(202)とAPサーバ1(204)は、会員情報管理サービスを実現している。一方、Webサーバ2(203)とAPサーバ2(205)は、オンラインショッピングを実現している。DBサーバ206は、これら2つのサービスによって共通にアクセスされる会員情報を管理している。ストレージ装置1(207)およびストレージ装置2(208)は、DBサーバ206が管理する会員情報を記録しており、DBサーバ206は、ストレージ装置1(207)およびストレージ装置2(208)上に記録されている会員情報の登録、更新、削除および参照を行う。
次にこの管理対象システム200が実現するショッピングサイトの処理例について説明する。このショッピングサイトの利用者のコンピュータ211は、IPネットワーク120を介して管理対象システム200と接続しており、会員情報変更のWebページを用いて会員情報の変更を行い、その後、オンラインストアのWebページで商品の購入を行うものとする。
Webサーバ1(202)は会員情報変更のページを持つ。そしてA社ショッピングサイトの利用者のコンピュータ211が発行するHTTPリクエストを受け付け、会員情報変更要求をHTTPリクエストから取り出し、APサーバ1(204)に送信する。APサーバ1(204)は、会員情報変更要求を受け取り、会員情報変更のSQLリクエストを作成してDBサーバ206に送信する。DBサーバ206は、SQLリクエストを受信し、会員情報を変更する。そしてDBサーバ206は、変更操作が正常に完了したことを示す応答をAPサーバ1(204)に送信する。APサーバ1(204)は、この応答を受け取り、Webサーバ1(202)に応答を送信する。Webサーバ1(202)は、この応答を受け取り、利用者のコンピュータ211にHTTPレスポンスとして応答を返す。
一方、Webサーバ2(203)はオンラインショッピングのページを持つ。そしてWebサーバ2(203)は、利用者のコンピュータ211が発行するHTTPリクエストを受け付け、HTTPリクエストから会員情報や選択された商品情報などを取り出し、APサーバ2(205)へ送信する。APサーバ2(205)は、会員情報や選択された商品情報を受け取り、会員情報を確認するため、会員情報を取得するSQLリクエストを作成し、DBサーバ206に送信する。DBサーバ206は、会員情報を取得するSQLリクエストを受け取り、応答として会員情報をAPサーバ2(205)に送信する。APサーバ2は、この会員情報を確認する。そして会員情報が正しいと判定した場合には、購入記録の登録要求のSQLリクエストを作成し、同様にDBサーバ206に送信する。DBサーバ206は、このSQLリクエストを受け取り、購入記録を保存する。
図3は、本発明の一実施例において構成情報テンプレート110に含まれるオブジェクト定義300のデータ構成を示す図である。このオブジェクト定義300は、3階層システムをモデル化して関係する性能パラメータを定義する。性能パラメータとは、性能情報の種別を示す情報である。本明細書では、性能情報種類を示す情報を性能パラメータとも呼ぶ。3階層システムとは、Webアプリケーションの実現に用いられる構成であり、Webサーバ、APサーバ、およびDBサーバから成る。A社のショッピングサイトは3階層システムである。ここでオブジェクトとは管理対象システム200の管理対象物を意味している。オブジェクト定義とは、オブジェクトの種類と、オブジェクト種類ごとに性能情報を収集するとすれば収集可能な性能パラメータを定義するものである。3階層システムのオブジェクトには、HTTPサービス、ホスト、Webサーバ、APサーバ、およびDBサーバがある。ここでHTTPサービスは、サービスの全体を管理対象物とみなすものである。またホストとは、ハードウェアとしての管理対象サーバ222を意味する。本実施例のオブジェクト定義300は、HTTPサービスオブジェクト定義310、ホストオブジェクト定義320、Webサーバオブジェクト定義330、APサーバオブジェクト定義340、およびDBサーバオブジェクト定義350から成る。
HTTPサービスの性能パラメータは、HTTPリクエストの送信準備からHTTPレスポンスを受信するまでの所要時間である総応答時間311と、DNS名前解決やTCPコネクションの確立に要したセットアップ時間312と、HTTPリクエストを送信し、HTTPレスポンスを受信するまでの所要時間であるHTTP時間313とから成る。HTTP時間にセットアップ時間を加えたものが総応答時間になる。ホストの性能パラメータは、CPU使用率321、メモリ使用率322および回線使用率323から成る。
Webサーバの性能パラメータは、Webサーバが単位時間あたりに受信するリクエスト数である受信リクエスト数331、平均レスポンス時間332、およびWebサーバに割り当てられたスレッド数に対するリクエスト処理中のスレッド数であるリクエスト処理中スレッド割合333から成る。平均レスポンス時間は、Webサーバがリクエストを受信してから応答を返すまでの時間である。一般にリクエストと使用するスレッドはほぼ1対1対応しており、リクエスト数が増えると使用するスレッド数が増える。
APサーバの性能パラメータは、JVM(Java(登録商標) Virtual Machine)に割り当てられたメモリに対する使用中メモリの割合を示すJVMメモリ使用率341、APサーバに割り当てられたスレッド数に対するリクエスト処理中のスレッド数であるリクエスト処理中スレッド割合342、実行待ちリクエスト数343、およびDB平均トランザクション時間344から成る。一般にAPサーバは、1つのリクエストについてDBサーバへ複数のトランザクションを発行する。平均トランザクション時間は、APサーバがDBサーバへトランザクションを送信してから応答を受け取るまでのトランザクション時間の平均値である。
DBサーバの性能パラメータは、単位時間あたり処理されるトランザクション数であるトランザクション数351、およびキャッシュヒット率352から成る。キャッシュヒット率352は、DBサーバ206がデータベース中のデータをその管理対象サーバ222のメモリに見出す割合である。
図4は、本発明の一実施例の構成情報テンプレート110に含まれるメトリック相関400のデータ構成例を示す図である。メトリック相関400は、管理対象システム200の性能に関するオブジェクトの性能パラメータ間の依存関係を表す。図示される矢印の元は影響を与える性能パラメータであり、矢印の先は影響を受ける性能パラメータを示す。
Webサーバの受信リクエスト数331は、Webサーバのリクエスト処理中スレッド割合333、およびAPサーバの実行待ちリクエスト数343に影響を与える。DBサーバのトランザクション数351は、APサーバのDB平均トランザクション時間344に影響を与え、DB平均トランザクション時間344は実行待ちリクエスト数343に影響を与える。一方、DBサーバのキャッシュヒット率352はトランザクション数351に影響を与える。なお本実施例では、APサーバは、APサーバ1とAPサーバ2から成るので、DBサーバのトランザクション数351は、両APサーバのDB平均トランザクション時間344および実行待ちリクエスト数343に影響を与えることになる。その他の性能パラメータもメトリック相関をもつがその依存関係が単純ではないので、ここでは単純な依存関係をもつ性能パラメータの例を示した。
図5は、本発明の一実施例の構成情報500のデータ構成を示す図である。構成情報500は、1つ以上のシステム情報510から成る。システム情報510は、管理対象のシステム名称511と、管理対象システムによって実現される1つ以上のサービス情報520とから成る。サービス情報520は、サービス名称521とそのサービスに含まれる1つ以上のオブジェクト情報530とから成る。さらにオブジェクト情報530は、オブジェクト名称531、オブジェクト種類532、オブジェクト固有情報533、オブジェクトの持つ1つ以上の性能パラメータ535、および性能パラメータ間の依存関係であるメトリック相関534とを持つ。ここで性能パラメータ535の組は、オブジェクト種類532によって異なり、オブジェクト定義300に従う。またメトリック相関534は、メトリック相関400で示す依存関係であり、影響を与える性能パラメータ535と影響を受ける性能パラメータ535とを結ぶリンク情報によって表現される。
なおシステム構成が大規模である場合にはオブジェクト数も非常に多数になり、オブジェクト情報530を入力する管理者の負担が大きい。このため本実施例の運用管理支援サーバ100は、性能パラメータ535とメトリック相関534について構成情報のひな形を構成情報テンプレート110として備えている。構成情報テンプレート110は、3階層システムに対応するオブジェクト定義300およびメトリック相関400が定義されているため、管理対象が定義される3階層システムであれば、管理者はこの構成情報テンプレート110を利用することができ、メトリック相関534と性能パラメータ535を入力する必要がなくなる。管理者が入力する構成情報500は、管理対象システム名511、サービス名称521、オブジェクト名称531、オブジェクト種類532、およびオブジェクト固有情報533だけである。これら管理者によって入力された情報の全体を構成定義情報600と呼ぶ。
図6は、本発明の一実施例の構成定義情報600の例を示す図である。構成定義情報600は、管理対象システム200を定義するためのものであり、この例のシステム名称511は「A社ショッピングシステム」である。この「A社ショッピングシステム」の2つのサービス名称521は、それぞれ「会員情報管理」と「オンラインストア」である。各サービス情報520は、サービスを実現するためのオブジェクト情報530を含む。
オブジェクト情報530は、HTTPサービス情報、Webサーバ情報、APサーバ情報、およびDBサーバ情報から成る。なおこの例では各サーバは1つであるが、複数でも良い。HTTPサービス情報は、オブジェクト名称531と、オブジェクト種類532と、オブジェクト固有情報533であるURLとから成る。このURLは、リクエストの送信先アドレスである。Webサーバ情報は、オブジェクト名称531、オブジェクト種類532、オブジェクト固有情報533であるホスト名、ポート番号、管理ポート番号から成る。APサーバ情報は、オブジェクト名称531、オブジェクト種類532、オブジェクト固有情報533であるホスト名、ポート番号、管理ポート番号から成る。DBサーバ情報は、オブジェクト名称531、オブジェクト種類532、オブジェクト固有情報533であるホスト名、ポート番号、管理ポート番号から成る。なおホスト名は管理対象サーバ222のアドレスであり、ポート番号は管理対象サーバプログラム221の持つサービス用のポートであり、管理ポート番号はエージェント201のポート番号である。
構成情報・収集条件登録部104は、管理者が入力する構成定義情報600を受け付けて構成情報500に登録する。
図7は、本発明の一実施例の収集条件112を示す図である。収集条件112は、性能情報の収集タイミング710と、収集の対象とする性能パラメータ720とを決定するものである。収集タイミング710は、性能情報の収集の間隔である計測間隔711と、一回の計測処理のタイムアウト712から成る。タイムアウト712は、応答がない場合の打ち切り時間である。収集対象性能パラメータ720は、各オブジェクトのもつ性能パラメータについて、性能情報の収集対象であるか否かの定義721と、当該性能情報についてしきい値監視を行う場合のしきい値722である。しきい値722は、当該性能パラメータをしきい値監視の対象とする場合に限り入力する。構成情報・収集条件登録部104は、管理者が入力する収集条件112を受け付けてデータベース106に登録する。
この例では、会員情報管理サービスについて総応答時間を収集し、総応答時間のしきい値監視を行う。しきい値は20秒である。Webサーバ1の性能情報収集対象は、受信リクエスト数と平均レスポンス時間である。APサーバの性能情報収集対象は、JVMメモリ使用率、リクエスト処理中スレッド割合、実行待ちリクエスト数、およびDB平均レスポンス時間である。なおDBサーバ206は性能情報を外部に提供するインタフェースを備えていないため、本実施例では性能情報の収集ができない。また各ホスト計算機は、構成定義情報600で定義していないため、性能情報収集の対象外としている。オンラインストアサービスについても、同様に収集対象性能パラメータ720を定義することができる。
図8は、本発明の一実施例の収集された性能情報113の例を示す図である。この性能情報は、運用管理支援サーバ100が会員情報管理サービスについて図7に示す収集条件112に基づき10分間隔で収集した結果である。
性能情報収集部105は、会員情報変更に要する時間を計測するため、Webサーバ1(202)に対して擬似的な会員情報変更要求であるHTTPリクエストを送信し、レスポンスを得るまでの時間を計り、サービス性能情報履歴810を作成する。また性能情報収集部105は、Webサーバ1(202)のエージェント201から受信リクエスト数、平均レスポンス時間を収集し、Webサーバ性能情報履歴820を作成する。さらに性能情報収集部105は、APサーバ1(204)のエージェント201からJVMメモリ使用率、実行待ちリクエスト数、リクエスト処理中スレッド割合、DB平均トランザクション時間を収集し、APサーバ性能情報履歴830を作成する。なお性能情報収集部105は、オンラインストアのサービスについても同様の性能履歴を作成する。
次に性能劣化の発見から原因解析の手順について説明する。運用管理支援サーバ100のしきい値監視部102は、このサービス性能情報履歴810の総応答時間が、収集条件112で指定されたしきい値722を逸脱しないか監視する。ここで会員情報変更にかかる総応答時間311が25秒となり、収集条件112で指定したしきい値722の20秒を超過すると、しきい値監視部102はポップアップウィンドウの表示によって管理者にしきい値超過を通知する。
管理者は総応答時間のしきい値超過を発見すると、しきい値超過の原因を調べるように分析・検索指示部103に指示する。分析・検索指示部103の指示を受けた相関分析部107は、総応答時間を目的変数とし、他の性能パラメータを説明変数として相関分析を実行する。相関分析部107は、総応答時間に対して高い相関係数を持つ他の性能パラメータを探す。そして相関分析によって高い相関係数を持つ性能パラメータを発見できた場合には、この性能パラメータに影響を与える他の性能パラメータを調整する。例えば影響を与えた性能パラメータがJVMメモリ使用率であれば、JVMに割り当てるメモリの量を増やす。
一方、相関分析によって高い相関係数を持つ性能パラメータを発見できない場合には、性能情報を収集していない性能パラメータが影響を与えた可能性を検討する。この場合、管理者は、収集条件112では収集対象とされてないが、影響を与える可能性があるDBサーバ206の性能パラメータを選択し、分析・検索指示部103に関連情報の検索を指示する。図9は、分析・検索指示部103が表示する検索指示画面900の例を示す図である。この検索指示画面900は、システム構成表示部910、実行ボタン920、およびキャンセルボタン930から成る。システム構成表示部910は、システムを構成するサービス、サービスを構成する構成要素、および構成要素の性能パラメータをツリー形式で表示する。なおこのツリーには、収集していない性能パラメータであっても表示される。この例では図を簡単にするためにDBサーバの性能パラメータのみを表示し、他のオブジェクトの性能パラメータを省略している。
管理者は、検索指示画面900を介して例えばDBサーバ206の性能パラメータであるトランザクション数351を選択し、実行ボタン920を押下する。これにより検索部101は、メトリック相関400を参照し、トランザクション数351から影響を受けたと考えられる性能パラメータを検索し、図10に示す検索結果画面1010にその性能情報の時間変化のグラフを表示する。トランザクション数351から影響を受ける可能性のある性能パラメータは、DB平均トランザクション時間344、および実行待ちリクエスト数343であるから、これら各々の性能情報のグラフが表示される。
図10は、検索部101が表示する検索結果画面1010の例を示す図である。検索結果画面1010は、結果表示部1011に現在しきい値を超過している総応答時間311の性能情報と、選択された性能パラメータであるトランザクション数351の影響を受けるAPサーバ1(204)およびAPサーバ2(205)の実行待ちリクエスト数343の性能情報と、またはAPサーバ1(204)およびAPサーバ2(205)のDB平均トランザクション数344の性能情報との時間による推移を折れ線グラフ形式で表示する。
結果表示部1011に示すように、トランザクション数351の影響を受ける関連性能情報の変化傾向が類似している場合には、管理者は、トランザクション数351が関連性能パラメータと同様に性能劣化しており、DBサーバ206に問題があると判断することができる。DB平均トランザクション数344の性能情報の時間による推移を表示する場合にも、管理者は、同様の判断をすることができるであろう。
一方、結果表示部1012に示すように、関連性能パラメータが類似した変化傾向を示していない場合、管理者は、トランザクション数351は性能劣化しておらず、DBサーバ206には問題がないと判断することができる。
なお本実施例の運用管理支援サーバ100は、あらかじめ定義されたオブジェクト定義300とメトリック相関400とを含む構成情報テンプレート110を備えるものとしたが、オブジェクト定義300、メトリック相関400を管理者が独自に定義するものとして、これらの情報を入力するGUIを備えるようにしても良い。
また本実施例では、総応答時間がしきい値を超過した場合に、管理者が関連性能パラメータの検索を指示するが、運用管理支援サーバ100が特定のパラメータの性能情報のしきい値超過を契機として、自動的に関連性能パラメータの検索を実行するようにしても良い。
さらに本実施例のメトリック相関400は、性能パラメータ間の依存関係を表しているが、メトリック相関400に、依存関係に加えて関連の強さに関する情報を持たせ、検索部101によって得られた関連性能パラメータの種類が多い場合には、関連の強さによって表示の順序を決定するようにしても良い。
以上説明したように、本実施例によると、性能情報を収集していない性能情報種類に関する性能情報の変化傾向を判断することが可能になる。そこで本実施例の処理手順を相関分析に対して補完的に利用することによって、性能劣化の原因特定を早期に行うことが可能になる。
実施例のシステムの構成図である。 実施例の管理対象システムの構成図である。 実施例のオブジェクト定義のデータ構成を示す図である。 メトリック相関のデータ構成例を示す図である。 実施例の構成情報のデータ構成を示す図である。 構成定義情報の例を示す図である。 実施例の収集条件を示す図である。 収集された性能情報の例を示す図である。 検索指示画面の例を示す図である。 検索結果画面の例を示す図である。
符号の説明
100…運用管理支援サーバ、101…検索部、102…しきい値監視部、103…分析・検索指示部、104…構成情報・収集条件登録部、105…性能情報収集部、106…データベース、107…相関分析部、110…構成情報テンプレート、112…収集条件、113…性能情報、200…管理対象システム、201…エージェント、221…管理対象サーバプログラム、222…管理対象サーバ、300…オブジェクト定義、400…メトリック相関、500…構成情報、600…構成定義情報

Claims (11)

  1. 少なくとも1台の計算機が稼動し、受信したリクエストの処理を行ってその応答を返す管理対象システムと、前記管理対象システムの稼動状態や処理性能を示す性能情報を収集する運用管理支援システムとを有するシステムにおいて前記運用管理支援システムによる性能情報表示方法であって、
    前記運用管理支援システムは、
    前記管理対象システムの性能情報の種別を示す複数の性能情報種類のうち選択された性能情報種類について前記管理対象システムから周期的に性能情報を収集して性能情報履歴を記録し、
    選択されない性能情報種類の1つが指定されたとき、性能情報種類間の依存関係について影響を与える性能情報種類と影響を受ける性能情報種類との関係を示す依存関係情報を検索して、指定された性能情報種類から影響を受けかつ選択済の複数の性能情報種類を取得し、
    取得した前記性能情報種類について前記性能情報履歴を表示することを特徴とする性能情報表示方法。
  2. 前記性能情報種類の1つに対応してしきい値を設定し、前記しきい値の設定された性能情報種類についての前記性能情報が前記しきい値を逸脱したとき、前記選択されない性能情報種類の指定を受け付けることを特徴とする請求項1記載の性能情報表示方法。
  3. 前記依存関係情報は、2つの性能情報種類間の依存関係の有無および依存関係の強さを示す情報を含み、前記運用管理支援システムは、前記依存関係情報の前記依存関係の強さに従って、指定された性能情報種類から影響を受けかつ選択済みの性能情報種類の順位付けをすることを特徴とする請求項1記載の性能情報表示方法。
  4. 前記管理対象システムは、複数のWebサーバ、複数のAPサーバ、および複数の前記APサーバによって共有される1つのデータベースサーバを含み、前記選択されない性能情報種類は、前記データベースサーバに関する性能情報種類であることを特徴とする請求項1記載の性能情報表示方法。
  5. 少なくとも1台の計算機が稼動し、受信したリクエストの処理を行ってその応答を返す管理対象システムと、前記管理対象システムの稼動状態や処理性能を示す性能情報を収集する運用管理支援計算機とを有するシステムにおいて前記運用管理支援計算機によって実行されるプログラムであって、前記運用管理支援計算機に、
    前記管理対象システムの性能情報の種別を示す複数の性能情報種類のうち選択された性能情報種類について前記管理対象システムから周期的に性能情報を収集して性能情報履歴を記録する機能、
    選択されない性能情報種類の1つが指定されたとき、性能情報種類間の依存関係について影響を与える性能情報種類と影響を受ける性能情報種類との関係を示す依存関係情報を検索して、指定された性能情報種類から影響を受けかつ選択済の複数の性能情報種類を取得する機能、および
    取得した前記性能情報種類について前記性能情報履歴を表示する機能を実現させるためのプログラム。
  6. さらに前記運用管理支援計算機に、前記性能情報種類の1つに対応してしきい値を設定し、前記しきい値の設定された性能情報種類についての前記性能情報が前記しきい値を逸脱したとき、前記選択されない性能情報種類の指定を受け付ける機能を実現させるための請求項5記載のプログラム。
  7. 前記管理対象システムは、複数のWebサーバ、複数のAPサーバ、および複数の前記APサーバによって共有される1つのデータベースサーバを含み、前記選択されない性能情報種類は、前記データベースサーバに関する性能情報種類であることを特徴とする請求項5記載のプログラム。
  8. 少なくとも1台の計算機が稼動し、受信したリクエストの処理を行ってその応答を返す管理対象システムと、前記管理対象システムの稼動状態や処理性能を示す性能情報を収集する運用管理支援システムとを有するシステムにおいて、前記運用管理支援システムは、
    前記管理対象システムの性能情報の種別を示す複数の性能情報種類と、収集した性能情報の履歴と、性能情報種類間の依存関係について影響を与える性能情報種類と影響を受ける性能情報種類との関係を示す依存関係情報とを格納する記憶装置と、
    前記性能情報種類のうち選択された性能情報種類について前記管理対象システムから周期的に性能情報を収集して性能情報履歴を記録する性能情報収集部と、
    選択されない性能情報種類の1つが指定されたとき、前記依存関係情報を検索して、指定された性能情報種類から影響を受けかつ選択済の複数の性能情報種類を取得し、取得した前記性能情報種類について前記性能情報履歴を表示する検索部とを有することを特徴とする運用管理支援システム。
  9. さらに前記性能情報種類の1つに対応してしきい値を設定し、前記しきい値の設定された性能情報種類についての前記性能情報が前記しきい値を逸脱したとき、前記選択されない性能情報種類の指定を受け付ける分析・検索指示部を有することを特徴とする請求項8記載の運用管理支援システム。
  10. 前記依存関係情報は、2つの性能情報種類間の依存関係の有無および依存関係の強さを示す情報を含み、前記検索部は、前記依存関係情報の前記依存関係の強さに従って、指定された性能情報種類から影響を受けかつ選択済みの性能情報種類の順位付けをすることを特徴とする請求項8記載の運用管理支援システム。
  11. 前記管理対象システムは、複数のWebサーバ、複数のAPサーバ、および複数の前記APサーバによって共有される1つのデータベースサーバを含み、前記選択されない性能情報種類は、前記データベースサーバに関する性能情報種類であることを特徴とする請求項8記載の運用管理支援システム。
JP2004189267A 2004-06-28 2004-06-28 運用管理支援システムおよび性能情報表示方法 Expired - Fee Related JP4430989B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004189267A JP4430989B2 (ja) 2004-06-28 2004-06-28 運用管理支援システムおよび性能情報表示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004189267A JP4430989B2 (ja) 2004-06-28 2004-06-28 運用管理支援システムおよび性能情報表示方法

Publications (3)

Publication Number Publication Date
JP2006011902A true JP2006011902A (ja) 2006-01-12
JP2006011902A5 JP2006011902A5 (ja) 2007-04-12
JP4430989B2 JP4430989B2 (ja) 2010-03-10

Family

ID=35779089

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004189267A Expired - Fee Related JP4430989B2 (ja) 2004-06-28 2004-06-28 運用管理支援システムおよび性能情報表示方法

Country Status (1)

Country Link
JP (1) JP4430989B2 (ja)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008009842A (ja) * 2006-06-30 2008-01-17 Hitachi Ltd コンピュータシステムの制御方法及びコンピュータシステム
JP2008171235A (ja) * 2007-01-12 2008-07-24 Nec Corp システム構成変更ルール生成システム、方法およびプログラム
JP2008171234A (ja) * 2007-01-12 2008-07-24 Nec Corp システム構成候補導出装置、方法およびプログラム
JP2008257397A (ja) * 2007-04-03 2008-10-23 Hitachi Ltd 設備業務統合管理方法及びシステム並びにそのプログラム
JP2009199534A (ja) * 2008-02-25 2009-09-03 Nec Corp 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
JP2009199533A (ja) * 2008-02-25 2009-09-03 Nec Corp 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
JP2009223886A (ja) * 2008-03-13 2009-10-01 Internatl Business Mach Corp <Ibm> データ処理システムの複数の資源に対するパフォーマンス傾向の統合された表示を発生する方法、プログラム及び装置(資源のパフォーマンス傾向の統合された表示)
WO2010010621A1 (ja) * 2008-07-24 2010-01-28 富士通株式会社 トラブルシュート支援プログラム,トラブルシュート支援方法及びトラブルシュート支援装置
JP2011146074A (ja) * 2011-04-26 2011-07-28 Nec Corp 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
JP2012108708A (ja) * 2010-11-17 2012-06-07 Nec Corp 障害検知装置、情報処理方法、およびプログラム
JP2013242902A (ja) * 2013-07-22 2013-12-05 Nec Corp 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
WO2014064913A1 (ja) * 2012-10-23 2014-05-01 日本電気株式会社 運用管理装置、及び、運用管理方法
JP2014115826A (ja) * 2012-12-10 2014-06-26 Fujitsu Ltd 処理プログラム、処理方法および処理装置
JP2017126363A (ja) * 2012-01-23 2017-07-20 日本電気株式会社 運用管理装置、運用管理方法、及びプログラム
JP2017523528A (ja) * 2014-07-10 2017-08-17 サイオス テクノロジー コーポレーションSios Technology Corporation コンピュータ環境を統制し分析するためのインターフェース
WO2018146714A1 (ja) * 2017-02-07 2018-08-16 株式会社日立製作所 コンピュータシステムの監視装置および方法
JP2019091199A (ja) * 2017-11-14 2019-06-13 株式会社日立製作所 計算機、ボトルネック特定方法、及びプログラム
JP2020038525A (ja) * 2018-09-05 2020-03-12 東日本電信電話株式会社 異常検知装置
JP2023504956A (ja) * 2020-11-16 2023-02-08 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 性能検出方法、装置、電子機器及びコンピュータ可読媒体

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008009842A (ja) * 2006-06-30 2008-01-17 Hitachi Ltd コンピュータシステムの制御方法及びコンピュータシステム
JP2008171235A (ja) * 2007-01-12 2008-07-24 Nec Corp システム構成変更ルール生成システム、方法およびプログラム
JP2008171234A (ja) * 2007-01-12 2008-07-24 Nec Corp システム構成候補導出装置、方法およびプログラム
JP2008257397A (ja) * 2007-04-03 2008-10-23 Hitachi Ltd 設備業務統合管理方法及びシステム並びにそのプログラム
JP2009199534A (ja) * 2008-02-25 2009-09-03 Nec Corp 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
JP2009199533A (ja) * 2008-02-25 2009-09-03 Nec Corp 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
JP2009223886A (ja) * 2008-03-13 2009-10-01 Internatl Business Mach Corp <Ibm> データ処理システムの複数の資源に対するパフォーマンス傾向の統合された表示を発生する方法、プログラム及び装置(資源のパフォーマンス傾向の統合された表示)
WO2010010621A1 (ja) * 2008-07-24 2010-01-28 富士通株式会社 トラブルシュート支援プログラム,トラブルシュート支援方法及びトラブルシュート支援装置
JP5267564B2 (ja) * 2008-07-24 2013-08-21 富士通株式会社 出力プログラム,出力方法,出力装置,トラブルシュート支援プログラム,トラブルシュート支援方法及びトラブルシュート支援装置
JP2012108708A (ja) * 2010-11-17 2012-06-07 Nec Corp 障害検知装置、情報処理方法、およびプログラム
JP2011146074A (ja) * 2011-04-26 2011-07-28 Nec Corp 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
US10296408B2 (en) 2012-01-23 2019-05-21 Nec Corporation Operation management apparatus, operation management method, and program
JP2017126363A (ja) * 2012-01-23 2017-07-20 日本電気株式会社 運用管理装置、運用管理方法、及びプログラム
WO2014064913A1 (ja) * 2012-10-23 2014-05-01 日本電気株式会社 運用管理装置、及び、運用管理方法
US9645909B2 (en) 2012-10-23 2017-05-09 Nec Corporation Operation management apparatus and operation management method
US9678849B2 (en) 2012-12-10 2017-06-13 Fujitsu Limited Processing method, processing apparatus, and recording medium to determine operational state of processing element
JP2014115826A (ja) * 2012-12-10 2014-06-26 Fujitsu Ltd 処理プログラム、処理方法および処理装置
JP2013242902A (ja) * 2013-07-22 2013-12-05 Nec Corp 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
JP2017523528A (ja) * 2014-07-10 2017-08-17 サイオス テクノロジー コーポレーションSios Technology Corporation コンピュータ環境を統制し分析するためのインターフェース
WO2018146714A1 (ja) * 2017-02-07 2018-08-16 株式会社日立製作所 コンピュータシステムの監視装置および方法
JPWO2018146714A1 (ja) * 2017-02-07 2019-02-14 株式会社日立製作所 コンピュータシステムの監視装置および方法
JP2019091199A (ja) * 2017-11-14 2019-06-13 株式会社日立製作所 計算機、ボトルネック特定方法、及びプログラム
JP2020038525A (ja) * 2018-09-05 2020-03-12 東日本電信電話株式会社 異常検知装置
JP2023504956A (ja) * 2020-11-16 2023-02-08 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 性能検出方法、装置、電子機器及びコンピュータ可読媒体
US11954013B2 (en) 2020-11-16 2024-04-09 Baidu Online Network Technology (Beijing) Co., Ltd. Method of testing applet performance, electronic device, and computer-readable medium

Also Published As

Publication number Publication date
JP4430989B2 (ja) 2010-03-10

Similar Documents

Publication Publication Date Title
JP4430989B2 (ja) 運用管理支援システムおよび性能情報表示方法
US10075509B2 (en) Capture, analysis, and visualization of concurrent system and network behavior of an application
JP6816139B2 (ja) 情報伝送パフォーマンス警告を生成するための方法、システム、および装置
US20210184947A1 (en) Automatic capture of detailed analysis information based on remote server analysis
US9369521B2 (en) Naming of distributed business transactions
US8326971B2 (en) Method for using dynamically scheduled synthetic transactions to monitor performance and availability of E-business systems
US9122715B2 (en) Detecting changes in end-user transaction performance and availability caused by changes in transaction server configuration
US7457864B2 (en) System and method for managing the performance of a computer system based on operational characteristics of the system components
US20060200373A1 (en) Facilitating Root Cause Analysis for Abnormal Behavior of Systems in a Networked Environment
US7624176B2 (en) Method and system for programmatically generating synthetic transactions to monitor performance and availability of a web application
US20030051191A1 (en) Problem detector and method
US20120046999A1 (en) Managing and Monitoring Continuous Improvement in Information Technology Services
EP3864516B1 (en) Veto-based model for measuring product health
JP2017084345A (ja) 性能テスト進行中におけるコンピュータシステムプロセッサ及びトランザクション性能のリアルタイム監視
US20080301574A1 (en) Modeling, Monitoring, and Analysis of Computer Services
US11681707B1 (en) Analytics query response transmission
US20150012647A1 (en) Router-based end-user performance monitoring
JP7255636B2 (ja) 端末管理装置、端末管理方法、およびプログラム
US20050283528A1 (en) Definition system and method for web services that monitor other web services
JP5942675B2 (ja) トランザクションデータ採取方法、トランザクションデータ採取プログラム、および情報処理装置
JP2004348640A (ja) ネットワーク管理システム及びネットワーク管理方法
US8195793B2 (en) Method and apparatus of filtering statistic, flow and transaction data on client/server
US8326977B2 (en) Recording medium storing system analyzing program, system analyzing apparatus, and system analyzing method
JP5974905B2 (ja) 応答時間監視プログラム、方法および応答時間監視装置
KR20040028400A (ko) 매트로 이더넷망의 장애처리 장치 및 그 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070222

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070222

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20070222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090519

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090526

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090716

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091201

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091218

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121225

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4430989

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131225

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees