JP4990018B2 - 装置性能管理方法、装置性能管理システム、および管理プログラム - Google Patents

装置性能管理方法、装置性能管理システム、および管理プログラム Download PDF

Info

Publication number
JP4990018B2
JP4990018B2 JP2007115478A JP2007115478A JP4990018B2 JP 4990018 B2 JP4990018 B2 JP 4990018B2 JP 2007115478 A JP2007115478 A JP 2007115478A JP 2007115478 A JP2007115478 A JP 2007115478A JP 4990018 B2 JP4990018 B2 JP 4990018B2
Authority
JP
Japan
Prior art keywords
performance
application
information
configuration information
acquired
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007115478A
Other languages
English (en)
Other versions
JP2008276279A (ja
Inventor
啓之 越智
伸夫 紅山
利明 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007115478A priority Critical patent/JP4990018B2/ja
Priority to US11/970,674 priority patent/US8024613B2/en
Publication of JP2008276279A publication Critical patent/JP2008276279A/ja
Priority to US13/208,694 priority patent/US8370686B2/en
Application granted granted Critical
Publication of JP4990018B2 publication Critical patent/JP4990018B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3485Performance evaluation by tracing or monitoring for I/O devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、将来アプリケーションに性能問題を引き起こす可能性が高い装置、または、現在アプリケーションに性能問題を引き起こしている可能性が高い装置を検出することができる装置性能管理方法、装置性能管理システム、および管理プログラムに関する。
将来アプリケーションに性能問題を引き起こす可能性が高い装置、または現在アプリケーションに性能問題を引き起こしている可能性が高い装置を検出することを、以下、性能飽和兆候の検出という。
従来、コンピュータシステムの性能管理方法として、以下の2種類の方法が行われてきた。性能管理方法1は、あるアプリケーションにおいて性能問題が起こった場合に、当該アプリケーションの実行に関わる装置群の性能を調査し、アプリケーションの性能問題を引き起こした装置を特定する、性能ボトルネックを分析するリアクティブな方法である。
性能管理方法2は、アプリケーションの性能問題が起きる前に、性能問題が起きる可能性があることを検出するための、アプリケーションの性能飽和兆候の検出をするプロアクティブな方法である。
前記性能管理方法1および性能管理方法2は、いずれも、性能管理対象の装置が膨大に存在する場合、コンピュータプログラムなどによる支援がなければ、装置管理者に大きな負担になる。そこで、それぞれの支援方法が行われてきている。
前記性能管理方法1の支援方法Aは、性能問題が起きたアプリケーションの性能情報と、当該アプリケーションと性能の依存関係がある装置群の各々との間で性能情報との相関を調べ、当該装置群の中からボトルネックとして確からしい装置を推定する。
前記性能管理方法2の支援方法Bは、アプリケーションまたは装置の性能情報に対して閾値情報を設定しておき、定期的に観測した性能情報と当該閾値情報を比較し、ルールに基づいてアラート(警告あるいは告知)をあげて支援する(例えば、特許文献1参照)。
特開2001−195285号公報
前記支援方法Aは、性能問題が起きたアプリケーションがわかっている場合に、当該アプリケーションと性能の依存関係がある装置群の中から、当該性能問題の原因として確からしい装置を推定するための支援方法であり、アプリケーションに性能問題が起きたことが未発覚の場合には使えない。
また、前記支援方法Bによる閾値を用いた支援方法では、そもそも適切な閾値を決定することが困難という理由がある。具体的には、装置の性能情報として、装置の使用率、スループット、レスポンスタイムなどがあるが、装置の管理者にとって、これらの値がどの程度まで達した場合に装置が飽和兆候を示すかを詳しく知ることは困難である。
前記性能管理方法2は、コンピュータシステムの性能増強プラン検討やリソース配置の最適化などを、アプリケーションの性能問題が起きる前に行うためことを目的とするが、アプリケーションの性能問題が起きる前のプロアクティブなアプリケーションの性能飽和兆候の検出に関して十分に出来ていない問題がある。
本発明は、前記の課題を解決するための発明であって、将来アプリケーションに性能問題を引き起こす可能性が高い装置、または、現在アプリケーションに性能問題を引き起こしている可能性が高い装置を検出することができる装置性能管理方法、装置性能管理システム、および管理プログラムを提供することを目的とする。
本発明による装置性能管理方法は、1つ以上の装置および該装置と性能の依存関係がある1つ以上のアプリケーションを備えるシステムにおける装置性能を管理する管理サーバ(例えば、性能管理サーバ151)が、装置の構成情報およびアプリケーションの構成情報、ならびに、装置およびアプリケーションの間に成り立つ性能の依存関係の構成情報を収集する構成情報収集処理(例えば、構成情報収集処理S233)と、装置の性能情報およびアプリケーションの性能情報を収集する性能情報収集処理(例えば、性能情報収集処理S231)と、構成情報と性能情報とに基づいて装置の飽和兆候を検出する飽和兆候検出処理(例えば、飽和兆候検出処理S236)と、を含んで実行することを特徴とする。
本発明による装置性能管理方法は、1つ以上の装置および該装置と性能の依存関係がある1つ以上のアプリケーションを備えるシステムにおける装置性能を管理する管理サーバが、装置の構成情報、該装置を抽象化した論理的存在である論理ユニットの構成情報、およびアプリケーションの構成情報、ならびに、装置、論理ユニット、およびアプリケーションの間に成り立つ性能の依存関係の構成情報を収集する構成情報収集処理と、装置の性能情報、論理ユニットの性能情報、およびアプリケーションの性能情報を収集する性能情報収集処理と、構成情報と性能情報とに基づいて装置の飽和兆候を検出する飽和兆候検出処理と、を含んで実行することを特徴とする。
飽和兆候検出処理は、装置の性能情報と、アプリケーションの性能情報の時間変化値に対して所定期間について相関分析し、相関分析により得られた相関係数が所定の閾値以上のとき、装置が飽和兆候ありと検出することが好ましい。
また、飽和兆候検出処理は、装置の性能情報と、装置と性能の依存関係がある論理ユニットの性能情報の時間変化値に対して所定期間について相関分析し、相関分析により得られた相関係数が所定の閾値以上のとき、装置が飽和兆候ありと検出することが好ましい。
本発明によれば、将来アプリケーションに性能問題を引き起こす可能性が高い装置、または、現在アプリケーションに性能問題を引き起こしている可能性が高い装置を検出することができる。
以下、本発明の実施形態について図面を参照して詳細に説明する。
初めに本発明の概要を説明する。本発明の装置性能管理方法では、飽和兆候検出対象とする装置の使用率の時系列な測定値と、当該装置と性能の依存関係がある1つまたは複数のアプリケーションが当該装置から受けるサービスレベルの時系列な測定値、の2つを入力とし、両者の時間変化に伴う変化値列同士の相関係数を計算する。当該相関係数を装置の飽和度とみなし、相関係数が閾値を超えた場合に、当該装置は、アプリケーションに性能問題を引き起こす兆候がある、またはアプリケーションに性能問題を引き起こしているとみなす。
装置の使用率が上昇し、装置毎に特有な値まで達した後に、当該装置を利用するアプリケーションのサービスレベルは急激に劣化する。この時、装置の使用率の変化値とアプリケーションが当該装置から受けるサービスレベルの変化値の間には高い相関がある。本発明では、前記使用率の変化値とサービスレベルの変化値の間にある相関関係を利用して、装置の飽和兆候を検出する。本発明の装置性能管理方法では、装置の使用率に対する閾値を設定するのではなく、相関係数に対する閾値を用いる。
より具体的には、以下のステップS1〜ステップS5に従い、装置の飽和兆候検出を行う。検出した装置の性能飽和兆候を、画面やログなどにより、表示または出力してもよい。いくつかのステップには、後で詳しく説明するように、バリエーションが考えられる。
ステップS1: 定期的もしくは要求に応じて、性能管理ソフトウェアが監視する対象の系から、装置、装置を抽象化した論理的存在、アプリケーション、の一覧を検出し、構成情報の一部として保存する。
ステップS2: 定期的もしくは要求に応じて、装置、装置を抽象化した論理的存在、アプリケーションの間に成り立つ性能の依存関係を検出し、構成情報の残りとして保存する。性能の依存関係とは、アプリケーションが発行するI/O命令を処理する一連の装置およびソフトウェアがある場合に、それらの間の関係を意味する。
ステップS3: 定期的もしくは要求に応じて、装置、装置を抽象化した論理的存在、アプリケーションから性能情報を収集し保存する。
ステップS4: 前記ステップS1で検出した装置一覧の中から、飽和兆候を検出したい装置群を決定する。
ステップS5: 前記ステップS4で、飽和兆候検出の対象と決定した装置群の各々について、当該装置と性能の依存関係があるアプリケーション群を、前記ステップS2で検出・保存した構成情報を用いて絞込み、当該装置と当該アプリケーション群との間で、性能情報の時間変化の相関係数を、前記ステップS3で保存した性能情報を用いて計算する。相関係数が閾値を超えた装置があれば、当該装置は飽和兆候を示したと判定する。アプリケーションの性能情報の代替として、当該装置と性能の依存関係がある装置を抽象化した論理的存在の性能情報を用いてもよい。この場合、当該論理的存在は、装置をアプリケーションが使用する際のインタフェースであり、装置の使用者とみなすことができる。
《実施形態1》
図1は、本発明の全体構成を示すブロック図である。ホスト、ストレージ装置およびその間のストレージエリアネットワークを基盤にした業務システムを構成するハードウェアには、業務クライアント101〜103、ローカルエリアネットワーク(LAN)104、ホストサーバ111,112、ストレージエリアネットワーク(SAN)のSANスイッチ121,122、ストレージサブシステム131,132があり、同じくソフトウェアには、アプリケーション115や、オペレーティングシステム(OS)113、ファイルシステム114がある。
業務クライアント101〜103は、業務システムのユーザインタフェース機能を提供するパソコンや、ワークステーション、シンクライアント端末などの装置であり、LAN104を経由してホストサーバ111や112にて稼動するアプリケーション115などと通信する。
アプリケーション115は、業務システムの業務論理機能を提供するソフトウェアであり、業務クライアント101〜103からの処理要求に応答し、必要に応じてファイルシステム114に対しデータの参照・更新を要求する。
ファイルシステム114は、データの管理処理を提供するソフトウェアであり、アプリケーション115からの要求に応答し、OS113を介してストレージサブシステム131と132に格納されたデータの操作・管理に関する処理を行う。アプリケーション115、ファイルシステム114、OS113の実行には、ホストサーバ内のCPU(Central Processing Unit)116、メモリ117が必要である。
ファイルシステム114からストレージサブシステム131,132にあるデータへのアクセスは、OS113、ホストバスアダプタ118,119、SANスイッチのホスト側ポート123,124、SANスイッチ121,122、SANスイッチのストレージ側ポート125と126、ストレージサブシステムのポート133,134を経由して行なわれる。
ホストサーバ、ストレージエリアネットワーク、ストレージサブシステムおよびアプリケーションの性能管理のためのシステムを構成するハードウェアには、情報収集サーバ141、性能管理サーバ151、性能管理クライアント161があり、同じくソフトウェアには、アプリケーション監視エージェント171、ホスト監視エージェント172、ファブリック監視エージェント173、ストレージサブシステム監視エージェント174、装置性能管理ソフト181がある。なお、装置性能管理ソフトとは、装置性能管理ソフトウェアの略である。
性能管理クライアント161は、装置性能管理ソフト181のユーザインタフェース機能を提供する装置であり、LAN104を経由して性能管理サーバ151の装置性能管理ソフト181と通信する。
装置性能管理ソフト181は、装置の性能情報の収集と分析に関する処理を提供するソフトウェアであり、ネットワークを構成するさまざまなハードウェアやソフトウェアから性能情報を取得する。
以下では、装置性能管理ソフト181がハードウェアやソフトウェアの性能情報取得のため、それぞれ専用の監視エージェントソフトウェアを利用する方法を説明する。エージェントの構成や配置にはいろいろな方法があり得るが、本実施形態の形態でもって本発明の実施方法を制限するものではない。また、エージェントを介さず、装置性能管理ソフト181が直接、監視対象の装置やソフトウェアと通信する形態もありうるが、このような形態にも本発明は適用可能である。
装置性能管理ソフト181のソフトウェアの場合は、性能管理サーバ151のCPUが、それぞれの監視エージェントのソフトウェアの場合は、情報収集サーバ141およびホストサーバ111,112のCPUが、それぞれ実行することで実現する。
アプリケーション監視エージェント171は、アプリケーション115に関する構成情報と性能劣化を検出するためのものである。ホスト監視エージェント172は、ホストサーバ111、ファイルシステム114、OS113、CPU116、メモリ117、ホストバスアダプタのポート118,119に関する構成情報と性能情報を取得する。ストレージサブシステム監視エージェント174は、ホストバスアダプタのポート142、SANスイッチのポート127、SANスイッチ121,122を経由して、ストレージサブシステム131と132に関する構成情報と性能情報を取得する。当該情報の中には、ポート133と134に関する情報が含まれる。
ファブリック監視エージェント173は、ホストバスアダプタのポート142、SANスイッチのポート127を経由して、SANスイッチ121,122が構成するファブリックの構成情報と性能情報を取得する。当該情報には、ポート123〜126に関する情報が含まれる。
本実施形態では、ストレージサブシステム監視エージェント174は、ストレージエリアネットワーク経由で装置の情報を取得しているが、ストレージサブシステム131,132のいずれかがLAN104に接続されている場合、LAN104経由で当該ストレージサブシステムの情報を取得してもよい。同様に、ファブリック監視エージェント173も、監視対象のストレージサブシステム131,132から情報を取得するために、LAN104を経由して通信してもよい。
また、本実施形態では、ファブリック監視エージェント173とストレージサブシステム監視エージェント174は、専用の情報収集サーバ141上で稼動しているが、どの計算機上で稼働してもよい。アプリケーション監視エージェント171およびホスト監視エージェント172についても同様で、本実施形態では、ホストサーバ111上で稼働しているが、他の計算機上で稼働し、通信を用いてアプリケーションの性能情報を取得してもよい。
図2は、本発明の各処理および各情報を示すブロック図である。図2に示すように、各処理および各情報を備えるハードウェア・ソフトウェアには、装置201〜203、アプリケーション211〜213、監視エージェント221〜223、装置性能管理ソフト181、性能管理クライアント161がある。
装置201〜203は、装置群が構成するネットワーク内で性能監視の対象となるハードウェアであり、図1に記載の例では、ホストサーバ111,112、ストレージサブシステム131,132、SANスイッチ121,122のうちのいずれかに該当する。
アプリケーション211〜213は、性能管理対象の装置を利用するソフトウェアであり、図1の例では、アプリケーション115に当たる。
監視エージェント221〜223は、ネットワークを構成する装置201〜203、または、当該装置を利用して処理を行うアプリケーション211〜213から性能情報と構成情報を取得するソフトウェアであり、図1の例では、アプリケーション監視エージェント171、ホスト監視エージェント172、ファブリック監視エージェント173、ストレージサブシステム監視エージェント174のうちのいずれかに該当する。
装置201〜203上のソフトウェアは、性能情報取得処理S204と、構成情報取得処理S205とを備える。アプリケーション211〜213の各々は、構成情報取得処理S215を備え、ログ214にアプリケーションの性能を出力する。装置上のソフトウェアまたはアプリケーションを監視する監視エージェントは、性能情報収集処理S224、性能情報225、性能情報応答処理S226、構成情報収集処理S227、構成情報228、構成情報応答処理S229を備える。
装置性能管理ソフト181は、性能情報収集処理S231、性能情報232、構成情報収集処理S233、構成情報234、飽和兆候検出対象装置設定処理S235、飽和兆候検出処理S236、飽和兆候情報237、飽和兆候情報出力処理S238を備える。
ネットワークを構成する装置の中には、当該装置を構成するさらに小さな単位の装置が存在する。また、装置を抽象化する論理的存在が生成されることがある。以下では、装置を抽象化する論理的存在のことを論理ユニットという。装置、論理ユニット、装置上で稼動するアプリケーションの間には、性能の依存関係が成り立つ。
監視エージェント221〜223および装置性能管理ソフト181から構成されるシステムが、装置、論理ユニット、アプリケーションの性能情報と構成情報を収集し、装置の飽和兆候を検出する処理を、図35〜図38を用いて概説する。
図35は、構成情報および性能情報を取得、保存する監視エージェントの処理を示すフローチャートである。監視エージェント221〜223は、構成情報の収集を行う。具体的には、構成情報収集処理S227が、装置、論理ユニット、アプリケーションの構成情報を収集し、構成情報228に保存し(ステップS3501)、次のステップに進む。監視エージェント221〜223は、性能情報の収集を行う。具体的には、性能情報収集処理S224が、装置、論理ユニット、アプリケーションの性能情報を収集し、性能情報225に保存し(ステップS3502)、所定の時刻までスリープ(ステップS3503)する。このサイクルを繰り返すことで、定期的に情報を収集することができる。
図36は、監視エージェントの構成情報収集処理の詳細を示すフローチャートである。監視エージェント221〜223の構成情報収集処理S227(ステップS3501)は、まず、装置の構成情報取得処理S205またはアプリケーションの構成情報取得処理215に問い合わせ、装置または論理ユニットまたはアプリケーションの一覧情報を取得し(ステップS3601)、取得した一覧情報を、構成情報228内に保存する(ステップS3602)。次に、監視エージェント221〜223の構成情報収集処理S227は、装置の構成情報取得処理S205またはアプリケーションの構成情報取得処理S215に問い合わせ、装置、論理ユニット、アプリケーション間に成り立つ性能の依存関係情報を取得し(ステップS3603)、取得した性能の依存関係情報を、構成情報228内に保存する(ステップS3604)。
図37は、監視エージェントの性能情報収集処理の詳細を示すフローチャートの例である。監視エージェント221〜223の性能情報収集処理S224(ステップS3502)は、まず、装置の性能情報取得処理204に問い合わせるか、または、アプリケーションのログ214を通信で取得し、解析することで、装置、論理ユニット、アプリケーションの各々の時系列な性能情報を取得する(ステップS3701)。次に、取得した性能情報を、監視エージェントの性能情報225に保存する(ステップS3702)。
構成情報のうち、装置、論理ユニット、アプリケーション間の性能の依存関係情報については、監視エージェントが保持する内容を後記する。装置、論理ユニット、アプリケーションの一覧情報、および、各装置、論理ユニット、アプリケーションの性能情報については、装置性能管理ソフト181が監視エージェントから収集した結果の情報を後記する。
図38は、装置性能管理ソフトの飽和兆候検出処理の主処理を示すフローチャートである。図38において、装置性能管理ソフト181が、監視エージェント221〜223が保存した構成情報と性能情報を利用して、装置の飽和兆候を検出するまでの主処理を示す。監視エージェント221〜223から構成情報を取得した後に装置性能管理ソフト181が備える記憶領域に保存する(ステップS3801,S3802)。具体的には、装置性能管理ソフト181の構成情報収集処理S233は、監視エージェントの構成情報応答処理S229に対し各監視エージェントが収集した構成情報の送信を要求し、要求した情報が監視エージェントの構成情報228から検索されて返信されると、装置性能管理ソフト181が備える構成情報234に、装置、論理ユニット、アプリ−ケーションの一覧情報を格納する(ステップS3801)。同様に、装置、論理ユニット、アプリ−ケーション間に成り立つ性能の依存関係情報を格納する(ステップS3802)。
次に、監視エージェント221〜223から性能情報を取得し、装置性能管理ソフト181が備える記憶領域に保存する(ステップS3803)。具体的には、装置性能管理ソフト181の性能情報収集処理S231は、監視エージェントの性能情報応答処理S226に対し各監視エージェントが収集した性能情報の送信を要求し、要求した情報が監視エージェントの性能情報225から検索されて返信されると、装置性能管理ソフト181が備える性能情報232に、装置、論理ユニット、アプリ−ケーションの各々の時系列の性能情報を格納する。装置性能管理ソフト181の飽和兆候検出処理S236は、構成情報234に保存した装置一覧情報を検索し、全装置の中から、飽和調和検出を行う対象である装置群を選択する(ステップS3804)。装置を飽和兆候検出の対象として設定する処理は、後述する飽和兆候検出対象装置設定処理S235である。ステップS3804にて飽和調和検出を行う対象として選択した装置について、性能情報232に基づいて飽和兆候の有無を検出し、検出した飽和兆候情報を飽和兆候情報237に保存する(ステップS3805)。そして、所定の時刻までスリープする(ステップS3806)。ステップS3801〜ステップS3806のサイクルを繰り返すことで、定期的に装置の飽和兆候を検出することができる。
前記した装置性能管理ソフト181のフローチャートでは、定期的な処理を行う場合について説明したが、装置性能管理ソフト181を用いる装置管理者から入力を受けることで、当該処理を実行してもよい。
図38のフローチャートには記載しなかった装置性能管理ソフト181の処理に、飽和兆候検出対象装置設定処理S235と、飽和兆候情報出力処理S238がある。飽和兆候検出対象装置設定処理S235は、構成情報234に格納した装置一覧情報を更新し、飽和兆候検出対象とする装置にフラグを設定する処理である。
また、飽和兆候情報出力処理S238は、前記飽和兆候検出処理S236の演算結果を、性能管理クライアント161経由で管理者へ通知するために出力する処理である。飽和兆候検出対象装置設定処理S235と、飽和兆候情報出力処理S238は、装置性能管理ソフト181を用いる装置管理者から入力を受けることで実行されてよい。
図3は、装置・論理ユニット・装置上で稼動するアプリケーション間に成り立つ性能の依存関係の例を示す説明図である。ここでは、各構成品の符号をかっこ書きとして、各構成品の名称と符号を明確にしている。図3に示すネットワークの構成例では、ハードウェアとして、ホストサーバA(301)とホストサーバB(302)という2つのホストサーバと、SANスイッチA(321)とSANスイッチB(322)という2つのSANスイッチからなるファブリックと、ストレージサブシステムA(331)という1つのストレージサブシステムがある。
ホストサーバA(301)では、アプリケーションA(303)とアプリケーションB(304)が稼働している。ホストサーバA(301)には、CPU−A(306)とメモリA(307)があり、また、ファイルシステムA(310)〜ファイルシステムC(312)とボリュームA(314)〜ボリュームC(316)を備える。ボリュームA(314)は、後に説明するLU―A(335)に対しI/O命令を発行できるようにマウントした仮想ディスクである。ボリュームB(315)とボリュームC(316)についても同様で、それぞれ、LU―B(336)とLU―C(337)をマウントした仮想ディスクである。ホストサーバAは、ホストバスアダプタ(318)を1つ備え、以下、番号(318)をポートAという。
ホストサーバB(302)では、ホストサーバAと同様に、アプリケーションC(305)が稼働している。ホストサーバB(302)には、CPU−B(308)とメモリB(309)があり、また、ファイルシステムD(313)とボリュームD(317)を備える。ホストサーバBは、ホストバスアダプタ(319)を1つ備え、以下、番号(319)をポートBという。
SANスイッチA(321)は、スイッチポート(323)〜(325)を備える。SANスイッチA(321)が備えるポートのうち、以下、番号(323)をポートC、番号(324)をポートD、番号(325)をポートEという。
SANスイッチB(322)についても同様で、SANスイッチB(322)は、ポート(326)〜(329)を備える。番号(326),(327),(328),(329)のポートをそれぞれ、以下、ポートF、ポートG、ポートH、ポートIという。
ストレージサブシステムA331は、物理ディスク(350)〜(357)を備える。物理ディスク(350)〜(353)によりRAID構成された仮想ディスクがRAIDグループA(348)で、物理ディスク(354)〜(357)によるRAID構成された仮想ディスクがRAIDグループB(349)である。RAIDグループA(348)を、上位のサーバが使いやすい大きさにスライスした結果が論理ボリュームA(344)と論理ボリュームB(345)である。同様に、RAIDグループB(349)をスライスした結果が論理ボリュームC(346)と論理ボリュームD(347)である。論理ボリュームA(344)をポートJ(332)経由でサーバからアクセス可能になるよう公開した存在がLU−A(335)であり、同様に、論理ボリュームB(345)、論理ボリュームC(346)、論理ボリュームD(347)を公開した存在が、LU−B(336)、LU−C(337)、LU−D(338)である。
ストレージサブシステムA(331)内のチャネルコントローラA(339)は、ポートJ(332)とキャッシュA(341)間のデータのやり取りを制御するCPUである。同様に、チャネルコントローラB(340)は、ポートK(333)およびポートL(334)とキャッシュA(341)間のデータのやり取りを制御するCPUである。また、ディスクコントローラA(342)は、RAIDグループA(348)とキャッシュA(341)間のデータのやり取りを制御するCPUである。同様に、ディスクコントローラB(343)は、RAIDグループB(349)とキャッシュA(341)間のデータのやり取りを制御するCPUである。
図3にて、装置は、ホストサーバA(301)、CPU−A(306)、メモリA(307)、ポートA(318)、ホストサーバB(302)、CPU−B(308)、メモリB(309)、ポートB(319)、SANスイッチA(321)、ポートC(323)〜E(325)、SANスイッチB(322)、ポートF(326)〜ポートI(329)、ストレージサブシステムA(331)、ポートJ(332)〜ポートL(334)、チャネルコントローラA(339)およびB(340)、キャッシュA(341)、ディスクコントローラA(342)およびB(343)、RAIDグループA(348)およびB(349)、物理ディスク群(350〜351)である。図3にて、アプリケーションは、アプリケーションA(303)〜アプリケーションC(305)である。図3にて、論理ユニットは、ファイルシステムA(310)〜ファイルシステムD(313)、ボリュームA(314)〜ボリュームD(317)、LU−A(335)〜LU−D(338)、論理ボリュームA(344)〜論理ボリュームD(347)である。
図3において、装置、論理ユニット、アプリケーション間に引かれた太線は、性能の依存関係を表わす。図3の例では、アプリケーションA(303)は、ファイルシステムA(310)とファイルシステムB(311)に対しI/O(Input/Output)処理を行う。この場合、アプリケーションA(303)は、ファイルシステムA(310)とファイルシステムB(311)に対しI/O上の負荷をかけることとなり、アプリケーションA(303)は、ファイルシステムA(310)とファイルシステムB(311)に性能上の負荷に関する依存関係があることとなる。ファイルシステムA(310)とボリュームAを結ぶ線は、ファイルシステムAがボリュームA上に配置される関係を表わしているが、この関係は、また、アプリケーションがファイルシステムAに対して操作を行った場合に、ボリュームAへ操作がつながるため、性能上の負荷について依存関係があることを表わしている。ボリュームA〜ボリュームCとポートAの間の線も同様に、性能の依存関係がある。
ボリュームA(314)は、ストレージサブシステムA(331)内のLU−A(335)をホストサーバA(301)上にマウントしたものであるため、アプリケーションA(303)がI/O命令を発行すると、LU−A(335)に対するアクセスをストレージサブシステムA(331)が処理することになる。そこで、LU−A(335)を、ストレージサブシステムA(331)内におけるアプリケーションA(303)の代替的存在であり、ストレージサブシステムA(331)内の装置を利用するコンシューマの1つと考えることができる。ストレージサブシステムA(331)内の装置のうち、LU−A(335)と関わりがあるものには、チャネルコントローラA(339)、キャッシュA(341)、ディスクコントローラA(342)、RAIDグループA(348)、物理ディスク群(350〜353)があり、それらは、LU−A(335)と性能の依存関係がある。
ホストサーバ内のボリュームと、同ボリュームのマウント元であるストレージサブシステム内のLUの対が決まると、この両者の間でやり取りされる入出力データの転送経路として、ホストバスアダプタのポート、SANスイッチのポート群、ストレージサブシステムのポートが決まる。ホストサーバのボリュームにかかる入出力の負荷は経路上のポートに対する通信の負荷となるため、ホストサーバ内のボリュームと、経路上のポートの間には性能の依存関係がある。図3の例では、ボリュームA(314)の対になるLUはLU−A(335)であり、ボリュームA(314)とLU―A(335)間の経路上のポートである、ポートA(318)、ポートC(323)、ポートD(324)、ポートJ(332)は、ボリュームA(314)と性能の依存関係がある。
図4〜図9を参照して監視エージェントの構成情報の内容を説明する。
図4は、各監視エージェントの構成情報に含まれるテーブルを示す説明図である。図4に示すように、各監視エージェント171〜174は、当該エージェントが監視する装置・論理ユニット・アプリケーションの一覧情報を格納するテーブルと、装置・論理ユニット・アプリケーション間の依存関係情報を格納するテーブルを、構成情報228に備える。
図4に示す例では、アプリケーション監視エージェント171は、監視対象アプリケーションの一覧情報をアプリケーション一覧テーブル402に格納するとともに、当該アプリケーションがどのファイルシステムを利用するかを示す情報をアプリケーション・ファイルシステム間関連テーブル401に格納する。
同様に、ホスト監視エージェント172は、監視対象のファイルシステム、ボリューム、ホストポートの一覧情報を、それぞれファイルシステム一覧テーブル413、ボリューム一覧テーブル414、ホストポート一覧テーブル415に格納するとともに、各監視対象間に成り立つ性能の依存関係情報を、ファイルシステム・ボリューム間関連テーブル411、ボリューム・LU・ホストポート間関連テーブル412に格納する。
同様に、ファブリック監視エージェント173は、監視対象のSANスイッチポートの一覧情報を、SANスイッチポート一覧テーブル422に格納するとともに、ホスト側ポートからストレージポートまでの通信経路上のポート群をホスト・ストレージポート間通信経路テーブル421に格納する。
同様に、ストレージサブシステム監視エージェント174は、監視対象のストレージポート、LU、チャネルコントローラ、キャッシュ、ディスクコントローラ、論理ボリューム、RAIDグループの各種類に関する一覧情報を、種類毎の一覧テーブル432〜438に格納する。また、LUおよび当該LUと性能の依存関係があるストレージサブシステム構成要素に成り立つ性能の依存関係情報を、LU・ストレージサブシステム内要素間関連テーブル431に格納する。
図5は、アプリケーション・ファイルシステム間関連テーブルの構造を示す説明図である。図5に示すテーブルは、アプリケーション監視エージェント171が備える構成情報228に格納される、アプリケーション・ファイルシステム間関連テーブル401(図4参照)の構造の一例を示している。アプリケーション・ファイルシステム間関連テーブル401は、アプリケーションとファイルシステムとの間の性能の依存関係を記録するためのものであり、アプリケーションの識別情報を格納するアプリケーション欄501、ファイルシステムの識別情報を格納するファイルシステム欄502を有する。テーブルの各行は、依存関係があるアプリケーションとファイルシステムの組に対応する。具体的には、図3で示した性能の依存関係の例において、ホストサーバA(301)上で稼働するアプリケーションA(303)は、ファイルシステムA(310)およびファイルシステムB(311)に、性能の依存関係があることがわかる。
図6は、ファイルシステム・ボリューム間関連テーブルの構造を示す説明図である。図6に示すテーブルは、ホスト監視エージェント172が備える構成情報228に格納される、ファイルシステム・ボリューム間関連テーブル411(図4参照)の構造の一例を示している。ファイルシステム・ボリューム間関連テーブル411は、アプリケーションとファイルシステムとの間の性能の依存関係を記録するためのものであり、ファイルシステムの識別情報を格納するファイルシステム欄601、ボリュームの識別情報を格納するボリューム欄602からなる。テーブルの各行は、依存関係があるファイルシステムとボリュームの組に対応する。具体的には、図3で示した性能の依存関係の例において、ホストサーバA(301)上の稼動するファイルシステムA(310),B(311),C(312)は、それぞれボリュームA(314),B(315),C(316)と性能の依存関係があることがわかる。
図7は、ボリューム・LU・ホストポート間関連テーブルの構造を示す説明図である。図7に示すテーブルは、ホスト監視エージェント172が備える構成情報228に格納される、ボリューム・LU・ホストポート間関連テーブル412(図4参照)の構造の一例を示している。ボリューム・LU・ホストポート間関連テーブル412は、ホスト内のボリュームとストレージサブシステム内のLU間の対応関係およびアクセスに用いるホストポートとの対応関係を記録するためのものであり、ボリュームの識別情報を格納するボリューム欄701、LUの識別情報を格納するLU欄702、LUを保持するストレージサブシステムの識別情報を格納するLU保持ストレージサブシステム欄703、アクセスに用いるホストポートの識別情報を格納するホストポート欄704からなる。テーブルの各行は、依存関係があるボリューム・LU・ポートの組に対応する。具体的には、図3で示した性能の依存関係の例において、ホストサーバA(301)は、LU−A(335)、LU保持するストレージサブシステム(331)、ポートA(318)と、性能の依存関係があることがわかる。
図8は、ホストポート・ストレージポート間通信経路テーブルの構造を示す説明図である。図8のテーブルは、ファブリック監視エージェント173が備える構成情報228に格納される、ホストポート・ストレージポート間通信経路テーブル421(図4参照)の構造の一例を示している。ホストポート・ストレージポート間通信経路テーブル421は、ホスト内のボリュームとストレージサブシステム内のLUとの転送経路情報を記録するものであり、ホストポートの識別情報を格納するホストポート欄801、ストレージポートの識別情報を格納するストレージポート欄802、当該ホストポートから当該ストレージポートまでの経路を示すSANスイッチ内ポート識別情報のリストを格納する通信経路欄803からなる。テーブルの各行は、依存関係があるホストポート、SANスイッチポート、ストレージポートの組に対応する。具体的には、図3で示した性能の依存関係の例において、ポートA(318)は、ポートC(323)およびポートD(324)を経由してポートJ(332)に接続されていることがわかる。
図9は、LU・ストレージサブシステム内要素間関連テーブルの構造を示す説明図である。図9に示すテーブルは、ストレージサブシステム監視エージェント174が備える構成情報228に格納される、LU・ストレージサブシステム内要素間関連テーブル431(図4参照)の構造の一例を示している。LU・ストレージサブシステム内要素間関連テーブル431は、ストレージサブシステム内のLUと当該ストレージサブシステム内の各要素との対応関係を記録するものであり、LUの識別情報を格納するLU欄901、ストレージポートの識別情報を格納するストレージポート欄902、チャネルコントローラの識別情報を格納するチャネルコントローラ欄903、キャッシュの識別情報を格納するキャッシュ欄904、ディスクコントローラの識別情報を格納するディスクコントローラ欄905、論理ボリュームの識別情報を格納する論理ボリューム欄906、RAIDグループの識別情報を格納するRAIDグループ欄907からなる。テーブルの各行は、LUと当該LUが依存関係がある各ストレージ装置内要素の組に対応する。具体的には、図3で示した性能の依存関係の例において、LU−A(335)は、ポートJ(332)、チャネルコントローラA(339)、キャッシュA(341)、ディスクコントローラA(342)、論理ボリュームA(344)、RAIDグループA(907)との対応関係があることがわかる。
図10は、実施形態1における装置性能管理ソフトの構成情報に含まれるテーブルを示す構成図である。装置性能管理ソフト181の構成情報234に格納する情報は、図5〜図9にて示した各監視エージェントが収集した情報を纏め上げた情報である。図10に示すように、構成情報234には、監視エージェントを介して取得した装置の一覧情報を格納する装置一覧テーブル1001、同じくアプリケーションの一覧情報を格納するアプリケーション一覧テーブル1002、装置と当該装置を利用するアプリケーションの対応関係情報を格納する装置・アプリケーション間関連テーブル1003を有している。図10には、装置の飽和兆候検出を行うため、装置とアプリケーションの性能情報の相関分析を行う場合に必要となるテーブルの例を示している。
図11は、装置一覧テーブルの構造を示す説明図である。図11に示すテーブルは、装置一覧テーブル1001(図10参照)の構造の一例を示している。装置一覧テーブル1001は、各装置監視エージェントが収集した装置の一覧情報を纏め上げたテーブルであり、装置種別の識別情報を格納する装置種別欄1101、装置名の識別情報を格納する装置名欄1102、装置がより大きな閉じたハードウェアを構成する要素である場合に、当該装置が所属するハードウェアの識別情報を格納する所属先欄1103、装置を飽和兆候検出対象とするか否かを決定する飽和兆候検出対象欄1104からなる。飽和兆候検出対象欄1104については、図16にて詳しく説明する。具体的には、図3に示した装置群の一覧情報を装置性能管理ソフト181が収集し纏め上げ、例えば、CPU−A(306)は、ホストサーバA(301)に属し、飽和兆候検出対象であることがわかる。
図12は、アプリケーション一覧テーブルの構造を示す説明図である。図12に示すテーブルは、アプリケーション一覧テーブル1002(図10参照)の構造の一例を示している。アプリケーション一覧テーブル1002は、アプリケーション監視エージェントが収集したアプリケーションの一覧情報を纏め上げたテーブルであり、アプリケーション名の識別情報を格納するアプリケーション欄1201、アプリケーションが稼動するサーバの識別情報を格納する所属先欄1202、アプリケーションを飽和兆候検出対象とするか否かを決定する飽和兆候検出対象欄1203からなる。飽和兆候検出対象欄1203については、図16にて詳しく説明する。具体的には、図3に示したアプリケーション群の一覧情報を装置性能管理ソフト181が収集し纏め上げ、例えば、アプリケーションA(303)は、ホストサーバA(301)に属し、飽和兆候検出対象であることがわかる。
図13は、装置・アプリケーション間関連テーブルの構造を示す説明図である。図13に示すテーブルは、装置・アプリケーション間関連テーブル1003(図10参照)の構造の一例を示している。装置・アプリケーション間関連テーブル1003は、監視エージェントが収集した装置、論理ユニット、アプリケーション間の関連情報を結合し、装置とアプリケーション間に成り立つ性能の依存関係を纏めたテーブルであり、装置種別の識別情報を格納する装置種別欄1300、装置名の識別情報を格納する装置名欄1301、当該装置の所属先ハードウェアの識別情報を格納する所属先欄1302、当該装置と性能の依存関係があるアプリケーション名の識別情報を格納するアプリケーション名欄1303、当該アプリケーションが稼動するサーバの識別情報を格納する所属先欄1304からなる。具体的には、図3に示した性能の依存関係の例において、監視エージェントから収集した情報から、個々の装置とアプリケーションとの関係を計算し、装置・アプリケーション間関連テーブル1003に格納する。例えば、CPU−A(306)は、ホストサーバA(301)に属し、アプリケーションA(303)は、ホストサーバA(301)に属し、CPU−A(306)と、アプリケーションA(303)は、性能の依存関係にあることがわかる。
個々の装置とアプリケーションとの関係の計算方法の概略を、図3および図4を参照して説明する。ここでは、RAIDグループと性能の依存関係があるアプリケーションを見つけ出す方法について示す。
RAIDグループと性能の依存関係があるLU群は、ストレージサブシステム監視エージェント174が備えるLU・ストレージサブシステム内要素間関連テーブル431より解決できる。解決した当該LU群の各々について、性能の依存関係があるボリューム群は、ホスト監視エージェント172が備えるボリューム・LU・ホストポート間関連テーブル412より解決できる。解決した当該ボリューム群の各々について、性能の依存関係があるファイルシステム群は、ホスト監視エージェント172が備えるファイルシステム・ボリューム間関連テーブル411より解決できる。解決した当該ファイルシステム群の各々について、性能の依存関係があるアプリケーション群は、アプリケーション監視エージェント171が備えるアプリケーション・ファイルシステム間関連テーブル401より解決できる。このようにして、RAIDグループを起点に、当該RAIDグループと性能の依存関係があるアプリケーションを解決する(見出す)ことができる。図3において、RAIDグループよりアプリケーションに近い側に位置する装置についても、同様に、依存関係があるアプリケーションを解決する(見出す)ことができる。
図14は、監視エージェントの性能情報および装置性能管理ソフトの性能情報に含まれるテーブルの構造を示す説明図である。監視エージェント221〜223の性能情報225(図2参照)には、性能情報記憶テーブル1401があり、当該監視エージェントの監視対象の、時系列な性能情報が格納される。装置性能管理ソフト181の性能情報232(図2参照)には、性能情報記憶テーブル1402があり、装置性能管理ソフト181が各監視エージェントから収集した性能情報が格納される。
図15は、性能情報記憶テーブルの構造を示す説明図である。図15のテーブルは、装置性能管理ソフト181が備える性能情報記憶テーブル1402(図14参照)の構造の一例を示している。性能情報記憶テーブル1402は、監視対象のアプリケーションまたは論理ユニットまたは装置の識別情報を格納する監視対象種別を格納する監視対象種別欄1500、監視対象名の識別情報を格納する監視対象名欄1501、当該監視対象が所属または稼動するハードウェアの識別情報を格納する所属先欄1502、当該監視対象が備える性能値の種類を識別する情報を格納する性能種別欄1503、観測した性能値を格納する性能値欄1504、観測した時刻を格納する観測時刻欄1505からなる。具体的には、図3で示した装置群、論理ユニット群、アプリケーション群の例において、装置性能管理ソフト181が、当該装置、論理ユニット、アプリケーション群の性能情報を収集し格納される。なお、性能情報記憶テーブル1401(図14参照)の構造は、性能情報記憶テーブル1402の構造と同様であるので、説明は省略する。
監視エージェント221〜223および装置性能管理ソフト181が収集、格納しうる性能情報には、いくつかの種類がある。例として、アプリケーションの性能情報の種類には、アプリケーションが発行するI/O(Input/Output)命令の量、I/Oバイト量、アプリケーションが当該アプリケーションの使用者/使用プログラムに対して提供するサービスレベルとしてのレスポンスタイムまたはスループット、アプリケーションが装置から受け取るサービスレベルとしてのレスポンスタイムまたはスループットがある。
論理ユニットは、アプリケーションの代替とみなすことができるため、論理ユニットには、当該論理ユニットを使用するアプリケーションが当該論理ユニットを経由して発行したI/O命令の量およびI/Oバイト量、論理ユニットが装置から受け取るサービスレベルとしてのレスポンスタイムまたはスループットがある。
装置の性能情報の種類には、装置が処理したI/O命令の量、I/Oバイト量、使用率がある。また、キャッシュの場合には、キャッシュヒットレートや、処理命令数に対するキャッシュへの書き込みを遅らせた回数の割合であるライトペンディングレートもある。
図16は、管理対象装置群の中から飽和兆候検出対象を決定するための画面例と決定された内容に応じての関連テーブル内容を示す説明図である。図16(a)に示す飽和兆候検出対象装置設定画面1601は、装置性能管理ソフト181の飽和兆候検出対象装置設定処理S235(図2参照)が性能管理クライアント161に表示する、管理対象装置群の中から飽和兆候検出対象を設定するための画面例である。当該画面例において、飽和兆候検出対象装置設定処理S235は、装置性能管理ソフト181が監視するアプリケーションの一覧を領域1603に表示する。管理者は、性能の依存関係がある装置を性能飽和兆候の検出対象としたいアプリケーションを検討し、領域1602のチェックボックスを使って選択する。
すると、図16(b)に示すように、飽和兆候検出対象装置設定処理S235は、アプリケーション一覧テーブル1002(図12参照)の飽和兆候検出対象欄1203の値を、管理者の選択内容に応じて更新する。
次に、図16(c)に示すように、飽和兆候検出対象装置設定処理S235は、アプリケーション一覧テーブル1002の飽和兆候検出対象欄1203の値が飽和兆候検出対象であることを意味する値となっているアプリケーションの一覧を取得し、当該アプリケーション群のいずれからも使用されない装置を、装置・アプリケーション間関連テーブル1003(図13参照)を使って絞り込み、絞り込まれた装置群について、装置一覧テーブル1001(図11参照)の飽和兆候検出対象欄1104の値を、飽和兆候検出対象としないように更新する。絞り込まれなかった装置は、飽和兆候検出対象とするように更新する。
図16に示すように、アプリケーションの視点で飽和兆候検出対象装置を決定する画面を表示してもよいし、装置一覧を表示し、各装置について飽和兆候検出対象装置とするか否かを選択する画面を表示してもよい。その場合は、アプリケーション一覧テーブル1002の飽和兆候検出対象欄1203は必要ない。また、当該機能を持たず、全装置を常に飽和兆候検出対象装置としてもよい。その場合は、装置一覧テーブル1001の飽和兆候検出対象欄1104は必要ない。図16では、画面による選択方法を示したが、設定ファイルなどによる選択方法を用いてもよい。
次に、飽和兆候検出処理を説明する。
図17は、実施形態1における装置性能管理ソフトの飽和兆候検出処理を示すフローチャートである。装置性能管理ソフト181の飽和兆候検出処理S236(図2参照)のフローチャートは、図38で示したステップS3804およびステップS3805にあたる。以下、当該フローチャートについて、初めに概要を説明した後、主要なステップについて詳細を説明する。なお、装置性能管理ソフト181のソフトウェアの処理は、性能管理サーバ151(図1参照)のCPUが実行することで実現する。
初めに、ステップS1701にて、装置とアプリケーションとで性能情報の変化の相関を分析する期間を決定する。期間は、現在時刻から特定の時間だけ遡った時刻までの範囲としてもよいし、管理者が画面や設定ファイルなどで決定した時間範囲としてもよい。
次に、ステップS1702にて、装置一覧テーブル1001(図11参照)から、飽和兆候検出対象とする装置一覧を取得する。装置一覧テーブル1001の飽和兆候検出対象欄1104のように、装置毎に飽和兆候検出対象とするか否かを設定する欄があれば、飽和兆候検出対象と指定された装置を抜き出す処理に相当する。次に、ステップS1703〜ステップS1712まで、ステップS1702にて取得した装置の各々についてループ処理を行う。
ステップS1704では、当該装置と性能の依存関係があるアプリケーション一覧を、装置・アプリケーション間関連テーブル1003(図13参照)を使って絞り込み、取得する。ステップS1705では、ステップS1701で決定した期間内の、当該装置の性能情報を、性能情報記憶テーブル1402(図15参照)から取得する。次に、ステップS1706〜ステップS1709まで、ステップS1705にて取得したアプリケーションの各々について、飽和兆候の有無を検出するためのループ処理を行う。
ステップS1707では、ステップS1701で決定した期間内の、当該アプリケーションの性能情報を、性能情報記憶テーブル1402から取得する。ステップS1708では、ステップS1705で取得した当該装置の性能情報と、ステップS1707で取得した当該アプリケーションの性能情報との間で相関係数Rを計測し、{当該装置の識別情報、当該アプリケーションの識別情報、ステップS1701で決定した期間情報、相関係数R}の組を、装置性能管理ソフト181の飽和兆候情報237の相関係数演算結果テーブル2001(図21参照)に保存する。相関係数演算結果テーブル2001については、図21を参照して後述する。ステップS1709は、アプリケーションに関するループの終了である。
ステップS1710では、ステップS1708で保存した、装置とアプリケーションとの間の性能情報の相関係数Rを当該装置の飽和度を表す指標として用い、相関係数Rが閾値を超えた場合には、装置が飽和兆候を示したと判定する。装置が飽和兆候を示したと判定(検出)した場合には(ステップS1710,Yes)、ステップS1711に処理ステップを進める。装置が飽和兆候を示したと判定(検出)しなかった場合には(ステップS1710,No)、ステップS1712に処理ステップを進める。
ステップS1711は、{飽和兆候を示したと判定した装置の識別情報、ステップS1701で決定した期間情報}の組を、装置性能管理ソフト181の飽和兆候情報237の飽和兆候情報テーブル2002(図22参照)に保存する。飽和兆候情報テーブル2002については、図22を参照して詳しく後述する。なお、ステップS1712は、装置に関するループの終了である。
次に、主要なステップについて、詳細を説明する。
ステップS1705では、装置の性能情報として、装置の使用率を用いるか、使用率以外の性能情報から擬似的に使用率を計算して用いる。使用率を取得できる装置には、CPUを内包するチャネルコントローラやディスクコントローラ、ホストサーバ上のCPUなどのCPU系装置と、RAIDグループなどのディスク系装置がある。ストレージポート、ホストポート、SANスイッチポートなどのポート系装置の場合には、使用率を取得できない場合があるが、その場合には、ポートの単位時間あたり最大転送可能バイト量を分母に、計測した単位時間あたり転送バイト量を分子にし、擬似的に使用率を計算してもよい。また、キャッシュについては、使用率は常に100%である場合が多く、その場合は性能情報として参考にならないため、使用率の変わりにキャッシュヒットレートまたはライトペンディングレートを用いてもよい。
ステップS1707では、アプリケーションの性能情報として、アプリケーションが当該アプリケーションの使用者/使用プログラムに対して提供するサービスレベルとしてのレスポンスタイムまたは、アプリケーションが装置から受け取るサービスレベルとしてのレスポンスタイムを使用する。
ステップS1708では、ステップS1701で決定した期間における、ステップS1705で取得した装置の時系列な使用率とステップS1707で取得したアプリケーションの時系列なレスポンスタイムから、各々の変化値列を計算し、変化値列同士の相関係数を計算する。装置の使用率と、装置からアプリケーションに対するレスポンスタイムの間の関係は、一般に図18に示すグラフのようになる。
図18は、装置の使用率と、当該装置を利用するアプリケーションが装置に処理要求を出した場合のレスポンスタイムの間に成り立つ関係を示す説明図である。図18において、横軸1801は装置の使用率を、縦軸1802は装置からアプリケーションに対するレスポンスタイムを、曲線1803は使用率とレスポンスタイムの間の関係を表す。縦線1804は使用率が100%であることを表し、縦線1805は、使用率がある値X%であることを表す。1806に示す範囲、即ち使用率が0%〜X%の間は、使用率が上昇しても、レスポンスタイムはあまり上昇しない。この場合、使用率変化に対するレスポンスタイム変化の反応は微弱であり、使用率変化とレスポンスタイム変化にはランダム性が生じやすく、相関は低くなりやすい。1808に示す範囲、即ち使用率がX%〜100%の間は、使用率が上昇するにつれ、レスポンスタイムも大きく上昇する。この場合、使用率変化に対するレスポンスタイム変化の反応は鋭く、使用率変化とレスポンスタイム変化の相関は大きくなりやすい。
以下、相関係数の計算方法の例をあげる。
図19は、装置の使用率と、当該装置を利用するアプリケーションが装置に処理要求を出した場合のレスポンスタイムとの間で、変化値の正負による相関分析を行う例を示す説明図である。図19に示すように、時間経過に伴う使用率とレスポンスタイムの変化量の正負を計算し、その共起割合を利用して、相関係数を計算することができる。
図19に示すグラフの横軸1901は、時間を表す。折れ線1902は、レスポンスタイムの時間変化を、折れ線1903は、使用率の時間変化を表す。区域1904は、時間経過に伴うレスポンスタイムの変化量の正負を表す。同様に区域1905は、時間経過に伴う使用率の変化量の正負を表す。区域1906は、レスポンスタイムと使用率それぞれの変化量の正負が共起したか否かを表す。全体に対して共起した回数の占める割合を使って、相関係数Rとすることができる。例えば、区域1906の共起した回数(Yesの回数)は7回のうち5回であるので、相関係数Rが71.4%であると算出できる。
正負を使わない方法として、レスポンスタイムと使用率各々の時系列な変化値同士を使って相関係数を測り、相関係数Rとすることができる。また、確度を高めるため、時間変化に伴う変化量が特定の閾値よりも低い場合には相関係数の計算に用いないなどの方法も考えられる。
装置がキャッシュの場合、使用率の代わりにキャッシュヒットレートを用いることもできる。キャッシュヒットレートは、使用率とは逆に、0%に近ければ近いほど、アプリケーションへのサービスレベルは低くなる。そこで、キャッシュヒットレートの変化値とサービスレベルの変化値で相関分析を行う場合には、相関係数の正負を逆転し、前記閾値と比較する。
図17に戻り、ステップS1710では、1つの装置を複数のアプリケーションが利用する場合に、各アプリケーションとの間で計算した複数の相関係数Rが得られる。この場合、アプリケーション毎に重みをつけ、複数の相関係数Rの加重平均を行うことで、複数の相関係数をまとめることができる。レスポンスタイムを重視したい特定の1つまたは複数のアプリケーションの重みを高くし、その他のアプリケーションの重みを低く設定することもできる。ステップS1710では、前記方法で計算した、装置と、装置を使用するアプリケーション(群)との間の性能情報の相関係数を、当該装置に関する飽和度とみなし、該相関係数が閾値を超えた場合には、当該装置は飽和兆候を示したと判定する。当該閾値は、システムに固定としてもよいし、画面や設定ファイルなどで設定可能としてもよい。
図20は、装置性能管理ソフトの飽和兆候情報に含まれるテーブルを示す構成図である。装置性能管理ソフト181の飽和兆候情報237には、相関係数演算結果テーブル2001と飽和兆候情報テーブル2002がある。
図21は、実施形態1における相関係数演算結果テーブルの構造を示す説明図である。図21に示すテーブルは、装置性能管理ソフト181が備える相関係数演算結果テーブル2001(図20参照)の構造の一例を示している。相関係数演算結果テーブル2001には、装置、アプリケーション、期間の組毎に計算した性能情報の相関係数を格納する。相関係数演算結果テーブル2001は、装置種別の識別情報を格納する装置種別欄2100、装置種別の装置名の識別情報を格納する装置名欄2101、当該装置の所属先であるハードウェア識別情報を格納する所属先欄2102、アプリケーション名のアプリケーション識別情報を格納するアプリケーション名欄2103、当該アプリケーションが稼動するサーバの所属先であるサーバ識別情報を格納する所属先欄2104、相関係数の計算に用いた性能情報の期間情報を格納するための、開始時刻情報を格納する開始時刻欄2105と終了時刻情報を格納する終了時刻欄2106、演算結果の相関係数を格納する相関係数欄2107からなる。
具体的には、図3で示した性能の依存関係の例において、CPU−A(306)とアプリケーションA(303)の相関係数を、開始時刻2007年1月22日10:00:00から終了時刻2007年1月22日12:00:00までの2時間の相関係数計算期間において計算し、相関係数が0.53であることがわかる。
図22は、飽和兆候情報テーブルの構造を示す説明図である。図22に示すテーブルは、飽和兆候を検知した装置の情報を格納するためのテーブルである飽和兆候情報テーブル2002(図20参照)の構造を示している。飽和兆候情報テーブル2002は、装置種別の識別情報を格納する装置種別欄2200、装置種別の装置名の識別情報を格納する装置名欄2201、当該装置が所属するハードウェア識別情報を格納する所属先欄2202、相関係数の計算に用いた期間情報を格納するための、開始時刻情報を格納する開始時刻欄2203と終了時刻情報を格納する終了時刻欄2204からなる。
具体的には、仮に、相関係数に対する閾値を0.30とし、当該閾値を超えた場合に装置が飽和兆候を示すと判定すると、図21に示すテーブルにてディスクコントローラAに関する相関係数は0.20であるため、ディスクコントローラAは飽和兆候を示したと判定されない。判定結果により、図22に示すテーブルには、ディスクコントローラAに関する飽和兆候情報は格納されていない。
図23は、実施形態1における装置性能管理ソフトの飽和兆候情報出力処理が出力する画面例を示す説明図である。装置性能管理ソフト181の飽和兆候情報出力処理S238が出力する画面2301は、1つの表を含み、当該表は、飽和兆候を検出した装置の識別情報を表示する装置種別列2302、当該装置の種別識別情報を表示する装置名列2303、当該装置が所属するハードウェアの識別情報を表示する所属先列2304、当該装置の使用率を表示する使用率列2305、当該装置と性能の依存関係があるアプリケーションの識別情報を表示する装置を使用するアプリケーション名列2306、当該アプリケーションが稼動するホストサーバの識別情報を表示するアプリケーション稼動サーバ列2307、当該アプリケーションのレスポンスタイムを表示するレスポンスタイム列2308、当該装置と当該アプリケーションとの間の性能情報の相関係数を表示する相関係数列2309、相関係数計算を行った期間を示す、期間の開始日時情報を表示する開始日時列2310と終了日時情報を表示する終了日時列2311、相関係数の演算に用いた性能情報の詳細を表示する画面を表示するためのボタンを表示するレポート列2312および当該ボタン2313からなる。各列2302〜2313の全てを画面表示することは、必ずしも必要としない。
図24は、実施形態1における装置性能管理ソフトの飽和兆候情報出力処理を示すフローチャートである。装置性能管理ソフト181のソフトウェアの処理は、性能管理サーバ151(図1参照)のCPUが実行することで実現する。装置性能管理ソフト181の飽和兆候情報出力処理S238は、ステップS2401にて飽和兆候情報テーブル2002(図22参照)をスキャンし、ステップS2402〜ステップS2411にて、飽和兆候情報テーブル2002の各行についてループ処理を行う。
当該ループ処理の中では、まずステップS2403にて、飽和兆候情報テーブル2002から検索した{装置種別欄2200、装置名欄2201、所属先欄2202、開始時刻欄2203、終了時刻欄2204}の値をキーに性能情報記憶テーブル1402(図15参照)を検索し、性能値欄1504より、当該装置の使用率を取得する。
次に、ステップS2404にて、ステップS2401〜ステップS2403で取得した、{装置種別、装置名、所属先、使用率}の各値を、図23の各列2302〜2305の値として表示する。開始時刻と終了時刻によって表される期間内に複数の時刻の使用率がある場合で、かつ、画面表示範囲の都合により当該期間内の全時刻の使用率を表示できない場合、取得した使用率を一つまたは複数の値に丸め込み、表示してもよい。この時、当該期間における平均値を表示してもよいし、期間の最後の値を表示してもよいし、期間内の最大値を表示してもよい。本実施形態は、表示内容を制限するものではない。
次に、ステップS2405にて、{装置種別欄2200、装置名欄2201、所属先欄2202、開始時刻欄2203、終了時刻欄2204}の値をキーに相関係数演算結果テーブル2001(図21参照)を検索し、{アプリケーション名欄2103、所属先欄2104、相関係数欄2107}の値の一覧を取得する。
次にステップS2406〜ステップS2410まで、取得したアプリケーションに関する一覧情報の各々についてループ処理を行う。当該ループ内のステップS2407では、{アプリケーション名欄2103、所属先欄2104、開始時刻欄2003、終了時刻欄2004}の値をキーに性能情報記憶テーブル1402(図15参照)を検索し、性能値欄1504より、当該アプリケーションのレスポンスタイムを取得する。
次にステップS2408にて、ステップS2405〜ステップS2407で取得した、{アプリケーション名、所属先、レスポンスタイム、相関係数}およびステップS2401で決定した{開始時刻、終了時刻}の各値を、図23の各列2306〜2311の値として表示する。レスポンスタイムも、装置の使用率の場合と同様に、画面表示範囲の都合により当該期間内の全時刻の使用率を表示できない場合、取得した使用率を一つまたは複数の値に丸め込み、表示してもよい。ステップS2409では、装置およびアプリケーションの組み合わせ毎に相関係数計算に用いた性能情報の詳細情報を表示するボタンを、図23のレポート列2312の要素であるボタン2313として表示する。
図25は、実施形態1における装置性能管理ソフトの飽和兆候情報出力処理が、相関係数を計算する際に用いた性能値の詳細情報を出力する画面例を示す説明図である。装置性能管理ソフト181の飽和兆候情報出力処理S238が、相関係数を計算する際に用いた性能値の詳細情報を出力する画面2501は、1つのグラフ2502を含み、当該グラフの横軸2505は時間軸を表し、一方の縦軸2503にはアプリケーションのレスポンスタイムを、もう一方の縦軸2504には装置の使用率を表す。グラフ2502は凡例2506を有してもよく、当該凡例では、アプリケーションおよび装置の識別情報と、必要があれば性能情報の種別も表示する。当該グラフの内容は表形式で表してもよい。また、図25のグラフ2502を、図23の画面2301内で表示してもよい。
飽和兆候情報出力処理S238は、さらに、将来アプリケーションに性能問題を引き起こす可能性が高い装置または現在アプリケーションに性能問題を引き起こしている可能性が高い装置として検出した装置の識別情報、当該装置と性能の依存関係がある装置を抽象化した論理的存在の識別情報、当該論理的存在と性能の依存関係があるアプリケーションの識別情報、当該装置または当該論理的存在または当該アプリケーションの性能情報、の可能な組み合わせのいずれかについて、画面、ログのいずれかまたは両方による出力、またはE−Mail、SNMP(Simple Network Management Protocol)、コマンド実行の全てまたはいずれかの方法によりアラートを行ってもよい。
本実施形態では、1つ以上の装置および該装置と性能の依存関係がある1つ以上のアプリケーションを備えるシステムにおける装置性能を管理する性能管理サーバ151が、装置性能管理ソフト181により、装置およびアプリケーションの構成情報、ならびに、前記装置および前記アプリケーションの間に成り立つ性能の依存関係の構成情報を収集する構成情報収集処理S233と、前記装置および前記アプリケーションの性能情報を収集する性能情報収集処理S231と、前記装置の性能情報と、前記アプリケーションの性能情報の時間変化値に対して所定期間について相関分析し、前記相関分析により得られた相関係数が所定の閾値以上のとき、前記装置が飽和兆候ありと検出する飽和兆候検出処理S236と、前記装置が飽和兆候ありと検出されたとき、飽和兆候ありとされた装置の飽和兆候関連情報を、性能を管理する管理クライアントに告知する飽和兆候情報出力処理S238を含んで実行する。これにより、将来アプリケーションに性能問題を引き起こす可能性が高い装置、または、現在アプリケーションに性能問題を引き起こしている可能性が高い装置を検出することができる。
《実施形態2》
実施形態1では、アプリケーションのレスポンスタイムと装置の使用率の相関分析により、装置の性能飽和兆候を検知した。実施形態2では、アプリケーションのレスポンスタイムがなんらかの理由により取得できない場合などに、アプリケーションのレスポンスタイムの代わりに、装置内に作られる論理ユニット単位に取得したレスポンスタイムを用いて装置の性能飽和兆候を検知する。図26〜図32を参照して説明する。
図26は、実施形態2における装置性能管理ソフトの構成情報に含まれるテーブルを示す構成図である。図26において、飽和兆候検出を行うため、装置の性能情報と、アプリケーションの代替として論理ユニットの性能情報との間で相関分析を行う場合に構成情報234に含まれるテーブルの例を示す。装置性能管理ソフト181の構成情報234は、図10に含むテーブルに加えて、論理ユニットの一覧情報を格納する論理ユニット一覧テーブル2601、装置と論理ユニット間に成り立つ性能の依存関係情報を格納する装置・論理ユニット間関連テーブル2602、同様に論理ユニットとアプリケーション間になりたつ性能の依存関係を格納する論理ユニット・アプリケーション間関連テーブル2603を有する。
図27は、論理ユニット一覧テーブルの構造を示す説明図である。図27に示すテーブルは、論理ユニット一覧テーブル2601(図26参照)の構造の一例を示している。論理ユニット一覧テーブル2601は、装置監視エージェントから論理ユニットに関する一覧情報を抜き出し、纏め上げたテーブルであり、論理ユニット種別の識別情報を格納する論理ユニット種別欄2701、論理ユニット名の識別情報を格納する論理ユニット名欄2702、当該論理ユニットを保持するハードウェアの識別情報を格納する所属先欄2703からなる。
図28は、装置・論理ユニット間関連テーブルの構造を示す説明図である。図28に示すテーブルは、前記装置・論理ユニット間関連テーブル2602(図26参照)の構造の一例を示している。装置・論理ユニット間関連テーブル2602は、監視エージェントが収集した装置、論理ユニット、アプリケーション間の関連情報をジョインし、装置と論理ユニット間に成り立つ性能の依存関係を纏めたテーブルであり、装置種別の識別情報を格納する装置種別欄2800、装置種別の装置名の識別情報を格納する装置名欄2801、当該装置の所属先ハードウェアの識別情報を格納する所属先欄2802、当該装置と性能の依存関係がある論理ユニット種別の識別情報を格納する論理ユニット種別欄2803、論理ユニット種別の論理ユニット名の識別情報を格納する論理ユニット名欄2804、当該論理ユニットの所属先ハードウェアの識別情報を格納する所属先欄2805からなる。
具体的には、図3に示した性能の依存関係の例において、監視エージェントから収集した情報から、個々の装置と論理ユニットとの関係を計算し、装置・論理ユニット間関連テーブル2602に格納する。例えば、ポートA(318)は、ホストサーバA(301)に属し、ボリュームA(314)は、ホストサーバA(301)に属し、ポートA(318)と、ボリュームA(314)は、性能の依存関係にあることがわかる。
図13にて、装置の末端であるRAIDグループから、当該RAIDグループを使用するアプリケーションを解決する方法を示した。当該方法を用いることで、装置と当該装置を使用する論理ユニット間で成り立つ性能の依存関係も、同様に計算できる。
計算結果の論理ユニットと装置間の依存関係の例として{LUとストレージポート、LUとチャネルコントローラ、LUとキャッシュ、LUとディスクコントローラ、LUとRAIDグループ、論理ボリュームとストレージポート、論理ボリュームとチャネルコントローラ、論理ボリュームとキャッシュ、論理ボリュームとディスクコントローラ、論理ボリュームとRAIDグループ、ボリュームとホストポート、ボリュームとSANスイッチポート、ボリュームとCPU、ボリュームとメモリ、ボリュームとストレージポート、ボリュームとチャネルコントローラ、ボリュームとキャッシュ、ボリュームとディスクコントローラ、ボリュームとRAIDグループ、ファイルシステムとCPU、ファイルシステムとメモリ、ファイルシステムとホストポート、ファイルシステムとSANスイッチポート、ファイルシステムとストレージポート、ファイルシステムとチャネルコントローラ、ファイルシステムとキャッシュ、ファイルシステムとディスクコントローラ、ファイルシステムとRAIDグループ}を含む。
図29は、論理ユニット・アプリケーション間関連テーブルの構造を示す説明図である。図29に示すテーブルは、論理ユニット・アプリケーション間関連テーブル2603(図26参照)の構造の一例を示している。論理ユニット・アプリケーション間関連テーブル2603は、監視エージェントが収集した装置、論理ユニット、アプリケーション間の関連情報を結合し、論理ユニットとアプリケーション間に成り立つ性能の依存関係を纏めたテーブルであり、論理ユニット種別の識別情報を格納する論理ユニット種別欄2900、論理ユニット名の識別情報を格納する論理ユニット名欄2901、当該論理ユニットの所属先ハードウェアの識別情報を格納する所属先欄2902、当該論理ユニットと性能の依存関係があるアプリケーション名の識別情報を格納するアプリケーション名欄2903、当該アプリケーションが稼動するサーバの識別情報を格納する所属先欄2904からなる。
具体的には、図3に示した性能の依存関係の例において、監視エージェントから収集した情報から、個々の論理ユニットとアプリケーションの関係を計算し、論理ユニット・アプリケーション間関連テーブル2603に格納する。なお、図13にて、装置の末端であるRAIDグループから、当該RAIDグループを使用するアプリケーションを解決する方法を示した。当該方法を用いることで、論理ユニットとアプリケーション間で成り立つ性能の依存関係も、同様に計算できる。
図30は、実施形態2における装置性能管理ソフトの飽和兆候検出処理を示すフローチャートである。装置性能管理ソフト181の飽和兆候検出処理S236Aのフローチャートは、装置の使用率と、当該装置と性能の依存関係がある論理ユニット毎に計測したレスポンスタイムとの相関分析を行うように修正した処理である。当該フローチャートについて説明する。
初めに、ステップS3001にて、装置と論理ユニット間で性能情報の変化の相関を分析する期間を決定する。期間は、現在時刻から特定の時間だけ遡った時刻までの範囲としてもよいし、管理者が画面や設定ファイルなどで決定した時間範囲としてもよい。
次に、ステップS3002にて、装置一覧テーブル1001(図11参照)から、飽和兆候検出対象とする装置一覧を取得する。装置一覧テーブル1001の飽和兆候検出対象欄1104のように、装置毎に飽和兆候検出対象とするか否かを設定可能な欄があれば、飽和兆候検出対象と指定された装置を抜き出す処理に相当する。
次に、ステップS3003〜ステップS3012まで、ステップS3002にて取得した装置の各々についてループ処理を行う。
ステップS3004では、当該装置と性能の依存関係がある論理ユニット一覧を、装置・論理ユニット間関連テーブル2602(図28参照)を使って絞り込み、取得する。ステップS3005では、ステップS3001で決定した期間内の、当該装置の性能情報を、性能情報記憶テーブル1402(図15参照)から取得する。次に、ステップS3006〜ステップS3009まで、ステップS3005にて取得した論理ユニットの各々についてループ処理を行う。
ステップS3007では、ステップS3001で決定した期間内の、当該論理ユニットの性能情報を、性能情報記憶テーブル1402から取得する。ステップS3008では、ステップS3005で取得した当該装置の性能情報と、ステップS3007で取得した当該論理ユニットの性能情報との間で相関係数Rを計測し、{当該装置の識別情報、当該論理ユニットの識別情報、ステップS3001で決定した期間情報、相関係数R}の組を、装置性能管理ソフト181の飽和兆候情報237の相関係数演算結果テーブル2001(図21参照)に保存する。ここでは、相関係数演算結果テーブル2001のアプリケーション名欄2103を論理ユニット識別情報格納欄とみなせばよい。同様に、アプリケーションが稼動するホストサーバ識別情報格納欄を、論理ユニットが所属するハードウェア識別情報格納欄とみなせばよい。ステップS3009は、論理ユニットに関するループの終了である。
ステップS3010では、ステップS3008で保存した、装置と論理ユニットとの間の性能情報の相関係数Rを当該装置の飽和度を表す指標として用い、装置が飽和兆候を示したか否かを判定する。装置が飽和兆候を示したと判定(検出)した場合には(ステップS3010,Yes)、ステップS3011に処理ステップを進める。装置が飽和兆候を示したと判定(検出)しなかった場合には(ステップS3010,No)、ステップS3012に処理ステップを進める。
ステップS3011では、{飽和兆候を示したと判定した装置の識別情報、ステップS3001で決定した期間情報}の組を、装置性能管理ソフト181の飽和兆候情報237の飽和兆候情報テーブル2002(図22参照)に保存する。ステップS3012は、装置に関するループの終了である。
図30に示すフローチャートでも、装置の性能情報として図17に示すフローチャートの説明と同様に装置の使用率を用いる。また、論理ユニットの性能値として、論理ユニットが装置から受け取るサービスレベルとしてのレスポンスタイムを使用する。装置の使用率と論理ユニットのレスポンスタイム間で行う相関係数の演算方法も、図17と同様である。1つまたは複数の論理ユニットが装置を利用する場合に、当該装置が飽和したか否かを決定する方法のバリエーションも図17にて説明した内容と同様である。
図31は、実施形態2における相関係数演算結果テーブルの構造を示す説明図である。図31に示す相関係数演算結果テーブル2001Aは、装置性能管理ソフト181の飽和兆候情報237に含まれる相関係数演算結果テーブル2001(図21参照)を、アプリケーションの代替として論理ユニットを用いる場合のために修正した例である。相関係数演算結果テーブル2001Aは、装置種別の識別情報を格納する装置種別欄3100、装置名の識別情報を格納する装置名欄3101、当該装置の所属先ハードウェアの識別情報を格納する所属先欄3102、当該装置と性能の依存関係を有する論理ユニット種別の識別情報を格納する論理ユニット種別欄3103、論理ユニット名の識別情報を格納する論理ユニット名欄3104、当該論理ユニットの所属先ハードウェアの識別情報を格納する所属先欄3105を備え、続いて、期間情報の格納のための開始時刻を格納する開始時刻欄3106と終了時刻を格納する終了時刻欄3107、相関係数を格納する相関係数欄3108を備える。図30のフローチャートのステップS3008では、図31で示した構造を備える相関係数演算結果テーブル2001Aに、演算した相関係数を格納すればよい。
具体的には、図3で示した性能の依存関係の例において、チャネルコントローラA(339)とLU−A(335)の相関係数を、開始時刻2007年1月22日10:00:00から終了時刻2007年1月22日12:00:00までの2時間の相関係数計算期間において計算し、相関係数が0.56であることがわかる。
図32は、実施形態2における装置性能管理ソフトの飽和兆候情報出力処理が出力する画面例を示す説明図である。図32は図23と比較して、装置性能管理ソフト181の飽和兆候情報出力処理S238が出力する画面例を、アプリケーションの代替に論理ユニットを使って装置の性能飽和兆候を検出する場合に修正した例である。図32の画面3201は、1つの表を含み、当該表は、飽和兆候を検出した装置種別の識別情報の表示する装置種別列3202、当該装置名の識別情報の表示する装置名列3203、当該装置が所属するハードウェアの識別情報を表示する装置所属列3204、当該装置の使用率を表示する使用率列3205、当該装置と性能の依存関係がある論理ユニット種別の識別情報を表示する論理ユニット種別列3206、当該論理ユニット名の識別情報を表示する論理ユニット名列3207、当該論理ユニットが所属するハードウェアの識別情報を表示する論理ユニット所属先列3208、当該論理ユニットのレスポンスタイムを表示するレスポンスタイム列3209、当該装置と当該論理ユニットとの間の性能情報の相関係数を表示する相関係数列3210、相関係数計算を行った期間を示す、期間の開始日時情報を表示する開始日時列3211と終了日時情報を表示する終了日時列3212、当該論理ユニットを用いるアプリケーション名の識別情報を表示する関連アプリケーション名列3213、当該アプリケーションが稼動するホストサーバの識別情報を表示するアプリケーション稼動サーバ列3214、相関係数の演算に用いた性能情報の詳細を表示する画面を表示するボタンを表示するレポート列3115および当該ボタン3216からなる。列3202〜列3215の全ての列を画面表示することは、必ずしも必要としない。
図33は、実施形態2における装置性能管理ソフトの飽和兆候情報出力処理を示すフローチャートである。飽和兆候情報出力処理S238Aは、図33は図24と比較して、装置性能管理ソフト181の飽和兆候情報出力処理S238のフローチャート例を、アプリケーションの代替として論理ユニットを用いるように修正した例である。飽和兆候情報出力処理S238Aは、ステップS3301にて飽和兆候情報テーブル2002をスキャンし、ステップS3302〜ステップS3313にて、飽和兆候情報テーブル2002の各行についてループ処理を行う。
当該ループ処理の中では、まずステップS3303にて、飽和兆候情報テーブル2002(図22参照)から検索した{装置種別欄2200、装置名欄2201、所属先欄2202、開始時刻欄2203、終了時刻欄2204}の値をキーに性能情報記憶テーブル1402(図15参照)を検索し、性能値欄1504より、当該装置の使用率を取得する。次に、ステップS3304にて、ステップS3301〜ステップS3303で取得した、{装置種別、装置名、所属先、使用率}の各値を、図32の列3202〜3205の値として表示する。開始時刻と終了時刻によって表される期間内に複数の時刻の使用率がある場合で、かつ、画面表示範囲の都合により当該期間内の全時刻の使用率を表示できない場合、取得した使用率を一つまたは複数の値に丸め込み、表示してもよい。この時、当該期間における平均値を表示してもよいし、期間の最後の値を表示してもよいし、期間内の最大値を表示してもよい。本実施形態は、表示内容を制限するものではない。
次にステップS3305にて、{装置種別欄2200、装置名欄2201、所属先欄2202、開始時刻欄2203、終了時刻欄2204}の値をキーに、図31で示した構造の相関係数演算結果テーブル2001Aを検索し、{論理ユニット種別欄3103、論理ユニット名欄3104、所属先欄3105、相関係数欄3108}の値の一覧を取得する。次にステップS3306〜ステップS3312まで、取得した論理ユニットに関する一覧情報の各々についてループ処理を行う。
ステップS3307では、{論理ユニット種別欄3103、論理ユニット名欄3104、所属先欄3105、開始時刻欄2003、終了時刻欄2004}の値をキーに性能情報記憶テーブル1402を検索し、性能値欄1504より、当該論理ユニットのレスポンスタイムを取得する。次にステップS3308にて、ステップS3304〜ステップS3307で取得した、{論理ユニット種別、論理ユニット名、所属先、レスポンスタイム、相関係数}およびステップS3301で決定した{開始時刻、終了時刻}の各値を、図32の列3206〜3212の値として表示する。レスポンスタイムも、装置の使用率の場合と同様に、画面表示範囲の都合により当該期間内の全時刻の使用率を表示できない場合、取得した使用率を一つまたは複数の値に丸め込み、表示してもよい。
次に、ステップS3309にて、{論理ユニット種別、論理ユニット名、所属先}列の値をキーに、論理ユニット・アプリケーション間関連テーブル2603を検索し、{アプリケーション名欄2903、アプリケーションが稼動する所属先欄2904}の一覧を取得する。次にステップS3310にて、ステップS3309で取得した{アプリケーション名欄2903、アプリケーションが稼動する所属先欄2904}の各組を、図32の各列3213〜3214の値として表示する。ステップS3311では、装置および論理ユニットの組み合わせ毎に相関係数計算に用いた性能情報の詳細情報を表示するボタンを、図32の列3215の要素と3216として表示する。
図34は、実施形態2における装置性能管理ソフトの飽和兆候情報出力処理が、相関係数を計算する際に用いた性能値の詳細情報を出力する画面例を示す説明図である。図34は図25と比較して、装置性能管理ソフト181の飽和兆候情報出力処理S238が、相関係数を計算する際に用いた性能値の詳細情報を出力する画面例を、アプリケーションの代替として論理ユニットを用いる場合に修正した例である。図34の画面3401は、1つのグラフ3402を含み、当該グラフの横軸3405は時間軸を表し、一方の縦軸3403には論理ユニットのレスポンスタイムを、もう一方の縦軸3404には装置の使用率を表す。グラフ3402は凡例3406を有してもよく、当該凡例では、論理ユニットおよび装置の識別情報と、必要があれば性能情報の種別も表示する。当該グラフの内容は表形式で表してもよい。また、図34のグラフ3402を、図32の画面3201内で表示してもよい。
本実施形態の装置性能管理方法は、1つ以上の装置および該装置と性能の依存関係がある1つ以上のアプリケーションを備えるシステムにおける装置性能を管理する性能管理サーバ151が、装置、該装置を抽象化した論理的存在である論理ユニット、およびアプリケーションの構成情報、ならびに、装置、論理ユニット、およびアプリケーションの間に成り立つ性能の依存関係の構成情報を収集する構成情報収集処理S233と、装置、論理ユニット、およびアプリケーションの性能情報を収集する性能情報収集処理S231と、構成情報と性能情報とに基づいて装置の飽和兆候を検出する性能飽和兆候検出ステップS236と、装置が飽和兆候ありと検出されたとき、飽和兆候ありとされた装置の飽和兆候関連情報を、性能を管理する管理クライアントに告知する飽和兆候情報出力処理S238を含んで実行することを特徴とする。これにより、将来アプリケーションに性能問題を引き起こす可能性が高い装置、または、現在アプリケーションに性能問題を引き起こしている可能性が高い装置を検出することができる。
飽和兆候検出処理S236は、装置の性能情報と、装置と性能の依存関係がある論理ユニットの性能情報の時間変化値に対して所定期間について相関分析し、相関分析により得られた相関係数が所定の閾値以上のとき、装置が飽和兆候ありと検出することが好ましい。
また、飽和兆候検出処理236は、装置の性能情報と、アプリケーションの性能情報の時間変化値に対して所定期間について相関分析し、相関分析により得られた相関係数が所定の閾値以上のとき、装置が飽和兆候ありと検出してもよい。
本発明の全体構成を示すブロック図である。 本発明の各処理および各情報を示すブロック図である。 装置・論理ユニット・装置上で稼動するアプリケーション間に成り立つ性能の依存関係の例を示す説明図である。 各監視エージェントの構成情報に含まれるテーブルを示す説明図である。 アプリケーション・ファイルシステム間関連テーブルの構造を示す説明図である。 ファイルシステム・ボリューム間関連テーブルの構造を示す説明図である。 ボリューム・LU・ホストポート間関連テーブルの構造を示す説明図である。 ホストポート・ストレージポート間通信経路テーブルの構造を示す説明図である。 LU・ストレージサブシステム内要素間関連テーブルの構造を示す説明図である。 実施形態1における装置性能管理ソフトの構成情報に含まれるテーブルを示す構成図である。 装置一覧テーブルの構造を示す説明図である。 アプリケーション一覧テーブルの構造を示す説明図である。 装置・アプリケーション間関連テーブルの構造を示す説明図である。 監視エージェントの性能情報および装置性能管理ソフトの性能情報に含まれるテーブルの構造を示す説明図である。 性能情報記憶テーブルの構造を示す説明図である。 管理対象装置群の中から飽和兆候検出対象を決定するための画面例と決定された内容に応じての関連テーブル内容を示す説明図である。 実施形態1における装置性能管理ソフトの飽和兆候検出処理を示すフローチャートである。 装置の使用率と、当該装置を利用するアプリケーションが装置に処理要求を出した場合のレスポンスタイムの間に成り立つ関係を示す説明図である。 装置の使用率と、当該装置を利用するアプリケーションが装置に処理要求を出した場合のレスポンスタイムとの間で、変化値の正負による相関分析を行う例を示す説明図である。 装置性能管理ソフトの飽和兆候情報に含まれるテーブルを示す構成図である。 実施形態1における相関係数演算結果テーブルの構造を示す説明図である。 飽和兆候情報テーブルの構造を示す説明図である。 実施形態1における装置性能管理ソフトの飽和兆候情報出力処理が出力する画面例を示す説明図である。 実施形態1における装置性能管理ソフトの飽和兆候情報出力処理を示すフローチャートである。 実施形態1における装置性能管理ソフトの飽和兆候情報出力処理が、相関係数を計算する際に用いた性能値の詳細情報を出力する画面例を示す説明図である。 実施形態2における装置性能管理ソフトの構成情報に含まれるテーブルを示す構成図である。 論理ユニット一覧テーブルの構造を示す説明図である。 装置・論理ユニット間関連テーブルの構造を示す説明図である。 論理ユニット・アプリケーション間関連テーブルの構造を示す説明図である。 実施形態2における装置性能管理ソフトの飽和兆候検出処理を示すフローチャートである。 実施形態2における相関係数演算結果テーブルの構造を示す説明図である。 実施形態2における装置性能管理ソフトの飽和兆候情報出力処理が出力する画面例を示す説明図である。 実施形態2における装置性能管理ソフトの飽和兆候情報出力処理を示すフローチャートである。 実施形態2における装置性能管理ソフトの飽和兆候情報出力処理が、相関係数を計算する際に用いた性能値の詳細情報を出力する画面例を示す説明図である。 構成情報および性能情報を取得、保存する監視エージェントの処理を示すフローチャートである。 監視エージェントの構成情報収集処理の詳細を示すフローチャートである。 監視エージェントの性能情報収集処理の詳細を示すフローチャートの例である。 装置性能管理ソフトの飽和兆候検出処理の主処理を示すフローチャートである。
符号の説明
101,102,103 業務クライアント
111,112 ホストサーバ
113 OS
114 ファイルシステム
115 アプリケーション
116 CPU
117 メモリ
118,119,142 ホストポート
121,122 SANスイッチ
123,124,125,126 SANスイッチポート
131,132 ストレージサブシステム
133,134 ストレージサブシステムポート
141 情報収集サーバ
151 性能管理サーバ
161 性能管理クライアント
171 アプリケーション監視エージェント
172 ホスト監視エージェント
173 ファブリック監視エージェント
174 ストレージサブシステム監視エージェント
181 装置性能管理ソフト
201,202,203 装置
211,212,213 アプリケーション
214 ログ
221,222,223 監視エージェント
225,232 性能情報
228,234 構成情報
237 飽和兆候情報
S204 性能情報取得処理
S205 構成情報取得処理
S215 構成情報取得処理
S224 性能情報収集処理
S226 性能情報応答処理
S227 構成情報収集処理
S229 構成情報応答処理
S231 性能情報収集処理
S233 構成情報収集処理
S235 飽和兆候検出対象装置設定処理
S236 飽和兆候検出処理
S238 飽和兆候情報出力処理

Claims (16)

  1. 1つ以上の装置および該装置と性能の依存関係がある1つ以上のアプリケーションを備えるシステムにおける装置性能を管理する装置性能管理方法であって、
    前記装置を管理する管理サーバが、
    前記装置の構成情報および前記アプリケーションの構成情報、ならびに、どの装置とどのアプリケーションとに依存関係が存在するか否かを示す、前記装置および前記アプリケーションの間に成り立つ性能の依存関係の構成情報を収集する構成情報収集処理と、
    前記装置の性能情報および前記アプリケーションの性能情報を収集する性能情報収集処理と、
    前記装置の構成情報に含まれる装置を処理対象の装置として、前記性能の依存関係の構成情報に基づいて前記処理対象の装置と依存関係にあるアプリケーションを取得し、前記処理対象の装置に対する前記装置の性能情報を取得し、前記取得したアプリケーションに対する前記アプリケーションの性能情報を取得し、前記取得した装置の性能情報と、前記取得したアプリケーションの性能情報の時間変化値に対して所定期間について相関分析し、前記相関分析により得られた相関係数が所定の閾値以上のとき、前記装置が将来アプリケーションに性能問題を引き起こす可能性が高い装置、または、現在アプリケーションに性能問題を引き起こしている可能性が高い装置であるとして検出する検出処理と、を含んで実行する
    ことを特徴とする装置性能管理方法。
  2. 1つ以上の装置および該装置と性能の依存関係がある1つ以上のアプリケーションを備えるシステムにおける装置性能を管理する装置性能管理方法であって、
    前記装置を管理する管理サーバが、
    前記装置の構成情報、論理ボリュームを含み該装置から該論理ボリュームに至る経路の構成品である論理ユニットの構成情報および前記アプリケーションの構成情報、ならびに、どの装置、どの論理ユニット、およびどのアプリケーションに依存関係が存在するか否かを示す、前記装置、前記論理ユニットおよび前記アプリケーションの間に成り立つ性能の依存関係の構成情報を収集する構成情報収集処理と、
    前記装置の性能情報、前記論理ユニットの性能情報および前記アプリケーションの性能情報を収集する性能情報収集処理と、
    前記装置の構成情報に含まれる装置を処理対象の装置として、前記性能の依存関係の構成情報に基づいて前記処理対象の装置と依存関係にある論理ユニットを取得し、前記処理対象の装置に対する前記装置の性能情報を取得し、前記取得した論理ユニットに対する前記論理ユニットの性能情報を取得し、前記取得した装置の性能情報と、前記取得した論理ユニットの性能情報の時間変化値に対して所定期間について相関分析し、前記相関分析により得られた相関係数が所定の閾値以上のとき、前記装置が将来アプリケーションに性能問題を引き起こす可能性が高い装置、または、現在アプリケーションに性能問題を引き起こしている可能性が高い装置であるとして検出する検出処理と、を含んで実行する
    ことを特徴とする装置性能管理方法。
  3. 記検出処理は、1つの前記装置を複数の前記アプリケーションが利用する際に、前記アプリケーション毎に前記装置の性能情報と各前記アプリケーションの性能情報の時間変化値に対して所定期間について相関分析により得られた複数の相関係数を、前記アプリケーション毎の重みに基づいて複数の前記相関係数の加重平均をする
    ことを特徴とする請求項1に記載の装置性能管理方法。
  4. 前記論理ユニットは、サーバ内のファイルシステム、ストレージシステム内のロジカルユニット、ストレージシステム内の論理ボリュームの少なくともいずれかを含む
    ことを特徴とする請求項2に記載の装置性能管理方法。
  5. 前記管理サーバが、前記構成情報を選択したアプリケーションで検索し、前記選択された1つ以上のアプリケーションと性能の依存関係にある装置を、前記検出処理の処理対象の装置として決定する処理対象装置決定処理、を含んで実行する
    ことを特徴とする請求項1または請求項2に記載の装置性能管理方法。
  6. 前記管理サーバは、さらに、
    前記検出処理で、前記装置が将来アプリケーションに性能問題を引き起こす可能性が高い装置、または、現在アプリケーションに性能問題を引き起こしている可能性が高い装置であるとして検出されたとき、前記検出された装置に問題がある旨を、性能を管理する管理クライアントに告知する出力処理を含んで実行する
    ことを特徴とする請求項1または請求項2に記載の装置性能管理方法。
  7. 前記告知の方法は、画面、ログの少なくともいずれかの出力による方法、または、電子メール、SNMP(Simple Network Management Protocol)、コマンド実行の少なくともいずれかにより警告する方法である
    ことを特徴とする請求項6に記載の装置性能管理方法。
  8. 1つ以上の装置および該装置と性能の依存関係がある1つ以上のアプリケーションを備えるシステムにおける装置性能を管理する装置性能管理システムであって、
    前記装置の構成情報および前記アプリケーションの構成情報、ならびに、どの装置とどのアプリケーションとに依存関係が存在するか否かを示す、前記装置および前記アプリケーションの間に成り立つ性能の依存関係の構成情報を収集する構成情報収集手段と、
    前記装置の性能情報および前記アプリケーションの性能情報を収集する性能情報収集手段と、
    前記装置の構成情報に含まれる装置を処理対象の装置として、前記性能の依存関係の構成情報に基づいて前記処理対象の装置と依存関係にあるアプリケーションを取得し、前記処理対象の装置に対する前記装置の性能情報を取得し、前記取得したアプリケーションに対する前記アプリケーションの性能情報を取得し、前記取得した装置の性能情報と、前記取得したアプリケーションの性能情報の時間変化値に対して所定期間について相関分析し、前記相関分析により得られた相関係数が所定の閾値以上のとき、前記装置が将来アプリケーションに性能問題を引き起こす可能性が高い装置、または、現在アプリケーションに性能問題を引き起こしている可能性が高い装置であるとして検出する検出手段と、を有する
    ことを特徴とする装置性能管理システム。
  9. 1つ以上の装置および該装置と性能の依存関係がある1つ以上のアプリケーションを備えるシステムにおける装置性能を管理する装置性能管理システムであって、
    前記装置の構成情報、論理ボリュームを含み該装置から該論理ボリュームに至る経路の構成品である論理ユニットの構成情報および前記アプリケーションの構成情報、ならびに、どの装置、どの論理ユニット、およびどのアプリケーションに依存関係が存在するか否かを示す、前記装置、前記論理ユニットおよび前記アプリケーションの間に成り立つ性能の依存関係の構成情報を収集する構成情報収集手段と、
    前記装置の性能情報、前記論理ユニットの性能情報および前記アプリケーションの性能情報を収集する性能情報収集手段と、
    前記装置の構成情報に含まれる装置を処理対象の装置として、前記性能の依存関係の構成情報に基づいて前記処理対象の装置と依存関係にある論理ユニットを取得し、前記処理対象の装置に対する前記装置の性能情報を取得し、前記取得した論理ユニットに対する前記論理ユニットの性能情報を取得し、前記取得した装置の性能情報と、前記取得した論理ユニットの性能情報の時間変化値に対して所定期間について相関分析し、前記相関分析により得られた相関係数が所定の閾値以上のとき、前記装置が将来アプリケーションに性能問題を引き起こす可能性が高い装置、または、現在アプリケーションに性能問題を引き起こしている可能性が高い装置であるとして検出する検出手段と、を有する
    ことを特徴とする装置性能管理システム。
  10. 記検出手段は、1つの前記装置を複数の前記アプリケーションが利用する際に、前記アプリケーション毎に前記装置の性能情報と各前記アプリケーションの性能情報の時間変化値に対して所定期間について相関分析により得られた複数の相関係数を、前記アプリケーション毎の重みに基づいて複数の前記相関係数の加重平均をする
    ことを特徴とする請求項8に記載の装置性能管理システム。
  11. 前記論理ユニットは、サーバ内のファイルシステム、ストレージシステム内のロジカルユニット、ストレージシステム内の論理ボリュームの少なくともいずれかを含む
    ことを特徴とする請求項9に記載の装置性能管理システム。
  12. 前記構成情報を選択したアプリケーションで検索し、前記選択された1つ以上のアプリケーションと性能の依存関係にある装置を、前記検出手段の処理対象の装置として決定する処理対象装置決定手段、を有する
    ことを特徴とする請求項8または請求項9に記載の装置性能管理システム。
  13. 前記装置性能管理システムは、さらに、
    記検出手段で、前記装置が将来アプリケーションに性能問題を引き起こす可能性が高い装置、または、現在アプリケーションに性能問題を引き起こしている可能性が高い装置であるとして検出されたとき、前記検出された装置に問題がある旨を、性能を管理する管理クライアントに告知する出力手段を有する
    ことを特徴とする請求項8または請求項9に記載の装置性能管理システム。
  14. 記出力手段は、画面、ログの少なくともいずれかの出力、または、電子メール、SNMP(Simple Network Management Protocol)、コマンド実行の少なくともいずれかにより警告する
    ことを特徴とする請求項13に記載の装置性能管理システム。
  15. 1つ以上の装置および該装置と性能の依存関係がある1つ以上のアプリケーションを備えるシステムにおける装置性能を管理する管理プログラムであって、
    コンピュータに、
    前記装置の構成情報および前記アプリケーションの構成情報、ならびに、どの装置とどのアプリケーションとに依存関係が存在するか否かを示す、前記装置および前記アプリケーションの間に成り立つ性能の依存関係の構成情報を収集する構成情報収集処理と、
    前記装置の性能情報および前記アプリケーションの性能情報を収集する性能情報収集処理と、
    前記装置の構成情報を選択したアプリケーションで検索し、前記選択された1つ以上のアプリケーションと性能の依存関係にある装置を、処理対象の装置として決定する処理対象装置決定処理と、
    前記性能の依存関係の構成情報に基づいて前記処理対象の装置と依存関係にあるアプリケーションを取得し、前記処理対象の装置に対する前記装置の性能情報を取得し、前記取得したアプリケーションに対する前記アプリケーションの性能情報を取得し、前記取得した装置の性能情報と、前記取得したアプリケーションの性能情報の時間変化値に対して所定期間について相関分析し、前記相関分析により得られた相関係数が所定の閾値以上のとき、前記装置が将来アプリケーションに性能問題を引き起こす可能性が高い装置、または、現在アプリケーションに性能問題を引き起こしている可能性が高い装置であるとして検出する検出処理とを
    実行させるための管理プログラム。
  16. 1つ以上の装置および該装置と性能の依存関係がある1つ以上のアプリケーションを備えるシステムにおける装置性能を管理する管理プログラムであって、
    コンピュータに、
    前記装置の構成情報、論理ボリュームを含み該装置から該論理ボリュームに至る経路の構成品である論理ユニットの構成情報および前記アプリケーションの構成情報、ならびに、どの装置、どの論理ユニット、およびどのアプリケーションに依存関係が存在するか否かを示す、前記装置、前記論理ユニットおよび前記アプリケーションの間に成り立つ性能の依存関係の構成情報を収集する構成情報収集処理と、
    前記装置の性能情報、前記論理ユニットの性能情報および前記アプリケーションの性能情報を収集する性能情報収集処理と、
    前記装置の構成情報を選択したアプリケーションで検索し、前記選択された1つ以上のアプリケーションと性能の依存関係にある装置を、処理対象の装置として決定する処理対象装置決定処理と、
    前記性能の依存関係の構成情報に基づいて前記処理対象の装置と依存関係にある論理ユニットを取得し、前記処理対象の装置に対する前記装置の性能情報を取得し、前記取得した論理ユニットに対する前記論理ユニットの性能情報を取得し、前記取得した装置の性能情報と、前記取得した論理ユニットの性能情報の時間変化値に対して所定期間について相関分析し、前記相関分析により得られた相関係数が所定の閾値以上のとき、前記装置が将来アプリケーションに性能問題を引き起こす可能性が高い装置、または、現在アプリケーションに性能問題を引き起こしている可能性が高い装置であるとして検出する検出処理と、
    前記検出された装置に問題がある旨を、性能を管理する管理クライアントに告知する出力処理とを
    実行させるための管理プログラム。
JP2007115478A 2007-04-25 2007-04-25 装置性能管理方法、装置性能管理システム、および管理プログラム Expired - Fee Related JP4990018B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007115478A JP4990018B2 (ja) 2007-04-25 2007-04-25 装置性能管理方法、装置性能管理システム、および管理プログラム
US11/970,674 US8024613B2 (en) 2007-04-25 2008-01-08 Method and system for managing apparatus performance
US13/208,694 US8370686B2 (en) 2007-04-25 2011-08-12 Method and system for managing apparatus performance

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007115478A JP4990018B2 (ja) 2007-04-25 2007-04-25 装置性能管理方法、装置性能管理システム、および管理プログラム

Publications (2)

Publication Number Publication Date
JP2008276279A JP2008276279A (ja) 2008-11-13
JP4990018B2 true JP4990018B2 (ja) 2012-08-01

Family

ID=39888487

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007115478A Expired - Fee Related JP4990018B2 (ja) 2007-04-25 2007-04-25 装置性能管理方法、装置性能管理システム、および管理プログラム

Country Status (2)

Country Link
US (2) US8024613B2 (ja)
JP (1) JP4990018B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4434235B2 (ja) * 2007-06-05 2010-03-17 株式会社日立製作所 計算機システムまたは計算機システムの性能管理方法
JP2009223442A (ja) 2008-03-13 2009-10-01 Hitachi Ltd ストレージシステム
CN102099795B (zh) * 2008-09-18 2014-08-13 日本电气株式会社 运用管理装置、运用管理方法和运用管理程序
JP4747203B2 (ja) * 2009-01-30 2011-08-17 富士通株式会社 ディスクアレイ装置、ディスクアレイ装置制御プログラム及びディスクアレイ装置制御方法
CN102033882B (zh) * 2009-09-25 2013-07-03 中兴通讯股份有限公司 一种性能数据的存储方法及系统
CN102576328B (zh) 2009-10-15 2015-09-09 日本电气株式会社 系统操作管理装置、系统操作管理方法和程序存储介质
KR101277274B1 (ko) 2009-11-27 2013-06-20 한국전자통신연구원 자원 간의 물리적/논리적 관계를 맵핑하는 방법 및 장치
US8438275B1 (en) * 2010-11-05 2013-05-07 Amazon Technologies, Inc. Formatting data for efficient communication over a network
US9075850B2 (en) 2011-06-28 2015-07-07 Hitachi, Ltd. Monitoring system and monitoring method
US9992090B2 (en) * 2014-01-08 2018-06-05 Bank Of America Corporation Data metrics analytics
US11003565B2 (en) 2015-04-21 2021-05-11 Hewlett-Packard Development Company, L.P. Performance change predictions
US10754866B2 (en) 2015-04-30 2020-08-25 Hitachi, Ltd. Management device and management method
JP6335153B2 (ja) * 2015-11-02 2018-05-30 Necプラットフォームズ株式会社 コンピュータ装置、制御方法およびプログラム
JP6842440B2 (ja) 2018-04-25 2021-03-17 株式会社日立製作所 性能分析方法および管理計算機
JP2020009202A (ja) * 2018-07-09 2020-01-16 株式会社日立製作所 ストレージ装置、ストレージシステム、および性能評価方法
US11221908B1 (en) * 2021-03-02 2022-01-11 International Business Machines Corporation Discovery of an inexplicit link between a change and an incident in a computing environment

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4739472B2 (ja) * 1998-12-04 2011-08-03 新日鉄ソリューションズ株式会社 性能予測装置および方法、記録媒体
JP2001195285A (ja) 2000-01-11 2001-07-19 Nippon Telegr & Teleph Corp <Ntt> アプリケーション性能劣化要因分析方法,アプリケーション性能劣化要因分析システムおよびそのプログラム記録媒体
US7225250B1 (en) * 2000-10-30 2007-05-29 Agilent Technologies, Inc. Method and system for predictive enterprise resource management
US8234229B2 (en) * 2001-07-27 2012-07-31 International Business Machines Corporation Method and apparatus for prediction of computer system performance based on types and numbers of active devices
US7290048B1 (en) * 2002-03-29 2007-10-30 Hyperformix, Inc. Method of semi-automatic data collection, data analysis, and model generation for the performance analysis of enterprise applications
JP2004145536A (ja) * 2002-10-23 2004-05-20 Hitachi Ltd 管理システム
JP2004362144A (ja) * 2003-06-03 2004-12-24 Hitachi Ltd 運用管理方法及び実施装置並びに処理プログラム
US7277826B2 (en) * 2003-08-25 2007-10-02 International Business Machines Corporation Apparatus and method for detecting and forecasting resource bottlenecks
US6993453B2 (en) * 2003-10-28 2006-01-31 International Business Machines Corporation Adjusted monitoring in a relational environment
US7356377B2 (en) * 2004-01-29 2008-04-08 Applied Materials, Inc. System, method, and medium for monitoring performance of an advanced process control system
JP4980581B2 (ja) * 2004-04-16 2012-07-18 新日鉄ソリューションズ株式会社 性能監視装置、性能監視方法及びプログラム
US7409594B2 (en) * 2004-07-06 2008-08-05 Intel Corporation System and method to detect errors and predict potential failures
US7484132B2 (en) * 2005-10-28 2009-01-27 International Business Machines Corporation Clustering process for software server failure prediction
JP4841982B2 (ja) * 2006-03-20 2011-12-21 富士通株式会社 性能情報収集方法、装置、及びプログラム
JP2007264921A (ja) * 2006-03-28 2007-10-11 Fujitsu Ltd 性能情報採取プログラム及び装置
US7412448B2 (en) * 2006-05-17 2008-08-12 International Business Machines Corporation Performance degradation root cause prediction in a distributed computing system
JP4837445B2 (ja) * 2006-06-06 2011-12-14 株式会社日立製作所 記憶システム並びに管理装置及び方法
US20080126881A1 (en) * 2006-07-26 2008-05-29 Tilmann Bruckhaus Method and apparatus for using performance parameters to predict a computer system failure
US7613576B2 (en) * 2007-04-12 2009-11-03 Sun Microsystems, Inc. Using EMI signals to facilitate proactive fault monitoring in computer systems
US8429467B2 (en) * 2007-10-19 2013-04-23 Oracle International Corporation User-triggered diagnostic data gathering
JP4782100B2 (ja) * 2007-12-11 2011-09-28 株式会社日立製作所 ストレージシステムの性能を監視する管理計算機、その管理計算機を含む計算機システム、及び、その制御方法
US8225291B2 (en) * 2008-01-04 2012-07-17 International Business Machines Corporation Automated detection of application performance bottlenecks
US8165862B2 (en) * 2008-02-05 2012-04-24 The Boeing Company Methods and systems for predicting application performance
US8098585B2 (en) * 2008-05-21 2012-01-17 Nec Laboratories America, Inc. Ranking the importance of alerts for problem determination in large systems
JP2009294949A (ja) * 2008-06-05 2009-12-17 Hitachi Ltd ストレージ装置及びその性能測定方法
US20120030346A1 (en) * 2010-07-29 2012-02-02 Hitachi, Ltd. Method for inferring extent of impact of configuration change event on system failure

Also Published As

Publication number Publication date
US8370686B2 (en) 2013-02-05
JP2008276279A (ja) 2008-11-13
US20080270851A1 (en) 2008-10-30
US8024613B2 (en) 2011-09-20
US20110295993A1 (en) 2011-12-01

Similar Documents

Publication Publication Date Title
JP4990018B2 (ja) 装置性能管理方法、装置性能管理システム、および管理プログラム
US20210184947A1 (en) Automatic capture of detailed analysis information based on remote server analysis
US10303533B1 (en) Real-time log analysis service for integrating external event data with log data for use in root cause analysis
US9015316B2 (en) Correlation of asynchronous business transactions
JP4980581B2 (ja) 性能監視装置、性能監視方法及びプログラム
JP5324958B2 (ja) データ処理システムの複数の資源に対するパフォーマンス傾向の統合された表示を発生する方法、プログラム及び装置(資源のパフォーマンス傾向の統合された表示)
JP5546686B2 (ja) 監視システム、及び監視方法
US20080195369A1 (en) Diagnostic system and method
EP3983900A1 (en) Generating data structures representing relationships among entities of a high-scale network infrastructure
JP6823265B2 (ja) 分析装置、分析システム、分析方法および分析プログラム
CN111614483A (zh) 链路监控方法、装置、存储介质及计算机设备
US11416321B2 (en) Component failure prediction
CN113190415A (zh) 互联网医院系统监控方法、设备、存储介质及程序产品
US9021078B2 (en) Management method and management system
US11392442B1 (en) Storage array error mitigation
US9645875B2 (en) Intelligent inter-process communication latency surveillance and prognostics
CN114398343A (zh) 数据库异常键处理方法、装置、设备及介质
JP2020009202A (ja) ストレージ装置、ストレージシステム、および性能評価方法
JP2004348640A (ja) ネットワーク管理システム及びネットワーク管理方法
CN113900898B (zh) 一种数据处理系统、设备及介质
JP7027912B2 (ja) 順序制御プログラム、順序制御方法、及び情報処理装置
CN116089681A (zh) 数据采集方法、装置、存储介质及计算机设备
JP2021105897A (ja) 制御プログラム、制御方法および制御装置
JP5237169B2 (ja) データ検索装置
WO2006011905A2 (en) Methods and systems for managing an application environment and portions thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110408

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110419

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111206

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20120117

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120118

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120403

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120501

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150511

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees