JPWO2005017736A1 - ディスクアレイ装置におけるボトルネックを検出するシステムおよびプログラム - Google Patents

ディスクアレイ装置におけるボトルネックを検出するシステムおよびプログラム Download PDF

Info

Publication number
JPWO2005017736A1
JPWO2005017736A1 JP2005513194A JP2005513194A JPWO2005017736A1 JP WO2005017736 A1 JPWO2005017736 A1 JP WO2005017736A1 JP 2005513194 A JP2005513194 A JP 2005513194A JP 2005513194 A JP2005513194 A JP 2005513194A JP WO2005017736 A1 JPWO2005017736 A1 JP WO2005017736A1
Authority
JP
Japan
Prior art keywords
exceeds
period
threshold
response time
average response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005513194A
Other languages
English (en)
Inventor
匡史 加藤
匡史 加藤
豊 日吉
豊 日吉
寿一 坂井
寿一 坂井
直樹 平林
直樹 平林
貴明 大和
貴明 大和
智成 堀越
智成 堀越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2005017736A1 publication Critical patent/JPWO2005017736A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

資源使用率だけを基にボトルネックを検出・特定する従来の方法では、本来解消すべきボトルネックを見逃し、未発生のボトルネックに対してボトルネック解消処理を行う場合があるという課題を有していた。そこで、クライアント端末にサービスを提供するサーバと、サーバが使用するデータが格納されるディスクアレイ装置と、ディスクアレイ装置のボトルネックを検出する監視端末とがネットワークを介して接続されるシステムを提供する。ディスクアレイ装置あるいはサーバは、サーバが発行するIO要求の数と各IO要求を処理するのに要した時間とディスクアレイ装置に含まれる資源毎の資源使用率を含むパフォーマンス情報を算出する。監視端末は、パフォーマンス情報に含まれる処理時間をIO要求数で割った平均応答時間に基づき基準点を定める。そして、基準点以前の所定期間における資源使用率に基づき、資源をボトルネックと特定することを特徴とする。

Description

本発明は、ディスクアレイ装置とそのディスクアレイ装置に対しデータの入出力を行うサーバを含むシステムに関する。
現在業務システムとして、ネットワークを介してクライアント端末にサービスを提供するサーバと、そのサーバにて稼動するアプリケーションプログラムが使用する各種データを格納するディスクアレイ装置とが接続されたシステムが随所で使用されている。このようなシステムでは、アプリケーションの処理に伴う時間が増大するとクライアント端末に提供するサービスを低下させてしまう。そこで、アプリケーションの処理に伴う時間が一定の基準以上となるよう、システムの性能に関する様々な情報(パフォーマンス情報)を監視し、アプリケーションの処理を遅らせる原因になり得る箇所(ボトルネック)が発生していないか検出する処理が実行され、ボトルネックが検出された場合、ボトルネックを特定し、そのボトルネックに対してボトルネックを解消する処理が行われている。
ディスクアレイ装置に関するボトルネックとしては、ディスアレイ装置内のCPU、物理ディスク等の資源がある。従来は、ディスクアレイ装置におけるボトルネックの検出・特定が一体として実行され、所定時間に資源が使用された時間の累積値を、その所定時間で割ることにより算出される資源使用率を利用し、資源使用率が閾値を超える場合、その資源がボトルネックであると特定していた。
しかしながら、資源使用率の上昇とボトルネックの発生は必ずしも対応しない場合がある。一例として、資源としてディスクが選択された場合を説明する。
図1は、アプリケーションの処理に伴うディスク使用率とボトルネックの発生を説明するための図である。縦軸が経過時間11を表し、横軸がアプリケーションの処理に伴ってサーバにより発行される書き込み、読み込み等の入出力(IO)要求を処理するのに要する時間12(応答時間)を表す。図1Aは、IO要求がある時間に集中して到着する場合であり、図1Bは、IO要求が比較的均等に到着する場合である。
図1Aでは、ディスクアレイ装置における処理能力以上のIO要求が短時間に集中して到着した結果、ボトルネックが発生する例である。IO要求の処理が済まないうちに、次々とIO要求が到着するため、後から到着したIO要求ほど処理に時間を要している。図1Bでは、IO要求が順調に処理されており、ボトルネックの発生は見られない。
応答時間の累積値を所定時間に到着したIO要求数で割った平均応答時間と、その所定時間に占めるディスクが使用された時間を合計した累積時間の割合であるディスク使用率をそれぞれ算出してみると、図1Aでは、平均応答時間が35ミリ秒(ms)、ディスク使用率が53%であるのに対し、図1Bでは、平均応答時間14ms、ディスク使用率が67%になる。
ところが、従来の資源使用率を監視してボトルネックを検出する方法では、ディスク使用率の閾値を60%とした場合、ディスクがボトルネックとして検出されるのは、図1Bの場合である。しかし、実際は図1Bの場合ボトルネック解消処理を行う必要はなく、ボトルネック解消処理が必要なのは図1Aの場合である。資源としてディスク以外のCPUや他の資源を監視する場合にも資源使用率と応答時間に関して図1と同じことが言える。
因みに関連する従来技術としては、IO競合を解消するディスクアレイ装置(特許文献1)等がある。
特開2000−215007号公報
このように、資源使用率だけを基にボトルネックを検出・特定する従来の方法では、本来解消すべきボトルネックを見逃し、未発生のボトルネックに対してボトルネック解消処理を行う場合があるという課題を有していた。
そこで本発明の目的は、ボトルネックの発生を適切に検出することが可能なシステムおよびプログラムを提供することにある。
上記目的は、ネットワークを介してクライアント端末にサービスを提供するサーバと、前記サーバおよび前記ネットワークに接続され、前記サーバが使用するデータが格納されるディスクアレイ装置と、前記ネットワークを介して前記ディスクアレイ装置に接続され、前記ディスクアレイ装置のボトルネックを検出する監視端末を有するシステムであって、前記ディスクアレイ装置あるいは前記サーバは、前記サーバから前記ディスクアレイ装置に対して発行されるIO要求の数と各IO要求を処理するのに要した時間と該ディスクアレイ装置に含まれる資源毎の資源使用率を含むパフォーマンス情報を算出して前記監視端末に定期的に通知し、前記監視端末は、前記定期的に通知されるパフォーマンス情報に含まれる前記処理時間を前記IO要求数で割った平均応答時間が第一の閾値を超える期間が、第一の所定期間を超える時刻を基準点とし、前記基準点以前の第二の所定期間に占める、前記資源使用率が前記資源毎に設定された第二の閾値を超える期間の割合が、所定の割合を超える場合に、該資源をボトルネックと特定することを特徴とする請求の範囲第1項に記載のシステムを提供することにより達成される。
また上記目的は、請求の範囲第1項において、前記監視端末は、前記平均応答時間が前記第一の閾値を越える期間が、連続して前記第一の所定期間を超える時刻を基準点とすることを特徴とする請求の範囲第2項に記載のシステムを提供することにより達成される。
また上記目的は、請求の範囲第1項において、前記監視端末は、前記平均応答時間が前記第一の閾値を超える期間を第三の所定期間累積した結果が、前記第一の所定期間を超える時刻を基準点とすることを特徴とする請求の範囲第3項に記載のシステムを提供することにより達成される。
また上記目的は、請求の範囲第3項において、前記監視端末は、前記第三の所定期間毎に前記累積結果を求めることを特徴とする請求の範囲第4項に記載のシステムを提供することにより達成される。
また上記目的は、請求の範囲第3項において、前記監視端末は、前記第三の所定期間より短い間隔で前記累積結果を求めることを特徴とする請求の範囲第5項に記載のシステムを提供することにより達成される。
また上記目的は、請求の範囲第3項において、前記監視端末は、前記第三の所定期間内に前記平均応答時間が、前記第一の閾値より低い第三の閾値を下回った場合、累積された期間を一旦ゼロにリセットすることを特徴とする請求の範囲第6項に記載のシステムを提供することにより達成される。
また上記目的は、請求の範囲第1項において、前記監視端末は、前記基準点以前であって、更に前記平均応答時間が第四の閾値を超えた期間である第四の所定期間に占める、前記資源使用率が前記資源毎に設定された前記第二の閾値を超える期間の割合が、前記所定の割合を超える場合に、該資源をボトルネックと特定することを特徴とする請求の範囲第7項に記載のシステムを提供することにより達成される。
また上記目的は、ネットワークを介してクライアント端末にサービスを提供するサーバと、前記サーバおよび前記ネットワークに接続され、前記サーバが使用するデータが格納されるディスクアレイ装置とを有するシステムに含まれ、該ネットワークを介して前記ディスクアレイ装置に接続された端末にて実行されるプログラムであって、前記端末に、前記サーバあるいは前記ディスクアレイ装置により定期的に通知される、前記ディスクアレイ装置に対して前記サーバから発行されるIO要求の数と各IO要求の処理に要した時間と該ディスクアレイ装置に含まれる資源毎の資源使用率を含むパフォーマンス情報を受信させ、前記受信したパフォーマンス情報に含まれる前記処理時間を前記IO要求数で割った平均応答時間が第一の閾値を超える期間が、第一の所定期間を超える時刻を基準点とし、前記基準点以前の第二の所定期間に占める、前記資源使用率が前記資源毎に設定された第二の閾値を超える期間の割合が、所定の割合を超える場合に、該資源をボトルネックと特定させることを特徴とする請求の範囲第8項に記載のプログラムを提供することにより達成される。
また上記目的は、ネットワークを介してクライアント端末にサービスを提供するサーバと、前記サーバおよび前記ネットワークに接続され、前記サーバが使用するデータが格納されるディスクアレイ装置と、前記ネットワークを介して前記ディスクアレイ装置に接続され、前記ディスクアレイ装置のボトルネックを検出する監視端末を有するシステムであって、前記ディスクアレイ装置あるいは前記サーバは、前記サーバから前記ディスクアレイ装置に対して発行されるIO要求の数と各IO要求を処理するのに要した時間と該ディスクアレイ装置に含まれる資源毎の資源使用率を含むパフォーマンス情報を算出して前記監視端末に定期的に通知し、前記監視端末は、前記定期的に通知されるパフォーマンス情報に含まれる前記処理時間を前記IO要求数で割った平均応答時間が第一の閾値を超える期間に基づき基準点となる時間を決定し、前記基準点以前の第一の所定期間に占める、前記資源使用率が前記資源毎に設定された第二の閾値を超える期間の割合が、所定の割合を超える場合に、該資源をボトルネックと特定することを特徴とするシステムを提供することにより達成される。
より好ましい実施例によれば、基準点は、平均応答時間が第一の閾値を超える期間が、連続して第二の所定期間を超える時刻である。また、基準点は、平均応答時間が第一の閾値を超える期間を第三の所定期間累積した合計が第二の所定期間を超える時刻でもよい。更に、基準点は、平均応答時間が連続して第一の閾値を超える期間において、時間を横軸に、平均応答時間を縦軸に配置し、時間に対する平均応答時間をプロットしてできる波形と、平均応答時間が第一の閾値を示す横線とで囲まれる部分の面積が、所定の面積を超える時刻とすることもできる。また、基準点は、時間に対する平均応答時間をプロットしてできる波形と、平均応答時間が第一の閾値を示す横線とで囲まれる部分の面積を第三の所定期間累積した合計が、所定の面積を超える時刻であってもよい。
また上記目的は、ネットワークを介してクライアント端末にサービスを提供するサーバと、前記サーバおよび前記ネットワークに接続され、前記サーバが使用するデータが格納されるディスクアレイ装置とを有するシステムに含まれ、該ネットワークを介して前記ディスクアレイ装置に接続された端末にて実行されるプログラムであって、前記端末に、前記サーバあるいは前記ディスクアレイ装置により定期的に通知される、前記ディスクアレイ装置に対して前記サーバから発行されるIO要求の数と各IO要求の処理に要した時間と該ディスクアレイ装置に含まれる資源毎の資源使用率を含むパフォーマンス情報を受信させ、前記受信したパフォーマンス情報に含まれる前記処理時間を前記IO要求数で割った平均応答時間が第一の閾値を超える期間に基づき基準点となる時間を決定させ、前記基準点以前の第一の所定期間に占める、前記資源使用率が前記資源毎に設定された第二の閾値を超える期間の割合が、所定の割合を超える場合に、該資源をボトルネックと特定させることを特徴とするプログラムを提供することにより達成される。
応答時間を基にボトルネックの検出を実施し、特定条件として応答時間とは異なる資源使用率を用いることで、2つの基準によってボトルネックの特定を行うことができ、従来よりもボトルネックの検出を適切に行うことが可能である。
アプリケーションの処理に伴うディスク使用率とボトルネックの発生を説明するための図である。 本発明の実施形態におけるシステム全体の構成例を示す図である。 サーバの構成例を示す図である。 ディスクアレイ装置の構成例を示す図である。 本発明の実施形態におけるボトルネック検出方法を説明するフローチャートである。 基準点条件(その1)を説明する図である。 基準点条件(その2)を説明する図である。 累積期間の算出法の変形例である。 累積期間が算出される間隔の例を説明する図である。 ボトルネックを特定する条件(その1)を説明するための図である。 ボトルネックを特定する条件(その2)を説明するための図である。 基準点条件(その3)を説明する図である。 基準点条件(その4)を説明する図である。
以下、本発明の実施の形態について図面に従って説明する。しかしながら、本発明の技術的範囲はかかる実施の形態に限定されるものではない。
図1に示されるように、ボトルネックが発生すると、IO要求の処理に要する応答時間が増大する。従って、ボトルネックの発生を検出するには応答時間を監視するのがよい。そこで本発明の実施形態においては、従来のように資源使用率を監視し、資源使用率によりボトルネックを検出するのではなく、応答時間に対して設定された条件に基づき、ボトルネックを検出する基準点を決定する。そして、基準点以前のパフォーマンス情報の履歴を参照し、資源使用率に対して設定された特定条件に基づき、ボトルネックを特定するものである。
図2は、本発明の実施形態における一般的なシステムの構成例を示す図である。サーバ22は、ネットワーク21を介してクライアント端末24に対しサービスを提供する。サーバ22上で稼動するアプリケーションに応じて、ウェブサーバ、メールサーバ、データベースサーバ等さまざまなサービスが提供される。監視端末25は、サーバ22やディスクアレイ装置23の動作状態を監視するための端末である。
FC(Fiber Channel)スイッチ等を含む構成のSAN(Storage Area Network)26を介してサーバ22に接続されたディスクアレイ装置23には、上記のアプリケーションに使用されるさまざまなデータが格納される。クライアント端末からの要求に応じてサーバ22は、ディスクアレイ装置23に格納されたデータにアクセスし、アプリケーションに基づく処理結果をクライアント端末24に応答する。
図3は、サーバ22の構成例を示す図である。基本的な構成は、クライアント端末24、監視端末25でも同様である。サーバ22は、ネットワークを介した通信を処理するネットワークインタフェース36(ネットワークIF)と、サーバ22に接続するディスクアレイ装置23、FCスイッチ等の周辺機器とのデータ交換を処理する入出力IF38と、OSやアプリケーションがインストールされる内蔵ディスク37と、実行のために読み出されたOSやアプリケーションが格納され、また処理に必要なデータが格納されるメモリ35と、サーバ22内の各装置をメモリに格納されたプログラムに従って制御するCPU34とを有する。サーバ22内の各装置は内部バス39により接続される。
図4は、ディスクアレイ装置23の構成例を示す図である。ディスクアレイ装置23は、ネットワークを介した通信を処理するネットワークIF43と、ディスクアレイ装置23に接続するサーバ22、PCスイッチ等の周辺機器40とのデータ交換を処理する入出力IF45と、データを格納するディスク47を複数含むディスク群46と、ディスクアレイ装置23を制御するプログラムであるファームウェアが格納され、また処理に必要なデータが格納されるメモリ42と、ディスクアレイ装置23内の各装置をファームウェアに従って制御するCPU41とを有する。ディスクアレイ装置23内の各装置は内部バス44により接続される。
続いて本発明の実施形態におけるボトルネック検出方法を説明する。本発明の実施形態においては、応答時間に対して設定された条件に基づき、ボトルネックを検出する基準点を決定する。そして、基準点以前のパフォーマンス情報の履歴を参照し、資源使用率に対して設定された特定条件に基づき、ボトルネックを特定するものである。
図5は、本発明の実施形態におけるボトルネック検出方法を説明するフローチャートである。例えば、監視端末25のメモリ36に格納されたプログラムを実行することにより、本発明のボトルネック検出方法が実施される。ここでは、図2の監視端末を用いてディスクアレイ装置のボトルネックを検出する様子を、図3、図4に示される各装置の構成例を参照して説明する。
まず、ボトルネックを検出する基準点を設定する際の応答時間に関する条件(基準点条件)を図2の監視端末25に設定する(S1)。本実施形態においては、応答時間が基準点条件を満たすことにより、ボトルネックの検出が実行され、基準点以前のパフォーマンス情報の履歴を参照し、ボトルネックが特定される。基準点条件としては、例えば、平均応答時間が連続して所定の閾値を超える期間が所定期間に達することや、第一の所定期間内に平均応答時間が第一の閾値を超える期間の累積期間が第二の所定期間に達すること等と設定することができる。なお基準点条件については、図6から図9にて後述する。
これらの条件は、監視端末25に含まれるメモリ35や内蔵ディスク37等の記憶手段に予め格納される。例えば、複数の条件にそれぞれ、基準点条件を特定する数字を対応させ、基準点条件に対応する変数にその数字を格納する。すると、基準点条件に対応する変数に格納された数字を読み出すことにより、条件を決定することができる。条件が1つのみであれば、自動的にその条件が使用される。
次に、ボトルネックを特定する条件(特定条件)をディスクアレイ装置23に含まれる資源毎に監視端末25に設定する(S2)。特定条件としては、例えば、所定期間に占める、ある資源の使用率がその資源に設定された所定の閾値を超える期間の割合が所定値を越えること等と設定することができる。基準点条件同様これらの条件は、監視端末25に含まれるメモリ35や内蔵ディスク37等の記憶手段に変数として格納され、その変数を読み出すことにより特定条件が決定されるよう構成してもよい。なお特定条件については、図9、図10にて後述する。
次に、監視端末25にてディスクアレイ装置23に関するパフォーマンス情報を取得する(S3)。ディスクアレイ装置23においては、定期的にファームウェアをCPU41が実行することにより、少なくともIO要求数、IO応答時間、ディスクアレイ装置23に含まれる資源の資源使用率を含むパフォーマンス情報を取得し、メモリ42等の記憶手段に蓄積することができる。
また、サーバ22やディスクアレイ装置23にSNMP(Simple Network Management Protocol)エージェント機能を持つプログラムを組み込み、監視端末25にSNMPマネージャ機能を持つプログラムを組み込むことで、ネットワークを介して、サーバ22やディスクアレイ装置23に蓄積されたパフォーマンス情報を定期的に監視端末25にて取得し、監視端末25に含まれる内蔵ディスク37等の記憶手段に格納することができる。こうして、ステップS3において、監視端末25にてディスクアレイ装置23に関するパフォーマンス情報を取得することができる。
そして、監視端末25にて、取得したパフォーマンス情報を基にボトルネックを検出するか判定し、ボトルネックの検出を実行する場合は基準点を決定する(S4)。ステップS4のボトルネック検出判定は、ステップS3で取得したパフォーマンス情報に含まれる応答時間がステップS1で設定された基準点条件を満たすかを判定すればよい。この判定の具体例については図6から図9に後述する。
ステップS4で基準点条件を満たさない場合、ボトルネック検出処理は行われないので、ステップS8に進み、一定時間待機した後、再びパフォーマンス情報を取得し(S3)、ボトルネックを検出するかを判定する(S4)処理を繰り返す。ステップS4で基準点条件を満たす場合、条件を満たす時刻を基準点と決定し、監視端末25にて、ステップS3で取得したパフォーマンス情報を基に資源毎にその資源がボトルネックかを判定する(S5)。ステップS5では、取得したパフォーマンス情報に含まれる資源毎の資源使用率がステップS2で設定された特定条件を満たすかを判定すればよい。この判定の具体例については図10および図11に後述する。
ステップS5で条件を満たす場合、監視端末25にてその資源をボトルネックと特定する(S6)。ボトルネックである資源が特定された後の処理はさまざまである。例えば、メールでシステム管理者に通知することもできるし、監視端末25に接続された図示しないディスプレイ装置にその資源がボトルネックであることを表示することもできるし、自動的な処理をさせることもできる。自動的な処理をより具体的に述べると、例えば、CPUやディスクをシステム構成から切り離したり、ディスクを停止させたり、CPUの冷却ファン速度を上昇させたりすることである。
ステップS5で条件を満たさない場合、監視端末にてディスクアレイ装置23に含まれるすべての資源についてステップS5の判定が完了したかを判定する(S7)。未だ、判定の行われていない資源がある場合(ステップS7でNoの場合)、ステップS5に戻り処理が続行する。すべての資源についてステップS5の判定が完了すれば(ステップS7でYesの場合)、ステップS8に進み、一定時間経過した後、再びパフォーマンス情報を取得し(S3)、ボトルネックを検出するかを判定する(S4)。
以上のボトルネック検出処理により、監視端末25にて、定期的にパフォーマンス情報を取得し、ボトルネックの検出を行うことができる。ボトルネックを検出するかを判定するのに使用されるのは、ボトルネックの発生に連動して時間が増大する応答時間であり、ボトルネックの発生とは必ずしも連動しない資源使用率を利用する従来例よりもボトルネックの検出を適切に行うことが可能となる。またボトルネックを特定する条件として使用されるのは資源使用率であり、ボトルネック検出を実施する条件(基準点条件)として応答時間を用いることにより、単一のパフォーマンス情報(資源使用率)のみを用いる従来例よりも、ボトルネックの特定をより適切に行うことが可能となる。
なお、本発明の実施形態においては、監視端末25にて、ボトルネック検出処理を実行する様子を説明したが、ネットワーク21を介してディスクアレイ装置23に接続されていればどの端末においても実行することが可能である。従ってサーバ22にて実行することもでき、その場合新たなハードウェアを導入することなく本発明の方法を適用することができる。
続いて、ステップS1で設定される基準点条件について、いくつかの例を用いて説明する。まず、基準点条件として、平均応答時間が連続してある閾値を超える期間が所定期間に達することと設定することができる。
図6は、基準点条件(その1)を説明する図である。期間と共に変化する平均応答時間の一例を示す図6のグラフを基に、その条件を適用してボトルネック検出処理が実行される場合を説明する。
図6では、閾値として30ms、所定期間として600秒を採用する。つまり、平均応答時間が30msを超える期間が600秒連続した場合、図5のステップS5以降の処理が開始される。
図6で最初に連続して平均応答時間が30msを超えるのは、区間61である。しかし区間61の期間合計(累積期間)は、所定期間の600秒に満たない。そこで、区間61では、ボトルネックの検出は実施されない。次に連続して平均応答時間が30msを超える区間62では、600秒以上平均応答時間が閾値を超える状態が連続するため、累積期間が600秒を超える時刻63が基準点と決定され、ボトルネックの検出が実行される。
連続して平均応答時間が閾値を超えた期間の合計が所定期間に達するのは、平均応答時間の高い状態が持続していることを意味し、ボトルネックが発生している可能性が高い。従って、基準点条件をこのように設定することでボトルネックをより適切に検出することができる。
基準点条件の別の条件として、第一の所定期間内に平均応答時間がある閾値を超える期間の合計(累積期間)が、第二の所定期間に達することと設定することができる。図7は、基準点条件(その2)を説明する図である。期間と共に変化する平均応答時間の一例を示す図7のグラフを基に、その条件を適用してボトルネック検出処理が実行される場合を説明する。
図7では、第一の所定期間として3600秒、第二の所定期間として、600秒、閾値として30msを採用する。つまり、3600秒の内、平均応答時間が30msを超える期間の合計が600秒に達した場合、図5のステップS5以降の処理が開始される。
図7で3600秒に区切られた最初のブロック71では、平均応答時間が30msを超える期間の合計は、第二の所定期間の600秒に満たない。そこで、ブロック71では、ボトルネックの検出は実行されない。次の3600秒(ブロック72)では、累積期間が600秒を超える時、ボトルネックの検出が実行される。
ある期間内に平均応答時間が閾値を超えた期間の合計が(第二の)所定期間に達するのは、平均応答時間の高い状態が持続していることを意味し、ボトルネックの発生の可能性が高い。従って、基準点条件をこのように設定することでボトルネックをより検出しやすくすることができる。更に、図7の設定にすると、連続して平均応答時間が閾値を超える区間が短いため、図6の設定ではボトルネックの検出が行われない場合でも、ボトルネックの検出が実行されることがあり、よりボトルネックの検出精度を上げることができる。
図8は、図7における累積期間の算出法の変形例である。図7においては、単純に平均応答時間が閾値を超える期間を加算するが、図8では、第一の閾値より低い第二の閾値を用意し、平均応答時間が第二の閾値を下回る場合、それまでの累積期間をゼロにするようにして累積期間を算出するものである。
図8は、3600秒に区切られたあるブロックにおける、期間と共に変化する平均応答時間の一例を示すグラフである。第二の閾値として5msを採用する。他の条件は図7と同様とする。今、平均応答時間が第一の閾値(30ms)を越える区間81で400秒が累積される。しかし、その後平均応答時間が第二の閾値を下回るとき、それまでの累積期間がゼロにリセットされる。その後再び、平均応答時間が第一の閾値を超える区間82が200秒連続するが、累積値がリセットされているため、第二の所定期間には達しない(ちなみに累積期間がリセットされていなければこの時点が基準点と決定され、ボトルネックの検出が実施される)。
図8において平均応答時間が第二の閾値を下回る場合、平均応答時間が変動していることを意味する。ディスクアレイ装置23においてボトルネックが発生する場合であれば、平均応答時間が高い状態が維持されるため、平均応答時間に変動が生じている場合、ディスクアレイ装置23以外でボトルネックが発生している可能性を意味し、図8の累積期間算出法にはこれを除外する効果がある。
図9は、累積期間が算出される間隔の例を説明する図である。言い換えると、図7における第一の所定期間の取り方の変形例を説明する図である。図7においては、第一の所定期間(3600秒)を互いに重ならない範囲として、3600秒ごとに区切ったブロックが現れたが、図9では、3600秒のブロックを少しずつずらして第一の所定時間を取るものである。
図9Aは、図7と同じ方法を図に表したものである。3600秒のブロック91が互いに重ならないように位置する。図9Bは、3600秒のブロック91が少しずつずれて位置する。ずれの量は、均一でも不均一でも構わない。図9Bのようにブロックを取ることで、ボトルネックの検出処理が行われる回数を増やすことができ、よりボトルネックの検出精度を上げることができる。
次に、ステップS2で設定される特定条件について、いくつか例を用いて説明する。ボトルネックを特定する条件としては、所定期間内に資源使用率が第一の閾値を越える期間の合計時間が、その所定時間に占める割合(影響度)を算出し、その割合が所定値以上であることと設定することができる。
まず、所定期間の一例としては、単純に基準点から所定期間前までの時間範囲とすることである。期間と共に変化する平均応答時間の一例を示す図10のグラフに基づき、その条件を適用してボトルネック検出処理が特定される場合を説明する。
図10では、所定期間として3600秒を採用する。資源毎に設定される資源使用率の閾値としては、CPU使用率の閾値として80%、ディスク使用率の閾値として60%を採用する。そして、影響度に対する所定値として80%を採用する。つまり、基準点から3600秒前までの期間(影響度を見る範囲)において、CPU使用率が80%を超えた期間の合計が影響度を見る範囲全体の80%以上であればCPUがボトルネックと特定され、同様にディスク使用率が60%を越えた期間の合計が影響度を見る範囲全体の80%以上であればディスクがボトルネックと特定される。
図10では、基準点から3600秒前までにおいて、CPU使用率が80%を超えた区間102が、影響度を見る範囲101に占める割合が20%であり、ディスク使用率が60%を超えた区間103が、影響度を見る範囲101に占める割合が95%であることがわかる。従って、影響度に対して設定された所定値(80%)を超えるディスクがボトルネックであると特定される。
所定期間の別の一例としては、基準点から所定期間前までの履歴において、平均応答時間が第二の閾値を超える時間範囲とすることである。期間と共に変化する平均応答時間の一例を示す図11のグラフに基づき、その条件を適用してボトルネックが特定される場合を説明する。
図11では、第二の閾値として30msを採用する。それ以外は図10の場合と同様とする。図11では、基準点から3600秒前までにおいて、更に、平均応答時間が第二の閾値(30ms)を超える時間範囲を影響度を見る範囲として抜き出す。すると2つの区間111、112が該当する。
そして、影響度を見る範囲(区間111、112)にて、CPU使用率が80%を超えた区間113が、影響度を見る範囲(区間111、112)に占める割合が20%であり、ディスク使用率が60%を超えた時間(区間114、115)の合計が、影響度を見る範囲(区間111、112)に占める割合が85%であることがわかる。従って、影響度に対して設定された所定値(80%)を超えるディスクがボトルネックであると特定される。
以上、本発明の実施形態をまとめると、ボトルネックと特定される資源は、基準点で応答時間が高い状態が継続しており、基準点以前に資源使用率も高い状態であった資源である。こうして、応答時間を基にボトルネックの検出を実施し、特定条件として応答時間とは異なる資源使用率を用いることで、2つの基準によってボトルネックの特定を行うことができ、従来よりもボトルネックの検出を適切に行うことが可能である。
なお、上記図6から図11にて使用される数値は一例に過ぎず、実施の形態に合わせて自由に設定することが可能である。また、ディスクアレイ装置23とサーバ22間の接続法はSANを介す方法に限定されず、SCSI(Small Computer System Interface)ケーブル等を用いたダイレクト接続でも本発明の適用が可能である。
また、本発明の実施形態においては、ディスクアレイ装置23におけるボトルネックを検出するために、ディスクアレイ装置23に蓄積されるパフォーマンス情報を用いたが、サーバ22でも、OSに備えられたコマンド等を定期的にCPU34が実行することにより、少なくともIO要求数、IO応答時間、ディスクアレイ装置23に含まれる資源の資源使用率を含むパフォーマンス情報を取得し、パフォーマンス情報を内蔵ディスク37等の記憶手段に蓄積することができる。従って、サーバに蓄積されるパフォーマンス情報を利用することも可能である。
更に、本発明のボトルネック検出方法は、監視端末25、あるいはサーバ22にて実行されるプログラムとして実施することも可能である。
ここで更に、ボトルネックの検出を開始するための条件である、基準点条件の変形例について説明する。図6から図9に説明した基準点条件においては、平均応答時間が連続して所定の閾値を超える期間が所定期間に達することや、第一の所定期間内に平均応答時間が第一の閾値を超える期間の累積期間が第二の所定期間に達することを一例として挙げた。ここでは、平均応答時間が閾値を超える部分の面積が所定面積に達する場合や、所定期間内に平均応答時間が閾値を超える部分の面積(累積面積)が所定面積に達する場合に、ボトルネックの検出が開始される。
図12は、基準点条件(その3)を説明する図である。期間と共に変化する平均応答時間の一例を示す図12のグラフを基に、平均応答時間が連続してある閾値を超える部分の面積が所定面積に達すると、ボトルネック検出処理が実行される場合を説明する。
図12では、閾値として30msを採用する。つまり、平均応答時間が30msを超える期間の平均応答時間と、閾値である30msを示す横線とで囲まれる部分の面積が所定面積に達する場合、図5のステップS5以降の処理が開始される。
平均応答時間と、閾値である30msを示す横線とで囲まれる部分の面積は、平均応答時間を関数により表せる場合(近似モデルにより近似される場合も含む)には、平均応答時間が30msを超える期間の最初から最後までの積分値として求めることができる。また、図12に示されるように、微小区間毎の長方形による近似により面積を求めても良い。
図12で最初に連続して平均応答時間が30msを超えるのは、区間121である。しかし区間121から算出される面積は、所定面積Sに満たない。そこで、区間121では、ボトルネックの検出は実施されない。
次に連続して平均応答時間が30msを超える区間122から算出される面積は、所定面積を超える。従って、平均応答時間が30msを超える期間の最後の時刻が基準点と決定され、ボトルネックの検出が実行される。なお、基準点は平均応答時間が30msを超える期間のどの時刻が選択されてもよい。
平均応答時間が所定の閾値を超える期間は短いが、その応答遅延の程度が大きい場合には、ボトルネックが発生している可能性が高い。この面積方式を使用すると、平均応答時間が所定の閾値を超える期間が短いため、図6から図9に示す方式ではボトルネックの検出が行われない場合にも、ボトルネックの検出を開始することができる。つまり、短い時間帯で応答時間が極端に遅い場合であってもボトルネックの検出を開始することができ、基準点条件をこのように設定することでボトルネックをより適切に検出することができる。
図13は、基準点条件(その4)を説明する図である。期間と共に変化する平均応答時間の一例を示す図13のグラフを基に、所定期間内に平均応答時間が閾値を超える部分の面積が所定面積に達するとボトルネックの検出が実行される場合を説明する。
図13では、所定期間として3600秒、閾値として30msを採用する。つまり、3600秒の内、平均応答時間が30msを超える期間における、平均応答時間が30msを超える期間の平均応答時間と、閾値である30msを示す横線とで囲まれる部分の面積が所定面積に達する場合、図5のステップS5以降の処理が開始される。
図13で3600秒に区切られた最初のブロック131では、平均応答時間が30msを超える期間が2箇所あり、平均応答時間と、閾値である30msを示す横線とで囲まれる部分の面積は、それぞれS11、S12であるとする。そして、その合計(S11+S12)は所定面積を超えない。そこで、ブロック131では、ボトルネックの検出は実行されない。
次の3600秒(ブロック132)では、平均応答時間が30msを超える期間から算出される面積の合計(S21+S22)が所定面積以上となる。従って、平均応答時間が30msを超える期間の最後の時刻が基準点と決定され、ボトルネックの検出が実行される。なお、基準点は平均応答時間が30msを超える期間のどの時刻が選択されてもよい。
ある期間内に平均応答時間が閾値を超えた期間から算出される面積の合計が所定面積に達するのは、短い時間帯で応答時間が極端に遅い場合が発生している可能性を示唆し、ボトルネックが発生している可能性が高い。従って、基準点条件をこのように設定することでボトルネックをより検出しやすくすることができる。更に、図13の設定にすると、連続して平均応答時間が閾値を超える区間が短いため、図12の設定ではボトルネックの検出が行われない場合でも、ボトルネックの検出が実行されることがあり、よりボトルネックの検出精度を上げることができる。
図6から図9に示した基準点条件では、閾値(例えば30ms)を大きく超える現象に対する配慮を行っていない。つまり、所定の閾値を超える期間は短いが、その応答遅延の程度が大きい場合には、ボトルネックが発生している可能性が高いものの、それを適切に検出できない事態も起こりうる。一方、図12、図13に示される基準点条件によれば、短い時間帯で応答時間が極端に遅い場合であってもボトルネックの検出を開始することができ、より適切にボトルネックを検出することができるようになる。
また、図13における累積面積の算出法として、図8に示されるように、第一の閾値(例えば30ms)より低い第二の閾値(5ms)を用意し、平均応答時間が第二の閾値を下回る場合、それまでの累積面積をゼロにするようにして累積面積を算出してもよい。また、累積面積を算出する間隔として、図9Bに示されるように、所定長(例えば3600秒)のブロックを少しずつずらして所定期間を取ることもできる。
図12、図13に示すような、面積に基づくボトルネック検出の開始法を採用しても、その後の処理は図5に示される場合と変わらずに行うことができる。つまり、ボトルネックの判断は、図10、図11に示されるように行って良い。また、図12、図13に示される変形例であっても、図1〜図11に示される実施形態同様の効果を得ることができる。
本発明のボトルネック検出方法は、例えば、ネットワークを介してクライアント端末にサービスを提供するサーバと、そのサーバにて稼動するアプリケーションプログラムが使用する各種データを格納するディスクアレイ装置とが接続されたシステム等に適用が可能である。
本発明の保護範囲は、上記の実施の形態に限定されず、特許請求の範囲に記載された発明とその均等物に及ぶものである。

Claims (32)

  1. ネットワークを介してクライアント端末にサービスを提供するサーバと、前記サーバおよび前記ネットワークに接続され、前記サーバが使用するデータが格納されるディスクアレイ装置と、前記ネットワークを介して前記ディスクアレイ装置に接続され、前記ディスクアレイ装置のボトルネックを検出する監視端末を有するシステムであって、
    前記ディスクアレイ装置あるいは前記サーバは、前記サーバから前記ディスクアレイ装置に対して発行されるIO要求の数と各IO要求を処理するのに要した時間と該ディスクアレイ装置に含まれる資源毎の資源使用率を含むパフォーマンス情報を算出して前記監視端末に定期的に通知し、
    前記監視端末は、前記定期的に通知されるパフォーマンス情報に含まれる前記処理時間を前記IO要求数で割った平均応答時間が第一の閾値を超える期間が、第一の所定期間を超える時刻を基準点とし、前記基準点以前の第二の所定期間に占める、前記資源使用率が前記資源毎に設定された第二の閾値を超える期間の割合が、所定の割合を超える場合に、該資源をボトルネックと特定することを特徴とするシステム。
  2. 請求項1において、
    前記監視端末は、前記平均応答時間が前記第一の閾値を越える期間が、連続して前記第一の所定期間を超える時刻を基準点とすることを特徴とするシステム。
  3. 請求項1において、
    前記監視端末は、前記平均応答時間が前記第一の閾値を超える期間を第三の所定期間累積した結果が、前記第一の所定期間を超える時刻を基準点とすることを特徴とするシステム。
  4. 請求項3において、
    前記監視端末は、前記第三の所定期間毎に前記累積結果を求めることを特徴とするシステム。
  5. 請求項3において、
    前記監視端末は、前記第三の所定期間より短い間隔で前記累積結果を求めることを特徴とするシステム。
  6. 請求項3において、
    前記監視端末は、前記第三の所定期間内に前記平均応答時間が、前記第一の閾値より低い第三の閾値を下回った場合、累積された期間を一旦ゼロにリセットすることを特徴とするシステム。
  7. 請求項1において、
    前記監視端末は、前記基準点以前であって、更に前記平均応答時間が第四の閾値を超えた期間である第四の所定期間に占める、前記資源使用率が前記資源毎に設定された前記第二の閾値を超える期間の割合が、前記所定の割合を超える場合に、該資源をボトルネックと特定することを特徴とするシステム。
  8. ネットワークを介してクライアント端末にサービスを提供するサーバと、前記サーバおよび前記ネットワークに接続され、前記サーバが使用するデータが格納されるディスクアレイ装置とを有するシステムに含まれ、該ネットワークを介して前記ディスクアレイ装置に接続された端末にて実行されるプログラムであって、
    前記端末に、
    前記サーバあるいは前記ディスクアレイ装置により定期的に通知される、前記ディスクアレイ装置に対して前記サーバから発行されるIO要求の数と各IO要求の処理に要した時間と該ディスクアレイ装置に含まれる資源毎の資源使用率を含むパフォーマンス情報を受信させ、
    前記受信したパフォーマンス情報に含まれる前記処理時間を前記IO要求数で割った平均応答時間が第一の閾値を超える期間が、第一の所定期間を超える時刻を基準点とし、前記基準点以前の第二の所定期間に占める、前記資源使用率が前記資源毎に設定された第二の閾値を超える期間の割合が、所定の割合を超える場合に、該資源をボトルネックと特定させることを特徴とするプログラム。
  9. 請求項8において、
    前記基準点は、前記平均応答時間が前記第一の閾値を越える期間が、連続して前記第一の所定期間を超える時刻であることを特徴とするプログラム。
  10. 請求項8において、
    前記基準点は、前記平均応答時間が前記第一の閾値を超える期間を第三の所定期間累積した結果が、前記第一の所定期間を超える時刻であることを特徴とするプログラム。
  11. 請求項10において、
    前記第三の所定期間毎に前記累積結果が求められることを特徴とするプログラム。
  12. 請求項10において、
    前記第三の所定期間より短い間隔で前記累積結果を求めることを特徴とするプログラム。
  13. 請求項10において、
    前記第三の所定期間内に前記平均応答時間が、前記第一の閾値より低い第三の閾値を下回った場合、累積された期間が一旦ゼロにリセットされることを特徴とするプログラム。
  14. 請求項8において、
    前記基準点以前の第二の所定期間に占める、前記資源使用率が前記資源毎に設定された第二の閾値を超える期間の割合が、所定の割合を超える場合の代わりに、前記基準点以前であって、更に前記平均応答時間が第四の閾値を超えた期間である第四の所定期間に占める、前記資源使用率が前記資源毎に設定された前記第二の閾値を超える期間の割合が、前記所定の割合を超える場合に、該資源をボトルネックと特定させることを特徴とするプログラム。
  15. ネットワークを介してクライアント端末にサービスを提供するサーバと、前記サーバおよび前記ネットワークに接続され、前記サーバが使用するデータが格納されるディスクアレイ装置と、前記ネットワークを介して前記ディスクアレイ装置に接続され、前記ディスクアレイ装置のボトルネックを検出する監視端末を有するシステムであって、
    前記ディスクアレイ装置あるいは前記サーバは、前記サーバから前記ディスクアレイ装置に対して発行されるIO要求の数と各IO要求を処理するのに要した時間と該ディスクアレイ装置に含まれる資源毎の資源使用率を含むパフォーマンス情報を算出して前記監視端末に定期的に通知し、
    前記監視端末は、前記定期的に通知されるパフォーマンス情報に含まれる前記処理時間を前記IO要求数で割った平均応答時間が第一の閾値を超える期間に基づき基準点となる時間を決定し、前記基準点以前の第一の所定期間に占める、前記資源使用率が前記資源毎に設定された第二の閾値を超える期間の割合が、所定の割合を超える場合に、該資源をボトルネックと特定することを特徴とするシステム。
  16. 請求項15において、
    前記基準点は、前記平均応答時間が前記第一の閾値を超える期間が、連続して第二の所定期間を超える時刻であることを特徴とするシステム。
  17. 請求項15において、
    前記基準点は、前記平均応答時間が前記第一の閾値を超える期間を第三の所定期間累積した合計が第二の所定期間を超える時刻であることを特徴とするシステム。
  18. 請求項15において、
    前記基準点は、前記平均応答時間が連続して前記第一の閾値を超える期間において、時間を横軸に、前記平均応答時間を縦軸に配置し、前記時間に対する前記平均応答時間をプロットしてできる波形と、前記平均応答時間が前記第一の閾値を示す横線とで囲まれる部分の面積が、所定の面積を超える時刻であることを特徴とするシステム。
  19. 請求項15において、
    前記基準点は、前記平均応答時間が前記第一の閾値を超える期間において、時間を横軸に、前記平均応答時間を縦軸に配置し、前記時間に対する前記平均応答時間をプロットしてできる波形と、前記平均応答時間が前記第一の閾値を示す横線とで囲まれる部分の面積を第三の所定期間累積した合計が、所定の面積を超える時刻であることを特徴とするシステム。
  20. 請求項17又は19において、
    前記第三の所定期間毎に前記累積合計が求められることを特徴とするシステム。
  21. 請求項17又は19において、
    前記第三の所定期間より短い間隔で前記累積合計が求められることを特徴とするシステム。
  22. 請求項17又は19において、
    前記監視端末は、前記第三の所定期間内に前記平均応答時間が、前記第一の閾値より低い第三の閾値を下回った場合、前記累積合計が一旦ゼロにリセットされることを特徴とするシステム。
  23. 請求項15において、
    前記監視端末は、前記基準点以前であって、更に前記平均応答時間が第四の閾値を超えた期間である第四の所定期間に占める、前記資源使用率が前記資源毎に設定された前記第二の閾値を超える期間の割合が、前記所定の割合を超える場合に、該資源をボトルネックと特定することを特徴とするシステム。
  24. ネットワークを介してクライアント端末にサービスを提供するサーバと、前記サーバおよび前記ネットワークに接続され、前記サーバが使用するデータが格納されるディスクアレイ装置とを有するシステムに含まれ、該ネットワークを介して前記ディスクアレイ装置に接続された端末にて実行されるプログラムであって、
    前記端末に、
    前記サーバあるいは前記ディスクアレイ装置により定期的に通知される、前記ディスクアレイ装置に対して前記サーバから発行されるIO要求の数と各IO要求の処理に要した時間と該ディスクアレイ装置に含まれる資源毎の資源使用率を含むパフォーマンス情報を受信させ、
    前記受信したパフォーマンス情報に含まれる前記処理時間を前記IO要求数で割った平均応答時間が第一の閾値を超える期間に基づき基準点となる時間を決定させ、前記基準点以前の第一の所定期間に占める、前記資源使用率が前記資源毎に設定された第二の閾値を超える期間の割合が、所定の割合を超える場合に、該資源をボトルネックと特定させることを特徴とするプログラム。
  25. 請求項24において、
    前記基準点は、前記平均応答時間が前記第一の閾値を超える期間が、連続して第二の所定期間を超える時刻であることを特徴とするプログラム。
  26. 請求項24において、
    前記基準点は、前記平均応答時間が前記第一の閾値を超える期間を第三の所定期間累積した合計が第二の所定期間を超える時刻であることを特徴とするプログラム。
  27. 請求項24において、
    前記基準点は、前記平均応答時間が連続して前記第一の閾値を超える期間において、時間を横軸に、前記平均応答時間を縦軸に配置し、前記時間に対する前記平均応答時間をプロットしてできる波形と、前記平均応答時間が前記第一の閾値を示す横線とで囲まれる部分の面積が、所定の面積を超える時刻であることを特徴とするプログラム。
  28. 請求項24において、
    前記基準点は、前記平均応答時間が前記第一の閾値を超える期間において、時間を横軸に、前記平均応答時間を縦軸に配置し、前記時間に対する前記平均応答時間をプロットしてできる波形と、前記平均応答時間が前記第一の閾値を示す横線とで囲まれる部分の面積を第三の所定期間累積した合計が、所定の面積を超える時刻であることを特徴とするプログラム。
  29. 請求項26又は28において、
    前記第三の所定期間毎に前記累積合計が求められることを特徴とするプログラム。
  30. 請求項26又は28において、
    前記第三の所定期間より短い間隔で前記累積結果が求められることを特徴とするプログラム。
  31. 請求項26又は28において、
    前記第三の所定期間内に前記平均応答時間が、前記第一の閾値より低い第三の閾値を下回った場合、前記累積合計が一旦ゼロにリセットされることを特徴とするプログラム。
  32. 請求項24において、
    前記基準点以前であって、更に前記平均応答時間が第四の閾値を超えた期間である第四の所定期間に占める、前記資源使用率が前記資源毎に設定された前記第二の閾値を超える期間の割合が、前記所定の割合を超える場合に、該資源をボトルネックと特定させることを特徴とするプログラム。
JP2005513194A 2003-08-19 2004-08-17 ディスクアレイ装置におけるボトルネックを検出するシステムおよびプログラム Pending JPWO2005017736A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JPPCT/JP03/10425 2003-08-19
PCT/JP2003/010425 WO2005017735A1 (ja) 2003-08-19 2003-08-19 ディスクアレイ装置におけるボトルネックを検出するシステムおよびプログラム
PCT/JP2004/011780 WO2005017736A1 (ja) 2003-08-19 2004-08-17 ディスクアレイ装置におけるボトルネックを検出するシステムおよびプログラム

Publications (1)

Publication Number Publication Date
JPWO2005017736A1 true JPWO2005017736A1 (ja) 2007-11-01

Family

ID=34179399

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005513194A Pending JPWO2005017736A1 (ja) 2003-08-19 2004-08-17 ディスクアレイ装置におけるボトルネックを検出するシステムおよびプログラム

Country Status (3)

Country Link
US (1) US20060106926A1 (ja)
JP (1) JPWO2005017736A1 (ja)
WO (2) WO2005017735A1 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4906913B2 (ja) * 2007-03-02 2012-03-28 パナソニック株式会社 再生装置、システムlsi、初期化方法
JP2009187324A (ja) * 2008-02-06 2009-08-20 Nec Corp ファイル保管装置、ファイル保管方法およびプログラム
US8645922B2 (en) * 2008-11-25 2014-02-04 Sap Ag System and method of implementing a concurrency profiler
JP2012068880A (ja) * 2010-09-22 2012-04-05 Fujitsu Ltd 管理プログラム、管理装置および管理方法
US9251032B2 (en) * 2011-11-03 2016-02-02 Fujitsu Limited Method, computer program, and information processing apparatus for analyzing performance of computer system
CN103379041B (zh) 2012-04-28 2018-04-20 国际商业机器公司 一种系统检测方法和装置以及流量控制方法和设备
US8954546B2 (en) 2013-01-25 2015-02-10 Concurix Corporation Tracing with a workload distributor
US8997063B2 (en) 2013-02-12 2015-03-31 Concurix Corporation Periodicity optimization in an automated tracing system
US20130283281A1 (en) 2013-02-12 2013-10-24 Concurix Corporation Deploying Trace Objectives using Cost Analyses
US8924941B2 (en) 2013-02-12 2014-12-30 Concurix Corporation Optimization analysis using similar frequencies
US9665474B2 (en) 2013-03-15 2017-05-30 Microsoft Technology Licensing, Llc Relationships derived from trace data
US9575874B2 (en) 2013-04-20 2017-02-21 Microsoft Technology Licensing, Llc Error list and bug report analysis for configuring an application tracer
US9495199B2 (en) * 2013-08-26 2016-11-15 International Business Machines Corporation Management of bottlenecks in database systems
US9292415B2 (en) 2013-09-04 2016-03-22 Microsoft Technology Licensing, Llc Module specific tracing in a shared module environment
CN103500143B (zh) * 2013-09-27 2016-08-10 华为技术有限公司 硬盘参数调整方法及装置
US9772927B2 (en) 2013-11-13 2017-09-26 Microsoft Technology Licensing, Llc User interface for selecting tracing origins for aggregating classes of trace data
US9471375B2 (en) 2013-12-19 2016-10-18 International Business Machines Corporation Resource bottleneck identification for multi-stage workflows processing
CN103810062B (zh) * 2014-03-05 2015-12-30 华为技术有限公司 慢盘检测方法和装置
US20160080229A1 (en) * 2014-03-11 2016-03-17 Hitachi, Ltd. Application performance monitoring method and device
CN106354590B (zh) * 2015-07-17 2020-04-24 中兴通讯股份有限公司 磁盘检测方法和装置
CN106407051B (zh) * 2015-07-31 2019-01-11 华为技术有限公司 一种检测慢盘的方法及装置
CN106407052B (zh) * 2015-07-31 2019-09-13 华为技术有限公司 一种检测磁盘的方法及装置
CN105573888B (zh) * 2015-12-14 2018-09-04 曙光信息产业股份有限公司 一种分布式文件系统中的磁盘性能检测方法及装置
CN107832202A (zh) * 2017-11-06 2018-03-23 郑州云海信息技术有限公司 一种检测硬盘的方法、装置及计算机可读存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5851362A (ja) * 1981-09-24 1983-03-26 Hitachi Ltd 計算機システムの性能予測方式
US6859783B2 (en) * 1995-12-29 2005-02-22 Worldcom, Inc. Integrated interface for web based customer care and trouble management
US6314465B1 (en) * 1999-03-11 2001-11-06 Lucent Technologies Inc. Method and apparatus for load sharing on a wide area network
US7441045B2 (en) * 1999-12-13 2008-10-21 F5 Networks, Inc. Method and system for balancing load distribution on a wide area network
US7490145B2 (en) * 2000-06-21 2009-02-10 Computer Associates Think, Inc. LiveException system
JP2002082926A (ja) * 2000-09-06 2002-03-22 Nippon Telegr & Teleph Corp <Ntt> 分散アプリケーション試験・運用管理システム
US20010054097A1 (en) * 2000-12-21 2001-12-20 Steven Chafe Monitoring and reporting of communications line traffic information
US6961794B2 (en) * 2001-09-21 2005-11-01 International Business Machines Corporation System and method for analyzing and optimizing computer system performance utilizing observed time performance measures
JP2003177963A (ja) * 2001-12-12 2003-06-27 Hitachi Ltd ストレージ装置
US20030135609A1 (en) * 2002-01-16 2003-07-17 Sun Microsystems, Inc. Method, system, and program for determining a modification of a system resource configuration

Also Published As

Publication number Publication date
WO2005017736A1 (ja) 2005-02-24
US20060106926A1 (en) 2006-05-18
WO2005017735A1 (ja) 2005-02-24

Similar Documents

Publication Publication Date Title
JPWO2005017736A1 (ja) ディスクアレイ装置におけるボトルネックを検出するシステムおよびプログラム
US20210184947A1 (en) Automatic capture of detailed analysis information based on remote server analysis
US10558544B2 (en) Multiple modeling paradigm for predictive analytics
EP3019971B1 (en) Methods and systems for performance monitoring for mobile applications
US7653725B2 (en) Management system selectively monitoring and storing additional performance data only when detecting addition or removal of resources
EP2487593B1 (en) Operational surveillance device, operational surveillance method and program storage medium
EP2808795A2 (en) Apparatus and method for monitoring a computer system
CN111475373A (zh) 微服务下的服务控制方法、装置、计算机设备及存储介质
US9027025B2 (en) Real-time database exception monitoring tool using instance eviction data
JP6191691B2 (ja) 異常検出装置、制御方法、及びプログラム
US8977908B2 (en) Method and apparatus for detecting a suspect memory leak
JP2008108120A (ja) エージェントを使用して性能を監視する計算機システム及びその方法
WO2015049742A1 (ja) ストレージシステムおよびストレージシステム制御方法
CN108268361A (zh) 一种bmc监控gpu的方法、系统、装置及存储介质
CN111555987B (zh) 限流配置方法、装置、设备及计算机存储介质
CN110347546B (zh) 监控任务动态调整方法、装置、介质及电子设备
KR102456150B1 (ko) 실제 환경에서 대용량 시스템에 대한 포괄적 성능평가를 수행하는 방법 및 이를 지원하는 장치
CN112817687A (zh) 一种数据同步方法和装置
JP2020035297A (ja) 機器状態監視装置及びプログラム
CN110928750A (zh) 数据处理方法、装置及设备
CN113886746A (zh) 页面加载方法、装置、设备和介质
CN114124763A (zh) 一种宽带接入速率的测量方法及系统
KR100547625B1 (ko) 그리드 정보서비스를 위한 지능형 모니터링 시스템 및 방법
CN110727518B (zh) 一种数据处理方法及相关设备
CN113791950A (zh) 一种服务程序的信息处理方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090224

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090707