JP2011186712A - 性能分析装置及び性能分析方法及び性能分析プログラム - Google Patents
性能分析装置及び性能分析方法及び性能分析プログラム Download PDFInfo
- Publication number
- JP2011186712A JP2011186712A JP2010050312A JP2010050312A JP2011186712A JP 2011186712 A JP2011186712 A JP 2011186712A JP 2010050312 A JP2010050312 A JP 2010050312A JP 2010050312 A JP2010050312 A JP 2010050312A JP 2011186712 A JP2011186712 A JP 2011186712A
- Authority
- JP
- Japan
- Prior art keywords
- load level
- server
- request
- time
- response time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
【課題】利用者の体感するシステムの時間性能であるターンアラウンド時間に関し、多重度やシステムの実装方法等によって変動する特性を、統計的に把握する。
【解決手段】性能分析装置110の計測データ処理部111は、サーバ101が要求を受信してから応答を返信するまでの応答時間(ターンアラウンド時間)を計測した計測値(ターンアラウンドリスト208)と、サーバ101の負荷を段階評価した負荷レベル(時間別負荷レベル207)とを時系列で格納する。性能分析装置110のデータ分析部112は、計測データ処理部111から負荷レベルごとに複数の計測値を抽出し、負荷レベルごとにサーバ101の応答時間がガウス分布をなすと仮定して、抽出した複数の計測値から負荷レベルごとにサーバ101の応答時間の確率密度関数(統計量データ214)を算出する。
【選択図】図2
【解決手段】性能分析装置110の計測データ処理部111は、サーバ101が要求を受信してから応答を返信するまでの応答時間(ターンアラウンド時間)を計測した計測値(ターンアラウンドリスト208)と、サーバ101の負荷を段階評価した負荷レベル(時間別負荷レベル207)とを時系列で格納する。性能分析装置110のデータ分析部112は、計測データ処理部111から負荷レベルごとに複数の計測値を抽出し、負荷レベルごとにサーバ101の応答時間がガウス分布をなすと仮定して、抽出した複数の計測値から負荷レベルごとにサーバ101の応答時間の確率密度関数(統計量データ214)を算出する。
【選択図】図2
Description
本発明は、性能分析装置及び性能分析方法及び性能分析プログラムに関するものである。本発明は、特に、稼動しているコンピュータシステムのログや統計情報から、コンピュータの負荷変動や要求の種類を抽出し、個々の要求のターンアラウンド時間からシステム性能の特性を評価するシステム性能計測装置に関するものである。
従来のオンラインシステムの性能レポート作成装置は、端末装置の通信記録を、通信情報ファイルから情報抽出手段によって抽出して集計ファイルを生成し、編集出力手段によって、性能レポートを出力することを行っていた(例えば、特許文献1参照)。また、従来の実行時間の評価装置は、ベンチマークによって、ソフトウェアの実行時間を推定する方法も用いていた(例えば、特許文献2参照)。
従来の性能レポート作成装置や、実行時間の評価装置は、システムが多重にアクセスされることによる負荷上昇に伴い、端末からの要求受信から結果の送信までのターンアラウンド時間の平均と分散が上昇する傾向を評価していないという課題があった。
本発明は、例えば、利用者の体感するシステムの時間性能であるターンアラウンド時間に関し、多重度やシステムの実装方法等によって変動する特性を、統計的に把握することを目的とする。
本発明の一の態様に係る性能分析装置は、
要求を受信すると当該要求に応じた処理を実行して応答を返信するサーバ装置の性能を分析する性能分析装置において、
前記サーバ装置が要求を受信してから応答を返信するまでの応答時間を計測した計測値と、前記サーバ装置の負荷を段階評価した負荷レベルとを時系列で記憶する記憶装置から、負荷レベルごとに複数の計測値を処理装置により抽出する計測データ処理部と、
負荷レベルごとに前記サーバ装置の応答時間がガウス分布をなすと仮定して、前記計測データ処理部により抽出された複数の計測値から、負荷レベルごとに前記サーバ装置の応答時間の確率密度関数を処理装置により算出するデータ分析部とを備えることを特徴とする。
要求を受信すると当該要求に応じた処理を実行して応答を返信するサーバ装置の性能を分析する性能分析装置において、
前記サーバ装置が要求を受信してから応答を返信するまでの応答時間を計測した計測値と、前記サーバ装置の負荷を段階評価した負荷レベルとを時系列で記憶する記憶装置から、負荷レベルごとに複数の計測値を処理装置により抽出する計測データ処理部と、
負荷レベルごとに前記サーバ装置の応答時間がガウス分布をなすと仮定して、前記計測データ処理部により抽出された複数の計測値から、負荷レベルごとに前記サーバ装置の応答時間の確率密度関数を処理装置により算出するデータ分析部とを備えることを特徴とする。
本発明の一の態様によれば、性能分析装置のデータ分析部が、負荷レベルごとにサーバ装置の応答時間がガウス分布をなすと仮定して、サーバ装置の応答時間を計測した複数の計測値から、負荷レベルごとにサーバ装置の応答時間の確率密度関数を算出することにより、サーバ装置の応答時間に関し、多重度やシステムの実装方法等によって変動する特性を、統計的に把握することが可能となる。
以下、本発明の実施の形態について、図を用いて説明する。
実施の形態1.
図1は、本実施の形態に係るシステム100(コンピュータシステム)の構成を示すブロック図である。
図1は、本実施の形態に係るシステム100(コンピュータシステム)の構成を示すブロック図である。
図1において、システム100は、サーバ101,121(サーバ装置)、性能分析装置110を少なくとも1つずつ備えるとともに、PC105(パーソナルコンピュータ)(クライアント装置)を複数備える。サーバ101,121、性能分析装置110、PC105は、互いにネットワークを介して接続されている。
サーバ101は複数のPC105にサービスを提供するコンピュータである。サーバ101は、各PC105から要求を受信すると当該要求に応じた処理を実行して各PC105へ応答を返信する。サーバ101は、アプリケーション102、システムモニタ103をCPU(Central・Processing・Unit)により実行し、イベント/CPU使用率104を出力する。アプリケーション102はサービスを実現するソフトウェアである。システムモニタ103はサーバ101のリソースの消費状態をモニタするソフトウェアである。イベント/CPU使用率104は、アプリケーション102やシステムモニタ103が出力するログ(ファイル)である。
性能分析装置110は、サーバ101の内部に実装されるソフトウェア(この場合、サーバ101自体が性能分析装置110であるといえる)、もしくは、外部に独立した装置として設置されるコンピュータである。性能分析装置110は、サーバ101の性能を分析する。性能分析装置110は、計測データ処理部111、データ分析部112を備える。計測データ処理部111は計測データを処理するソフトウェアである。データ分析部112はデータを分析するソフトウェアである。データ分析部112は時間性能レポート113や性能特性レポート114といったレポート(ファイル)を出力する。
サーバ121はサーバ101と連携するコンピュータである。サーバ121は、アプリケーション122をCPUにより実行する。アプリケーション122はアプリケーション102にサービスを提供するソフトウェアであるが、本実施の形態において必須ではない。
例えば、サーバ101はメールサーバ、サーバ121はデータベースサーバである。このとき、サーバ101のアプリケーション102は複数のPC105にメールサービスを提供する。具体的には、アプリケーション102は、各PC105からログイン要求、メールの一覧要求、メールの送信要求、メールの受信要求といった各種の要求を受信すると、要求された処理を実行し、実行結果を応答として各PC105に返信する。サーバ121のアプリケーション122はユーザアカウントやメールを管理するデータベースにアクセスし、データを読み出してサーバ101のアプリケーション102へ渡したり、サーバ101のアプリケーション102からのデータを書き込んだりする。
図2は、計測対象となるサーバ101と、性能分析装置110の構成を示すブロック図である。
サーバ101は、前述したアプリケーション102、システムモニタ103を実行するほか、ログ収集部151、スプリット処理部152を有する。ログ収集部151は、アプリケーション102からイベント(サービスの実行結果等)のログ(イベント/CPU使用率104の一部)を収集し、ログファイル153として出力する。ログ収集部151から出力されたログファイル153は、HDD(Hard・Disk・Drive)等の記憶装置に保存され、後述するファイル入力部202によって読み込まれる。あるいは、ログ収集部151から出力されたログファイル153は、スプリット処理部152によって、後述する標準入力部201に渡される。システムモニタ103は、サーバ101で起こったイベント(エラー、警告、通知等)や負荷(CPU使用率等)を観測し、統計情報154(イベント/CPU使用率104の一部)として出力する。システムモニタ103から出力された統計情報154は、後述する負荷変動収集部203に渡される。
性能分析装置110の計測データ処理部111は、標準入力部201、ファイル入力部202、負荷変動収集部203、対象事象抽出フィルタ部204、要求種類抽出部205、ターンアラウンド算出部206を有する。標準入力部201、ファイル入力部202は計測対象であるサーバ101からデータを取得するインターフェースである。負荷変動収集部203はサーバ101から統計情報154を、対象事象抽出フィルタ部204から事象(イベントに関する情報)を受け取り、時間別負荷レベル207を生成・更新する。時間別負荷レベル207は時間帯ごとの負荷の程度を記録したテーブルである。対象事象抽出フィルタ部204は標準入力部201、ファイル入力部202からデータを取得し対象となる事象のみを関連する各部に伝える。要求種類抽出部205は対象事象抽出フィルタ部204が取得した事象からユニークな要求を抽出し、要求種リスト209を生成・更新する。要求種リスト209はユニークな要求を記録したテーブルである。ターンアラウンド算出部206は対象事象抽出フィルタ部204が取得した事象から要求のターンアラウンド時間を算出し、ターンアラウンドリスト208を生成・更新する。ターンアラウンドリスト208は個々の要求のターンアラウンド時間を記録したテーブルである。
性能分析装置110のデータ分析部112は、要求種/負荷レベル別ヒストグラム生成部211、ガウス分布/複合ガウス分布係数抽出部213、負荷別時間性能評価部215、負荷別特性評価部216を有する。要求種/負荷レベル別ヒストグラム生成部211は時間別負荷レベル207、ターンアラウンドリスト208、要求種リスト209からヒストグラムデータ212を生成する。ヒストグラムデータ212は要求種、負荷レベルごとのヒストグラムを記録したテーブルである。ガウス分布/複合ガウス分布係数抽出部213はガウス分布に近似したときの係数を算出して統計量データ214を記録する。統計量データ214は統計量を記録したテーブルである。負荷別時間性能評価部215は負荷レベルごとの時間性能の評価を行い、評価結果を時間性能レポート113として出力する。負荷別特性評価部216負荷レベルごとの特性の評価を行い、評価結果を性能特性レポート114として出力する。
図3は、性能分析装置110のハードウェア構成の一例を示す図である。なお、サーバ101,121も同様のハードウェア構成にて実装可能である。
図3において、性能分析装置110は、コンピュータであり、LCD901(Liquid・Crystal・Display)、キーボード902(K/B)、マウス903、FDD904(Flexible・Disk・Drive)、CDD905(Compact・Disc・Drive)、プリンタ906といったハードウェアデバイスを備えている。これらのハードウェアデバイスはケーブルや信号線で接続されている。LCD901の代わりに、CRT(Cathode・Ray・Tube)、あるいは、その他の表示装置が用いられてもよい。マウス903の代わりに、タッチパネル、タッチパッド、トラックボール、ペンタブレット、あるいは、その他のポインティングデバイスが用いられてもよい。
性能分析装置110は、プログラムを実行するCPU911を備えている。CPU911は、処理装置の一例である。CPU911は、バス912を介してROM913(Read・Only・Memory)、RAM914(Random・Access・Memory)、通信ボード915、LCD901、キーボード902、マウス903、FDD904、CDD905、プリンタ906、HDD920と接続され、これらのハードウェアデバイスを制御する。HDD920の代わりに、フラッシュメモリ、光ディスク装置、メモリカードリーダライタ又はその他の記憶媒体が用いられてもよい。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、HDD920は、不揮発性メモリの一例である。これらは、記憶装置の一例である。通信ボード915、キーボード902、マウス903、FDD904、CDD905は、入力装置の一例である。また、通信ボード915、LCD901、プリンタ906は、出力装置の一例である。
通信ボード915は、LAN(Local・Area・Network)等に接続されている。通信ボード915は、LANに限らず、IP−VPN(Internet・Protocol・Virtual・Private・Network)、広域LAN、ATM(Asynchronous・Transfer・Mode)ネットワークといったWAN(Wide・Area・Network)、あるいは、インターネットに接続されていても構わない。LAN、WAN、インターネットは、ネットワークの一例である。
HDD920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923のプログラムは、CPU911、オペレーティングシステム921、ウィンドウシステム922により実行される。プログラム群923には、本実施の形態の説明において「〜部」として説明する機能を実行するプログラムが含まれている。プログラムは、CPU911により読み出され実行される。ファイル群924には、本実施の形態の説明において、「〜データ」、「〜情報」、「〜ID(識別子)」、「〜フラグ」、「〜結果」として説明するデータや情報や信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」や「〜テーブル」の各項目として含まれている。「〜ファイル」や「〜データベース」や「〜テーブル」は、RAM914やHDD920等の記憶媒体に記憶される。RAM914やHDD920等の記憶媒体に記憶されたデータや情報や信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出され、抽出、検索、参照、比較、演算、計算、制御、出力、印刷、表示といったCPU911の処理(動作)に用いられる。抽出、検索、参照、比較、演算、計算、制御、出力、印刷、表示といったCPU911の処理中、データや情報や信号値や変数値やパラメータは、メインメモリやキャッシュメモリやバッファメモリに一時的に記憶される。
本実施の形態の説明において用いるブロック図やフローチャートの矢印の部分は主としてデータや信号の入出力を示す。データや信号は、RAM914等のメモリ、FDD904のフレキシブルディスク(FD)、CDD905のコンパクトディスク(CD)、HDD920の磁気ディスク、光ディスク、DVD(Digital・Versatile・Disc)、あるいは、その他の記録媒体に記録される。また、データや信号は、バス912、信号線、ケーブル、あるいは、その他の伝送媒体により伝送される。
本実施の形態の説明において「〜部」として説明するものは、「〜回路」、「〜装置」、「〜機器」であってもよく、また、「〜ステップ」、「〜工程」、「〜手順」、「〜処理」であってもよい。即ち、「〜部」として説明するものは、ROM913に記憶されたファームウェアで実現されていても構わない。あるいは、「〜部」として説明するものは、ソフトウェアのみ、あるいは、素子、デバイス、基板、配線といったハードウェアのみで実現されていても構わない。あるいは、「〜部」として説明するものは、ソフトウェアとハードウェアとの組み合わせ、あるいは、ソフトウェアとハードウェアとファームウェアとの組み合わせで実現されていても構わない。ファームウェアとソフトウェアは、プログラムとして、フレキシブルディスク、コンパクトディスク、磁気ディスク、光ディスク、DVD等の記録媒体に記憶される。プログラムはCPU911により読み出され、CPU911により実行される。即ち、プログラムは、本実施の形態の説明で述べる「〜部」としてコンピュータを機能させるものである。あるいは、プログラムは、本実施の形態の説明で述べる「〜部」の手順や方法をコンピュータに実行させるものである。
次に、性能分析装置110の動作(本実施の形態に係る性能分析方法、本実施の形態に係る性能分析プログラムの処理手順)について説明する。
図2に示したように、計測対象のサーバ101にて、PC105の要求の受信と結果の応答のログは、ログ収集部151によって記録される。また、サーバ101のCPU等のリソースの消費状況はシステムモニタ103によって統計情報154として記録される。
性能分析装置110の計測データ処理部111は、ログファイル153をファイル入力部202によって読み込むか、スプリット処理部152から標準入力部201によって読み込むことで、対象事象抽出フィルタ部204の入力を得る。対象事象抽出フィルタ部204は、計測の対象となっている事象を処理装置により抽出して、負荷変動収集部203、ターンアラウンド算出部206、要求種類抽出部205にフィルタした事象を通知する。負荷変動収集部203は、統計情報154もしくは対象事象抽出フィルタ部204から得た情報から時間帯ごとの負荷状況を時間別負荷レベル207として記憶装置に記憶する。ターンアラウンド算出部206は、対象事象抽出フィルタ部204から得た情報を入力として、個々の要求と結果(応答)の時刻からターンアラウンド時間を処理装置により算出し、ターンアラウンドリスト208として記憶装置に記憶する。要求種類抽出部205は、対象事象抽出フィルタ部204から得た情報を入力として、発生した要求を処理装置により照査し、要求種リスト209として記憶装置により記憶する。
性能分析装置110のデータ分析部112は、時間別負荷レベル207、ターンアラウンドリスト208、要求種リスト209を入力として、時間性能レポート113、性能特性レポート114を出力装置により出力する。データ分析部112の要求種/負荷レベル別ヒストグラム生成部211は、データ分析部112の入力から、要求種ごと、負荷レベルごとの要求のターンアラウンド時間のヒストグラムを処理装置により生成し、ヒストグラムデータ212として記憶装置に記憶する。ガウス分布/複合ガウス分布係数抽出部213は、個々のヒストグラムについて、ガウス分布を仮定した係数抽出を処理装置により行い、統計量データ214を出力する。負荷別時間性能評価部215は、統計量データ214から負荷の上昇とターンアラウンド時間の平均、分散の変動を、時間性能レポート113として出力装置により出力する。負荷別特性評価部216は、複合ガウス分布が有意なケースについて、複合した分布の構成を性能特性レポート114として出力装置により出力する。
図4は、対象事象抽出フィルタ部204の動作を示すフローチャートである。
対象事象抽出フィルタ部204は、標準入力部201又はファイル入力部202にて入力があるまで待機する(ステップS101)。入力があると、対象事象抽出フィルタ部204は、入力されたログファイル153のレコードを受け取る(ステップS102)。対象事象抽出フィルタ部204は、正常にレコードを受け取った場合にはステップS103に進み、それ以外の場合には終了する。
標準入力部201、ファイル入力部202から得られるレコードには、要求と結果を示すレコード以外も含まれているため、対象事象抽出フィルタ部204は、予め与えられるレコード定義情報301(記憶装置に予め記憶されている、抽出対象のレコードを定義する情報)に従って、レコード評価を処理装置により行う(ステップS103)。対象事象抽出フィルタ部204は、必要なレコード(要求と応答のログのレコード)があれば後続の処理へ当該レコードだけ引き渡し、なければステップS101に戻る。
図5は、負荷変動収集部203の動作を示すフローチャートである。
負荷変動収集部203は、統計情報154の入力又は対象事象抽出フィルタ部204からの入力があるまで待機する(ステップS201)。入力があると、負荷変動収集部203は、入力されたデータを受け取る(ステップS202)。負荷変動収集部203は、正常にデータを受け取った場合には入力の判定を行い、それ以外の場合には終了する。
統計情報154が入力の場合、負荷変動収集部203は、その中の例えばCPU使用率を参照して、予め与えられる設定情報である負荷レベル情報402(記憶装置に予め記憶されている、負荷レベルを定義する情報)に従って負荷レベルを処理装置により決定する(ステップS203)。即ち、負荷変動収集部203は、統計情報154に記録された単位時間ごとのCPU使用率を負荷レベル情報402に照らして段階評価することで負荷レベルを割り出す。そして、負荷変動収集部203は、時間別負荷レベル207を更新し(ステップS204)、ステップS201に戻る。このとき、統計情報154と予め与えられる時間粒度情報401(記憶装置に予め記憶されている、時間粒度を定義する情報)における時間粒度(単位時間)は一致しているものとする。
対象事象抽出フィルタ部204の出力が入力の場合、負荷変動収集部203は、予め与えられる設定情報である時間粒度情報401に従った時刻のマスク、例えば秒単位や分単位でのマスクを行う(ステップS205)。負荷変動収集部203は、内部情報である時刻別件数データ403(記憶装置に記憶されている、所定の時間帯、即ち、時間粒度情報401で定義された時間粒度の時刻ごとに、件数を示すデータ)を参照する(ステップS206)。ステップS205で得られた時刻が新規時刻(時刻別件数データ403に記録されている時刻より後の時刻)であれば、負荷変動収集部203は、時刻別件数データ403から旧時刻の件数を読み出し、負荷レベル情報402に従って負荷レベルを処理装置により決定する(ステップS207)。即ち、負荷変動収集部203は、対象事象抽出フィルタ部204から入力されたデータに記録された単位時間ごとの要求の件数を負荷レベル情報402に照らして段階評価することで負荷レベルを割り出す。そして、負荷変動収集部203は、時間別負荷レベル207を更新し(ステップS208)、時刻別件数データ403に現在の粒度の時刻(上記新規時刻)と件数0を設定する(ステップS209)。続けて、負荷変動収集部203は、件数をインクリメントし(ステップS210)、ステップS201に戻る。ステップS205で得られた時刻が既に時刻別件数データ403に記録されている時刻と一致する粒度の時刻であれば、負荷変動収集部203は、単に件数をインクリメントし(ステップS210)、ステップS201に戻る。
図6は、要求種類抽出部205の動作を示すフローチャートである。
要求種類抽出部205は、対象事象抽出フィルタ部204から出力されたデータを入力として(ステップS301)、レコード定義情報301に従って要求の種類を処理装置により評価する(ステップS302)。要求種リスト209に存在しない種類であれば、要求種類抽出部205は、当該種類の要求種リスト209への追加を行う(ステップS303)。
図7は、ターンアラウンド算出部206の動作を示すフローチャートである。
ターンアラウンド算出部206は、対象事象抽出フィルタ部204から出力されたデータを入力として(ステップS401)、レコード定義情報301に従って要求と応答、PC105を識別する(ステップS402)。新規の要求であれば、ターンアラウンド算出部206は、要求とPC105を識別するコード(例えばIP(Internet・Protocol)アドレス)をキーとした内部情報であるキー別時刻データ501(記憶装置に記憶されている、キーごとに、サーバ101がPC105から要求を受信した時刻を示すデータ)にキー及び対応する時刻を記録して(ステップS403)、終了する。応答であれば、ターンアラウンド算出部206は、キー別時刻データ501を参照して、キーに対応する要求の時刻を特定し、要求と応答の間の経過時間を処理装置により算出する(ステップS404)。そして、ターンアラウンド算出部206は、キー別時刻データ501から当該キー及び対応する時刻を削除し(ステップS405)、ターンアラウンドリスト208に、算出した時間を記録して(ステップS406)、終了する。
図8は、要求種/負荷レベル別ヒストグラム生成部211の動作を示すフローチャートである。
要求種/負荷レベル別ヒストグラム生成部211は、時間別負荷レベル207、ターンアラウンドリスト208、要求種リスト209の入力があるまで待機する(ステップS501)。入力があると、要求種/負荷レベル別ヒストグラム生成部211は、入力された時間別負荷レベル207、ターンアラウンドリスト208、要求種リスト209を参照する(ステップS502)。要求種/負荷レベル別ヒストグラム生成部211は、正常に時間別負荷レベル207、ターンアラウンドリスト208、要求種リスト209を参照できた場合にはステップS503に進み、それ以外の場合には終了する。
要求種/負荷レベル別ヒストグラム生成部211は、時間別負荷レベル207、ターンアラウンドリスト208、要求種リスト209に基づき、ターンアラウンドリスト208から得た要求のターンアラウンド時間について、そのときの負荷レベル、要求種を識別する(ステップS503,S504)。そして、要求種/負荷レベル別ヒストグラム生成部211は、予め与えられる区間定義情報601(記憶装置に予め記憶されている、ヒストグラムの階級を定義する情報)に従い、該当するヒストグラムの階級について度数のインクリメントを処理装置により行う(ステップS504,506)。このとき、ヒストグラムデータ212が負荷レベルと要求種の数分、生成される。
上記のように、本実施の形態において、性能分析装置110の計測データ処理部111は、サーバ101が要求を受信してから応答を返信するまでの応答時間(ターンアラウンド時間)を計測した計測値(ターンアラウンドリスト208)と、サーバ101の負荷を段階評価した負荷レベル(時間別負荷レベル207)とを時系列で記憶装置に格納する。
また、本実施の形態において、計測データ処理部111は、サーバ101の応答時間の計測値を、サーバ101が受信した要求の種類とともに記憶装置に格納する。
図9は、ガウス分布/複合ガウス分布係数抽出部213の動作を示すフローチャートである。
ガウス分布/複合ガウス分布係数抽出部213は、ヒストグラムデータ212を入力として(ステップS601)、次式(1)を仮定した、標準偏差σ(分散σ2)、平均μを処理装置により導出する(yは、ヒストグラムの階級)(ステップS602)。
また、ガウス分布/複合ガウス分布係数抽出部213は、次式(2)、(3)を仮定した、標準偏差σi(分散σ2 i)、平均μiを導出する(yは、ヒストグラムの階級)(ステップS603)。
この導出は、ヒストグラムを確率密度として正規化し、係数を仮定した上記式(1)〜(3)から得られるg(y)、f(y)と、χ2が最小となるよう仮定を繰り返すことで行う(χ2検定を行う)。ガウス分布/複合ガウス分布係数抽出部213は、導出した結果を統計量データ214に出力する(ステップS604)。
図10は、負荷別時間性能評価部215の動作を示すフローチャートである。
負荷別時間性能評価部215は、統計量データ214を入力として(ステップS701)、同一要求種の負荷レベル間の標準偏差σ(分散σ2)、平均μの変動をレポートする時間性能レポート113を出力装置により出力する(ステップS702〜S704)。時間性能レポート113は、例えば図11に示すようなグラフとして表現することも可能である。図11のグラフでは、4つの負荷レベル“1”、“30”、“80”、“120”のそれぞれについて、ある1種類の要求に対するサーバ101の応答時間の確率密度関数g(y)を示している。そのため、グラフの横軸が応答時間、縦軸が度数となっている。負荷別時間性能評価部215は、図11のようなグラフを、要求の種類ごとに出力装置により出力する。前述したメールサーバの例であれば、例えばPC105からログイン要求があった場合(記憶装置へのアクセスが比較的少ないケース)のサーバ101の応答時間に関し、図11のようなグラフを示すことで、多重度やサーバ101の実装方法(例えば、記憶装置の構成、具体的には、どのようなキャッシュを実装しているか)等によって変動する特性を統計的に把握することが可能となる。
上記のように、本実施の形態において、性能分析装置110のデータ分析部112は、計測データ処理部111から負荷レベルごとに複数の計測値を処理装置により抽出し、負荷レベルごとにサーバ101の応答時間がガウス分布をなすと仮定して、抽出した複数の計測値から負荷レベルごとにサーバ101の応答時間の確率密度関数g(y)を処理装置により算出する。また、データ分析部112は、負荷レベルごとにサーバ101の応答時間の確率密度関数g(y)を表すグラフを出力装置により出力する。
また、本実施の形態において、データ分析部112は、計測データ処理部111から要求の種類と負荷レベルとの組み合わせごとに複数の計測値を処理装置により抽出し、要求の種類と負荷レベルとの組み合わせごとにサーバ101の応答時間がガウス分布をなすと仮定して、抽出した複数の計測値から要求の種類と負荷レベルとの組み合わせごとにサーバ101の応答時間の確率密度関数g(y)を処理装置により算出する。
図12は、負荷別特性評価部216の動作を示すフローチャートである。
負荷別特性評価部216は、統計量データ214を入力として(ステップS801)、同一要求種、特定負荷レベル間の重み係数αi、標準偏差σi(分散σ2 i)、平均μiの変動をレポートする性能特性レポート114を出力装置により出力する(ステップS802〜S805)。性能特性レポート114は、例えば図13に示すようなグラフ及び表として表現することも可能である。図13のグラフでは、ある1つの負荷レベルについて、ある1種類の要求に対するサーバ101の応答時間の確率密度関数f(y)を示している。そのため、グラフの横軸が応答時間、縦軸が度数となっている。また、図13のグラフで度数のピークが3つあることからわかるように、この例では3つのガウス分布が合成された複合ガウス分布が仮定され、図13の表に示した各3つの重み係数αi、分散σ2 i、平均μiが求められている(χ2検定で求められる)。負荷別特性評価部216は、図13のようなグラフ及び表を、要求の種類と負荷レベルとの組み合わせごとに出力装置により出力する。前述したメールサーバの例であれば、例えばPC105からメールの一覧要求があった場合(記憶装置へのアクセスを比較的多く要するケース)のサーバ101の応答時間に関し、図13のようなグラフ及び表を示すことで、多重度やサーバ101の実装方法(例えば、記憶装置の構成、具体的には、どのようなキャッシュを実装しているか)等によって変動する特性を統計的に把握することが可能となる。
上記のように、本実施の形態において、性能分析装置110のデータ分析部112は、計測データ処理部111から負荷レベルごとに複数の計測値を処理装置により抽出し、負荷レベルごとにサーバ101の応答時間が複数のガウス分布をそれぞれ重み係数により重み付けして合成した複合ガウス分布をなすと仮定して、抽出した複数の計測値から負荷レベルごとにサーバ101の応答時間の確率密度関数f(y)を処理装置により算出する。そして、データ分析部112は、負荷レベルごとにサーバ101の応答時間の確率密度関数f(y)における複数の重み係数αiを出力装置により出力する。データ分析部112は、さらに、負荷レベルごとにサーバ101の応答時間の確率密度関数f(y)における複数の重み係数αiのそれぞれに対応する平均μiと分散σ2 iとを出力装置により出力する。また、データ分析部112は、負荷レベルごとにサーバ101の応答時間の確率密度関数f(y)を表すグラフを出力装置により出力する。
また、本実施の形態において、データ分析部112は、計測データ処理部111から要求の種類と負荷レベルとの組み合わせごとに複数の計測値を処理装置により抽出し、要求の種類と負荷レベルとの組み合わせごとにサーバ101の応答時間が複合ガウス分布をなすと仮定して、抽出した複数の計測値から要求の種類と負荷レベルとの組み合わせごとにサーバ101の応答時間の確率密度関数f(y)を処理装置により算出する。
以上のように、本実施の形態では、性能分析装置110が、稼働中のシステム100(サーバ101,121)に対して、ベンチマークテスト等を行うことなく、要求の種類と負荷のレベルを抽出し、利用者の体感するターンアラウンド時間の要求の種類ごと、負荷のレベルごとの平均と分散を把握することができる。また、システム100(サーバ101,121)の実現上のアルゴリズム等による性能のばらつきについても分析することができる。
以上説明したように、本実施の形態に係る性能分析装置110(システム性能計測装置)は、稼働中のシステム100(サーバ101,121)のログ等の情報から、負荷ごとのターンアラウンド時間を抽出し、負荷上昇によるターンアラウンド時間の劣化を定量化することを特徴とする。
また、性能分析装置110は、稼働中のシステム100(サーバ101,121)のログ等の情報から、要求の種類ごとのターンアラウンド時間を抽出し、要求の違いによるターンアラウンド時間の差異を定量化することを特徴とする。
また、性能分析装置110は、ターンアラウンド時間の条件による違いを、ガウス分布を仮定して、平均と分散で評価可能とすることを特徴とする。
また、性能分析装置110は、ターンアラウンド時間の同一条件下におけるばらつきを、複合ガウス分布を仮定して、ばらつきの要因数を分析可能とすることを特徴とする。
100 システム、101,121 サーバ、102,122 アプリケーション、103 システムモニタ、104 イベント/CPU使用率、105 PC、110 性能分析装置、111 計測データ処理部、112 データ分析部、113 時間性能レポート、114 性能特性レポート、151 ログ収集部、152 スプリット処理部、153 ログファイル、154 統計情報、201 標準入力部、202 ファイル入力部、203 負荷変動収集部、204 対象事象抽出フィルタ部、205 要求種類抽出部、206 ターンアラウンド算出部、207 時間別負荷レベル、208 ターンアラウンドリスト、209 要求種リスト、211 要求種/負荷レベル別ヒストグラム生成部、212 ヒストグラムデータ、213 ガウス分布/複合ガウス分布係数抽出部、214 統計量データ、215 負荷別時間性能評価部、216 負荷別特性評価部、301 レコード定義情報、401 時間粒度情報、402 負荷レベル情報、403 時刻別件数データ、501 キー別時刻データ、601 区間定義情報、901 LCD、902 キーボード、903 マウス、904 FDD、905 CDD、906 プリンタ、911 CPU、912 バス、913 ROM、914 RAM、915 通信ボード、920 HDD、921 オペレーティングシステム、922 ウィンドウシステム、923 プログラム群、924 ファイル群。
Claims (8)
- 要求を受信すると当該要求に応じた処理を実行して応答を返信するサーバ装置の性能を分析する性能分析装置において、
前記サーバ装置が要求を受信してから応答を返信するまでの応答時間を計測した計測値と、前記サーバ装置の負荷を段階評価した負荷レベルとを時系列で記憶装置に格納する計測データ処理部と、
前記計測データ処理部から負荷レベルごとに複数の計測値を処理装置により抽出し、負荷レベルごとに前記サーバ装置の応答時間がガウス分布をなすと仮定して、抽出した複数の計測値から負荷レベルごとに前記サーバ装置の応答時間の確率密度関数を処理装置により算出するデータ分析部とを備えることを特徴とする性能分析装置。 - 前記データ分析部は、負荷レベルごとに前記サーバ装置の応答時間が複数のガウス分布をそれぞれ重み係数により重み付けして合成した複合ガウス分布をなすと仮定して、抽出した複数の計測値から負荷レベルごとに前記サーバ装置の応答時間の確率密度関数を処理装置により算出することを特徴とする請求項1に記載の性能分析装置。
- 前記データ分析部は、負荷レベルごとに前記サーバ装置の応答時間の確率密度関数における複数の重み係数を出力装置により出力することを特徴とする請求項2に記載の性能分析装置。
- 前記データ分析部は、さらに、負荷レベルごとに前記サーバ装置の応答時間の確率密度関数における複数の重み係数のそれぞれに対応する平均と分散とを出力装置により出力することを特徴とする請求項3に記載の性能分析装置。
- 前記データ分析部は、さらに、負荷レベルごとに前記サーバ装置の応答時間の確率密度関数を表すグラフを出力装置により出力することを特徴とする請求項1から4までのいずれかに記載の性能分析装置。
- 前記計測データ処理部は、前記サーバ装置の応答時間の計測値を、前記サーバ装置が受信した要求の種類とともに記憶装置に格納し、
前記データ分析部は、前記計測データ処理部から要求の種類と負荷レベルとの組み合わせごとに複数の計測値を処理装置により抽出し、要求の種類と負荷レベルとの組み合わせごとに前記サーバ装置の応答時間がガウス分布をなすと仮定して、抽出した複数の計測値から要求の種類と負荷レベルとの組み合わせごとに前記サーバ装置の応答時間の確率密度関数を処理装置により算出することを特徴とする請求項1から5までのいずれかに記載の性能分析装置。 - 要求を受信すると当該要求に応じた処理を実行して応答を返信するサーバ装置の性能を分析する性能分析方法において、
記憶装置が、前記サーバ装置が要求を受信してから応答を返信するまでの応答時間を計測した計測値と、前記サーバ装置の負荷を段階評価した負荷レベルとを時系列で格納し、
処理装置が、記憶装置から負荷レベルごとに複数の計測値を抽出し、負荷レベルごとに前記サーバ装置の応答時間がガウス分布をなすと仮定して、抽出した複数の計測値から負荷レベルごとに前記サーバ装置の応答時間の確率密度関数を算出することを特徴とする性能分析方法。 - 要求を受信すると当該要求に応じた処理を実行して応答を返信するサーバ装置の性能を分析する性能分析プログラムにおいて、
前記サーバ装置が要求を受信してから応答を返信するまでの応答時間を計測した計測値と、前記サーバ装置の負荷を段階評価した負荷レベルとを時系列で記憶装置に格納する計測データ処理と、
記憶装置から負荷レベルごとに複数の計測値を処理装置により抽出し、負荷レベルごとに前記サーバ装置の応答時間がガウス分布をなすと仮定して、抽出した複数の計測値から負荷レベルごとに前記サーバ装置の応答時間の確率密度関数を処理装置により算出するデータ分析処理とをコンピュータに実行させることを特徴とする性能分析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010050312A JP2011186712A (ja) | 2010-03-08 | 2010-03-08 | 性能分析装置及び性能分析方法及び性能分析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010050312A JP2011186712A (ja) | 2010-03-08 | 2010-03-08 | 性能分析装置及び性能分析方法及び性能分析プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011186712A true JP2011186712A (ja) | 2011-09-22 |
Family
ID=44792913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010050312A Pending JP2011186712A (ja) | 2010-03-08 | 2010-03-08 | 性能分析装置及び性能分析方法及び性能分析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011186712A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013145629A1 (ja) * | 2012-03-30 | 2013-10-03 | 日本電気株式会社 | 負荷評価を実行する情報処理装置及び負荷評価方法 |
JP2014013445A (ja) * | 2012-07-03 | 2014-01-23 | Fujitsu Ltd | プログラム、測定装置及び測定方法 |
JP2015108878A (ja) * | 2013-12-03 | 2015-06-11 | 日本電気株式会社 | 割当判定装置、制御方法、及びプログラム |
CN105786681A (zh) * | 2016-02-18 | 2016-07-20 | 中国科学院计算技术研究所 | 数据中心的服务器性能评估及服务器更新方法 |
-
2010
- 2010-03-08 JP JP2010050312A patent/JP2011186712A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013145629A1 (ja) * | 2012-03-30 | 2013-10-03 | 日本電気株式会社 | 負荷評価を実行する情報処理装置及び負荷評価方法 |
JP2014013445A (ja) * | 2012-07-03 | 2014-01-23 | Fujitsu Ltd | プログラム、測定装置及び測定方法 |
JP2015108878A (ja) * | 2013-12-03 | 2015-06-11 | 日本電気株式会社 | 割当判定装置、制御方法、及びプログラム |
CN105786681A (zh) * | 2016-02-18 | 2016-07-20 | 中国科学院计算技术研究所 | 数据中心的服务器性能评估及服务器更新方法 |
CN105786681B (zh) * | 2016-02-18 | 2019-03-26 | 中国科学院计算技术研究所 | 数据中心的服务器性能评估及服务器更新方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10171335B2 (en) | Analysis of site speed performance anomalies caused by server-side issues | |
US8326965B2 (en) | Method and apparatus to extract the health of a service from a host machine | |
US10263833B2 (en) | Root cause investigation of site speed performance anomalies | |
JP6845819B2 (ja) | 分析装置、分析方法、および分析プログラム | |
US10235399B2 (en) | Methods and systems for determining hardware sizing for storage array systems | |
US11093349B2 (en) | System and method for reactive log spooling | |
US9886195B2 (en) | Performance-based migration among data storage devices | |
US9146927B2 (en) | Data processing apparatus, data processing method, and program | |
US10411969B2 (en) | Backend resource costs for online service offerings | |
JP2010117757A (ja) | 性能監視システムおよび性能監視方法 | |
US20160094392A1 (en) | Evaluating Configuration Changes Based on Aggregate Activity Level | |
US10073726B2 (en) | Detection of outage in cloud based service using usage data based error signals | |
US10504026B2 (en) | Statistical detection of site speed performance anomalies | |
JP2011186712A (ja) | 性能分析装置及び性能分析方法及び性能分析プログラム | |
Park et al. | A big data analytics framework for hpc log data: Three case studies using the titan supercomputer log | |
US9201752B2 (en) | System and method for correlating empirical data with user experience | |
US9276826B1 (en) | Combining multiple signals to determine global system state | |
US20160036670A1 (en) | Detection of outage in cloud based service using synthetic measurements and anonymized usage data | |
Xue et al. | Fill-in the gaps: Spatial-temporal models for missing data | |
US11157348B1 (en) | Cognitive control of runtime resource monitoring scope | |
US8326977B2 (en) | Recording medium storing system analyzing program, system analyzing apparatus, and system analyzing method | |
JP2014238688A (ja) | 評価システムおよび評価方法 | |
JP2020068019A (ja) | 情報分析装置、情報分析方法、情報分析システムおよびプログラム | |
JP5623336B2 (ja) | リソース使用率算出装置および応答時間比算出装置およびリソース使用率算出方法およびプログラム | |
JP5519436B2 (ja) | システム安定度を分析する情報分析装置、情報分析方法、情報分析システムおよびプログラム |