JP5313101B2 - Information management program, information management method, and information management apparatus - Google Patents
Information management program, information management method, and information management apparatus Download PDFInfo
- Publication number
- JP5313101B2 JP5313101B2 JP2009227467A JP2009227467A JP5313101B2 JP 5313101 B2 JP5313101 B2 JP 5313101B2 JP 2009227467 A JP2009227467 A JP 2009227467A JP 2009227467 A JP2009227467 A JP 2009227467A JP 5313101 B2 JP5313101 B2 JP 5313101B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- performance information
- period
- performance
- trace
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Description
本発明は、情報を管理する情報管理プログラム、情報管理方法、及び、情報管理装置に関する。 The present invention relates to an information management program for managing information, an information management method, and an information management apparatus.
プログラムに基づき所定の処理を実行する処理部を備える処理装置に関して、処理部における性能トラブル、例えば、一部のプロセスの一時的なレスポンスの劣化等の原因を調査する方法として、処理部における処理状況を示す性能情報を解析する方法がある。 Regarding a processing device including a processing unit that executes predetermined processing based on a program, the processing status in the processing unit as a method for investigating the cause of performance troubles in the processing unit, for example, temporary response deterioration of some processes, etc. There is a method of analyzing performance information indicating
性能情報は、例えば、処理装置を管理するOS(Operating System)により提供される情報であり、具体的には、処理部を監視するカウンタが、処理部でのプロセスの実行により発生する、例えば、書込要求数や書込要求サイズ等をカウントすることで生成されている。 The performance information is, for example, information provided by an OS (Operating System) that manages the processing device. Specifically, a counter that monitors the processing unit is generated by executing a process in the processing unit. It is generated by counting the number of write requests, the write request size, and the like.
しかしながら、カウンタでは実行されたプロセスを特定する情報やプロセスの実行が誰によるものかを特定するような情報は生成されないため、性能情報を解析しても、性能トラブルが誰のどのような処理によるものかを特定することができなかった。このため、性能トラブルの種類によっては、原因を特定するまでに多大な時間を要してしまう可能性があった。 However, the counter does not generate information that identifies the process that was executed or information that identifies who the process was executed by. I couldn't determine what it was. For this reason, depending on the type of performance trouble, it may take a long time to identify the cause.
このような点に鑑み、性能トラブルの原因の特定に要する時間の短縮を図る、情報管理プログラム、情報管理方法、及び、情報管理装置を提供することを目的とする。 In view of these points, an object of the present invention is to provide an information management program, an information management method, and an information management apparatus that can reduce the time required to identify the cause of a performance problem.
上記目的を達成するために以下のような情報管理プログラムが提供される。当該情報管理プログラムは、コンピュータに、処理を実行する処理部のトレース情報と、第1及び第2のカウンタのカウントアップ条件とを対応付けた変換テーブルに基づき、第1の期間毎に処理部のトレース情報に応じて第1のカウンタをカウントアップしたカウント値を第1の性能情報として記憶し、第1の期間より長い第2の期間毎に処理部のトレース情報に応じて第2のカウンタをカウントアップしたカウント値を第2の性能情報として記憶し、第2の性能情報に対応する処理部の処理状況と、第1の性能情報に対応する処理部の処理状況とを比較した結果に基づいて所定の事象を検出する処理を実行させるものである。 In order to achieve the above object, the following information management program is provided. The information management program stores the processing unit's processing information for each first period based on a conversion table that associates the trace information of the processing unit that executes the processing with the count-up conditions of the first and second counters. The count value obtained by counting up the first counter according to the trace information is stored as the first performance information, and the second counter is set according to the trace information of the processing unit every second period longer than the first period. The counted count value is stored as the second performance information, and based on the result of comparing the processing status of the processing unit corresponding to the second performance information and the processing status of the processing unit corresponding to the first performance information Thus, a process for detecting a predetermined event is executed.
開示の情報管理プログラムによれば、性能トラブルの原因の特定に要する時間の短縮を図ることが可能となる。 According to the disclosed information management program, it is possible to reduce the time required to identify the cause of the performance trouble.
以下、実施形態を図面を参照して説明する。
[第1の実施形態]
図1は、第1の実施形態に係る情報管理装置の一例を示す図である。情報管理装置10は、処理部11と、トレース情報記憶部12と、生成部13と、検出部14と、出力部15とを有する。
Hereinafter, embodiments will be described with reference to the drawings.
[First Embodiment]
FIG. 1 is a diagram illustrating an example of an information management apparatus according to the first embodiment. The
処理部11は、プログラムに基づいて所定の処理を実行する。トレース情報記憶部12は、処理部11における処理の履歴を示すトレース情報を記憶する。ここで、トレース情報は、処理を特定する情報や、処理の実行が誰によるものかを示す情報を含んでいる。また、トレース情報は、例えば、情報管理装置10を管理するOS(Operating System)により提供される。
The
生成部13は、トレース情報記憶部12に記憶されたトレース情報に基づいて、性能情報を生成する。性能情報は、処理部11の処理状況を示す情報であり、例えば、応答速度や処理速度等を示す指標を含む。例えば、性能情報は、書込要求数、書込要求サイズ、CPU消費率、メモリ使用量、IO稼働率、読込要求数、読込要求サイズ等を含む。さらに、生成部13は、生成した性能情報と生成元のトレース情報とを対応付ける。
The
検出部14は、生成部13が生成した性能情報に基づいて、所定の事象を検出する。所定の事象とは、例えば、通常の状態とは大きく異なる異常状態を示す特異事象である。多くの場合、この特異事象は、性能トラブルの現象となって現れる。
The
出力部15は、検出部14が所定の事象を検出すると、検出元になった性能情報と、この性能情報に対応するトレース情報とを、例えば、保存部や表示装置の表示画面等(図示せず)に出力する。
When the
なお、情報管理装置10は、処理部11及びトレース情報記憶部12を必ずしも有している必要はない。例えば、情報管理装置10とネットワーク等で接続された外部の処理装置に、処理部11及びトレース情報記憶部12を設定することも可能である。この場合、情報管理装置10は、ネットワーク等を介して外部の処理装置からトレース情報を取得する。
The
次に、この情報管理装置10の動作について説明する。図2は、第1の実施形態に係る情報管理装置の処理手順の一例を示すフローチャートである。
[ステップS11]処理を開始すると、生成部13が、トレース情報記憶部12に記憶されているトレース情報に基づいて性能情報を生成する。
Next, the operation of the
[Step S11] When processing is started, the
[ステップS12]生成部13が、ステップS11で生成された性能情報と、生成元のトレース情報とを対応付ける。
[ステップS13]検出部14が、ステップS11で生成された性能情報に基づいて、所定の事象を検出する。所定の事象を検出した場合、処理をステップS14に進める。所定の事象が検出されない場合は、処理を終了する。
[Step S12] The
[Step S13] The
[ステップS14]ステップS13で、検出部14が所定の事象を検出した場合、出力部15が、検出元になった性能情報と、この性能情報に対応するトレース情報とを出力して処理を終了する。
[Step S14] When the
なお、性能トラブルの原因の調査は、出力部15が出力した情報を調査することで行われる。例えば、出力部15が情報を表示装置の表示画面に出力する場合、ユーザは、この表示画面を閲覧することで調査を行うことが可能となる。
The cause of the performance trouble is investigated by examining the information output by the
このように、情報管理装置10は、性能情報と生成元のトレース情報とを対応付け、性能情報に所定の事象が検出された場合、検出元になった性能情報と、この性能情報と対応するトレース情報とを出力する。
In this way, the
これにより、性能トラブルの原因を調査する際、トレース情報にまで遡って調査を行うことが可能となる。トレース情報は、処理を特定する情報や、処理の実行が誰によるものかを示す情報を含んでいるため、トレース情報を調査することで、性能トラブルの原因が誰のどのような処理によるものかを、短時間で特定することが可能となる。 As a result, when investigating the cause of a performance problem, it is possible to investigate retroactively to the trace information. The trace information includes information that identifies the process and information that indicates who is executing the process. By examining the trace information, the process that caused the performance trouble is caused by who and what process. Can be specified in a short time.
さらに、情報管理装置10では、出力される性能情報及びトレース情報は、所定の事象が検出された情報のみなので、調査の対象を絞ることが可能となり、調査時間をさらに短縮することが可能となる。
Furthermore, in the
次に、情報管理装置10をより具体的にした例を、第2の実施形態に説明する。
[第2の実施形態]
第2の実施形態に係る情報管理装置について説明する。まず、情報管理装置のハードウェアについて説明する。図3は、第2の実施形態に係る情報管理装置のハードウェアの一例を示すブロック図である。
Next, a more specific example of the
[Second Embodiment]
An information management apparatus according to the second embodiment will be described. First, the hardware of the information management apparatus will be described. FIG. 3 is a block diagram illustrating an example of hardware of the information management apparatus according to the second embodiment.
情報管理装置100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス106を介してRAM(Random Access Memory)102、ハードディスクドライブ(HDD:Hard Disk Drive)103、及びグラフィック処理部104、入力インタフェース105が接続されている。
The
RAM102には、CPU101に実行させるOSのプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。HDD103には、OSやアプリケーションのプログラム、各種データが格納される。グラフィック処理部104には、モニタ107が接続されており、CPU101からの命令に従って画像をモニタ107の画面に表示させる。入力インタフェース105には、キーボード108aやマウス108b等の入力デバイスが接続されており、キーボード108aやマウス108bから送られてくる信号を、バス106を介してCPU101に送信する。
The
このようなハードウェアによって、情報管理装置100の処理機能を実現することができる。次に、情報管理装置100の機能について説明する。図4は、第2の実施形態に係る情報管理装置の機能の一例を示すブロック図である。
The processing function of the
情報管理装置100は、処理部110と、トレース情報記憶部120と、性能情報生成部130と、性能情報生成部140と、事象検出部150と、情報出力部160と、保存部170とを有する。
The
処理部110は、プログラムに基づいて所定のプロセスやスレッド等の処理を実行する。処理部110は、例えば、API(Application Program Interface)を実行するAPI層111と、情報を一時記憶するキャッシュ層112と、情報の入出力を行うIO層113とを含んでいる。
The
トレース情報記憶部120は、処理部110における処理の履歴を示すトレース情報を記憶する。ここでは、トレース情報記憶部120は、各API層111、キャッシュ層112、及び、IO層113に対応したトレース情報をそれぞれ記憶する。
The trace
ここで、トレース情報は、プロセスやスレッドを特定する情報や、プロセスやスレッドの実行が誰によるものかを示す情報を含んでいる。また、トレース情報は、例えば、情報管理装置100を管理するOSにより提供される。なお、トレース情報記憶部120に記憶されたトレース情報は、例えば、一定時間(1分程度)経過すると、次のトレース情報に上書きされる。
Here, the trace information includes information for identifying a process or thread and information indicating who is executing the process or thread. The trace information is provided by, for example, an OS that manages the
性能情報生成部130は、トレース情報記憶部120に記憶されたトレース情報に基づいて、性能情報を生成する。性能情報は、処理部110の処理状況を示し、例えば、応答速度や処理速度等を示す指標を含む。具体的には、性能情報は、例えば、書込要求数、書込要求サイズ、CPU消費率、メモリ使用量、IO稼働率等を含む。さらに、性能情報生成部130は、生成した性能情報と生成元のトレース情報とを対応付けて記憶する。
The performance
具体的には、性能情報生成部130は、変換部131と、トレース情報退避部132と、カウンタ133とを有している。さらに、変換部131は、トレース情報を性能情報に変換するための変換テーブルを記憶した変換テーブル記憶部134を有している。
Specifically, the performance
変換部131は、トレース情報記憶部120に記憶されたトレース情報に基づいて、変換テーブル記憶部134に記憶された変換テーブルを参照して、カウンタ133をカウントアップする変換操作を行う。なお、変換部131によるトレース情報の変換操作は、第1の期間(例えば、30秒)毎に実施される。このとき、変換部131は、直前の第1の期間(例えば、30秒)分のトレース情報を変換操作の対象としている。
Based on the trace information stored in the trace
トレース情報退避部132は、変換部131で変換操作の対象となった第1の期間分のトレース情報を記憶する。なお、トレース情報退避部132に記憶されたトレース情報は、記憶されてから所定の期間(例えば、10分)が経過すると、トレース情報退避部132から消去される。
The trace
カウンタ133は、性能情報を示す値を記憶するものであり、変換部131の変換操作に基づきカウントを行う。即ち、変換部131が第1の期間分のトレース情報に基づいてカウンタ133をカウントアップさせる変換操作を行うことで、カウンタ133に、第1の期間分の性能情報が生成されて記憶される。また、カウンタ133は、例えば、性能情報の種類別に設けられた複数のカウンタ部により構成されている。例えば、カウンタ133は、書込要求数を示すカウンタ部と、書込要求サイズを示すカウンタ部と、CPU消費率を示すカウンタ部等を含んでいる。
The
ここで、生成された第1の期間分の性能情報は、生成元となったトレース情報と対応付けられて記憶される。即ち、第1の期間分の性能情報から生成元となったトレース情報が特定できるようにしている。例えば、これは、第1の期間分の性能情報に、生成元となったトレース情報の検索キーを付与することで実現することが可能である。なお、カウンタ133は、例えば、変換部131が、第1の期間経過後、次の回の変換操作を開始すると、ゼロクリアされる。
Here, the generated performance information for the first period is stored in association with the trace information that is the generation source. That is, the trace information that is the generation source can be specified from the performance information for the first period. For example, this can be realized by adding a search key for the trace information that is the generation source to the performance information for the first period. Note that the
次に、性能情報生成部140は、カウンタ133が記憶した第1の期間分の性能情報を取得して蓄積し、蓄積した第1の期間分の性能情報群が第2の期間分に達していると、蓄積した第1の期間分の性能情報群を集計して第2の期間分の性能情報を生成する。そして、性能情報生成部140は、生成した第2の期間分の性能情報と集計元の第1の期間分の性能情報群とを対応付けて記憶する。
Next, the performance
具体的には、性能情報生成部140は、集計部141と、性能情報退避部142と、カウンタ143とを有している。集計部141は、性能情報生成部130のカウンタ133が記憶した第1の期間分の性能情報を、記憶される毎、即ち、第1の期間毎に取得して、第1の期間分の性能情報群を蓄積する。
Specifically, the performance
さらに、集計部141は、蓄積した第1の期間分の性能情報群が、第2の期間(例えば、10分)分に達していると、第1の期間分の性能情報群を、性能情報の種類毎、例えば、書込要求数、書込要求サイズ、CPU消費率毎に集計して1つにまとめる。これにより、第2の期間(例えば、10分間)分の性能情報が生成される。
Further, when the accumulated performance information group for the first period reaches the second period (for example, 10 minutes), the
なお、集計部141は、カウンタ133が記憶した第1の期間分の性能情報を取得することで、蓄積する第1の期間分の性能情報群が第2の期間分を超えた場合、一番古く蓄積した第1の期間分の性能情報を消去する。そして、今回取得された分を含めた第2の期間分の第1の性能情報群を、性能情報の種類毎に集計する。
Note that the totaling
性能情報退避部142は、集計部141で生成された第2の期間分の性能情報の集計元となった第1の期間分の性能情報群を記憶する。なお、性能情報退避部142に記憶された第1の期間分の性能情報群は、記憶されてから所定の期間(例えば、7日間)が経過すると、性能情報退避部142から消去される。
The performance
カウンタ143は、集計部141で生成された第2の期間分の性能情報を記憶する。ここで、第2の期間分の性能情報は、集計元となった第1の期間分の性能情報群と対応付けられて記憶される。即ち、第2の期間分の性能情報から集計元となった第1の期間分の性能情報群が特定できるようにしている。例えば、これは、第2の期間分の性能情報に、集計元となった第1の期間分の性能情報群の検索キーを付与することで実現することが可能である。なお、カウンタ143は、例えば、集計部141が、第1の期間経過後、次の回の集計を開始すると、ゼロクリアされる。
The
次に、事象検出部150は、カウンタ133に記憶された第1の期間分の性能情報と、カウンタ143に記憶された第2の期間分の性能情報とを比較し、比較結果に基づいて所定の事象を検出する。所定の事象とは、例えば、第2の期間分の性能情報に対して、第1の期間分の性能情報が異常値を示すような特異事象である。具体例としては、10分間のCPU消費率が20%未満とそれほど高くないにもかかわらず、30秒間の書込要求サイズが10MBを超えるような非常に大きい場合である。
Next, the
ここで、第1の期間分の性能情報が、第1の期間分よりも長い第2の期間分の大局的な性能情報に対して異常値を示すような場合は、その第1の期間における処理において、性能トラブルが発生している可能性が高いと考えられる。 Here, when the performance information for the first period shows an abnormal value for the global performance information for the second period longer than the first period, the performance information for the first period It is highly probable that a performance problem has occurred during processing.
ここでは、事象検出部150は、特異事象として識別される条件を記憶する条件記憶部151を有している。そして、この条件記憶部151に記憶された条件を参照して、比較結果から所定の事象を検出する。
Here, the
また、例えば、性能トラブルが発生した際に現れる事象が予め分かっていれば、この事象を識別する条件を条件記憶部151に記憶しておくことで、性能トラブルに伴う事象を検出する検出精度を向上させることが可能となる。
In addition, for example, if an event that appears when a performance trouble occurs is known in advance, a condition for identifying the event is stored in the
情報出力部160は、事象検出部150が所定の事象を検出すると、カウンタ143に記憶された第2の期間分の性能情報と、カウンタ133に記憶された第1の期間分の性能情報と、トレース情報退避部132に記憶された直前の第1の期間分のトレース情報とを取得する。さらに、情報出力部160は、取得した第2の期間分の性能情報、第1の期間分の性能情報、及び、トレース情報を、保存部170に出力する。
When the
なお、情報出力部160は、さらに、性能情報退避部142に記憶された直前の第1の期間分の性能情報群と、トレース情報記憶部120に記憶されたトレース情報とを取得し、保存部170に出力しても良い。
The
保存部170に保存された、第2の期間分の性能情報と、第1の期間分の性能情報と、トレース情報とは、例えば、図3に示す情報管理装置100のモニタ107に表示される。この時、例えば、第2の期間分の性能情報と、第1の期間分の性能情報と、トレース情報とが、互いに対応付けられて表示される。
The performance information for the second period, the performance information for the first period, and the trace information stored in the
次に、トレース情報記憶部120が記憶するトレース情報について説明する。
図5〜図7は、トレース情報の一例を示す図である。
処理部110のAPI層111の処理履歴を示すトレース情報121は、例えば、図5に示される。トレース情報121は、処理が実行された時間(TIME)と、処理プロセス及びスレッドを特定するプロセスID及びスレッドIDとを含む。さらに、トレース情報121は、処理の実行が誰によるものかを示す呼出元アドレスと、処理の依頼の履歴か、又は、処理の応答の履歴かを特定する区分と、処理の種類を示す機能名と、処理内容を示すパラメタとを含む。
Next, the trace information stored in the trace
5 to 7 are diagrams illustrating examples of trace information.
The
例えば、プログラムA(プロセスN1、スレッドM1)がファイルAに32MBの書き込みを行う場合、トレース情報121の最上欄に示されるように、TIMEに処理が実行された時間が記憶され、プロセスIDに「N1」、スレッドIDに「M1」が記憶される。さらに、呼出元アドレスにこの処理の呼出元アドレスである「xxx1」が記憶され、区分に「call」が記憶され、機能名に「fwrite」が記憶され、パラメタに「ファイルA,1,32M,1」等が記憶される。
For example, when the program A (process N1, thread M1) writes 32 MB to the file A, as shown in the uppermost column of the
処理部110のキャッシュ層112の処理履歴を示すトレース情報122は、例えば、図6に示される。トレース情報122は、処理が実行された時間(TIME)と、処理プロセス及びスレッドの依頼元を特定する依頼元プロセスID及び依頼元スレッドIDとを含む。さらに、トレース情報122は、処理の実行が誰によるものかを示す呼出元アドレスと、処理の依頼の履歴か、又は、処理の応答の履歴かを特定する区分と、処理の種類を示す機能名と、処理内容を示すパラメタとを含む。
The
処理部110のIO層113の処理履歴を示すトレース情報123は、例えば、図7に示される。トレース情報123は、処理が実行された時間(TIME)と、処理プロセス及びスレッドの依頼元を特定する依頼元プロセスID及び依頼元スレッドIDとを含む。さらに、トレース情報123は、処理の実行が誰によるものかを示す呼出元アドレスと、処理の依頼の履歴か、又は、処理の応答の履歴かを特定する区分と、処理の種類を示す機能名と、処理内容を示すパラメタとを含む。
The
次に、変換テーブル記憶部134に記憶されている変換テーブルについて説明する。図8は、変換テーブルの一例を示す図である。変換テーブルは処理部110内の各層別に区分れている。ここでは、変換テーブルは、例えば、API層、キャッシュ層、IO層に区分されている。さらに、変換テーブルには、各層別に、変換対象となるトレース情報の機能名、カウンタ133における変換先のカウンタ部、変換操作内容が設けられている。
Next, the conversion table stored in the conversion
API層の欄については、例えば、機能名が書き込みを示す「fwrite」であり、変換先カウンタ部が、書込要求数(全体)、書込要求数(プロセス)、書込要求サイズ(全体)、書込要求サイズ(プロセス)である。さらに、変換操作内容が、「書込要求数(全体)に1を加える」、「書込要求数(プロセスID)に1を加える」、「書込要求サイズ(全体)に第3パラメタを加える」、「書込要求サイズ(プロセスID)に第3パラメタを加える」である。 In the API layer column, for example, the function name is “fwrite” indicating writing, and the conversion destination counter unit has the number of write requests (whole), the number of write requests (process), and the write request size (whole). Write request size (process). Furthermore, the contents of the conversion operation are “add 1 to the number of write requests (total)”, “add 1 to the number of write requests (process ID)”, and add the third parameter to the write request size (total). And “Add third parameter to write request size (process ID)”.
キャッシュ層の欄については、例えば、機能名が書き込みを示す「cwrite」であり、変換先カウンタ部が、書込要求数(論理装置)、書込要求サイズ(論理装置)である。さらに、変換操作内容が、「書込要求数(論理装置)に1を加える」、「書込要求サイズ(論理装置)に第3パラメタを加える」である。 In the cache layer column, for example, the function name is “cwrite” indicating writing, and the conversion destination counter unit is the number of write requests (logical device) and the write request size (logical device). Furthermore, the contents of the conversion operation are “add 1 to the number of write requests (logical device)” and “add the third parameter to the write request size (logical device)”.
IO層の欄については、例えば、機能名が書き込みを示す「iowrite」であり、変換先カウンタ部が、書込要求数(物理装置)、書込要求サイズ(物理装置)である。さらに、変換操作内容が、「書込要求数(物理装置)に1を加える」、「書込要求サイズ(物理装置)に第3パラメタを加える」である。 In the IO layer column, for example, the function name is “iowrite” indicating writing, and the conversion destination counter unit is the number of write requests (physical device) and the write request size (physical device). Furthermore, the contents of the conversion operation are “add 1 to the number of write requests (physical device)” and “add the third parameter to the write request size (physical device)”.
例えば、機能名が「fwrite」のAPI層111に対応するトレース情報に対しては、変換テーブル(API層)に基づいて、次の通り変換操作が行われる。即ち、カウンタ133における書込要求数(全体)を示すカウンタ部、及び、書込要求数(プロセスID)を示すカウンタ部にそれぞれ1が加えられる。さらに、カウンタ133における書込要求サイズ(全体)を示すカウンタ部、及び、書込要求サイズ(プロセスID)を示すカウンタ部にそれぞれに書込情報のサイズが加えられる。
For example, the following conversion operation is performed on the trace information corresponding to the
次に、カウンタ133に記憶される第1の期間分の性能情報について説明する。図9は、第1の期間分の性能情報の一例を示す図である。
第1の期間分の性能情報では、性能情報の種類毎、即ち、カウンタ部毎に、それぞれカウンタ値が対応付けられている。ここでは、性能情報の種類に、例えば、プロセス全体の書込要求数及び書込要求サイズ、プロセスIDの書込要求数及び書込要求サイズ、論理装置の書込要求数及び書込要求サイズ、物理装置の書込要求数及び書込要求サイズを含んでいる。これらのそれぞれに対して、カウンタ値、及び、単位時間当たりのカウンタ値が対応付けられている。
Next, the performance information for the first period stored in the
In the performance information for the first period, a counter value is associated with each type of performance information, that is, for each counter unit. Here, the types of performance information include, for example, the number of write requests and the write request size of the entire process, the number of write requests and the write request size of the process ID, the number of write requests and the write request size of the logical device, It includes the number of physical device write requests and the write request size. Each of these is associated with a counter value and a counter value per unit time.
さらに、第1の期間分の性能情報は、当該性能情報の生成に要した期間を示す生成期間を含んでいる。図9に示される例では、第1の期間が30秒間なので、生成期間が30秒を示している。また、第1の期間分の性能情報には、生成時刻が付与されている。例えば、この生成時刻を、対応するトレース情報を検索する際の検索キーとすることも可能である。 Furthermore, the performance information for the first period includes a generation period indicating a period required to generate the performance information. In the example shown in FIG. 9, since the first period is 30 seconds, the generation period is 30 seconds. Moreover, the generation time is given to the performance information for the first period. For example, this generation time can be used as a search key when searching for the corresponding trace information.
次に、カウンタ143に記憶される第2の期間分の性能情報について説明する。図10は、第2の期間分の性能情報の一例を示す図である。
第2の期間分の性能情報も、図9に示される第1の期間分の性能情報と同様の形式を備えている。図10に示される例では、第2の期間が10分間、即ち、600秒間なので、生成期間が600秒を示している。また、第2の期間分の性能情報にも、生成時刻が付与されている。例えば、この生成時刻を、対応する第1の性能情報群を検索する際の検索キーとすることも可能である。
Next, the performance information for the second period stored in the
The performance information for the second period also has the same format as the performance information for the first period shown in FIG. In the example shown in FIG. 10, since the second period is 10 minutes, that is, 600 seconds, the generation period is 600 seconds. The generation time is also given to the performance information for the second period. For example, this generation time can be used as a search key when searching for the corresponding first performance information group.
次に、情報管理装置100の処理手順について説明する。図11、図12は、第2の実施形態に係る情報管理装置の処理手順の一例を示すフローチャートである。まず、図11を用いて説明する。
Next, a processing procedure of the
第1の期間(例えば、30秒間)毎に処理が開始する。
[ステップS110]変換部131が、トレース情報記憶部120に記憶されている第1の期間分のトレース情報に基づいて、カウンタ133をカウントアップして、第1の期間分の性能情報を生成する。このとき、変換部131は、例えば、変換テーブル記憶部134に記憶されている変換テーブルを参照する。
The process starts every first period (for example, 30 seconds).
[Step S110] The
[ステップS120]トレース情報退避部132が、ステップS110で生成された第1の期間分の性能情報の生成元となった第1の期間分のトレース情報を記憶する。
[ステップS130]カウンタ133が、ステップS110で生成された第1の期間分の性能情報を、生成元となったトレース情報と対応付けて記憶する。
[Step S120] The trace
[Step S130] The
[ステップS140]集計部141が、ステップS130で第1の期間分の性能情報がカウンタ133に記憶されると、カウンタ133から第1の期間分の性能情報を取得して蓄積する。次のステップからは図12を用いて説明する。
[Step S140] When the performance information for the first period is stored in the
[ステップS150]集計部141が、ステップS140で蓄積した第1の期間分の性能情報群が第2の期間(例えば、10分間)分に達しているかどうかを判定する。達している場合は処理をステップS160に進める。達していない場合は処理を終了する。
[Step S150] The
[ステップS160]集計部141が、第1の期間分の性能情報群を集計して第2の期間分の性能情報を生成する。
[ステップS170]性能情報退避部142が、ステップS160で生成された第2の期間分の性能情報の集計元となった第1の期間分の性能情報群を記憶する。
[Step S160] The totaling
[Step S170] The performance
[ステップS180]カウンタ143が、ステップS160で生成された第2の期間分の性能情報を、集計元となった第1の期間分の性能情報群と対応付けて記憶する。
[ステップS190]事象検出部150が、ステップS130でカウンタ133に記憶された第1の期間分の性能情報と、ステップS180でカウンタ143に記憶された第2の期間分の性能情報とを比較する。
[Step S180] The
[Step S190] The
[ステップS200]事象検出部150が、ステップS190の比較結果に基づいて所定の事象を検出する。このとき、事象検出部150は、例えば、条件記憶部151に記憶されている条件を参照して、所定の事象を検出する。所定の事象が検出された場合、処理をステップS210に進める。所定の事象が検出されない場合、処理を終了する。
[Step S200] The
[ステップS210]情報出力部160が、ステップS180でカウンタ143に記憶された第2の性能情報、ステップS130でカウンタ133に記憶された第1の性能情報、ステップS120でトレース情報退避部132に記憶されたトレース情報を、保存部170に出力する。これで処理を終了する。なお、この時、情報出力部160が、さらに、ステップS170で性能情報退避部142に記憶された第1の期間分の性能情報群、及び、トレース情報記憶部120に記憶されたトレース情報を、保存部170に出力しても良い。なお、性能トラブルの原因の調査は、保存部170に保存された第2の期間分の性能情報、第1の期間分の性能情報群、及び、トレース情報を調査することで行われる。
[Step S210] The
ここで、保存部170に保存された情報から、ある性能トラブルの原因を調査する一例を説明する。図13〜図16は、調査の一例を説明する図である。
図13には、カウンタ133が記憶する30秒間の性能情報と、カウンタ143が記憶する10分間の性能情報とが示されている。図13に示すように、事象検出部150により、30秒間の性能情報と10分間の性能情報とから、10分間のCPU消費率が11%とそれほど高くないにもかかわらず、30秒間の磁気ディスク#1の書込要求サイズが18MB/秒である特異事象が検出されたとする。ここで、磁気ディスク#1は、磁気ディスクが有する領域の一部を指すものである。
Here, an example of investigating the cause of a certain performance trouble from the information stored in the
FIG. 13 shows the 30-second performance information stored in the
この特異事象が検出されると、情報出力部160が、検出元になった第1の期間分の性能情報をカウンタ133から取得し、さらに、この第1の期間分の性能情報に対応するトレース情報をトレース情報退避部132から取得する。そして、情報出力部160は、取得した第1の期間分の性能情報と、トレース情報とを、保存部170に出力する。
When this peculiar event is detected, the
事象検出部150にて特異事象が検出されると、情報管理装置100は、例えば、図3に示されるモニタ108にアラーム情報を表示する等して、特異事象が検出されたことをユーザに報知する。ユーザは、情報管理装置100からの特異事象の報知に基づき、保存部170の調査を行う。なお、ユーザは、情報管理装置100からの報知によらずに、定期的に保存部170の調査を行っても良いし、情報管理装置100の操作中に動作速度が遅くなる等の不具合を感知することで、調査を行っても良い。
When the
保存部170の調査を行う場合、ユーザは、30秒間の性能情報に対応付けされた同時間帯のトレース情報を参照して分析する。図14は、対応するIO層のトレース情報である。図14に示すトレース情報123には、磁気ディスク#1への書き込みが記憶されている。今回の特異事象は書込要求サイズに関するものであるため、書き込みのトレース情報(機能名:iowrite)から、書き込み対象のキャッシュバッファを全て抽出する。ここでは、キャッシュバッファ#2、#3、#4が抽出された。ここで、各キャッシュバッファ#2〜#4はそれぞれ、キャッシュバッファが有する領域の一部を指すものである。
When investigating the
次に、ユーザは、抽出したキャッシュバッファ#2〜#4を元に、同時間帯のキャッシュ層112のトレース情報122を調査する。このトレース情報122に抽出したキャッシュバッファ#2〜#4が検出されなければ、前の30秒間分のトレース情報122やそれ以前の30秒間分のトレース情報122にも遡って調査する。ここでは、前の30秒間のキャッシュ層112のトレース情報122に、抽出したキャッシュバッファ#2〜#4が検出された。図15は、そのキャッシュ層のトレース情報である。
Next, the user investigates the
次に、ユーザは、キャッシュバッファ#2〜#4が検出されたキャッシュ層112のトレース情報122と同時間帯のAPI層111のトレース情報121を解析する。図16は、そのAPI層のトレース情報である。すると、キャッシュバッファ#2〜#4が検出された同時間に、対応するプロセス/スレッドから、1回で32MBもの「fwrite」を発行していることが検出された。呼出元アドレスに基づいてプロセスの開発元に照会したところ、プログラム動作環境パラメタの設定ミスにより不当なサイズでファイルの初期獲得が実施された結果、今回の事象が発生したことが判明した。
Next, the user analyzes the
このように、情報管理装置100は、第1の期間分の性能情報と生成元のトレース情報とを対応付けて記憶し、第1の期間分の性能情報に所定の事象が検出された場合、記憶した第1の期間分の性能情報とトレース情報とを保存部170に出力する。
As described above, the
これにより、性能トラブルの原因を調査する際、トレース情報にまで遡って調査を行うことが可能となる。トレース情報は、処理プロセスやスレッドを特定する情報や、処理の実行が誰によるものかを示す情報を含んでいるため、トレース情報を調査することで、性能トラブルの原因が誰のどのような処理によるものかを、短時間で特定することが可能となる。 As a result, when investigating the cause of a performance problem, it is possible to investigate retroactively to the trace information. Trace information includes information that identifies the processing process and thread, and information that indicates who executed the processing. Therefore, by examining the trace information, what kind of processing causes the performance problem. It is possible to specify whether or not it is due to a short time.
さらに、情報管理装置100では、第1の期間分の性能情報からの所定の事象の検出は、第1の期間分の性能情報と、第1の期間分の性能情報を第2の期間分蓄積して集計した第2の期間分の性能情報とを比較することで行われる。これにより、第1の期間分の性能情報の局所的な異常値を検出することが可能となり、検出精度を向上させることが可能となる。
Furthermore, in the
さらに、情報管理装置100では、保存部170に保存される第2の期間分の性能情報、第1の期間分の性能情報、及びトレース情報は、所定の事象が検出された情報のみなので、調査の対象を絞ることが可能となり、調査時間をさらに短縮することが可能となる。また、この構成によれば、保存部170の記憶容量を小さく設定することが可能となる。
Furthermore, in the
なお、以上の処理は、前述した通り、コンピュータに所定のプログラムを実行させることで実現できる。その場合、実現すべき処理内容を記述したプログラムが提供される。処理内容を記述したプログラムは、コンピュータ読み取り可能な記録媒体に記録しておくことができる。コンピュータ読み取り可能な記録媒体には、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリがある。磁気記録装置には、ハードディスク装置、フレキシブルディスク(FD)、磁気テープ(MT)等がある。光ディスクには、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc ? Read Only Memory)、CD−R(Recordable)、CD−RW(ReWritable)等がある。光磁気記録媒体には、MO(Magneto-Optical disk)等がある。 The above processing can be realized by causing a computer to execute a predetermined program as described above. In that case, a program describing the processing contents to be realized is provided. The program describing the processing contents can be recorded on a computer-readable recording medium. Examples of the computer-readable recording medium include a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory. Examples of the magnetic recording device include a hard disk device, a flexible disk (FD), and a magnetic tape (MT). Optical discs include DVD (Digital Versatile Disc), DVD-RAM, CD-ROM (Compact Disc? Read Only Memory), CD-R (Recordable), CD-RW (ReWritable), and the like. Magneto-optical recording media include MO (Magneto-Optical disk).
プログラムを流通させる場合、例えば、そのプログラムが記録されたDVD、CD−ROM等の可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにプログラムを転送することもできる。 When distributing the program, for example, a portable recording medium such as a DVD or a CD-ROM in which the program is recorded is sold. It is also possible to store the program in a storage device of a server computer and transfer the program from the server computer to another computer via a network.
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラム又はサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送される毎に、逐次、受け取ったプログラムに従った処理を実行することもできる。 The computer that executes the program stores, for example, the program recorded on the portable recording medium or the program transferred from the server computer in its own storage device. Then, the computer reads the program from its own storage device and executes processing according to the program. The computer can also read the program directly from the portable recording medium and execute processing according to the program. In addition, each time the program is transferred from the server computer, the computer can sequentially execute processing according to the received program.
10 情報管理装置
11 処理部
12 トレース情報記憶部
13 生成部
14 検出部
15 出力部
DESCRIPTION OF
Claims (9)
処理を実行する処理部のトレース情報と、第1及び第2のカウンタのカウントアップ条件とを対応付けた変換テーブルに基づき、第1の期間毎に前記処理部のトレース情報に応じて前記第1のカウンタをカウントアップしたカウント値を第1の性能情報として記憶し、前記第1の期間より長い第2の期間毎に前記処理部のトレース情報に応じて前記第2のカウンタをカウントアップしたカウント値を第2の性能情報として記憶し、Based on the conversion table in which the trace information of the processing unit that executes the process and the count-up conditions of the first and second counters are associated, the first information according to the trace information of the processing unit for each first period. The count value obtained by counting up the counter is stored as first performance information, and the second counter is counted up according to the trace information of the processing unit every second period longer than the first period. Store the value as second performance information,
前記第2の性能情報に対応する前記処理部の処理状況と、前記第1の性能情報に対応する前記処理部の処理状況とを比較した結果に基づいて所定の事象を検出する A predetermined event is detected based on a result of comparing the processing status of the processing unit corresponding to the second performance information and the processing status of the processing unit corresponding to the first performance information.
処理を実行させる、情報管理プログラム。 An information management program that executes processing.
前記所定の事象を検出すると、検出元になった前記第1の性能情報と該第1の性能情報に対応する前記トレース情報とを出力する処理をさらに実行させる
請求項1に記載の情報管理プログラム。 Before Symbol generator of the first performance information in advance in association with trace information,
Upon detection of a pre-Symbol predetermined event, further to execute a process of outputting said trace information corresponding to become detection source the first performance information and the first performance information
The information management program according to claim 1.
請求項2に記載の情報管理プログラム。 The second performance information, that is obtained by aggregating a plurality of said performance information including the first performance information
Information management program according to 請 Motomeko 2.
請求項2又は3に記載の情報管理プログラム。 In the process of the output, and the trace information corresponding to the became detection source first performance information and said first performance information, you output the storage unit
Information management program according to 請 Motomeko 2 or 3.
請求項1〜4のいずれか1つに記載の情報管理プログラム。 Wherein at least one of the first and second performance information, including an indication that at least one of the response speed and processing speed
Information management program according to any one of 請 Motomeko 1-4.
請求項5に記載の情報管理プログラム。 Wherein at least one of the first and second performance information, the number of write requests, and, including the write request size
Information management program according to 請 Motomeko 5.
請求項1〜6のいずれか1つに記載の情報管理プログラム。The information management program as described in any one of Claims 1-6.
処理を実行する処理部のトレース情報と、第1及び第2のカウンタのカウントアップ条件とを対応付けた変換テーブルに基づき、第1の期間毎に前記処理部のトレース情報に応じて前記第1のカウンタをカウントアップしたカウント値を第1の性能情報として前記記憶装置に記憶し、前記第1の期間より長い第2の期間毎に前記処理部のトレース情報に応じて前記第2のカウンタをカウントアップしたカウント値を第2の性能情報として前記記憶装置に記憶し、Based on the conversion table in which the trace information of the processing unit that executes the process and the count-up conditions of the first and second counters are associated, the first information according to the trace information of the processing unit for each first period. The count value obtained by counting up the counter is stored in the storage device as first performance information, and the second counter is set according to the trace information of the processing unit every second period longer than the first period. Store the counted up count value as second performance information in the storage device,
前記第2の性能情報に対応する前記処理部の処理状況と、前記第1の性能情報に対応する前記処理部の処理状況とを比較した結果に基づいて所定の事象を検出する A predetermined event is detected based on a result of comparing the processing status of the processing unit corresponding to the second performance information and the processing status of the processing unit corresponding to the first performance information.
処理を実行する、情報管理方法。 An information management method that executes processing.
前記第2の性能情報に対応する前記処理部の処理状況と、前記第1の性能情報に対応する前記処理部の処理状況とを比較した結果に基づいて所定の事象を検出する検出部と、 A detection unit for detecting a predetermined event based on a result of comparing the processing status of the processing unit corresponding to the second performance information and the processing status of the processing unit corresponding to the first performance information;
を有する、情報管理装置。 An information management device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009227467A JP5313101B2 (en) | 2009-09-30 | 2009-09-30 | Information management program, information management method, and information management apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009227467A JP5313101B2 (en) | 2009-09-30 | 2009-09-30 | Information management program, information management method, and information management apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011076389A JP2011076389A (en) | 2011-04-14 |
JP5313101B2 true JP5313101B2 (en) | 2013-10-09 |
Family
ID=44020303
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009227467A Expired - Fee Related JP5313101B2 (en) | 2009-09-30 | 2009-09-30 | Information management program, information management method, and information management apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5313101B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014149606A (en) * | 2013-01-31 | 2014-08-21 | Fujitsu Ltd | Resource usage totaling program, resource usage totaling method and resource usage totaling device |
WO2015181921A1 (en) * | 2014-05-28 | 2015-12-03 | 三菱電機株式会社 | Programmable display device and rendering software |
JP6349983B2 (en) * | 2014-06-06 | 2018-07-04 | 富士通株式会社 | Abnormality detection method, abnormality detection program, and abnormality detection device |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04355455A (en) * | 1991-05-31 | 1992-12-09 | Iwasaki Electric Co Ltd | Display structure of mark in print plate |
JPH09282283A (en) * | 1996-04-16 | 1997-10-31 | Hitachi Ltd | Tracing method and performance evaluation method for on-line transaction, and on-line transaction processing system |
JP2004005198A (en) * | 2002-05-31 | 2004-01-08 | Nec Corp | Computerized analysis display method and measurement analysis display device |
JP4449929B2 (en) * | 2006-03-16 | 2010-04-14 | 日本電気株式会社 | Transaction apparatus, delay fault detection apparatus and method, and program |
JP2008021062A (en) * | 2006-07-12 | 2008-01-31 | Mitsubishi Electric Corp | Monitoring apparatus, monitoring method and monitoring program |
JP4151985B2 (en) * | 2006-07-19 | 2008-09-17 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Technology to detect information processing devices that have malfunctioned |
JP2008090699A (en) * | 2006-10-04 | 2008-04-17 | Hitachi Ltd | Method, apparatus and program of trace logging |
US7974800B2 (en) * | 2006-12-12 | 2011-07-05 | International Business Machines Corporation | Method, apparatus, and program for detecting the correlation between repeating events |
JP5249569B2 (en) * | 2007-12-11 | 2013-07-31 | 株式会社日本総合研究所 | Business performance monitoring system and method |
-
2009
- 2009-09-30 JP JP2009227467A patent/JP5313101B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011076389A (en) | 2011-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8839271B2 (en) | Call stack sampling to obtain information for analyzing idle states in a data processing system | |
JP5423904B2 (en) | Information processing apparatus, message extraction method, and message extraction program | |
US9110780B2 (en) | Memory utilization analysis | |
US8181161B2 (en) | System for automatically collecting trace detail and history data | |
US7472039B2 (en) | Program, apparatus, and method for analyzing processing activities of computer system | |
US20070089094A1 (en) | Temporal sample-based profiling | |
US7941742B1 (en) | Visualizing growing time series data in a single view | |
US20080148241A1 (en) | Method and apparatus for profiling heap objects | |
US8140919B2 (en) | Display of data used for system performance analysis | |
JP5313101B2 (en) | Information management program, information management method, and information management apparatus | |
WO2016165542A1 (en) | Method for analyzing cache hit rate, and device | |
KR20060113551A (en) | Method and apparatus for time correlating defects found on hard disks | |
JP6238221B2 (en) | Apparatus, method and program for monitoring execution of software | |
US20100174947A1 (en) | Damaged software system detection | |
US20100191508A1 (en) | Detecting and Recording Performance Events in a Data Processing System | |
CN112783711A (en) | Method and storage medium for analyzing program memory on NodeJS | |
US8930661B2 (en) | Operation processing device and method of detecting memory leak | |
US20120047504A1 (en) | Methods, systems, and computer program products for maintaining a resource based on a cost of energy | |
JP2009134535A (en) | Device for supporting software development, method of supporting software development, and program for supporting software development | |
KR101484783B1 (en) | Digital video recorder and hard disc management method | |
JP2004288017A (en) | Database retrieval system and method | |
JP2012168702A (en) | Log analysis device and log analysis method | |
TWI705370B (en) | Program execution analysis system and method thereof | |
US8645774B2 (en) | Expedited memory drive self test | |
JP7111965B2 (en) | Information processing method, information processing device, and information processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111215 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130326 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130524 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130702 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130703 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5313101 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |