JP2011076389A - Information management program, information management method and information management device - Google Patents

Information management program, information management method and information management device Download PDF

Info

Publication number
JP2011076389A
JP2011076389A JP2009227467A JP2009227467A JP2011076389A JP 2011076389 A JP2011076389 A JP 2011076389A JP 2009227467 A JP2009227467 A JP 2009227467A JP 2009227467 A JP2009227467 A JP 2009227467A JP 2011076389 A JP2011076389 A JP 2011076389A
Authority
JP
Japan
Prior art keywords
information
performance information
performance
trace
period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009227467A
Other languages
Japanese (ja)
Other versions
JP5313101B2 (en
Inventor
Takayuki Matsui
孝行 松井
Satoshi Ogiwara
聡 荻原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Frontech Ltd filed Critical Fujitsu Frontech Ltd
Priority to JP2009227467A priority Critical patent/JP5313101B2/en
Publication of JP2011076389A publication Critical patent/JP2011076389A/en
Application granted granted Critical
Publication of JP5313101B2 publication Critical patent/JP5313101B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To reduce a time period required for identifying the cause of performance trouble. <P>SOLUTION: An information management program makes a computer to execute as: a generation means for generating performance information which indicates the processing status of a processing unit, on the basis of trace information of the processing unit for executing processing to associate the performance information with trace information which is a generation source; a detection means for detecting a predetermined event, on the basis of the generated performance information; and an output means for outputting the performance information which is a detection source and the trace information corresponding to the performance information, when the predetermined event is detected. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、情報を管理する情報管理プログラム、情報管理方法、及び、情報管理装置に関する。   The present invention relates to an information management program for managing information, an information management method, and an information management apparatus.

プログラムに基づき所定の処理を実行する処理部を備える処理装置に関して、処理部における性能トラブル、例えば、一部のプロセスの一時的なレスポンスの劣化等の原因を調査する方法として、処理部における処理状況を示す性能情報を解析する方法がある。   Regarding a processing device including a processing unit that executes predetermined processing based on a program, the processing status in the processing unit as a method for investigating the cause of performance troubles in the processing unit, for example, temporary response deterioration of some processes, etc. There is a method of analyzing performance information indicating

性能情報は、例えば、処理装置を管理するOS(Operating System)により提供される情報であり、具体的には、処理部を監視するカウンタが、処理部でのプロセスの実行により発生する、例えば、書込要求数や書込要求サイズ等をカウントすることで生成されている。   The performance information is, for example, information provided by an OS (Operating System) that manages the processing device. Specifically, a counter that monitors the processing unit is generated by executing a process in the processing unit. It is generated by counting the number of write requests, the write request size, and the like.

特開2006−227999号公報JP 2006-227999 A 特開平6−59944号公報JP-A-6-59944 特開2002−288005号公報JP 2002-288005 A

しかしながら、カウンタでは実行されたプロセスを特定する情報やプロセスの実行が誰によるものかを特定するような情報は生成されないため、性能情報を解析しても、性能トラブルが誰のどのような処理によるものかを特定することができなかった。このため、性能トラブルの種類によっては、原因を特定するまでに多大な時間を要してしまう可能性があった。   However, the counter does not generate information that identifies the process that was executed or information that identifies who the process was executed by. I couldn't determine what it was. For this reason, depending on the type of performance trouble, it may take a long time to identify the cause.

このような点に鑑み、性能トラブルの原因の特定に要する時間の短縮を図る、情報管理プログラム、情報管理方法、及び、情報管理装置を提供することを目的とする。   In view of these points, an object of the present invention is to provide an information management program, an information management method, and an information management apparatus that can reduce the time required to identify the cause of a performance problem.

上記目的を達成するために以下のような情報管理プログラムが提供される。
この情報管理プログラムは、コンピュータを、処理を実行する処理部のトレース情報に基づいて処理部の処理状況を示す性能情報を生成し、性能情報と生成元のトレース情報とを対応付ける生成手段、生成した性能情報に基づいて所定の事象を検出する検出手段、所定の事象を検出すると、検出元になった性能情報と性能情報に対応するトレース情報とを出力する出力手段、として実行させる。
In order to achieve the above object, the following information management program is provided.
The information management program generates performance information indicating the processing status of the processing unit based on the trace information of the processing unit that executes the process, and generates a generation unit that associates the performance information with the trace information of the generation source. It is executed as detection means for detecting a predetermined event based on performance information, and as output means for outputting performance information as a detection source and trace information corresponding to the performance information when a predetermined event is detected.

開示の情報管理プログラムによれば、性能トラブルの原因の特定に要する時間の短縮を図ることが可能となる。   According to the disclosed information management program, it is possible to reduce the time required to identify the cause of the performance trouble.

第1の実施形態に係る情報管理装置の一例を示す図。The figure which shows an example of the information management apparatus which concerns on 1st Embodiment. 第1の実施形態に係る情報管理装置の処理手順の一例を示すフローチャート。5 is a flowchart illustrating an example of a processing procedure of the information management apparatus according to the first embodiment. 第2の実施形態に係る情報管理装置のハードウェアの一例を示すブロック図。The block diagram which shows an example of the hardware of the information management apparatus which concerns on 2nd Embodiment. 第2の実施形態に係る情報管理装置の機能の一例を示すブロック図。The block diagram which shows an example of the function of the information management apparatus which concerns on 2nd Embodiment. トレース情報の一例を示す図。The figure which shows an example of trace information. トレース情報の一例を示す図。The figure which shows an example of trace information. トレース情報の一例を示す図。The figure which shows an example of trace information. 変換テーブルの一例を示す図。The figure which shows an example of a conversion table. 第1の期間分の性能情報の一例を示す図。The figure which shows an example of the performance information for the 1st period. 第2の期間分の性能情報の一例を示す図。The figure which shows an example of the performance information for the 2nd period. 第2の実施形態に係る情報管理装置の処理手順の一例を示すフローチャート。9 is a flowchart illustrating an example of a processing procedure of the information management apparatus according to the second embodiment. 第2の実施形態に係る情報管理装置の処理手順の一例を示すフローチャート。9 is a flowchart illustrating an example of a processing procedure of the information management apparatus according to the second embodiment. 調査の一例を説明する図。The figure explaining an example of investigation. 調査の一例を説明する図。The figure explaining an example of investigation. 調査の一例を説明する図。The figure explaining an example of investigation. 調査の一例を説明する図。The figure explaining an example of investigation.

以下、実施形態を図面を参照して説明する。
[第1の実施形態]
図1は、第1の実施形態に係る情報管理装置の一例を示す図である。情報管理装置10は、処理部11と、トレース情報記憶部12と、生成部13と、検出部14と、出力部15とを有する。
Hereinafter, embodiments will be described with reference to the drawings.
[First Embodiment]
FIG. 1 is a diagram illustrating an example of an information management apparatus according to the first embodiment. The information management apparatus 10 includes a processing unit 11, a trace information storage unit 12, a generation unit 13, a detection unit 14, and an output unit 15.

処理部11は、プログラムに基づいて所定の処理を実行する。トレース情報記憶部12は、処理部11における処理の履歴を示すトレース情報を記憶する。ここで、トレース情報は、処理を特定する情報や、処理の実行が誰によるものかを示す情報を含んでいる。また、トレース情報は、例えば、情報管理装置10を管理するOS(Operating System)により提供される。   The processing unit 11 executes predetermined processing based on the program. The trace information storage unit 12 stores trace information indicating a history of processing in the processing unit 11. Here, the trace information includes information specifying the process and information indicating who executed the process. The trace information is provided by, for example, an OS (Operating System) that manages the information management apparatus 10.

生成部13は、トレース情報記憶部12に記憶されたトレース情報に基づいて、性能情報を生成する。性能情報は、処理部11の処理状況を示す情報であり、例えば、応答速度や処理速度等を示す指標を含む。例えば、性能情報は、書込要求数、書込要求サイズ、CPU消費率、メモリ使用量、IO稼働率、読込要求数、読込要求サイズ等を含む。さらに、生成部13は、生成した性能情報と生成元のトレース情報とを対応付ける。   The generation unit 13 generates performance information based on the trace information stored in the trace information storage unit 12. The performance information is information indicating the processing status of the processing unit 11 and includes, for example, an index indicating a response speed, a processing speed, and the like. For example, the performance information includes the number of write requests, the write request size, the CPU consumption rate, the memory usage, the IO operation rate, the number of read requests, the read request size, and the like. Furthermore, the generation unit 13 associates the generated performance information with the generation source trace information.

検出部14は、生成部13が生成した性能情報に基づいて、所定の事象を検出する。所定の事象とは、例えば、通常の状態とは大きく異なる異常状態を示す特異事象である。多くの場合、この特異事象は、性能トラブルの現象となって現れる。   The detection unit 14 detects a predetermined event based on the performance information generated by the generation unit 13. The predetermined event is, for example, a specific event indicating an abnormal state that is significantly different from the normal state. In many cases, this unique event appears as a phenomenon of performance trouble.

出力部15は、検出部14が所定の事象を検出すると、検出元になった性能情報と、この性能情報に対応するトレース情報とを、例えば、保存部や表示装置の表示画面等(図示せず)に出力する。   When the detection unit 14 detects a predetermined event, the output unit 15 displays performance information that is a detection source and trace information corresponding to the performance information, for example, a display screen of a storage unit or a display device (not illustrated). Output).

なお、情報管理装置10は、処理部11及びトレース情報記憶部12を必ずしも有している必要はない。例えば、情報管理装置10とネットワーク等で接続された外部の処理装置に、処理部11及びトレース情報記憶部12を設定することも可能である。この場合、情報管理装置10は、ネットワーク等を介して外部の処理装置からトレース情報を取得する。   The information management apparatus 10 does not necessarily have the processing unit 11 and the trace information storage unit 12. For example, the processing unit 11 and the trace information storage unit 12 can be set in an external processing device connected to the information management device 10 via a network or the like. In this case, the information management apparatus 10 acquires trace information from an external processing apparatus via a network or the like.

次に、この情報管理装置10の動作について説明する。図2は、第1の実施形態に係る情報管理装置の処理手順の一例を示すフローチャートである。
[ステップS11]処理を開始すると、生成部13が、トレース情報記憶部12に記憶されているトレース情報に基づいて性能情報を生成する。
Next, the operation of the information management apparatus 10 will be described. FIG. 2 is a flowchart illustrating an example of a processing procedure of the information management apparatus according to the first embodiment.
[Step S11] When processing is started, the generation unit 13 generates performance information based on the trace information stored in the trace information storage unit 12.

[ステップS12]生成部13が、ステップS11で生成された性能情報と、生成元のトレース情報とを対応付ける。
[ステップS13]検出部14が、ステップS11で生成された性能情報に基づいて、所定の事象を検出する。所定の事象を検出した場合、処理をステップS14に進める。所定の事象が検出されない場合は、処理を終了する。
[Step S12] The generation unit 13 associates the performance information generated in step S11 with the trace information of the generation source.
[Step S13] The detection unit 14 detects a predetermined event based on the performance information generated in step S11. If a predetermined event is detected, the process proceeds to step S14. If the predetermined event is not detected, the process is terminated.

[ステップS14]ステップS13で、検出部14が所定の事象を検出した場合、出力部15が、検出元になった性能情報と、この性能情報に対応するトレース情報とを出力して処理を終了する。   [Step S14] When the detection unit 14 detects a predetermined event in step S13, the output unit 15 outputs the performance information as the detection source and the trace information corresponding to the performance information, and ends the processing. To do.

なお、性能トラブルの原因の調査は、出力部15が出力した情報を調査することで行われる。例えば、出力部15が情報を表示装置の表示画面に出力する場合、ユーザは、この表示画面を閲覧することで調査を行うことが可能となる。   The cause of the performance trouble is investigated by examining the information output by the output unit 15. For example, when the output unit 15 outputs information to the display screen of the display device, the user can perform an investigation by browsing the display screen.

このように、情報管理装置10は、性能情報と生成元のトレース情報とを対応付け、性能情報に所定の事象が検出された場合、検出元になった性能情報と、この性能情報と対応するトレース情報とを出力する。   In this way, the information management apparatus 10 associates the performance information with the trace information of the generation source, and when a predetermined event is detected in the performance information, the performance management information corresponding to the detection source corresponds to the performance information. Output trace information.

これにより、性能トラブルの原因を調査する際、トレース情報にまで遡って調査を行うことが可能となる。トレース情報は、処理を特定する情報や、処理の実行が誰によるものかを示す情報を含んでいるため、トレース情報を調査することで、性能トラブルの原因が誰のどのような処理によるものかを、短時間で特定することが可能となる。   As a result, when investigating the cause of a performance problem, it is possible to investigate retroactively to the trace information. The trace information includes information that identifies the process and information that indicates who is executing the process. By examining the trace information, the process that caused the performance trouble is caused by who and what process. Can be specified in a short time.

さらに、情報管理装置10では、出力される性能情報及びトレース情報は、所定の事象が検出された情報のみなので、調査の対象を絞ることが可能となり、調査時間をさらに短縮することが可能となる。   Furthermore, in the information management apparatus 10, since the output performance information and trace information are only information in which a predetermined event is detected, it is possible to narrow down the investigation target and further reduce the investigation time. .

次に、情報管理装置10をより具体的にした例を、第2の実施形態に説明する。
[第2の実施形態]
第2の実施形態に係る情報管理装置について説明する。まず、情報管理装置のハードウェアについて説明する。図3は、第2の実施形態に係る情報管理装置のハードウェアの一例を示すブロック図である。
Next, a more specific example of the information management apparatus 10 will be described in the second embodiment.
[Second Embodiment]
An information management apparatus according to the second embodiment will be described. First, the hardware of the information management apparatus will be described. FIG. 3 is a block diagram illustrating an example of hardware of the information management apparatus according to the second embodiment.

情報管理装置100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス106を介してRAM(Random Access Memory)102、ハードディスクドライブ(HDD:Hard Disk Drive)103、及びグラフィック処理部104、入力インタフェース105が接続されている。   The information management apparatus 100 is entirely controlled by a CPU (Central Processing Unit) 101. A random access memory (RAM) 102, a hard disk drive (HDD) 103, a graphic processing unit 104, and an input interface 105 are connected to the CPU 101 via a bus 106.

RAM102には、CPU101に実行させるOSのプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。HDD103には、OSやアプリケーションのプログラム、各種データが格納される。グラフィック処理部104には、モニタ107が接続されており、CPU101からの命令に従って画像をモニタ107の画面に表示させる。入力インタフェース105には、キーボード108aやマウス108b等の入力デバイスが接続されており、キーボード108aやマウス108bから送られてくる信号を、バス106を介してCPU101に送信する。   The RAM 102 temporarily stores at least a part of OS programs and application programs to be executed by the CPU 101. The RAM 102 stores various data necessary for processing by the CPU 101. The HDD 103 stores the OS, application programs, and various data. A monitor 107 is connected to the graphic processing unit 104, and an image is displayed on the screen of the monitor 107 in accordance with a command from the CPU 101. Input devices such as a keyboard 108 a and a mouse 108 b are connected to the input interface 105, and signals sent from the keyboard 108 a and the mouse 108 b are transmitted to the CPU 101 via the bus 106.

このようなハードウェアによって、情報管理装置100の処理機能を実現することができる。次に、情報管理装置100の機能について説明する。図4は、第2の実施形態に係る情報管理装置の機能の一例を示すブロック図である。   The processing function of the information management apparatus 100 can be realized by such hardware. Next, functions of the information management apparatus 100 will be described. FIG. 4 is a block diagram illustrating an example of functions of the information management apparatus according to the second embodiment.

情報管理装置100は、処理部110と、トレース情報記憶部120と、性能情報生成部130と、性能情報生成部140と、事象検出部150と、情報出力部160と、保存部170とを有する。   The information management apparatus 100 includes a processing unit 110, a trace information storage unit 120, a performance information generation unit 130, a performance information generation unit 140, an event detection unit 150, an information output unit 160, and a storage unit 170. .

処理部110は、プログラムに基づいて所定のプロセスやスレッド等の処理を実行する。処理部110は、例えば、API(Application Program Interface)を実行するAPI層111と、情報を一時記憶するキャッシュ層112と、情報の入出力を行うIO層113とを含んでいる。   The processing unit 110 executes processing such as a predetermined process or thread based on a program. The processing unit 110 includes, for example, an API layer 111 that executes an application program interface (API), a cache layer 112 that temporarily stores information, and an IO layer 113 that inputs and outputs information.

トレース情報記憶部120は、処理部110における処理の履歴を示すトレース情報を記憶する。ここでは、トレース情報記憶部120は、各API層111、キャッシュ層112、及び、IO層113に対応したトレース情報をそれぞれ記憶する。   The trace information storage unit 120 stores trace information indicating a history of processing in the processing unit 110. Here, the trace information storage unit 120 stores trace information corresponding to each API layer 111, cache layer 112, and IO layer 113.

ここで、トレース情報は、プロセスやスレッドを特定する情報や、プロセスやスレッドの実行が誰によるものかを示す情報を含んでいる。また、トレース情報は、例えば、情報管理装置100を管理するOSにより提供される。なお、トレース情報記憶部120に記憶されたトレース情報は、例えば、一定時間(1分程度)経過すると、次のトレース情報に上書きされる。   Here, the trace information includes information for identifying a process or thread and information indicating who is executing the process or thread. The trace information is provided by, for example, an OS that manages the information management apparatus 100. Note that the trace information stored in the trace information storage unit 120 is overwritten on the next trace information when, for example, a certain time (about 1 minute) has elapsed.

性能情報生成部130は、トレース情報記憶部120に記憶されたトレース情報に基づいて、性能情報を生成する。性能情報は、処理部110の処理状況を示し、例えば、応答速度や処理速度等を示す指標を含む。具体的には、性能情報は、例えば、書込要求数、書込要求サイズ、CPU消費率、メモリ使用量、IO稼働率等を含む。さらに、性能情報生成部130は、生成した性能情報と生成元のトレース情報とを対応付けて記憶する。   The performance information generation unit 130 generates performance information based on the trace information stored in the trace information storage unit 120. The performance information indicates the processing status of the processing unit 110 and includes, for example, an index indicating a response speed, a processing speed, and the like. Specifically, the performance information includes, for example, the number of write requests, the write request size, the CPU consumption rate, the memory usage, the IO operation rate, and the like. Furthermore, the performance information generation unit 130 stores the generated performance information and the generation source trace information in association with each other.

具体的には、性能情報生成部130は、変換部131と、トレース情報退避部132と、カウンタ133とを有している。さらに、変換部131は、トレース情報を性能情報に変換するための変換テーブルを記憶した変換テーブル記憶部134を有している。   Specifically, the performance information generation unit 130 includes a conversion unit 131, a trace information saving unit 132, and a counter 133. Furthermore, the conversion unit 131 includes a conversion table storage unit 134 that stores a conversion table for converting trace information into performance information.

変換部131は、トレース情報記憶部120に記憶されたトレース情報に基づいて、変換テーブル記憶部134に記憶された変換テーブルを参照して、カウンタ133をカウントアップする変換操作を行う。なお、変換部131によるトレース情報の変換操作は、第1の期間(例えば、30秒)毎に実施される。このとき、変換部131は、直前の第1の期間(例えば、30秒)分のトレース情報を変換操作の対象としている。   Based on the trace information stored in the trace information storage unit 120, the conversion unit 131 refers to the conversion table stored in the conversion table storage unit 134 and performs a conversion operation for counting up the counter 133. Note that the conversion operation of the trace information by the conversion unit 131 is performed every first period (for example, 30 seconds). At this time, the conversion unit 131 sets the trace information for the immediately preceding first period (for example, 30 seconds) as a conversion operation target.

トレース情報退避部132は、変換部131で変換操作の対象となった第1の期間分のトレース情報を記憶する。なお、トレース情報退避部132に記憶されたトレース情報は、記憶されてから所定の期間(例えば、10分)が経過すると、トレース情報退避部132から消去される。   The trace information saving unit 132 stores the trace information for the first period that is the target of the conversion operation by the conversion unit 131. Note that the trace information stored in the trace information saving unit 132 is erased from the trace information saving unit 132 when a predetermined period (for example, 10 minutes) has elapsed since the storage.

カウンタ133は、性能情報を示す値を記憶するものであり、変換部131の変換操作に基づきカウントを行う。即ち、変換部131が第1の期間分のトレース情報に基づいてカウンタ133をカウントアップさせる変換操作を行うことで、カウンタ133に、第1の期間分の性能情報が生成されて記憶される。また、カウンタ133は、例えば、性能情報の種類別に設けられた複数のカウンタ部により構成されている。例えば、カウンタ133は、書込要求数を示すカウンタ部と、書込要求サイズを示すカウンタ部と、CPU消費率を示すカウンタ部等を含んでいる。   The counter 133 stores a value indicating performance information, and performs counting based on the conversion operation of the conversion unit 131. That is, the conversion unit 131 performs a conversion operation for counting up the counter 133 based on the trace information for the first period, so that the performance information for the first period is generated and stored in the counter 133. In addition, the counter 133 is configured by, for example, a plurality of counter units provided for each type of performance information. For example, the counter 133 includes a counter unit indicating the number of write requests, a counter unit indicating the write request size, a counter unit indicating the CPU consumption rate, and the like.

ここで、生成された第1の期間分の性能情報は、生成元となったトレース情報と対応付けられて記憶される。即ち、第1の期間分の性能情報から生成元となったトレース情報が特定できるようにしている。例えば、これは、第1の期間分の性能情報に、生成元となったトレース情報の検索キーを付与することで実現することが可能である。なお、カウンタ133は、例えば、変換部131が、第1の期間経過後、次の回の変換操作を開始すると、ゼロクリアされる。   Here, the generated performance information for the first period is stored in association with the trace information that is the generation source. That is, the trace information that is the generation source can be specified from the performance information for the first period. For example, this can be realized by adding a search key for the trace information that is the generation source to the performance information for the first period. Note that the counter 133 is cleared to zero when, for example, the conversion unit 131 starts the next conversion operation after the first period has elapsed.

次に、性能情報生成部140は、カウンタ133が記憶した第1の期間分の性能情報を取得して蓄積し、蓄積した第1の期間分の性能情報群が第2の期間分に達していると、蓄積した第1の期間分の性能情報群を集計して第2の期間分の性能情報を生成する。そして、性能情報生成部140は、生成した第2の期間分の性能情報と集計元の第1の期間分の性能情報群とを対応付けて記憶する。   Next, the performance information generation unit 140 acquires and accumulates performance information for the first period stored by the counter 133, and the accumulated performance information group for the first period reaches the second period. If so, the accumulated performance information group for the first period is totaled to generate performance information for the second period. Then, the performance information generation unit 140 stores the generated performance information for the second period and the performance information group for the first period of the aggregation source in association with each other.

具体的には、性能情報生成部140は、集計部141と、性能情報退避部142と、カウンタ143とを有している。集計部141は、性能情報生成部130のカウンタ133が記憶した第1の期間分の性能情報を、記憶される毎、即ち、第1の期間毎に取得して、第1の期間分の性能情報群を蓄積する。   Specifically, the performance information generation unit 140 includes a counting unit 141, a performance information saving unit 142, and a counter 143. The aggregation unit 141 acquires the performance information for the first period stored by the counter 133 of the performance information generation unit 130 every time it is stored, that is, for each first period, and acquires the performance information for the first period. Accumulate information group.

さらに、集計部141は、蓄積した第1の期間分の性能情報群が、第2の期間(例えば、10分)分に達していると、第1の期間分の性能情報群を、性能情報の種類毎、例えば、書込要求数、書込要求サイズ、CPU消費率毎に集計して1つにまとめる。これにより、第2の期間(例えば、10分間)分の性能情報が生成される。   Further, when the accumulated performance information group for the first period reaches the second period (for example, 10 minutes), the counting unit 141 converts the performance information group for the first period to the performance information. For each type, for example, the number of write requests, the write request size, and the CPU consumption rate. Thereby, performance information for the second period (for example, 10 minutes) is generated.

なお、集計部141は、カウンタ133が記憶した第1の期間分の性能情報を取得することで、蓄積する第1の期間分の性能情報群が第2の期間分を超えた場合、一番古く蓄積した第1の期間分の性能情報を消去する。そして、今回取得された分を含めた第2の期間分の第1の性能情報群を、性能情報の種類毎に集計する。   Note that the totaling unit 141 acquires the performance information for the first period stored in the counter 133, so that when the accumulated performance information group for the first period exceeds the second period, The old accumulated performance information for the first period is deleted. And the 1st performance information group for the 2nd period including the part acquired this time is totaled for every kind of performance information.

性能情報退避部142は、集計部141で生成された第2の期間分の性能情報の集計元となった第1の期間分の性能情報群を記憶する。なお、性能情報退避部142に記憶された第1の期間分の性能情報群は、記憶されてから所定の期間(例えば、7日間)が経過すると、性能情報退避部142から消去される。   The performance information saving unit 142 stores the performance information group for the first period, which is the aggregation source of the performance information for the second period generated by the aggregation unit 141. Note that the performance information group for the first period stored in the performance information saving unit 142 is deleted from the performance information saving unit 142 when a predetermined period (for example, seven days) has elapsed since the storage.

カウンタ143は、集計部141で生成された第2の期間分の性能情報を記憶する。ここで、第2の期間分の性能情報は、集計元となった第1の期間分の性能情報群と対応付けられて記憶される。即ち、第2の期間分の性能情報から集計元となった第1の期間分の性能情報群が特定できるようにしている。例えば、これは、第2の期間分の性能情報に、集計元となった第1の期間分の性能情報群の検索キーを付与することで実現することが可能である。なお、カウンタ143は、例えば、集計部141が、第1の期間経過後、次の回の集計を開始すると、ゼロクリアされる。   The counter 143 stores the performance information for the second period generated by the counting unit 141. Here, the performance information for the second period is stored in association with the performance information group for the first period that is the aggregation source. That is, the performance information group for the first period that is the source of aggregation can be identified from the performance information for the second period. For example, this can be realized by assigning a search key for the performance information group for the first period, which is the source of aggregation, to the performance information for the second period. Note that the counter 143 is cleared to zero when, for example, the counting unit 141 starts counting the next time after the first period has elapsed.

次に、事象検出部150は、カウンタ133に記憶された第1の期間分の性能情報と、カウンタ143に記憶された第2の期間分の性能情報とを比較し、比較結果に基づいて所定の事象を検出する。所定の事象とは、例えば、第2の期間分の性能情報に対して、第1の期間分の性能情報が異常値を示すような特異事象である。具体例としては、10分間のCPU消費率が20%未満とそれほど高くないにもかかわらず、30秒間の書込要求サイズが10MBを超えるような非常に大きい場合である。   Next, the event detection unit 150 compares the performance information for the first period stored in the counter 133 with the performance information for the second period stored in the counter 143, and determines the predetermined information based on the comparison result. Detect the event. The predetermined event is, for example, a specific event in which the performance information for the first period indicates an abnormal value with respect to the performance information for the second period. As a specific example, the CPU consumption rate for 10 minutes is not so high as less than 20%, but the write request size for 30 seconds is very large such that it exceeds 10 MB.

ここで、第1の期間分の性能情報が、第1の期間分よりも長い第2の期間分の大局的な性能情報に対して異常値を示すような場合は、その第1の期間における処理において、性能トラブルが発生している可能性が高いと考えられる。   Here, when the performance information for the first period shows an abnormal value for the global performance information for the second period longer than the first period, the performance information for the first period It is highly probable that a performance problem has occurred during processing.

ここでは、事象検出部150は、特異事象として識別される条件を記憶する条件記憶部151を有している。そして、この条件記憶部151に記憶された条件を参照して、比較結果から所定の事象を検出する。   Here, the event detection unit 150 includes a condition storage unit 151 that stores a condition identified as a unique event. Then, a predetermined event is detected from the comparison result with reference to the condition stored in the condition storage unit 151.

また、例えば、性能トラブルが発生した際に現れる事象が予め分かっていれば、この事象を識別する条件を条件記憶部151に記憶しておくことで、性能トラブルに伴う事象を検出する検出精度を向上させることが可能となる。   In addition, for example, if an event that appears when a performance trouble occurs is known in advance, a condition for identifying the event is stored in the condition storage unit 151, so that the detection accuracy for detecting the event associated with the performance trouble is increased. It becomes possible to improve.

情報出力部160は、事象検出部150が所定の事象を検出すると、カウンタ143に記憶された第2の期間分の性能情報と、カウンタ133に記憶された第1の期間分の性能情報と、トレース情報退避部132に記憶された直前の第1の期間分のトレース情報とを取得する。さらに、情報出力部160は、取得した第2の期間分の性能情報、第1の期間分の性能情報、及び、トレース情報を、保存部170に出力する。   When the event detection unit 150 detects a predetermined event, the information output unit 160 includes the performance information for the second period stored in the counter 143, the performance information for the first period stored in the counter 133, Trace information for the first period immediately before stored in the trace information saving unit 132 is acquired. Furthermore, the information output unit 160 outputs the acquired performance information for the second period, performance information for the first period, and trace information to the storage unit 170.

なお、情報出力部160は、さらに、性能情報退避部142に記憶された直前の第1の期間分の性能情報群と、トレース情報記憶部120に記憶されたトレース情報とを取得し、保存部170に出力しても良い。   The information output unit 160 further obtains the performance information group for the first period immediately before stored in the performance information saving unit 142 and the trace information stored in the trace information storage unit 120, and saves the storage unit. You may output to 170.

保存部170に保存された、第2の期間分の性能情報と、第1の期間分の性能情報と、トレース情報とは、例えば、図3に示す情報管理装置100のモニタ107に表示される。この時、例えば、第2の期間分の性能情報と、第1の期間分の性能情報と、トレース情報とが、互いに対応付けられて表示される。   The performance information for the second period, the performance information for the first period, and the trace information stored in the storage unit 170 are displayed on, for example, the monitor 107 of the information management apparatus 100 illustrated in FIG. . At this time, for example, performance information for the second period, performance information for the first period, and trace information are displayed in association with each other.

次に、トレース情報記憶部120が記憶するトレース情報について説明する。
図5〜図7は、トレース情報の一例を示す図である。
処理部110のAPI層111の処理履歴を示すトレース情報121は、例えば、図5に示される。トレース情報121は、処理が実行された時間(TIME)と、処理プロセス及びスレッドを特定するプロセスID及びスレッドIDとを含む。さらに、トレース情報121は、処理の実行が誰によるものかを示す呼出元アドレスと、処理の依頼の履歴か、又は、処理の応答の履歴かを特定する区分と、処理の種類を示す機能名と、処理内容を示すパラメタとを含む。
Next, the trace information stored in the trace information storage unit 120 will be described.
5 to 7 are diagrams illustrating examples of trace information.
The trace information 121 indicating the processing history of the API layer 111 of the processing unit 110 is illustrated in FIG. 5, for example. The trace information 121 includes a time (TIME) when the process is executed, and a process ID and a thread ID that specify a process and a thread. Furthermore, the trace information 121 includes a caller address that indicates who is executing the process, a classification that identifies whether the process is a request history or a process response history, and a function name that indicates the type of process. And a parameter indicating the processing content.

例えば、プログラムA(プロセスN1、スレッドM1)がファイルAに32MBの書き込みを行う場合、トレース情報121の最上欄に示されるように、TIMEに処理が実行された時間が記憶され、プロセスIDに「N1」、スレッドIDに「M1」が記憶される。さらに、呼出元アドレスにこの処理の呼出元アドレスである「xxx1」が記憶され、区分に「call」が記憶され、機能名に「fwrite」が記憶され、パラメタに「ファイルA,1,32M,1」等が記憶される。   For example, when the program A (process N1, thread M1) writes 32 MB to the file A, as shown in the uppermost column of the trace information 121, the time when the process is executed is stored in the TIME, and the process ID is “ N1 ”and“ M1 ”are stored in the thread ID. Furthermore, “xxx1” which is the caller address of this process is stored in the caller address, “call” is stored in the category, “fwrite” is stored in the function name, and “file A, 1, 32M, 1 "etc. are stored.

処理部110のキャッシュ層112の処理履歴を示すトレース情報122は、例えば、図6に示される。トレース情報122は、処理が実行された時間(TIME)と、処理プロセス及びスレッドの依頼元を特定する依頼元プロセスID及び依頼元スレッドIDとを含む。さらに、トレース情報122は、処理の実行が誰によるものかを示す呼出元アドレスと、処理の依頼の履歴か、又は、処理の応答の履歴かを特定する区分と、処理の種類を示す機能名と、処理内容を示すパラメタとを含む。   The trace information 122 indicating the processing history of the cache layer 112 of the processing unit 110 is illustrated in FIG. 6, for example. The trace information 122 includes a time (TIME) when the process is executed, a request source process ID and a request source thread ID that specify the request source of the processing process and the thread. Furthermore, the trace information 122 includes a caller address indicating who is executing the process, a classification specifying whether the process is a request history or a process response history, and a function name indicating the type of process. And a parameter indicating the processing content.

処理部110のIO層113の処理履歴を示すトレース情報123は、例えば、図7に示される。トレース情報123は、処理が実行された時間(TIME)と、処理プロセス及びスレッドの依頼元を特定する依頼元プロセスID及び依頼元スレッドIDとを含む。さらに、トレース情報123は、処理の実行が誰によるものかを示す呼出元アドレスと、処理の依頼の履歴か、又は、処理の応答の履歴かを特定する区分と、処理の種類を示す機能名と、処理内容を示すパラメタとを含む。   The trace information 123 indicating the processing history of the IO layer 113 of the processing unit 110 is illustrated in FIG. 7, for example. The trace information 123 includes a time (TIME) when the process is executed, a request source process ID and a request source thread ID for specifying the request source of the processing process and the thread. Further, the trace information 123 includes a caller address indicating who is executing the process, a classification specifying whether the process is a request history or a process response history, and a function name indicating the type of process. And a parameter indicating the processing content.

次に、変換テーブル記憶部134に記憶されている変換テーブルについて説明する。図8は、変換テーブルの一例を示す図である。変換テーブルは処理部110内の各層別に区分れている。ここでは、変換テーブルは、例えば、API層、キャッシュ層、IO層に区分されている。さらに、変換テーブルには、各層別に、変換対象となるトレース情報の機能名、カウンタ133における変換先のカウンタ部、変換操作内容が設けられている。   Next, the conversion table stored in the conversion table storage unit 134 will be described. FIG. 8 is a diagram illustrating an example of the conversion table. The conversion table is divided for each layer in the processing unit 110. Here, the conversion table is divided into, for example, an API layer, a cache layer, and an IO layer. Further, the conversion table is provided with the function name of the trace information to be converted, the conversion destination counter section in the counter 133, and the conversion operation content for each layer.

API層の欄については、例えば、機能名が書き込みを示す「fwrite」であり、変換先カウンタ部が、書込要求数(全体)、書込要求数(プロセス)、書込要求サイズ(全体)、書込要求サイズ(プロセス)である。さらに、変換操作内容が、「書込要求数(全体)に1を加える」、「書込要求数(プロセスID)に1を加える」、「書込要求サイズ(全体)に第3パラメタを加える」、「書込要求サイズ(プロセスID)に第3パラメタを加える」である。   In the API layer column, for example, the function name is “fwrite” indicating writing, and the conversion destination counter unit has the number of write requests (whole), the number of write requests (process), and the write request size (whole). Write request size (process). Furthermore, the contents of the conversion operation are “add 1 to the number of write requests (total)”, “add 1 to the number of write requests (process ID)”, and add the third parameter to the write request size (total). And “Add third parameter to write request size (process ID)”.

キャッシュ層の欄については、例えば、機能名が書き込みを示す「cwrite」であり、変換先カウンタ部が、書込要求数(論理装置)、書込要求サイズ(論理装置)である。さらに、変換操作内容が、「書込要求数(論理装置)に1を加える」、「書込要求サイズ(論理装置)に第3パラメタを加える」である。   In the cache layer column, for example, the function name is “cwrite” indicating writing, and the conversion destination counter unit is the number of write requests (logical device) and the write request size (logical device). Furthermore, the contents of the conversion operation are “add 1 to the number of write requests (logical device)” and “add the third parameter to the write request size (logical device)”.

IO層の欄については、例えば、機能名が書き込みを示す「iowrite」であり、変換先カウンタ部が、書込要求数(物理装置)、書込要求サイズ(物理装置)である。さらに、変換操作内容が、「書込要求数(物理装置)に1を加える」、「書込要求サイズ(物理装置)に第3パラメタを加える」である。   In the IO layer column, for example, the function name is “iowrite” indicating writing, and the conversion destination counter unit is the number of write requests (physical device) and the write request size (physical device). Furthermore, the contents of the conversion operation are “add 1 to the number of write requests (physical device)” and “add the third parameter to the write request size (physical device)”.

例えば、機能名が「fwrite」のAPI層111に対応するトレース情報に対しては、変換テーブル(API層)に基づいて、次の通り変換操作が行われる。即ち、カウンタ133における書込要求数(全体)を示すカウンタ部、及び、書込要求数(プロセスID)を示すカウンタ部にそれぞれ1が加えられる。さらに、カウンタ133における書込要求サイズ(全体)を示すカウンタ部、及び、書込要求サイズ(プロセスID)を示すカウンタ部にそれぞれに書込情報のサイズが加えられる。   For example, the following conversion operation is performed on the trace information corresponding to the API layer 111 whose function name is “fwrite” based on the conversion table (API layer). That is, 1 is added to each of the counter unit indicating the number of write requests (total) in the counter 133 and the counter unit indicating the number of write requests (process ID). Furthermore, the size of the write information is added to the counter unit indicating the write request size (whole) and the counter unit indicating the write request size (process ID) in the counter 133, respectively.

次に、カウンタ133に記憶される第1の期間分の性能情報について説明する。図9は、第1の期間分の性能情報の一例を示す図である。
第1の期間分の性能情報では、性能情報の種類毎、即ち、カウンタ部毎に、それぞれカウンタ値が対応付けられている。ここでは、性能情報の種類に、例えば、プロセス全体の書込要求数及び書込要求サイズ、プロセスIDの書込要求数及び書込要求サイズ、論理装置の書込要求数及び書込要求サイズ、物理装置の書込要求数及び書込要求サイズを含んでいる。これらのそれぞれに対して、カウンタ値、及び、単位時間当たりのカウンタ値が対応付けられている。
Next, the performance information for the first period stored in the counter 133 will be described. FIG. 9 is a diagram illustrating an example of performance information for the first period.
In the performance information for the first period, a counter value is associated with each type of performance information, that is, for each counter unit. Here, the types of performance information include, for example, the number of write requests and the write request size of the entire process, the number of write requests and the write request size of the process ID, the number of write requests and the write request size of the logical device, It includes the number of physical device write requests and the write request size. Each of these is associated with a counter value and a counter value per unit time.

さらに、第1の期間分の性能情報は、当該性能情報の生成に要した期間を示す生成期間を含んでいる。図9に示される例では、第1の期間が30秒間なので、生成期間が30秒を示している。また、第1の期間分の性能情報には、生成時刻が付与されている。例えば、この生成時刻を、対応するトレース情報を検索する際の検索キーとすることも可能である。   Furthermore, the performance information for the first period includes a generation period indicating a period required to generate the performance information. In the example shown in FIG. 9, since the first period is 30 seconds, the generation period is 30 seconds. Moreover, the generation time is given to the performance information for the first period. For example, this generation time can be used as a search key when searching for the corresponding trace information.

次に、カウンタ143に記憶される第2の期間分の性能情報について説明する。図10は、第2の期間分の性能情報の一例を示す図である。
第2の期間分の性能情報も、図9に示される第1の期間分の性能情報と同様の形式を備えている。図10に示される例では、第2の期間が10分間、即ち、600秒間なので、生成期間が600秒を示している。また、第2の期間分の性能情報にも、生成時刻が付与されている。例えば、この生成時刻を、対応する第1の性能情報群を検索する際の検索キーとすることも可能である。
Next, the performance information for the second period stored in the counter 143 will be described. FIG. 10 is a diagram illustrating an example of performance information for the second period.
The performance information for the second period also has the same format as the performance information for the first period shown in FIG. In the example shown in FIG. 10, since the second period is 10 minutes, that is, 600 seconds, the generation period is 600 seconds. The generation time is also given to the performance information for the second period. For example, this generation time can be used as a search key when searching for the corresponding first performance information group.

次に、情報管理装置100の処理手順について説明する。図11、図12は、第2の実施形態に係る情報管理装置の処理手順の一例を示すフローチャートである。まず、図11を用いて説明する。   Next, a processing procedure of the information management apparatus 100 will be described. 11 and 12 are flowcharts illustrating an example of a processing procedure of the information management apparatus according to the second embodiment. First, it demonstrates using FIG.

第1の期間(例えば、30秒間)毎に処理が開始する。
[ステップS110]変換部131が、トレース情報記憶部120に記憶されている第1の期間分のトレース情報に基づいて、カウンタ133をカウントアップして、第1の期間分の性能情報を生成する。このとき、変換部131は、例えば、変換テーブル記憶部134に記憶されている変換テーブルを参照する。
The process starts every first period (for example, 30 seconds).
[Step S110] The conversion unit 131 counts up the counter 133 based on the trace information for the first period stored in the trace information storage unit 120, and generates performance information for the first period. . At this time, the conversion unit 131 refers to a conversion table stored in the conversion table storage unit 134, for example.

[ステップS120]トレース情報退避部132が、ステップS110で生成された第1の期間分の性能情報の生成元となった第1の期間分のトレース情報を記憶する。
[ステップS130]カウンタ133が、ステップS110で生成された第1の期間分の性能情報を、生成元となったトレース情報と対応付けて記憶する。
[Step S120] The trace information saving unit 132 stores the trace information for the first period that is the generation source of the performance information for the first period generated in Step S110.
[Step S130] The counter 133 stores the performance information for the first period generated in step S110 in association with the trace information that is the generation source.

[ステップS140]集計部141が、ステップS130で第1の期間分の性能情報がカウンタ133に記憶されると、カウンタ133から第1の期間分の性能情報を取得して蓄積する。次のステップからは図12を用いて説明する。   [Step S140] When the performance information for the first period is stored in the counter 133 in step S130, the counting unit 141 acquires and accumulates the performance information for the first period from the counter 133. The following steps will be described with reference to FIG.

[ステップS150]集計部141が、ステップS140で蓄積した第1の期間分の性能情報群が第2の期間(例えば、10分間)分に達しているかどうかを判定する。達している場合は処理をステップS160に進める。達していない場合は処理を終了する。   [Step S150] The counting unit 141 determines whether or not the performance information group for the first period accumulated in Step S140 has reached the second period (for example, 10 minutes). If so, the process proceeds to step S160. If not, the process is terminated.

[ステップS160]集計部141が、第1の期間分の性能情報群を集計して第2の期間分の性能情報を生成する。
[ステップS170]性能情報退避部142が、ステップS160で生成された第2の期間分の性能情報の集計元となった第1の期間分の性能情報群を記憶する。
[Step S160] The totaling unit 141 totals the performance information group for the first period to generate performance information for the second period.
[Step S170] The performance information saving unit 142 stores the performance information group for the first period, which is the aggregation source of the performance information for the second period generated in step S160.

[ステップS180]カウンタ143が、ステップS160で生成された第2の期間分の性能情報を、集計元となった第1の期間分の性能情報群と対応付けて記憶する。
[ステップS190]事象検出部150が、ステップS130でカウンタ133に記憶された第1の期間分の性能情報と、ステップS180でカウンタ143に記憶された第2の期間分の性能情報とを比較する。
[Step S180] The counter 143 stores the performance information for the second period generated in step S160 in association with the performance information group for the first period that is the source of aggregation.
[Step S190] The event detection unit 150 compares the performance information for the first period stored in the counter 133 in step S130 with the performance information for the second period stored in the counter 143 in step S180. .

[ステップS200]事象検出部150が、ステップS190の比較結果に基づいて所定の事象を検出する。このとき、事象検出部150は、例えば、条件記憶部151に記憶されている条件を参照して、所定の事象を検出する。所定の事象が検出された場合、処理をステップS210に進める。所定の事象が検出されない場合、処理を終了する。   [Step S200] The event detection unit 150 detects a predetermined event based on the comparison result in step S190. At this time, the event detection unit 150 detects a predetermined event with reference to the conditions stored in the condition storage unit 151, for example. If a predetermined event is detected, the process proceeds to step S210. If the predetermined event is not detected, the process is terminated.

[ステップS210]情報出力部160が、ステップS180でカウンタ143に記憶された第2の性能情報、ステップS130でカウンタ133に記憶された第1の性能情報、ステップS120でトレース情報退避部132に記憶されたトレース情報を、保存部170に出力する。これで処理を終了する。なお、この時、情報出力部160が、さらに、ステップS170で性能情報退避部142に記憶された第1の期間分の性能情報群、及び、トレース情報記憶部120に記憶されたトレース情報を、保存部170に出力しても良い。なお、性能トラブルの原因の調査は、保存部170に保存された第2の期間分の性能情報、第1の期間分の性能情報群、及び、トレース情報を調査することで行われる。   [Step S210] The information output unit 160 stores the second performance information stored in the counter 143 in Step S180, the first performance information stored in the counter 133 in Step S130, and the trace information saving unit 132 in Step S120. The trace information thus output is output to the storage unit 170. This ends the process. At this time, the information output unit 160 further includes the performance information group for the first period stored in the performance information saving unit 142 in step S170 and the trace information stored in the trace information storage unit 120. You may output to the preservation | save part 170. FIG. The investigation of the cause of the performance trouble is performed by investigating the performance information for the second period, the performance information group for the first period, and the trace information stored in the storage unit 170.

ここで、保存部170に保存された情報から、ある性能トラブルの原因を調査する一例を説明する。図13〜図16は、調査の一例を説明する図である。
図13には、カウンタ133が記憶する30秒間の性能情報と、カウンタ143が記憶する10分間の性能情報とが示されている。図13に示すように、事象検出部150により、30秒間の性能情報と10分間の性能情報とから、10分間のCPU消費率が11%とそれほど高くないにもかかわらず、30秒間の磁気ディスク#1の書込要求サイズが18MB/秒である特異事象が検出されたとする。ここで、磁気ディスク#1は、磁気ディスクが有する領域の一部を指すものである。
Here, an example of investigating the cause of a certain performance trouble from the information stored in the storage unit 170 will be described. 13-16 is a figure explaining an example of investigation.
FIG. 13 shows the 30-second performance information stored in the counter 133 and the 10-minute performance information stored in the counter 143. As shown in FIG. 13, the event detection unit 150 uses a 30-second magnetic disk based on 30-second performance information and 10-minute performance information, even though the CPU consumption rate for 10 minutes is not as high as 11%. It is assumed that a unique event in which the # 1 write request size is 18 MB / second is detected. Here, the magnetic disk # 1 indicates a part of the area of the magnetic disk.

この特異事象が検出されると、情報出力部160が、検出元になった第1の期間分の性能情報をカウンタ133から取得し、さらに、この第1の期間分の性能情報に対応するトレース情報をトレース情報退避部132から取得する。そして、情報出力部160は、取得した第1の期間分の性能情報と、トレース情報とを、保存部170に出力する。   When this peculiar event is detected, the information output unit 160 acquires performance information for the first period as a detection source from the counter 133, and further traces corresponding to the performance information for the first period. Information is acquired from the trace information saving unit 132. Then, the information output unit 160 outputs the acquired performance information and trace information for the first period to the storage unit 170.

事象検出部150にて特異事象が検出されると、情報管理装置100は、例えば、図3に示されるモニタ108にアラーム情報を表示する等して、特異事象が検出されたことをユーザに報知する。ユーザは、情報管理装置100からの特異事象の報知に基づき、保存部170の調査を行う。なお、ユーザは、情報管理装置100からの報知によらずに、定期的に保存部170の調査を行っても良いし、情報管理装置100の操作中に動作速度が遅くなる等の不具合を感知することで、調査を行っても良い。   When the event detection unit 150 detects a specific event, the information management apparatus 100 notifies the user that the specific event has been detected, for example, by displaying alarm information on the monitor 108 shown in FIG. To do. The user investigates the storage unit 170 based on notification of a specific event from the information management apparatus 100. Note that the user may periodically check the storage unit 170 without notification from the information management apparatus 100, or may detect a malfunction such as a slow operation speed during the operation of the information management apparatus 100. By doing so, you may investigate.

保存部170の調査を行う場合、ユーザは、30秒間の性能情報に対応付けされた同時間帯のトレース情報を参照して分析する。図14は、対応するIO層のトレース情報である。図14に示すトレース情報123には、磁気ディスク#1への書き込みが記憶されている。今回の特異事象は書込要求サイズに関するものであるため、書き込みのトレース情報(機能名:iowrite)から、書き込み対象のキャッシュバッファを全て抽出する。ここでは、キャッシュバッファ#2、#3、#4が抽出された。ここで、各キャッシュバッファ#2〜#4はそれぞれ、キャッシュバッファが有する領域の一部を指すものである。   When investigating the storage unit 170, the user refers to and analyzes the trace information of the same time zone associated with the 30-second performance information. FIG. 14 shows trace information of the corresponding IO layer. The trace information 123 shown in FIG. 14 stores writing to the magnetic disk # 1. Since this singular event is related to the write request size, all the cache buffers to be written are extracted from the write trace information (function name: iwrite). Here, cache buffers # 2, # 3, and # 4 are extracted. Here, each of the cache buffers # 2 to # 4 indicates a part of the area of the cache buffer.

次に、ユーザは、抽出したキャッシュバッファ#2〜#4を元に、同時間帯のキャッシュ層112のトレース情報122を調査する。このトレース情報122に抽出したキャッシュバッファ#2〜#4が検出されなければ、前の30秒間分のトレース情報122やそれ以前の30秒間分のトレース情報122にも遡って調査する。ここでは、前の30秒間のキャッシュ層112のトレース情報122に、抽出したキャッシュバッファ#2〜#4が検出された。図15は、そのキャッシュ層のトレース情報である。   Next, the user investigates the trace information 122 of the cache layer 112 in the same time zone based on the extracted cache buffers # 2 to # 4. If the cache buffers # 2 to # 4 extracted in the trace information 122 are not detected, the trace information 122 for the previous 30 seconds and the trace information 122 for the previous 30 seconds are examined retrospectively. Here, the extracted cache buffers # 2 to # 4 are detected in the trace information 122 of the cache layer 112 for the previous 30 seconds. FIG. 15 shows the trace information of the cache layer.

次に、ユーザは、キャッシュバッファ#2〜#4が検出されたキャッシュ層112のトレース情報122と同時間帯のAPI層111のトレース情報121を解析する。図16は、そのAPI層のトレース情報である。すると、キャッシュバッファ#2〜#4が検出された同時間に、対応するプロセス/スレッドから、1回で32MBもの「fwrite」を発行していることが検出された。呼出元アドレスに基づいてプロセスの開発元に照会したところ、プログラム動作環境パラメタの設定ミスにより不当なサイズでファイルの初期獲得が実施された結果、今回の事象が発生したことが判明した。   Next, the user analyzes the trace information 121 of the API layer 111 in the same time zone as the trace information 122 of the cache layer 112 in which the cache buffers # 2 to # 4 are detected. FIG. 16 shows the trace information of the API layer. Then, at the same time when the cache buffers # 2 to # 4 were detected, it was detected that 32 MB of “fwrite” was issued at a time from the corresponding process / thread. When the process developer was queried based on the caller address, it was found that this event occurred as a result of initial acquisition of the file with an invalid size due to a mistake in setting the program operating environment parameters.

このように、情報管理装置100は、第1の期間分の性能情報と生成元のトレース情報とを対応付けて記憶し、第1の期間分の性能情報に所定の事象が検出された場合、記憶した第1の期間分の性能情報とトレース情報とを保存部170に出力する。   As described above, the information management apparatus 100 stores the performance information for the first period and the trace information of the generation source in association with each other, and when a predetermined event is detected in the performance information for the first period, The stored performance information and trace information for the first period are output to the storage unit 170.

これにより、性能トラブルの原因を調査する際、トレース情報にまで遡って調査を行うことが可能となる。トレース情報は、処理プロセスやスレッドを特定する情報や、処理の実行が誰によるものかを示す情報を含んでいるため、トレース情報を調査することで、性能トラブルの原因が誰のどのような処理によるものかを、短時間で特定することが可能となる。   As a result, when investigating the cause of a performance problem, it is possible to investigate retroactively to the trace information. Trace information includes information that identifies the processing process and thread, and information that indicates who executed the processing. Therefore, by examining the trace information, what kind of processing causes the performance problem. It is possible to specify whether or not it is due to a short time.

さらに、情報管理装置100では、第1の期間分の性能情報からの所定の事象の検出は、第1の期間分の性能情報と、第1の期間分の性能情報を第2の期間分蓄積して集計した第2の期間分の性能情報とを比較することで行われる。これにより、第1の期間分の性能情報の局所的な異常値を検出することが可能となり、検出精度を向上させることが可能となる。   Furthermore, in the information management apparatus 100, the detection of the predetermined event from the performance information for the first period accumulates the performance information for the first period and the performance information for the first period for the second period. This is done by comparing the performance information for the second period totaled. This makes it possible to detect local abnormal values of the performance information for the first period, and to improve detection accuracy.

さらに、情報管理装置100では、保存部170に保存される第2の期間分の性能情報、第1の期間分の性能情報、及びトレース情報は、所定の事象が検出された情報のみなので、調査の対象を絞ることが可能となり、調査時間をさらに短縮することが可能となる。また、この構成によれば、保存部170の記憶容量を小さく設定することが可能となる。   Furthermore, in the information management apparatus 100, the performance information for the second period, the performance information for the first period, and the trace information that are stored in the storage unit 170 are only information in which a predetermined event is detected. This makes it possible to narrow down the survey time. Further, according to this configuration, the storage capacity of the storage unit 170 can be set small.

なお、以上の処理は、前述した通り、コンピュータに所定のプログラムを実行させることで実現できる。その場合、実現すべき処理内容を記述したプログラムが提供される。処理内容を記述したプログラムは、コンピュータ読み取り可能な記録媒体に記録しておくことができる。コンピュータ読み取り可能な記録媒体には、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリがある。磁気記録装置には、ハードディスク装置、フレキシブルディスク(FD)、磁気テープ(MT)等がある。光ディスクには、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc ? Read Only Memory)、CD−R(Recordable)、CD−RW(ReWritable)等がある。光磁気記録媒体には、MO(Magneto-Optical disk)等がある。   The above processing can be realized by causing a computer to execute a predetermined program as described above. In that case, a program describing the processing contents to be realized is provided. The program describing the processing contents can be recorded on a computer-readable recording medium. Examples of the computer-readable recording medium include a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory. Examples of the magnetic recording device include a hard disk device, a flexible disk (FD), and a magnetic tape (MT). Optical discs include DVD (Digital Versatile Disc), DVD-RAM, CD-ROM (Compact Disc? Read Only Memory), CD-R (Recordable), CD-RW (ReWritable), and the like. Magneto-optical recording media include MO (Magneto-Optical disk).

プログラムを流通させる場合、例えば、そのプログラムが記録されたDVD、CD−ROM等の可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにプログラムを転送することもできる。   When distributing the program, for example, a portable recording medium such as a DVD or a CD-ROM in which the program is recorded is sold. It is also possible to store the program in a storage device of a server computer and transfer the program from the server computer to another computer via a network.

プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラム又はサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送される毎に、逐次、受け取ったプログラムに従った処理を実行することもできる。   The computer that executes the program stores, for example, the program recorded on the portable recording medium or the program transferred from the server computer in its own storage device. Then, the computer reads the program from its own storage device and executes processing according to the program. The computer can also read the program directly from the portable recording medium and execute processing according to the program. In addition, each time the program is transferred from the server computer, the computer can sequentially execute processing according to the received program.

10 情報管理装置
11 処理部
12 トレース情報記憶部
13 生成部
14 検出部
15 出力部
DESCRIPTION OF SYMBOLS 10 Information management apparatus 11 Processing part 12 Trace information storage part 13 Generation part 14 Detection part 15 Output part

Claims (10)

コンピュータを、
処理を実行する処理部のトレース情報に基づいて前記処理部の処理状況を示す性能情報を生成し、前記性能情報と生成元の前記トレース情報とを対応付ける生成手段、
生成した前記性能情報に基づいて所定の事象を検出する検出手段、
前記所定の事象を検出すると、検出元になった前記性能情報と該性能情報に対応する前記トレース情報とを出力する出力手段、
として実行させることを特徴とする情報管理プログラム。
Computer
Generating means for generating performance information indicating a processing status of the processing unit based on trace information of the processing unit that executes processing, and associating the performance information with the trace information of the generation source;
Detecting means for detecting a predetermined event based on the generated performance information;
When the predetermined event is detected, output means for outputting the performance information as a detection source and the trace information corresponding to the performance information;
An information management program that is executed as
前記生成手段は、第1の期間分の前記トレース情報に基づいて、第1の期間分の第1の性能情報を生成し、前記第1の性能情報と生成元の前記トレース情報とを対応付け、
前記検出手段は、前記第1の性能情報と、前記第1の期間分よりも長い第2の期間分の第2の性能情報とを比較し、比較結果に基づいて前記所定の事象を検出し、
前記出力手段は、前記所定の事象を検出すると、検出元になった前記第1の性能情報と該第1の性能情報に対応する前記トレース情報とを出力すること、
を特徴とする請求項1に記載の情報管理プログラム。
The generation unit generates first performance information for a first period based on the trace information for a first period, and associates the first performance information with the trace information of the generation source. ,
The detecting means compares the first performance information with second performance information for a second period longer than the first period, and detects the predetermined event based on a comparison result. ,
When the output means detects the predetermined event, the output means outputs the first performance information as a detection source and the trace information corresponding to the first performance information;
The information management program according to claim 1.
前記第2の性能情報は、前記第1の性能情報を含む複数の前記性能情報を集計して得られることを特徴とする請求項2に記載の情報管理プログラム。   The information management program according to claim 2, wherein the second performance information is obtained by aggregating a plurality of the performance information including the first performance information. 前記出力手段は、検出元になった前記性能情報と該性能情報に対応する前記トレース情報とを、保存部に出力することを特徴とする請求項1〜3のいずれか1つに記載の情報管理プログラム。   The information according to claim 1, wherein the output unit outputs the performance information as a detection source and the trace information corresponding to the performance information to a storage unit. Management program. 前記性能情報は、応答速度や処理速度を示す指標を含むことを特徴とする請求項1〜4のいずれか1つに記載の情報管理プログラム。   The information management program according to any one of claims 1 to 4, wherein the performance information includes an index indicating a response speed and a processing speed. 前記性能情報は、書込要求数、及び、書込要求サイズを含むことを特徴とする請求項5に記載の情報管理プログラム。   The information management program according to claim 5, wherein the performance information includes a write request count and a write request size. 前記生成手段は、前記トレース情報を前記性能情報に変換する変換テーブルを参照して、前記性能情報を生成することを特徴とする請求項1〜6のいずれか1つに記載の情報管理プログラム。   The information management program according to claim 1, wherein the generation unit generates the performance information with reference to a conversion table that converts the trace information into the performance information. 前記検出手段は、特異情報として識別される条件を参照して、前記所定の事象を検出することを特徴とする請求項1〜7のいずれか1つに記載の情報管理プログラム。   The information management program according to claim 1, wherein the detection unit detects the predetermined event with reference to a condition identified as specific information. コンピュータが、
処理を実行する処理部のトレース情報に基づいて前記処理部の処理状況を示す性能情報を生成し、前記性能情報と生成元の前記トレース情報とを対応付け、
生成した前記性能情報に基づいて所定の事象を検出し、
前記所定の事象を検出すると、検出元になった前記性能情報と該性能情報に対応する前記トレース情報とを出力する、
ことを特徴とする情報管理方法。
Computer
Generate performance information indicating the processing status of the processing unit based on the trace information of the processing unit that executes processing, associate the performance information with the trace information of the generation source,
A predetermined event is detected based on the generated performance information,
When the predetermined event is detected, the performance information as a detection source and the trace information corresponding to the performance information are output.
An information management method characterized by that.
処理を実行する処理部のトレース情報に基づいて前記処理部の処理状況を示す性能情報を生成し、前記性能情報と生成元の前記トレース情報とを対応付ける生成部と、
生成した前記性能情報に基づいて所定の事象を検出する検出部と、
前記所定の事象を検出すると、検出元になった前記性能情報と該性能情報に対応する前記トレース情報とを出力する出力部と、
を有することを特徴とする情報管理装置。
Generating performance information indicating the processing status of the processing unit based on the trace information of the processing unit that executes processing, and a generation unit that associates the performance information with the trace information of the generation source;
A detection unit for detecting a predetermined event based on the generated performance information;
When the predetermined event is detected, an output unit that outputs the performance information as a detection source and the trace information corresponding to the performance information;
An information management apparatus comprising:
JP2009227467A 2009-09-30 2009-09-30 Information management program, information management method, and information management apparatus Expired - Fee Related JP5313101B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009227467A JP5313101B2 (en) 2009-09-30 2009-09-30 Information management program, information management method, and information management apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009227467A JP5313101B2 (en) 2009-09-30 2009-09-30 Information management program, information management method, and information management apparatus

Publications (2)

Publication Number Publication Date
JP2011076389A true JP2011076389A (en) 2011-04-14
JP5313101B2 JP5313101B2 (en) 2013-10-09

Family

ID=44020303

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009227467A Expired - Fee Related JP5313101B2 (en) 2009-09-30 2009-09-30 Information management program, information management method, and information management apparatus

Country Status (1)

Country Link
JP (1) JP5313101B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014149606A (en) * 2013-01-31 2014-08-21 Fujitsu Ltd Resource usage totaling program, resource usage totaling method and resource usage totaling device
WO2015181921A1 (en) * 2014-05-28 2015-12-03 三菱電機株式会社 Programmable display device and rendering software
JP2015230714A (en) * 2014-06-06 2015-12-21 富士通株式会社 Abnormality detection method, abnormality detection program and abnormality detection device

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04355455A (en) * 1991-05-31 1992-12-09 Iwasaki Electric Co Ltd Display structure of mark in print plate
JPH09282283A (en) * 1996-04-16 1997-10-31 Hitachi Ltd Tracing method and performance evaluation method for on-line transaction, and on-line transaction processing system
JP2004005198A (en) * 2002-05-31 2004-01-08 Nec Corp Computerized analysis display method and measurement analysis display device
JP2007249663A (en) * 2006-03-16 2007-09-27 Nec Corp Transaction device, delay failure detection device and method, and program
JP2008021062A (en) * 2006-07-12 2008-01-31 Mitsubishi Electric Corp Monitoring apparatus, monitoring method and monitoring program
JP2008027061A (en) * 2006-07-19 2008-02-07 Internatl Business Mach Corp <Ibm> Technique for detecting abnormal information processing apparatus
JP2008090699A (en) * 2006-10-04 2008-04-17 Hitachi Ltd Method, apparatus and program of trace logging
WO2008072678A1 (en) * 2006-12-12 2008-06-19 International Business Machines Corporation Detecting device, system, program, and detecting method
JP2009146001A (en) * 2007-12-11 2009-07-02 Japan Research Institute Ltd System and method for obtaining business performance

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04355455A (en) * 1991-05-31 1992-12-09 Iwasaki Electric Co Ltd Display structure of mark in print plate
JPH09282283A (en) * 1996-04-16 1997-10-31 Hitachi Ltd Tracing method and performance evaluation method for on-line transaction, and on-line transaction processing system
JP2004005198A (en) * 2002-05-31 2004-01-08 Nec Corp Computerized analysis display method and measurement analysis display device
JP2007249663A (en) * 2006-03-16 2007-09-27 Nec Corp Transaction device, delay failure detection device and method, and program
JP2008021062A (en) * 2006-07-12 2008-01-31 Mitsubishi Electric Corp Monitoring apparatus, monitoring method and monitoring program
JP2008027061A (en) * 2006-07-19 2008-02-07 Internatl Business Mach Corp <Ibm> Technique for detecting abnormal information processing apparatus
JP2008090699A (en) * 2006-10-04 2008-04-17 Hitachi Ltd Method, apparatus and program of trace logging
WO2008072678A1 (en) * 2006-12-12 2008-06-19 International Business Machines Corporation Detecting device, system, program, and detecting method
JP2009146001A (en) * 2007-12-11 2009-07-02 Japan Research Institute Ltd System and method for obtaining business performance

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014149606A (en) * 2013-01-31 2014-08-21 Fujitsu Ltd Resource usage totaling program, resource usage totaling method and resource usage totaling device
WO2015181921A1 (en) * 2014-05-28 2015-12-03 三菱電機株式会社 Programmable display device and rendering software
JP5996150B2 (en) * 2014-05-28 2016-09-21 三菱電機株式会社 Programmable display and drawing software
JP2015230714A (en) * 2014-06-06 2015-12-21 富士通株式会社 Abnormality detection method, abnormality detection program and abnormality detection device

Also Published As

Publication number Publication date
JP5313101B2 (en) 2013-10-09

Similar Documents

Publication Publication Date Title
US8676568B2 (en) Information processing apparatus and message extraction method
US8839271B2 (en) Call stack sampling to obtain information for analyzing idle states in a data processing system
ES2734305T3 (en) Prediction, diagnosis and recovery of application failures based on resource access patterns
US8359450B2 (en) Memory utilization analysis
US20070050174A1 (en) Method and apparatus for adaptive tracing with different processor frequencies
US20070089094A1 (en) Temporal sample-based profiling
US20080148241A1 (en) Method and apparatus for profiling heap objects
JP2009223886A (en) Method, program and device (consolidated display of resource performance trends) for generating consolidated representation of performance trends for a plurality of resources in data processing system
US8140919B2 (en) Display of data used for system performance analysis
JP2013206147A (en) Logging device, logging method, and program
WO2023185767A1 (en) Slow disk drive detection method and apparatus, and electronic device and storage medium
JP5313101B2 (en) Information management program, information management method, and information management apparatus
KR20060113551A (en) Method and apparatus for time correlating defects found on hard disks
US20100174947A1 (en) Damaged software system detection
JP2014182646A (en) Apparatus for monitoring execution of software, method and program
CN105760267A (en) Comparative detection method for CPU consumption of storage device read-write
US7657664B2 (en) Method and system for tracking device driver requests
US8930661B2 (en) Operation processing device and method of detecting memory leak
JP2011159015A (en) Program, apparatus and method for supporting search
US20120047504A1 (en) Methods, systems, and computer program products for maintaining a resource based on a cost of energy
TW201439916A (en) Method for system resource management of virtual system
KR101484783B1 (en) Digital video recorder and hard disc management method
JP2016139244A (en) Information processor, information processing method, and computer program
JP2016042339A (en) Message display method, message display apparatus, and message display program
JP2012168702A (en) Log analysis device and log analysis method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130326

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130703

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5313101

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees