JP2013114372A - Log analysis device, log analysis method and program - Google Patents
Log analysis device, log analysis method and program Download PDFInfo
- Publication number
- JP2013114372A JP2013114372A JP2011258633A JP2011258633A JP2013114372A JP 2013114372 A JP2013114372 A JP 2013114372A JP 2011258633 A JP2011258633 A JP 2011258633A JP 2011258633 A JP2011258633 A JP 2011258633A JP 2013114372 A JP2013114372 A JP 2013114372A
- Authority
- JP
- Japan
- Prior art keywords
- log
- output
- coordinate value
- sequence
- executed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
本発明は、大規模分散処理システムから出力されたログを解析するログ解析装置、ログ解析方法およびプログラムに関する。 The present invention relates to a log analysis device, a log analysis method, and a program for analyzing a log output from a large-scale distributed processing system.
近年、Googleの検索システムに代表される、多数のPC(Personal Computer)サーバを用いて大規模なデータを並列して分散処理する大規模分散処理技術の研究開発が盛んに行なわれている。 2. Description of the Related Art In recent years, research and development of large-scale distributed processing technology that performs distributed processing of large-scale data in parallel using a large number of PC (Personal Computer) servers represented by a Google search system has been actively conducted.
大規模分散処理技術では、多数のPCサーバのそれぞれに小規模なデータ処理を実行させることにより、全体として大規模なデータ処理の実行を可能にしている。また、大規模分散処理技術では、データ処理の性能を向上させたい場合や、データの蓄積容量を増大させたい場合には、PCサーバを追加することによって対応できるようにしている。 In the large-scale distributed processing technology, large-scale data processing can be executed as a whole by causing each of a large number of PC servers to execute small-scale data processing. Further, in the large-scale distributed processing technology, when it is desired to improve the data processing performance or increase the data storage capacity, it is possible to cope by adding a PC server.
さらに、大規模分散処理技術では、多数のPCサーバを用いることから、PCサーバの故障に対して柔軟に対応できるようにしている。具体的には、大規模分散処理技術を適用した大規模分散処理システムでは、PCサーバの故障時にその故障したPCサーバを自動的にシステムから切り離し、システム全体の処理に影響がないようにするフォールトトレラント性が確保されている。 Furthermore, since a large-scale distributed processing technique uses a large number of PC servers, it can flexibly cope with PC server failures. Specifically, in a large-scale distributed processing system to which a large-scale distributed processing technology is applied, a fault that automatically disconnects the failed PC server from the system when a PC server fails and does not affect the processing of the entire system. Tolerant property is ensured.
一方、大規模分散処理システムを利用および運用する際には、障害時の原因分析や、想定している性能が発揮されない場合の性能分析等が必要となる。このような分析を行う場合、多数のPCサーバのそれぞれにおいて動作する多数のプロセスから出力された大量のログを解析しなければならず、この解析自体に大規模分散処理技術を要するほどの状況になることがしばしばある。 On the other hand, when using and operating a large-scale distributed processing system, it is necessary to perform cause analysis at the time of failure, performance analysis when expected performance is not exhibited, and the like. When performing such an analysis, it is necessary to analyze a large number of logs output from a large number of processes operating on each of a large number of PC servers, and this analysis itself requires a large-scale distributed processing technique. It often happens.
なお、大規模分散処理システムの障害解析作業を効率化するための技術が例えば、非特許文献1に開示されている。 For example, Non-Patent Document 1 discloses a technique for improving the efficiency of failure analysis work of a large-scale distributed processing system.
上述したように、大規模分散処理システムにおいて障害時の原因分析や性能分析を行うためには、大規模分散処理システムから出力された大量のログを解析する必要がある。 As described above, in order to perform cause analysis and performance analysis at the time of failure in a large-scale distributed processing system, it is necessary to analyze a large amount of logs output from the large-scale distributed processing system.
ここで、データベースへの書き込みや読み込み、ファイルシステムへのデータの書き込みや読み込み等、大規模分散処理システムにおいて繰り返し行われている処理に着目する。そして、このような処理において、異常なシーケンス(正常時とは異なるシーケンス)の有無の検出や、性能の変化の検出について考えてみる。 Here, attention is focused on processing that is repeatedly performed in a large-scale distributed processing system, such as writing to and reading from a database and writing and reading of data to a file system. In such a process, let us consider detection of presence / absence of an abnormal sequence (sequence different from normal) and detection of a change in performance.
まず、異常なシーケンスの有無については、例えばエラーメッセージがログに示されるような場合、このエラーメッセージを見つけることによって比較的容易に検出することができる。 First, the presence or absence of an abnormal sequence can be detected relatively easily by finding this error message when an error message is shown in the log, for example.
しかし、大規模分散処理システムは、上述したようにPCサーバ等の故障に対して柔軟に対応できるように設計されている。そのため、再送や故障回避等の処理によってシステム全体としては正常に処理が済んでいるように見える場合もある。この場合、異常なシーケンスがあることを見逃してしまう可能性がある。 However, the large-scale distributed processing system is designed so that it can flexibly cope with a failure of a PC server or the like as described above. Therefore, it may appear that the entire system has been processed normally by processing such as retransmission and failure avoidance. In this case, there is a possibility of missing an abnormal sequence.
これを回避するためには、大量のログを複数のシーケンス毎に分類し、シーケンス毎に処理過程を分析して異常なシーケンスの有無を検出する必要があるが、ログが大量であるため、膨大な時間がかかってしまう。 In order to avoid this, it is necessary to classify a large amount of logs into a plurality of sequences and analyze the processing process for each sequence to detect the presence or absence of abnormal sequences. Takes a long time.
また、性能の変化については、大規模分散処理システムの性能を測定できるアプリケーションによって検出することもできる。しかし、そのアプリケーションが定常的に動作するとは限らない。この場合も、性能の変化を見逃してしまう可能性がある。 The change in performance can also be detected by an application that can measure the performance of a large-scale distributed processing system. However, the application does not always operate constantly. In this case as well, there is a possibility that a change in performance may be missed.
これを回避するためには、異常なシーケンスを検出する場合と同様に、大量のログをシーケンス毎に分類し、それぞれの処理に要した時間を分析することになるが、ログが大量であるため、非常に労力がかかる作業となる。 To avoid this, as in the case of detecting an abnormal sequence, a large amount of logs are classified for each sequence and the time required for each process is analyzed. This is a very labor intensive work.
このように、異常なシーケンスの有無や性能の変化を検出するには、膨大な時間や労力等のコストを要するという問題点がある。 As described above, detecting the presence or absence of an abnormal sequence or a change in performance has a problem in that it requires enormous time and labor costs.
本発明は、異常なシーケンスの有無や、性能の変化の検出に要するコストを低減することを可能にするログ解析装置、ログ解析方法およびプログラムを提供することを目的とする。 An object of the present invention is to provide a log analysis device, a log analysis method, and a program that can reduce the cost required for detecting the presence or absence of an abnormal sequence or a change in performance.
上記目的を達成するために本発明のログ解析装置は、システムから出力されたログを解析するログ解析装置であって、
前記システムにおいてシーケンスが正常に実行された場合に出力されたログを、該ログに含まれる時刻情報に基づき、時間領域において周期性を有する所定の関数上の点の座標値に変換し、前記システムにおいてシーケンスが正常に実行された場合以外に出力されたログを、該ログに含まれる時刻情報に基づき、前記時間領域において前記所定の関数上以外の点の座標値に変換し、前記変換された座標値に対してフーリエ変換を実行することによって周波数領域における座標値を算出する解析部と、
前記解析部にて算出された座標値に基づいた情報を外部に通知するための出力を行う出力部と、を有する。
In order to achieve the above object, a log analysis apparatus of the present invention is a log analysis apparatus that analyzes a log output from a system,
A log output when the sequence is executed normally in the system is converted into a coordinate value of a point on a predetermined function having periodicity in the time domain based on time information included in the log, and the system The log output except when the sequence is normally executed in the step is converted into the coordinate value of the point other than the predetermined function in the time domain based on the time information included in the log, and the converted An analysis unit that calculates a coordinate value in the frequency domain by performing a Fourier transform on the coordinate value;
And an output unit that performs output for notifying the outside of information based on the coordinate value calculated by the analysis unit.
また、上記目的を達成するために本発明のログ解析方法は、システムから出力されたログを解析するログ解析装置におけるログ解析方法であって、
前記システムにおいてシーケンスが正常に実行された場合に出力されたログを、該ログに含まれる時刻情報に基づき、時間領域において周期性を有する所定の関数上の点の座標値に変換し、前記システムにおいてシーケンスが正常に実行された場合以外に出力されたログを、該ログに含まれる時刻情報に基づき、前記時間領域において前記所定の関数上以外の点の座標値に変換する処理と、
前記変換された座標値に対してフーリエ変換を実行することによって周波数領域における座標値を算出する処理と、
前記算出した座標値に基づいた情報を外部に通知するための出力を行う処理と、を有する。
In order to achieve the above object, the log analysis method of the present invention is a log analysis method in a log analysis device for analyzing a log output from a system,
A log output when the sequence is executed normally in the system is converted into a coordinate value of a point on a predetermined function having periodicity in the time domain based on time information included in the log, and the system A process of converting a log output other than when the sequence is normally executed in step 1 to a coordinate value of a point other than on the predetermined function in the time domain based on time information included in the log;
A process of calculating coordinate values in the frequency domain by performing a Fourier transform on the transformed coordinate values;
And a process of performing an output for notifying the outside of information based on the calculated coordinate value.
また、上記目的を達成するために本発明のプログラムは、システムから出力されたログを解析するログ解析装置に、
前記システムにおいてシーケンスが正常に実行された場合に出力されたログを、該ログに含まれる時刻情報に基づき、時間領域において周期性を有する所定の関数上の点の座標値に変換し、前記システムにおいてシーケンスが正常に実行された場合以外に出力されたログを、該ログに含まれる時刻情報に基づき、前記時間領域において前記所定の関数上以外の点の座標値に変換する機能と、
前記変換された座標値に対してフーリエ変換を実行することによって周波数領域における座標値を算出する機能と、
前記算出した座標値に基づいた情報を外部に通知するための出力を行う機能と、を実現させる。
In addition, in order to achieve the above object, the program of the present invention provides a log analysis device for analyzing a log output from the system.
A log output when the sequence is executed normally in the system is converted into a coordinate value of a point on a predetermined function having periodicity in the time domain based on time information included in the log, and the system A function of converting a log output except when the sequence is normally executed in step 1 to a coordinate value of a point other than on the predetermined function in the time domain based on time information included in the log;
A function of calculating coordinate values in the frequency domain by performing Fourier transform on the converted coordinate values;
And a function of performing output for notifying the outside of information based on the calculated coordinate value.
本発明は以上説明したように構成されているので、異常なシーケンスの有無や性能の変化を検出するために、大量のログをシーケンス毎に分類して解析する必要がない。 Since the present invention is configured as described above, it is not necessary to classify and analyze a large number of logs for each sequence in order to detect the presence or absence of an abnormal sequence or a change in performance.
従って、異常なシーケンスの有無や、性能の変化の検出に要するコストを低減することが可能となる。 Therefore, it is possible to reduce the cost required for detecting the presence or absence of an abnormal sequence or a change in performance.
以下に、本発明の実施の形態について図面を参照して説明する。 Embodiments of the present invention will be described below with reference to the drawings.
図1は、本発明のログ解析装置の実施の一形態の構成を示すブロック図である。 FIG. 1 is a block diagram showing a configuration of an embodiment of a log analysis apparatus of the present invention.
本実施形態のログ解析装置10は図1に示すように、ログ入力部11と、解析部12と、出力部13とを備えている。
As shown in FIG. 1, the log analysis apparatus 10 according to the present embodiment includes a
ログ入力部11は、多数のPCサーバから構成される大規模分散処理システム20から出力されたログをネットワーク50を介して受け付ける。そして、ログ入力部11は、例えば受け付けたログの数が所定数になると、受け付けた複数のログを解析部12へ出力する。なお、ログ入力部11は、例えば所定の時刻になると、受け付けた複数のログを解析部12へ出力するようにしてもよい。また、ここでは、ログ入力部11は、大規模分散処理システム20から出力されたログをネットワークを介して受け付けているが、ログを受け付ける方法は、これに限定されない。ログ入力部11は、例えば大規模分散処理システム20から出力されたログを記憶した記憶装置等に記憶されたログを受け付けることも可能である。
The
図2は、図1に示したログ入力部11が受け付ける複数のログの一例を示す図である。
FIG. 2 is a diagram illustrating an example of a plurality of logs received by the
図1に示したログ入力部11が受け付ける複数のログのそれぞれは図2に示すように、時刻を示す時刻情報と、そのログの内容を示すメッセージとを含むものとする。なお、時刻情報は例えば、そのログが大規模分散処理システム20から出力された時刻や、そのログに対応する処理が大規模分散処理システム20にて実行された時刻を示す情報である。
Each of the plurality of logs received by the
再度、図1を参照すると、解析部12は、ログをx軸(時間)とy軸とからなる時間領域において周期性を有する関数上の点の座標値に変換する。具体的には、解析部12は、ログを、時間領域における正弦関数上の点の座標値に変換する。
Referring to FIG. 1 again, the
図3は、図1に示した解析部12がログを時間領域における座標値に変換する際に用いる正弦関数を説明するための図であり、(a)は大規模分散処理システム20においてシーケンスが正常に実行された場合に出力されると想定される複数のログのそれぞれに含まれる時刻情報の一例を示す図、(b)は(a)に示した時刻情報を含む複数のログに基づいた正弦関数を示す図である。
FIG. 3 is a diagram for explaining a sine function used when the
ここでは、大規模分散処理システム20においてシーケンスが正常に実行された場合に出力されると想定されるログに含まれる時刻情報とメッセージとを、(time1,message1),(time2,message2),(time3,message3),・・・(timeN,messageN)のように表す。なお、時刻情報は、文字列ではなく整数値に変換されたものを用いる。整数値とは例えば、time1を基準とした秒数とすることが考えられる。
Here, the time information and the message included in the log that is assumed to be output when the sequence is executed normally in the large-scale distributed
大規模分散処理システム20においてシーケンスが正常に実行された場合に出力されると想定されるログは、x軸とy軸とからなる時間領域における周波数fの正弦関数(y=sin(2π×f×x)(0≦x<2π))上の点に割り当てられる。
The log that is assumed to be output when the sequence is normally executed in the large-scale distributed
具体的には、時刻(timeX)におけるxの値(x_timeX)を以下に示す式(1)を用いて算出する。 Specifically, the value (x_timeX) of x at time (timeX) is calculated using the following equation (1).
x_timeX=(timeX−time1)/(timeN−time1)・・・式(1)
そして、算出したx_timeXの値を以下に示す式(2)に代入する。
x_timeX = (timeX-time1) / (timeN-time1) Expression (1)
Then, the calculated value of x_timeX is substituted into the following equation (2).
y_messageX=sin(2π×f×x_timeX)・・・式(2)
解析部12は、上記の式(2)にて表される正弦関数を予め記憶している。また、解析部12は、シーケンスが正常に実行された場合に出力されるログの種類を記憶している。解析部12は、ログ入力部11から出力された複数のログを受け付ける。そして、解析部12は、受け付けた複数のログのうちの1つを選択し、選択したログが、シーケンスが正常に実行された場合に出力されたログであるかどうかを確認する。確認の結果、選択したログがシーケンスが正常に実行された場合に出力されたログである場合、解析部12は、以下に示す式(3)を用いてx_timeXを算出する。
y_messageX = sin (2π × f × x_timeX) (2)
The
x_timeX=((timeX mod (timeN−time1))/(timeN−time1))・・・式(3)
なお、式(3)において((timeX mod (timeN−time1))としているのは、ログを正弦関数上の点の座標値に変換する際に、x_timeXの値が0〜2πの間に含まれるようにするためである。
x_timeX = ((timeX mod (timeN-time1)) / (timeN-time1)) (3)
Note that ((timeX mod (timeN-time1)) in Equation (3) indicates that the value of x_timeX is included between 0 and 2π when the log is converted into the coordinate value of a point on the sine function. It is for doing so.
そして、解析部12は、算出したx_timeXの値を上記の式(2)に代入する。これにより、大規模分散処理システム20においてシーケンスが正常に実行された場合に出力されたログは、上述した正弦関数(y=sin(2π×f×x)(0≦x<2π))と周波数成分が同じで位相θだけが異なる正弦関数(y=sin(2π×f×x+θ)(0≦x<2π))上の点の座標値に変換されることになる。
Then, the
図4は、図1に示した解析部12がログを正弦関数上の点の座標値に変換する動作を説明するための図であり、(a)は解析部12が受け付けた複数のログのそれぞれに含まれる時刻情報の一例を示す図、(b)は(a)に示した時刻情報を含む複数のログが正弦関数上の点の座標値に変換された状態を示す図である。
4 is a diagram for explaining the operation of the
図4は、大規模分散処理システム20において相互に異なる3つのシーケンスが実行されている場合を示している。つまり、図4(a)に示すログ1−1〜1−7、ログ2−1〜2−7、ログ3−1〜3−7のそれぞれは、相互に異なる3つのシーケンスのそれぞれが実行されたことによって出力されたログである。
FIG. 4 shows a case where three different sequences are executed in the large-scale distributed
図4(b)に示す3つの正弦関数の周波数はすべて同じである。この場合、後述するフーリエ変換が実行されることにより、周波数領域には単一のスペクトルが周波数成分として現れることになる。 All three sine functions shown in FIG. 4B have the same frequency. In this case, when a Fourier transform described later is executed, a single spectrum appears as a frequency component in the frequency domain.
ここで、上述した確認の結果、選択したログが、シーケンスが正常に実行されたときに出力されたログでない場合、例えば再送処理やエラー等、シーケンスが正常に実行された場合以外に出力されたログである場合、解析部12は、上記の式(2)を用いずにログを時間領域における点の座標値に変換する。すなわち、解析部12は、選択したログを、上記の式(2)にて表される正弦関数上以外の点の座標値に変換する。具体的には例えば、(x,y)=(x_timeX,0)とする。これにより、後述するフーリエ変換が実行されることで周波数領域には、上述した単一のスペクトルとは異なるスペクトルが周波数成分として現れることになる。なお、解析部12は、受け付けた複数のログのすべてについて、上述した確認と、時間領域における点の座標値への変換とを繰り返して行う。
Here, if the selected log is not the log that was output when the sequence was executed normally as a result of the confirmation described above, it was output except when the sequence was executed normally, such as a retransmission process or an error. In the case of a log, the
次に、解析部12は、変換した複数の座標値のそれぞれに対してフーリエ変換を実行することにより、周波数領域における座標値を算出する。そして、解析部12は、算出した周波数領域における座標値を出力部13に出力する。
Next, the
なお、シーケンスが正常に実行された場合に出力されたログの数が十分でなく、フーリエ変換を実行した際に、十分な数の座標点が得られない場合には、シーケンスが正常に実行された場合に出力された1つログを、上記の式(2)上の連続する複数の点の座標値に変換しておけばよい。 Note that if the number of logs output when the sequence is executed normally is not sufficient and a sufficient number of coordinate points cannot be obtained when the Fourier transform is executed, the sequence is executed normally. In this case, one log output in this case may be converted into coordinate values of a plurality of consecutive points on the above equation (2).
再度、図1を参照すると出力部13は、画面(不図示)を備えている。出力部13は、解析部12から出力された座標値を受け付け、受け付けた座標値を示す周波数領域のグラフをその画面に表示する。
Referring to FIG. 1 again, the
図5は、図1に示した出力部13が備える画面に表示された周波数領域のグラフの一例を示す図であり、(a)は大規模分散処理システム20においてシーケンスが正常に実行された場合を示す図、(b)は大規模分散処理システム20において正常に実行されなかったシーケンスがある場合を示す図である。
FIG. 5 is a diagram illustrating an example of a frequency domain graph displayed on the screen included in the
大規模分散処理システム20においてシーケンスが正常に実行された場合には図5(a)に示すように、周波数fの単一のスペクトルのみが周波数成分として現れることになる。
When the sequence is normally executed in the large-scale distributed
一方、大規模分散処理システム20において正常に実行されなかったシーケンスがある場合には図5(b)に示すように、周波数fの単一スペクトル以外のスペクトルが周波数成分として現れることになる。これにより、例えば大規模分散処理システム20の管理者は、大規模分散処理システム20において正常に実行されなかったシーケンスがあることを把握することができる。
On the other hand, when there is a sequence that has not been normally executed in the large-scale distributed
なお、出力部13は、スペクトルを対数表示で表示することも可能である。この場合、微小な周波数成分が拡大表示されることになる。これにより、例えば大規模分散処理システム20の管理者は、大規模分散処理システム20において正常に実行されなかったシーケンスがあることをより容易に把握することができる。
The
図6は、図1に示した出力部13が備える画面に表示された周波数領域のグラフの他の例を示す図である。
FIG. 6 is a diagram illustrating another example of the frequency domain graph displayed on the screen included in the
図6では、シーケンスが正常かつ、予め想定していた性能で実行された場合の周波数をfとしている。 In FIG. 6, the frequency when the sequence is normal and is executed with the performance assumed in advance is f.
大規模分散処理システム20においてシーケンスが正常に実行されたが、その処理時間が想定よりも遅い場合、例えば図6(a)において実線で表したような、中心周波数がfよりも小さなスペクトルが周波数成分として現れることになる。一方、大規模分散処理システム20においてシーケンスが正常に実行され、その処理時間が想定よりも速い場合、例えば図6(a)において破線で表したような、中心周波数がfよりも大きなスペクトルが周波数成分として現れることになる。
When the sequence is normally executed in the large-scale distributed
また、大規模分散処理システム20においてシーケンスが正常に実行されたが、その処理時間のばらつきが想定よりも大きな場合、例えば図6(b)に示す線幅が広いスペクトルが現れることになる。一方、大規模分散処理システム20においてシーケンスが正常に実行され、その処理時間のばらつきが想定よりも小さな場合、例えば図6(b)に示す線幅が狭いスペクトルが周波数成分として現れることになる。
Further, when the sequence is normally executed in the large-scale distributed
これにより、例えば大規模分散処理システム20の管理者は、大規模分散処理システム20の性能の変化を把握することができる。
Thereby, for example, an administrator of the large-scale distributed
以下に、上記のように構成されたログ解析装置10が大規模分散処理システム20から出力されたログを解析する動作について説明する。
Below, the operation | movement which the log analyzer 10 comprised as mentioned above analyzes the log output from the large-scale distributed
図7は、図1〜図6に示したログ解析装置10が大規模分散処理システム20から出力されたログを解析する動作を説明するためのフローチャートである。
FIG. 7 is a flowchart for explaining an operation in which the log analysis apparatus 10 shown in FIGS. 1 to 6 analyzes the log output from the large-scale distributed
まず、ログ入力部11は、大規模分散処理システム20から出力された複数のログを受け付ける(ステップS1)。
First, the
そして、ログ入力部11は、受け付けた複数のログを解析部12へ出力する。
Then, the
ログ入力部11から出力された複数のログを受け付けた解析部12は、受け付けた複数のログのうち未選択のログを1つ選択する(ステップS2)。
The
そして、解析部12は、選択したログが、シーケンスが正常に実行された場合に出力されたログであるかどうかを確認する(ステップS3)。
And the
ステップS3における確認の結果、選択したログが、シーケンスが正常に実行された場合に出力されたログである場合、解析部12は、上記の式(2)および式(3)を用い、選択したログを時間領域における正弦関数上の点の座標値に変換する(ステップS4)。
As a result of the confirmation in step S3, when the selected log is a log output when the sequence is executed normally, the
一方、ステップS3における確認の結果、選択したログが、シーケンスが正常に実行された場合に出力されたログでない場合、解析部12は、選択したログを、時間領域における上記の式(2)上の点以外の座標値に変換する(ステップS5)。
On the other hand, as a result of the confirmation in step S3, when the selected log is not a log output when the sequence is executed normally, the
ステップ4またはステップ5の後、解析部12は、受け付けた複数のログのすべてを選択済みかどうかを確認する(ステップS6)。
After step 4 or
ステップS6における確認の結果、受け付けた複数のログのすべてを選択済みでない場合、ステップS2の動作へ遷移する。 As a result of the confirmation in step S6, if all of the accepted logs have not been selected, the process proceeds to the operation in step S2.
一方、ステップS6における確認の結果、受け付けた複数のログのすべてを選択済みである場合、解析部12は、ステップS4およびステップS5にて変換した複数の座標値のそれぞれに対してフーリエ変換を実行することによって周波数領域における座標値を算出する(ステップS7)。
On the other hand, as a result of the confirmation in step S6, when all of the received plurality of logs have been selected, the
そして、解析部12は、算出した座標値を出力部13へ出力する。
Then, the
解析部12から出力された座標値を受け付けた出力部13は、受け付けた座標値を示す周波数領域のグラフを画面に表示する。すなわち、出力部13は、解析部12にて算出された座標値を示す周波数領域のグラフを画面に表示する(ステップS8)。
The
このように本実施形態においてログ解析装置10は、大規模分散処理システム20においてシーケンスが正常に実行された場合に出力されたログを、そのログに含まれる時刻情報に基づき、時間領域において周期性を有する所定の関数上の点の座標値に変換する。
As described above, in the present embodiment, the log analysis apparatus 10 uses the log output when the sequence is normally executed in the large-scale distributed
また、ログ解析装置10は、大規模分散処理システム20においてシーケンスが正常に実行された場合以外に出力されたログを、そのログに含まれる時刻情報に基づき、上記の時間領域において上記の所定の関数上以外の点の座標値に変換する。
Further, the log analysis apparatus 10 outputs the log output except when the sequence is normally executed in the large-scale distributed
そして、ログ解析装置10は、変換された座標値に対してフーリエ変換を実行することによって周波数領域における座標値を算出し、算出した座標値に基づいた情報を外部に通知するための出力を行う。 Then, the log analysis device 10 calculates a coordinate value in the frequency domain by executing a Fourier transform on the converted coordinate value, and performs an output for notifying information based on the calculated coordinate value to the outside. .
これにより、異常なシーケンスの有無や性能の変化を検出するために、大量のログをシーケンス毎に分類して解析する必要がない。 Thus, it is not necessary to classify and analyze a large number of logs for each sequence in order to detect the presence or absence of abnormal sequences and changes in performance.
従って、異常なシーケンスの有無や、性能の変化の検出に要するコストを低減することが可能となる。 Therefore, it is possible to reduce the cost required for detecting the presence or absence of an abnormal sequence or a change in performance.
なお、本実施形態では、解析部12がログを正弦関数上の点の座標値に変換する場合について説明したが、解析部12がログを例えば余弦関数上の点の座標値に変換するようにしてもよい。
In this embodiment, the case where the
また、本実施形態では、出力部13が、受け付けた座標値を示す周波数領域のグラフを画面に表示する場合について説明した。但し、出力部13は、大規模分散処理システム20においてシーケンスが正常に実行されたかどうかや、性能に変化があったかどうか等のシーケンスの正常性を外部に通知することができればよい。従って、出力部13は、例えば印刷機能を備え、受け付けた座標値を示す周波数領域のグラフを印字して出力するようにしてもよい。また、出力部13は、通信機能を備え、受け付けた座標値を示す周波数領域のグラフの情報を予め決められた装置等へ送信するようにしてもよい。
In the present embodiment, the case where the
また、出力部13は、受け付けた座標値の特徴や、受け付けた座標値とシーケンスが正常に実行された場合の座標値との比較から、大規模分散処理システム20において実行されたシーケンスの正常性を確認するようにしてもよい。そして、大規模分散処理システム20において実行されたシーケンスの正常性が確認されなかった場合、出力部13は、例えば警報を発するようにしてもよい。
Further, the
また、本実施形態においては、大規模分散処理システム20からのログの出力タイミングのパターンが1つである場合を想定していた。大規模分散処理システム20からのログの出力タイミングのパターンが複数ある場合、解析部12が、相互に異なる複数の周波数のそれぞれを含む複数の正弦関数を予め記憶しておく。そして、解析部12が、受け付けた複数のログのそれぞれの出力タイミングのパターンを判定し、複数の正弦関数のうち、判定した結果に応じた正弦関数を用いてそのログを時間領域における座標値に変換するようにすればよい。これにより、周波数領域において相互に異なる複数の周波数成分が現れることになる。
Further, in the present embodiment, it is assumed that the log output timing pattern from the large-scale distributed
また、本発明においては、ログ解析装置内の処理は上述の専用のハードウェアにより実現されるもの以外に、その機能を実現するためのプログラムをログ解析装置にて読取可能な記録媒体に記録し、この記録媒体に記録されたプログラムをログ解析装置に読み込ませ、実行するものであっても良い。ログ解析装置にて読取可能な記録媒体とは、フレキシブルディスク、光磁気ディスク、DVD、CDなどの移設可能な記録媒体の他、ログ解析装置に内蔵されたHDDなどを指す。 In the present invention, the processing in the log analysis device is recorded on a recording medium readable by the log analysis device, in addition to the processing realized by the dedicated hardware described above. The program recorded on the recording medium may be read by a log analysis device and executed. The recording medium that can be read by the log analysis apparatus refers to a transfer medium such as a flexible disk, a magneto-optical disk, a DVD, and a CD, and an HDD built in the log analysis apparatus.
10 ログ解析装置
11 ログ入力部
12 解析部
13 出力部
20 大規模分散処理システム
50 ネットワーク
DESCRIPTION OF SYMBOLS 10
Claims (6)
前記システムにおいてシーケンスが正常に実行された場合に出力されたログを、該ログに含まれる時刻情報に基づき、時間領域において周期性を有する所定の関数上の点の座標値に変換し、前記システムにおいてシーケンスが正常に実行された場合以外に出力されたログを、該ログに含まれる時刻情報に基づき、前記時間領域において前記所定の関数上以外の点の座標値に変換し、前記変換された座標値に対してフーリエ変換を実行することによって周波数領域における座標値を算出する解析部と、
前記解析部にて算出された座標値に基づいた情報を外部に通知するための出力を行う出力部と、を有するログ解析装置。 A log analysis device for analyzing a log output from a system,
A log output when the sequence is executed normally in the system is converted into a coordinate value of a point on a predetermined function having periodicity in the time domain based on time information included in the log, and the system The log output except when the sequence is normally executed in the step is converted into the coordinate value of the point other than the predetermined function in the time domain based on the time information included in the log, and the converted An analysis unit that calculates a coordinate value in the frequency domain by performing a Fourier transform on the coordinate value;
A log analysis device comprising: an output unit configured to output information for notifying outside of information based on the coordinate value calculated by the analysis unit.
前記出力部は、前記解析部にて算出された座標値を示す周波数領域のグラフを表示するログ解析装置。 The log analysis apparatus according to claim 1,
The log analysis device that displays a graph of a frequency domain indicating the coordinate value calculated by the analysis unit.
前記出力部は、前記解析部にて算出された座標値に基づき、前記システムにおいて実行されたシーケンスの正常性を確認し、該確認の結果を外部に通知するための出力を行うログ解析装置。 The log analysis apparatus according to claim 1,
The log analysis device, wherein the output unit confirms the normality of a sequence executed in the system based on the coordinate value calculated by the analysis unit, and performs output for notifying the result of the confirmation to the outside.
前記所定の関数は、正弦関数または余弦関数であるログ解析装置。 In the log analysis device according to any one of claims 1 to 3,
The log analysis apparatus, wherein the predetermined function is a sine function or a cosine function.
前記システムにおいてシーケンスが正常に実行された場合に出力されたログを、該ログに含まれる時刻情報に基づき、時間領域において周期性を有する所定の関数上の点の座標値に変換し、前記システムにおいてシーケンスが正常に実行された場合以外に出力されたログを、該ログに含まれる時刻情報に基づき、前記時間領域において前記所定の関数上以外の点の座標値に変換する処理と、
前記変換された座標値に対してフーリエ変換を実行することによって周波数領域における座標値を算出する処理と、
前記算出した座標値に基づいた情報を外部に通知するための出力を行う処理と、を有するログ解析方法。 A log analysis method in a log analysis device for analyzing a log output from a system,
A log output when the sequence is executed normally in the system is converted into a coordinate value of a point on a predetermined function having periodicity in the time domain based on time information included in the log, and the system A process of converting a log output other than when the sequence is normally executed in step 1 to a coordinate value of a point other than on the predetermined function in the time domain based on time information included in the log;
A process of calculating coordinate values in the frequency domain by performing a Fourier transform on the transformed coordinate values;
And a process of performing an output for notifying the outside of information based on the calculated coordinate value.
前記システムにおいてシーケンスが正常に実行された場合に出力されたログを、該ログに含まれる時刻情報に基づき、時間領域において周期性を有する所定の関数上の点の座標値に変換し、前記システムにおいてシーケンスが正常に実行された場合以外に出力されたログを、該ログに含まれる時刻情報に基づき、前記時間領域において前記所定の関数上以外の点の座標値に変換する機能と、
前記変換された座標値に対してフーリエ変換を実行することによって周波数領域における座標値を算出する機能と、
前記算出した座標値に基づいた情報を外部に通知するための出力を行う機能と、を実現させるためのプログラム。 In the log analysis device that analyzes the log output from the system,
A log output when the sequence is executed normally in the system is converted into a coordinate value of a point on a predetermined function having periodicity in the time domain based on time information included in the log, and the system A function of converting a log output except when the sequence is normally executed in step 1 to a coordinate value of a point other than on the predetermined function in the time domain based on time information included in the log;
A function of calculating coordinate values in the frequency domain by performing Fourier transform on the converted coordinate values;
A program for realizing an output for notifying the outside of information based on the calculated coordinate value.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011258633A JP5632354B2 (en) | 2011-11-28 | 2011-11-28 | Log analysis apparatus, log analysis method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011258633A JP5632354B2 (en) | 2011-11-28 | 2011-11-28 | Log analysis apparatus, log analysis method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013114372A true JP2013114372A (en) | 2013-06-10 |
JP5632354B2 JP5632354B2 (en) | 2014-11-26 |
Family
ID=48709885
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011258633A Expired - Fee Related JP5632354B2 (en) | 2011-11-28 | 2011-11-28 | Log analysis apparatus, log analysis method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5632354B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016076071A (en) * | 2014-10-06 | 2016-05-12 | 富士通株式会社 | Log management apparatus, log management program, and log management method |
CN115878421A (en) * | 2022-12-09 | 2023-03-31 | 国网湖北省电力有限公司信息通信公司 | Data center equipment-level fault prediction method, system and medium based on log time sequence correlation characteristic mining |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009116651A (en) * | 2007-11-07 | 2009-05-28 | Nec Corp | Fault analysis system, method and program |
JP2010086160A (en) * | 2008-09-30 | 2010-04-15 | Nec Corp | Fault analysis system, fault analysis method, and program for fault analysis |
JP2010134862A (en) * | 2008-12-08 | 2010-06-17 | Nec Corp | Log analysis system, method, and program |
-
2011
- 2011-11-28 JP JP2011258633A patent/JP5632354B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009116651A (en) * | 2007-11-07 | 2009-05-28 | Nec Corp | Fault analysis system, method and program |
JP2010086160A (en) * | 2008-09-30 | 2010-04-15 | Nec Corp | Fault analysis system, fault analysis method, and program for fault analysis |
JP2010134862A (en) * | 2008-12-08 | 2010-06-17 | Nec Corp | Log analysis system, method, and program |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016076071A (en) * | 2014-10-06 | 2016-05-12 | 富士通株式会社 | Log management apparatus, log management program, and log management method |
CN115878421A (en) * | 2022-12-09 | 2023-03-31 | 国网湖北省电力有限公司信息通信公司 | Data center equipment-level fault prediction method, system and medium based on log time sequence correlation characteristic mining |
CN115878421B (en) * | 2022-12-09 | 2023-11-14 | 国网湖北省电力有限公司信息通信公司 | Data center equipment level fault prediction method, system and medium |
Also Published As
Publication number | Publication date |
---|---|
JP5632354B2 (en) | 2014-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11748394B1 (en) | Using indexers from multiple systems | |
US11768848B1 (en) | Retrieving, modifying, and depositing shared search configuration into a shared data store | |
US10679135B2 (en) | Periodicity analysis on heterogeneous logs | |
US20160085792A1 (en) | Systems and methods for large-scale system log analysis, deduplication and management | |
US20160321352A1 (en) | Systems and methods for providing dynamic indexer discovery | |
JPWO2013111560A1 (en) | Operation management apparatus, operation management method, and program | |
US20170201606A1 (en) | Automatically adjusting timestamps from remote systems based on time zone differences | |
Devold et al. | Digitalization of oil and gas facilities reduce cost and improve maintenance operations | |
JP6413537B2 (en) | Predictive failure notification device, predictive notification method, predictive notification program | |
US20190196897A1 (en) | Influence range specifying method, influence range specifying apparatus, and storage medium | |
JP5632354B2 (en) | Log analysis apparatus, log analysis method, and program | |
US20180276566A1 (en) | Automated meta parameter search for invariant based anomaly detectors in log analytics | |
US20180137275A1 (en) | Malware collusion detection | |
JP2009098706A (en) | Device for supporting analysis of processing history, its system, and its program | |
Huang et al. | Component fault diagnosis and fault tolerance of alternating group graphs | |
JP2019049802A (en) | Failure analysis supporting device, incident managing system, failure analysis supporting method, and program | |
Collier et al. | Machine Learning with the Elastic Stack: Expert techniques to integrate machine learning with distributed search and analytics | |
WO2022104163A1 (en) | System and method for facilitating management of application infrastructure for plurality of users | |
JP5743826B2 (en) | Configuration information management program and configuration information management method | |
JP2012168702A (en) | Log analysis device and log analysis method | |
CN115348197B (en) | Network asset detection method and device, electronic equipment and storage medium | |
Tanabe et al. | Integration of Wireless and Remote Monitoring in Condition Monitoring Systems for Offshore Applications | |
US11843530B2 (en) | System, method, and computer program for unobtrusive propagation of solutions for detected incidents in computer applications | |
JP4947218B2 (en) | Message classification method and message classification device | |
US20220261689A1 (en) | Off-duty-cycle-robust machine learning for anomaly detection in assets with random down times |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140821 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141007 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141009 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5632354 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |