JP2005284520A - Method, program, program recording medium, apparatus and system for log collection - Google Patents

Method, program, program recording medium, apparatus and system for log collection Download PDF

Info

Publication number
JP2005284520A
JP2005284520A JP2004095245A JP2004095245A JP2005284520A JP 2005284520 A JP2005284520 A JP 2005284520A JP 2004095245 A JP2004095245 A JP 2004095245A JP 2004095245 A JP2004095245 A JP 2004095245A JP 2005284520 A JP2005284520 A JP 2005284520A
Authority
JP
Japan
Prior art keywords
log
computer
log collection
collection device
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004095245A
Other languages
Japanese (ja)
Inventor
Kunihiro Koshiba
国博 小柴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2004095245A priority Critical patent/JP2005284520A/en
Publication of JP2005284520A publication Critical patent/JP2005284520A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To facilitate collection and analysis of a log in the event of a fault in a system having computers distributed in a plurality of countries and time zones. <P>SOLUTION: A log collector 1 receives a log from a log collection target unit 2N in which the fault has occurred. The log collector refers to a relating node definition file group 14, and requests other log collection target units belonging to the identical group to the log collection target unit of interest to transfer a log. Thus, the logs of the other log collection target units are automatically collected. Each log collection target unit transmits to the log collector time of the log collection target unit, time zone information and locale information simultaneously with the log transfer. The log collector preserves a difference between the time of the log collector and the time of the log collection target unit, the received time zone information and locale information, together with the collected log file, into a log file group 13M of a group M. When referring to the collected logs, the log collector performs time correction and language correction by referring to the log file group of the group M. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、信頼性向上や負荷分散のために、複数のコンピュータで1つの役割を果たすシステム(クラスタシステム)や、システムを構成する複数のコンピュータが、複数の言語、複数のタイムゾーンに分散して設置されたシステムにおいて、障害発生時のログを収集、解析するのを支援する障害情報管理システムに関する。   In the present invention, in order to improve reliability and load distribution, a system (cluster system) that plays a role in a plurality of computers and a plurality of computers constituting the system are distributed in a plurality of languages and a plurality of time zones. In particular, the present invention relates to a failure information management system that supports collecting and analyzing a log when a failure occurs.

業務システムは、小規模のシステムであっても、ファイルサーバやプリンタサーバといった、ある機能に特化したコンピュータ数台で構成され、中規模、大規模システムともなると、さまざまな機能を有した数十台、数百台のコンピュータで構成される。これらコンピュータのいずれかで障害が発生した場合、各コンピュータでログを収集すると効率が悪いため、通常、ネットワークを介してログを収集する手段を用いることにより、障害解析の効率化を図っている。   A business system is composed of several computers specialized for a certain function, such as a file server and a printer server, even if it is a small system. And hundreds of computers. When a failure occurs in any one of these computers, it is inefficient to collect the log in each computer. Therefore, the efficiency of failure analysis is usually achieved by using a means for collecting logs via a network.

ログの収集や解析の効率化のために、特開2003−216457(特許文献1)では、収集したエラーログを時系列で整理し、エラー内容から考えられる障害原因をレポートとして出力する方法が開示されている。また、特開2001−282671(特許文献2)では、障害が発生したコンピュータに、障害内容に応じた障害情報を収集するアプリケーションを配布することにより、障害発生時に適切な障害情報を収集する方法が開示されている。
特開2003−216457号公報 特開2001−282671号公報 特開2003−132019号公報
In order to improve the efficiency of log collection and analysis, Japanese Patent Laid-Open No. 2003-216457 (Patent Document 1) discloses a method of organizing collected error logs in a time series and outputting a possible cause of failure from a report as a report. Has been. Japanese Patent Laid-Open No. 2001-282671 (Patent Document 2) discloses a method of collecting appropriate failure information when a failure occurs by distributing an application that collects failure information according to the failure content to a computer in which a failure has occurred. It is disclosed.
JP 2003-216457 A JP 2001-282671 A Japanese Patent Laid-Open No. 2003-132019

近年のコンピュータシステムは、部門間や会社間でWAN(Wide Area Network)やLAN(Local Area Network)を介した通信を行たり、信頼性向上や負荷分散を目的としたデュプレックスシステムやデュアルシステム(クラスタシステム)として構成されたりする場合がある。したがって、障害解析においては、あるコンピュータの障害情報のみを解析するのではなく、ネットワークで接続されたコンピュータや、クラスタシステムを構成するコンピュータのログが同時に必要となってくるケースが多い。また、近年、ネットワーク回線の伝送容量拡大などインフラストラクチャの充実にともない、複数の国で事業を行っている企業などでは、コンピュータはネットワークを介して複数の国、複数のタイムゾーンに分散されて設置されている場合がある。   In recent years, computer systems communicate between departments and companies via WAN (Wide Area Network) and LAN (Local Area Network), duplex systems and dual systems (cluster) for the purpose of improving reliability and load distribution. System). Therefore, in failure analysis, not only failure information of a certain computer is analyzed, but there are many cases where logs of computers connected via a network and computers constituting a cluster system are required at the same time. Also, in recent years, with the expansion of infrastructure such as the expansion of network line transmission capacity, companies that operate in multiple countries have computers installed in multiple countries and multiple time zones via the network. May have been.

以上のようなコンピュータシステムにおいて、特許文献1や特許文献2に記載の発明などの従来技術を用いると、次のような問題点が生じる。   In the computer system as described above, when conventional techniques such as the inventions described in Patent Document 1 and Patent Document 2 are used, the following problems occur.

第1に、従来のログ収集方法では、障害が発生したコンピュータと関連するコンピュータのログを、障害が発生した時刻とできるだけ同一の時刻に収集することができなかった。   First, in the conventional log collection method, the computer logs related to the computer in which the failure has occurred cannot be collected at the same time as the time at which the failure has occurred.

なぜなら、従来のログ収集方法では、クラスタシステムのように複数のコンピュータで1つの機能を実現するシステムのログ収集を同時刻に確実に行う方法について考慮されていないためである。   This is because the conventional log collection method does not consider a method of reliably collecting logs at the same time in a system that realizes one function with a plurality of computers like a cluster system.

例えば、特開2003−132019号公報(特許文献3)に記載の発明では、障害が発生したコンピュータのログを収集後、ログの内容をプログラムもしくはオペレータにより解析を行い、必要に応じて他のコンピュータのログを収集する方法が開示されている。ログは上書きされたり、障害発生時にできるだけ速やかに採取されたりしなければ有効な情報を採取できない場合があるが、この収集方法では、新しく発見された障害パターンの場合など、必ずしも他のコンピュータのログが障害発生時に即時収集されない、つまりは有効なログを収集できない場合がある。   For example, in the invention described in Japanese Patent Laid-Open No. 2003-132019 (Patent Document 3), after collecting a log of a computer in which a failure has occurred, the contents of the log are analyzed by a program or an operator, and another computer is used as necessary A method for collecting the logs is disclosed. In some cases, valid information cannot be collected unless the log is overwritten or collected as soon as possible when a failure occurs. May not be collected immediately when a failure occurs, that is, a valid log may not be collected.

第2に、複数の国、複数のタイムゾーンに分散されたコンピュータの障害を解析する場合、言語の違いによる文字化けや、トレースログを時系列に整理することが困難である。   Secondly, when analyzing failures of computers distributed in a plurality of countries and a plurality of time zones, it is difficult to organize garbled characters and trace logs in a time series.

なぜなら、従来のログ収集方法では、複数の国、複数のタイムゾーンに分散されたコンピュータのログの一括管理について考慮されていないためである。   This is because the conventional log collection method does not consider collective management of computer logs distributed in a plurality of countries and a plurality of time zones.

本発明の目的は、複数の国、複数のタイムゾーンに分散された複数のコンピュータからなるコンピュータシステムにおいて、障害発生時のログの収集と分析を容易にする方法を提供することにある。   An object of the present invention is to provide a method for facilitating the collection and analysis of logs when a failure occurs in a computer system comprising a plurality of computers distributed in a plurality of countries and a plurality of time zones.

上記目的を達成するために、本発明は、被ログ収集装置で障害が発生した場合、ログ収集装置のログ収集部が、まず、当該被ログ収集装置のログ転送部からログを受信する。次に、ログ収集装置のログ収集部は、関連ノード定義ファイル郡を参照し、障害が発生した被ログ収集装置と同じグループに所属する他の被ログ収集装置のログ転送部に対してログ転送要求を行い、障害が発生した被ログ収集装置と関連づけられた他の被ログ収集装置のログを自動的に収集する。   In order to achieve the above object, according to the present invention, when a failure occurs in the log collection device, the log collection unit of the log collection device first receives a log from the log transfer unit of the log collection device. Next, the log collection unit of the log collection device refers to the related node definition file group, and transfers the log to the log transfer unit of another log collection device belonging to the same group as the log collection device in which the failure occurred. A request is made, and the logs of other log-collected devices associated with the log-collected device in which a failure has occurred are automatically collected.

また、被ログ収集装置のログ転送部は、被ログ収集装置の時刻、タイムゾーン情報、ロケール情報を、ログ転送と同時にログ収集装置のログ収集部に送信する。ログ収集装置のログ収集部は、ログ収集装置の時刻と被ログ収集装置の時刻の差分、受信したタイムゾーン情報、ロケール情報を、収集したログファイルとともにグループMのログファイル郡に保存する。ログ収集装置のログ参照部は、収集されたログを参照する場合、グループMのログファイル郡を参照することにより、時刻補正、言語補正を行う。   Further, the log transfer unit of the log collection device transmits the time, time zone information, and locale information of the log collection device to the log collection unit of the log collection device simultaneously with the log transfer. The log collection unit of the log collection device stores the difference between the time of the log collection device and the time of the log collection device, the received time zone information, and locale information in the log file group of the group M together with the collected log files. When referring to the collected logs, the log reference unit of the log collection device performs time correction and language correction by referring to the group M log file group.

以上説明したように、本発明によれば、次のような効果が得られる。   As described above, according to the present invention, the following effects can be obtained.

第1に、障害が発生したコンピュータと関連するコンピュータのログを自動的に選択して収集できる点である。クラスタシステムを構成するコンピュータのうち1台で障害が発生した場合、自動的にクラスタシステムを構成する他のコンピュータのログをすべて収集でき、保守者の作業を軽減できる。   First, it is possible to automatically select and collect computer logs related to the computer in which the failure has occurred. If a failure occurs in one of the computers that make up the cluster system, all the logs of other computers that make up the cluster system can be automatically collected, reducing the work of the maintenance personnel.

第2に、タイムゾーンが異なる地域に分散されたコンピュータのログや、同一のタイムゾーンであってもコンピュータ間の時刻が異なる複数のコンピュータのログであっても、ログを参照するコンピュータ(ログ収集装置)上の時刻を基準とした時刻に補正されるため、時差に影響されずログを時系列に整理できる点である。これにより、障害解析の時間を短縮できる。   Second, a computer that refers to a log (log collection) even if it is a log of computers distributed in different time zones or a log of a plurality of computers having the same time zone but different time between computers. Since the time is corrected with respect to the time on the device), the log can be arranged in time series without being influenced by the time difference. Thereby, the time for failure analysis can be shortened.

第3に、複数のタイムゾーンに分散されたコンピュータのログであっても、ログに記録された言語の違いによる文字化けを補正できる点である。これにより、保守性の向上と障害解析の時間を短縮できる。   Thirdly, even computer logs distributed in a plurality of time zones can correct garbled characters due to differences in languages recorded in the logs. As a result, it is possible to improve maintainability and shorten the time for failure analysis.

次に、本発明の実施の形態について、図面を参照して詳細に説明する。   Next, embodiments of the present invention will be described in detail with reference to the drawings.

図1を参照すると、本発明の一実施形態のログ収集システムは、業務アプリケーションを作動し、トレースログや、障害発生時には障害解析用のログを出力する複数の被ログ収集装置2N(N=1、2、・・・)と、被ログ収集装置2N(N=1、2、・・・)から出力されたログを収集、管理するログ収集装置1と、ログ収集装置1と被ログ収集装置2N(N=1、2、・・・)とを接続するネットワーク3を含む。   Referring to FIG. 1, a log collection system according to an embodiment of the present invention operates a business application, and outputs a trace log and a plurality of log collection apparatuses 2N (N = 1) that output a log for failure analysis when a failure occurs. 2,..., And a log collection device 1 that collects and manages logs output from the log collection device 2N (N = 1, 2,...), The log collection device 1, and the log collection device 2N (N = 1, 2,...) Is connected.

ログ収集装置1は、収集したログの時刻や言語の表示を補正するログ参照部11と、被ログ収集装置2N(N=1、2、・・・)からログを収集するログ収集部12と、ログ収集部12が収集したグループM(M=1、2、・・・)に属する被ログ収集装置2N(N=1、2、・・・)のログを保存するグループMのログファイル郡13M(M=1、2、・・・)と、グループM(M=1、2、・・・)を定義した関連ノード定義ファイル群14を含む。   The log collection device 1 includes a log reference unit 11 that corrects the display of the time and language of the collected logs, and a log collection unit 12 that collects logs from the log collection device 2N (N = 1, 2,...). The log file group of the group M that stores the logs of the log collection devices 2N (N = 1, 2,...) Belonging to the group M (M = 1, 2,...) Collected by the log collection unit 12. 13M (M = 1, 2,...) And a related node definition file group 14 that defines a group M (M = 1, 2,...).

被ログ収集装置2N(N=1、2、・・・)は、業務アプリケーションが出力したトレースログや障害発生時に出力する障害情報ログを含むログファイル2N2(N=1、2、・・・)と、ログファイルをログ収集装置1に転送するログ転送部2N1(N=1、2、・・・)を含む。   The log collection device 2N (N = 1, 2,...) Is a log file 2N2 (N = 1, 2,...) Including a trace log output by a business application and a failure information log output when a failure occurs. And a log transfer unit 2N1 (N = 1, 2,...) For transferring the log file to the log collection device 1.

図2を参照すると、グループMのログファイル郡13M(M=1、2、・・・)の詳細が示されている。グループMのログファイル郡13M(M=1、2、・・・)は、グループM(M=1、2、・・・)に属する被ログ収集装置2N(N=1、2、・・・)の時刻とログ収集装置1の時刻の差を記録する時刻差分テーブル13M1(M=1、2、・・・)と、グループM(M=1、2、・・・)に属する被ログ収集装置2N(N=1、2、・・・)のタイムゾーン情報を記録するタイムゾーンテーブル13M2(M=1、2、・・・)と、グループM(M=1、2、・・・)に属する被ログ収集装置2N(N=1、2、・・・)のロケール情報を記録するロケールテーブル13M3(M=1、2、・・・)と、グループM(M=1、2、・・・)に属する被ログ収集装置2N(N=1、2、・・・)のログファイル2N2(N=1、2、・・・)を収集したログファイル13M4(M=1、2、・・・)を含む。ここで、タイムゾーン情報とは、サマータイムなど、被ログ収集装置2N(N=1、2、・・・)が設置されている地域固有の時刻変更情報のことである。また、ロケール情報とは、被ログ収集装置2N(N=1、2、・・・)で使用している言語情報のことである。   Referring to FIG. 2, details of the log file group 13M (M = 1, 2,...) Of the group M are shown. The log file group 13M (M = 1, 2,...) Of the group M has a log collection device 2N (N = 1, 2,...) Belonging to the group M (M = 1, 2,...). ) And the time difference table 13M1 (M = 1, 2,...) For recording the difference between the time of the log collection device 1 and the log collection belonging to the group M (M = 1, 2,...). A time zone table 13M2 (M = 1, 2,...) For recording time zone information of the device 2N (N = 1, 2,...) And a group M (M = 1, 2,...) A locale table 13M3 (M = 1, 2,...) For recording locale information of log collection devices 2N (N = 1, 2,...) Belonging to the group M (M = 1, 2,. ..) log file 2N2 (N = 1, 2,...) Of the log collection device 2N (N = 1, 2,...) Belonging to Log file 13M4 (M = 1,2, ···) that was collected, including the. Here, the time zone information is time change information specific to the region where the log collection device 2N (N = 1, 2,...) Is installed, such as daylight saving time. The locale information is language information used in the log collection device 2N (N = 1, 2,...).

図3を参照すると、関連ノード定義ファイル郡14の詳細が示されている。関連ノード定義ファイル郡14は、クラスタ(グループ)を構成する被ログ収集装置2N(N=1、2、・・・)をグルーピングするテーブル14M(M=1、2、・・・)を備えている。例えば、グループ1に被ログ収集装置21と23と29がグルーピングされていることを表す。ログ収集装置1は、被ログ収集装置21と23と29のいずれか1つに障害が検出されると、被ログ収集装置21と23と29のすべてからログを収集する。   Referring to FIG. 3, details of the related node definition file group 14 are shown. The related node definition file group 14 includes a table 14M (M = 1, 2,...) For grouping the log collection devices 2N (N = 1, 2,...) Constituting the cluster (group). Yes. For example, the log collection devices 21, 23, and 29 are grouped in the group 1. When a failure is detected in any one of the log collection devices 21, 23, and 29, the log collection device 1 collects logs from all of the log collection devices 21, 23, and 29.

次に、ログ収集装置1が、グルーピングされている被ログ収集装置2N(N=1、2、・・・)の1つから障害を検出したときに、グルーピングされているすべての被ログ収集装置2N(N=1、2、・・・)からログを収集する動作について、図1から図3を参照して説明する。   Next, when the log collection device 1 detects a failure from one of the grouped log collection devices 2N (N = 1, 2,...), All the grouped log collection devices are grouped. The operation of collecting logs from 2N (N = 1, 2,...) Will be described with reference to FIGS.

負荷分散のために、複数のコンピュータで構成されたWebサーバ郡が、例えば、被ログ収集装置21と被ログ収集装置23と被ログ収集装置29で構成されているとする。関連ノード定義ファイル郡14のテーブル141には、21と23と29があらかじめ登録される。ここで、被ログ収集装置21に障害が発生した場合、被ログ収集装置21は障害ログを出力し、ログ転送部211により、ログ収集装置1にトレースログおよび障害ログを転送する。ログ収集装置1は、被ログ収集装置21のログを保存すると同時に、関連ノード定義ファイル郡14を参照し、被ログ収集装置21と関連づけられたノード(被ログ収集装置)が存在するか検索する。テーブル141に被ログ収集装置21と関連付けられた被ログ収集装置23および被ログ収集装置29が存在するため、被ログ収集装置23および被ログ収集装置29に対してログの収集指示を行い、指示を受けたログ転送部231とログ転送部291は、トレースログをログ収集装置1に転送する。   For load distribution, it is assumed that a Web server group composed of a plurality of computers is composed of, for example, a log collection device 21, a log collection device 23, and a log collection device 29. In the table 141 of the related node definition file group 14, 21, 23, and 29 are registered in advance. When a failure occurs in the log collection device 21, the log collection device 21 outputs a failure log, and the log transfer unit 211 transfers the trace log and the failure log to the log collection device 1. The log collection device 1 stores the log of the log collection device 21 and, at the same time, refers to the related node definition file group 14 and searches for a node (log collection device) associated with the log collection device 21. . Since the log collection device 23 and the log collection device 29 associated with the log collection device 21 exist in the table 141, the log collection instruction is issued to the log collection device 23 and the log collection device 29. In response to this, the log transfer unit 231 and the log transfer unit 291 transfer the trace log to the log collection device 1.

次に、ログ収集装置1が、被ログ収集装置2N(N=1、2、・・・)から収集したログに関し、グループMのログファイル群(M=1、2、・・・)を参照して、ログの補正を行う動作について、図1から図5を参照して説明する。   Next, regarding the log collected by the log collection device 1 from the log collection device 2N (N = 1, 2,...), Refer to the log file group (M = 1, 2,...) Of the group M. An operation for correcting the log will be described with reference to FIGS.

例えば、被ログ収集装置22と被ログ収集装置25が、言語やタイムゾーンの異なる遠隔地に設置され、通信を行っているとする。関連ノード定義ファイル郡14のテーブル142には、22と25があらかじめ登録される。ここで、被ログ収集装置22に障害が発生した場合、被ログ収集装置22は障害ログを出力し、ログ転送部221により、ログ収集装置1にトレースログや障害ログ、さらに、被ログ収集装置22の時刻、タイムゾーン情報、ロケール情報をあわせて転送する。   For example, it is assumed that the log collection device 22 and the log collection device 25 are installed in remote places with different languages and time zones and are communicating with each other. In the table 142 of the related node definition file group 14, 22 and 25 are registered in advance. Here, when a failure occurs in the log collection device 22, the log collection device 22 outputs a failure log, and the log transfer unit 221 causes the log collection device 1 to send a trace log and a failure log to the log collection device 1. 22 times, time zone information, and locale information are transferred together.

ログ収集装置1は、まず、転送された被ログ収集装置22の時刻と、ログ収集装置1の時刻の差分を、グループ2のログファイル郡132の時刻差分テーブル1321に保存する。例えば、ログ収集装置1が設置されている地域と被ログ収集装置22が設置されている地域の標準時間に6時間のずれがあり、ログ収集装置1と被ログ収集装置22のシステム時刻に3分のずれがあった場合、ログ収集装置1と被ログ収集装置22の時刻差分は6時間3分となる。   First, the log collection device 1 stores the difference between the transferred time of the log collection device 22 and the time of the log collection device 1 in the time difference table 1321 of the log file group 132 of the group 2. For example, there is a difference of 6 hours in the standard time between the area where the log collection device 1 is installed and the area where the log collection device 22 is installed, and the system time of the log collection device 1 and the log collection device 22 is 3 When there is a difference of minutes, the time difference between the log collection device 1 and the log collection device 22 is 6 hours and 3 minutes.

また、被ログ収集装置22のタイムゾーン情報、ロケール情報、ログファイルを、グループ2のログファイル郡132のタイムゾーンテーブル1322と、ロケールテーブル1323と、ログファイル1324にそれぞれ保存する。   Further, the time zone information, locale information, and log file of the log collection device 22 are stored in the time zone table 1322, the locale table 1323, and the log file 1324 of the log file group 132 of the group 2, respectively.

次に、ログ収集装置1は、関連ノード定義ファイル郡14のテーブルを参照し、被ログ収集装置22と関連つけられたノード(被ログ収集装置)が存在するか検索する。テーブル142に被ログ収集装置22と関連付けられた被ログ収集装置25が存在するため、被ログ収集装置25に対してログの収集指示を行い、指示を受けたログ転送部251は、トレースログをログ収集装置1に転送する。このあと、被ログ収集装置22の場合と同様な処理(時間差分、タイムゾーン情報、ロケール情報、ログファイルの保存)が行われる。   Next, the log collection device 1 refers to the table of the related node definition file group 14 and searches for a node (log collection device) associated with the log collection device 22. Since the log collection device 25 associated with the log collection device 22 exists in the table 142, the log transfer unit 251 issues a log collection instruction to the log collection device 25, and the log transfer unit 251 that receives the instruction collects the trace log. Transfer to the log collection device 1. Thereafter, the same processing (time difference, time zone information, locale information, and log file storage) as in the case of the log collection device 22 is performed.

ログ収集装置1が収集されたログを参照する場合、まず、ログ参照部11が、図4に示すように、時刻差分テーブル13M1とタイムゾーンテーブル13M2(この場合、M=2)を用いて、マスタログファイル41中の時刻をログ収集装置1のシステム時刻に補正する。前述の被ログ収集装置22の例を引用すると、時刻差分テーブル1321には、6時間3分が保存されているため、図4のマスタログファイル41の時刻を6時間3分ずらす。次に、タイムゾーンテーブル1322を用いて、被ログ収集装置22が設置されている地域においてサマータイムといった地域固有の時刻変更がある場合は、その時間分を補正する。例えば、被ログ収集装置22が設定されている地域では、サマータイムが導入され、1時間のずれがある場合、さらに1時間、合計7時間3分をマスタログファイル41の時刻に対して補正し、時刻補正後ログファイル42を生成する。   When referring to the log collected by the log collection device 1, first, the log reference unit 11 uses a time difference table 13M1 and a time zone table 13M2 (in this case, M = 2) as shown in FIG. The time in the master log file 41 is corrected to the system time of the log collection device 1. To cite the example of the log collection device 22 described above, the time difference table 1321 stores 6 hours and 3 minutes, so the time of the master log file 41 in FIG. 4 is shifted by 6 hours and 3 minutes. Next, using the time zone table 1322, if there is an area-specific time change such as daylight saving time in the area where the log collection device 22 is installed, the time is corrected. For example, in the area where the log collection device 22 is set, when daylight saving time is introduced and there is a difference of one hour, another one hour, a total of seven hours and three minutes is corrected with respect to the time of the master log file 41, A log file 42 after time correction is generated.

次にログ参照部11は、図5に示すように、ロケールテーブル1323を用いて、時刻補正後ログファイル42の文字を補正する。ログ収集装置1で使用しているロケールと被ログ収集装置22で使用しているロケールが異なる場合は、ロケール情報を用いて、時刻補正後ログファイル42に使用されている文字列をUnicodeに変換した言語補正後ログファイル43を生成し、被ログ収集装置22で使用している文字で表示可能とする。   Next, as illustrated in FIG. 5, the log reference unit 11 corrects the characters of the time-corrected log file 42 using the locale table 1323. When the locale used in the log collection device 1 and the locale used in the log collection device 22 are different, the character string used in the time-corrected log file 42 is converted to Unicode using the locale information. The language-corrected log file 43 is generated and can be displayed in the characters used in the log collection device 22.

なお、ログ収集装置1は、専用のハードウェアにより実現する以外に、その機能を実現するためのプログラムを、コンピュータ読み取りが可能な記録媒体に記録して、この記録媒体に記録されたプログラムを、ログ収集装置1となるべきコンピュータに読み込ませて実行することにより、実現するものでもよい。コンピュータ読み取りが可能な記録媒体とは、フロッピーディスク、光磁気ディスク、CD−ROM等の記録媒体、コンピュータシステムに内蔵されるハードディスク装置等の記憶装置を指す。さらに、コンピュータ読み取りが可能な記録媒体とは、インターネットを介してプログラムを送信する場合のように、短時間の間に、動的にプログラムを保持するもの(伝送媒体もしくは伝送波)、コンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含む。   The log collection device 1 records a program for realizing its function on a computer-readable recording medium in addition to being realized by dedicated hardware, and the program recorded on the recording medium is It may be realized by being read and executed by a computer to be the log collection device 1. The computer-readable recording medium refers to a recording medium such as a floppy disk, a magneto-optical disk, a CD-ROM, or a storage device such as a hard disk device built in a computer system. Furthermore, a computer-readable recording medium is a medium that dynamically holds a program (transmission medium or transmission wave) in a short time, as in the case of transmitting a program via the Internet. Such as a volatile memory, which holds a program for a certain period of time.

本発明の一実施形態のログ収集システムの構成を示した図である。It is the figure which showed the structure of the log collection system of one Embodiment of this invention. グループMのログファイル群の詳細を示した図である。6 is a diagram showing details of a log file group of group M. FIG. 関連ノード定義ファイル群の詳細を示した図である。It is the figure which showed the detail of the related node definition file group. マスタログファイルの時刻補正を示した図である。It is a figure showing time correction of a master log file. 時刻補正後ログファイルの言語補正を示した図である。It is the figure which showed the language correction of the log file after time correction.

符号の説明Explanation of symbols

1 ログ収集装置
11 ログ参照部
12 ログ収集部
13M グループMのログファイル群
13M1 時刻差分テーブル
13M2 タイムゾーンテーブル
13M3 ロケールテーブル
13M4 ログファイル
14 関連ノード定義ファイル群
14M テーブル
2N 被ログ収集装置
2N1 ログ転送部
2N2 ログファイル
3 ネットワーク
41 マスタログファイル
42 時刻補正後ログファイル
43 言語補正後ログファイル
1 Log Collection Device 11 Log Reference Unit 12 Log Collection Unit 13M Group M Log File Group
13M1 time difference table
13M2 time zone table
13M3 locale table
13M4 log file 14 Related node definition file group
14M Table 2N Logged Device 2N1 Log Transfer Unit 2N2 Log File 3 Network 41 Master Log File 42 Time Corrected Log File 43 Language Corrected Log File

Claims (9)

ネットワークによって相互に接続された複数のコンピュータにより構成されたコンピュータシステムの障害発生時に、前記複数のコンピュータから、前記ネットワークを介して、障害発生に関連するログを収集するログ収集装置で行なわれるログ収集方法であって、
前記コンピュータシステムを構成する前記複数のコンピュータの識別子を相互に関連づけて登録する第1のステップと、
障害の発生したコンピュータにより送信された、障害の発生したコンピュータを示す識別子と障害発生を示すログを受信すると、前記障害の発生したコンピュータの識別子と関連づけられた識別子を有するすべてのコンピュータに対して、当該コンピュータの保有するログの送信を要求する第2のステップを有するログ収集方法。
Log collection performed by a log collection device that collects logs related to the occurrence of a failure from the plurality of computers via the network when a failure occurs in a computer system configured by a plurality of computers interconnected by a network A method,
A first step of registering the identifiers of the plurality of computers constituting the computer system in association with each other;
Upon receipt of an identifier indicating a failed computer and a log indicating the occurrence of a failure transmitted by the failed computer, all computers having an identifier associated with the failed computer identifier are A log collection method comprising a second step of requesting transmission of a log held by the computer.
前記第2のステップで、前記ログ収集装置は、前記コンピュータに、前記コンピュータのログに加えて、前記コンピュータのシステム時刻と、前記コンピュータのタイムゾーン情報をさらに送信させ、
前記ログ収集装置が、前記コンピュータのシステム時刻と、前記コンピュータのタイムゾーン情報にもとづいて、前記コンピュータのログに含まれる時刻を、前記ログ収集装置のシステム時刻に補正する第3のステップをさらに有する、請求項1に記載のログ収集方法。
In the second step, the log collection device causes the computer to further transmit a system time of the computer and time zone information of the computer in addition to the computer log,
The log collection device further includes a third step of correcting the time included in the log of the computer to the system time of the log collection device based on the system time of the computer and the time zone information of the computer. The log collection method according to claim 1.
前記第2のステップで、前記ログ収集装置は、前記コンピュータに、前記コンピュータのログに加えて、前記コンピュータのロケール情報をさらに送信させ、
前記ログ収集装置が、前記コンピュータのロケール情報にもとづいて、前記コンピュータのログをUnicode変換する第4のステップをさらに有する、請求項1または2に記載のログ収集方法。
In the second step, the log collection device causes the computer to further transmit locale information of the computer in addition to the computer log,
The log collection method according to claim 1, wherein the log collection device further includes a fourth step of Unicode conversion of the computer log based on locale information of the computer.
請求項1から3のいずれか1項に記載の各ステップを、前記ログ収集装置となるべきコンピュータに実行させるプログラム。   The program which makes the computer which should become the said log collection apparatus perform each step of any one of Claim 1 to 3. 請求項1から3のいずれか1項に記載の各ステップを、前記ログ収集装置となるべきコンピュータに実行させるプログラムを記録した、コンピュータ読み取りが可能な記録媒体。   A computer-readable recording medium on which a program for causing a computer to be the log collecting apparatus to execute each step according to claim 1 is recorded. ネットワークによって相互に接続された複数のコンピュータにより構成されたコンピュータシステムの障害発生時に、前記複数のコンピュータから、前記ネットワークを介して、障害発生に関連するログを収集するログ収集装置であって、
あらかじめ、前記コンピュータシステムを構成する前記複数のコンピュータの識別子を相互に関連づけて登録する第1の手段と、
障害の発生したコンピュータにより送信された、障害の発生したコンピュータを示す識別子と障害発生を示すログを受信すると、前記障害の発生したコンピュータの識別子と関連づけられた識別子を有するすべてのコンピュータに対して、当該コンピュータの保有するログの送信を要求する第2の手段を有するログ収集装置。
A log collection device for collecting logs related to the occurrence of a failure from the plurality of computers via the network when a failure occurs in a computer system configured by a plurality of computers connected to each other via a network,
First means for previously registering identifiers of the plurality of computers constituting the computer system in association with each other;
Upon receipt of an identifier indicating a failed computer and a log indicating the occurrence of a failure transmitted by the failed computer, all computers having an identifier associated with the failed computer identifier are A log collection device having second means for requesting transmission of a log held by the computer.
前記第2の手段は、前記コンピュータに、前記コンピュータのログに加えて、前記コンピュータのシステム時刻と、前記コンピュータのタイムゾーン情報をさらに送信させる手段をさらに有し、
前記コンピュータのシステム時刻と、前記コンピュータのタイムゾーン情報にもとづいて、前記コンピュータのログに含まれる時刻を、前記ログ収集装置のシステム時刻に補正する第3の手段をさらに有する、請求項6に記載のログ収集装置。
The second means further includes means for causing the computer to further transmit a system time of the computer and time zone information of the computer in addition to the log of the computer,
The system according to claim 6, further comprising third means for correcting the time included in the log of the computer to the system time of the log collection device based on the system time of the computer and the time zone information of the computer. Log collector.
前記第2の手段は、前記コンピュータに、前記コンピュータのログに加えて、前記コンピュータのロケール情報をさらに送信させる手段をさらに有し、
前記コンピュータのロケール情報にもとづいて、前記コンピュータのログをUnicode変換する第4の手段をさらに有する、請求項6または7に記載のログ収集装置。
The second means further includes means for causing the computer to further transmit locale information of the computer in addition to the computer log,
The log collection device according to claim 6 or 7, further comprising a fourth means for Unicode-converting the computer log based on locale information of the computer.
コンピュータシステムを構成する、ネットワークにより相互に接続された複数のコンピュータと、
前記コンピュータシステムの障害発生時に、前記複数のコンピュータから、前記ネットワークを介して、障害発生に関連するログを収集する、請求項6から8のいずれか1項に記載の前記ログ収集装置を有するログ収集システム。
A plurality of computers connected to each other by a network, which form a computer system;
The log having the log collection device according to any one of claims 6 to 8, wherein when a failure occurs in the computer system, a log related to the failure occurrence is collected from the plurality of computers via the network. Collection system.
JP2004095245A 2004-03-29 2004-03-29 Method, program, program recording medium, apparatus and system for log collection Pending JP2005284520A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004095245A JP2005284520A (en) 2004-03-29 2004-03-29 Method, program, program recording medium, apparatus and system for log collection

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004095245A JP2005284520A (en) 2004-03-29 2004-03-29 Method, program, program recording medium, apparatus and system for log collection

Publications (1)

Publication Number Publication Date
JP2005284520A true JP2005284520A (en) 2005-10-13

Family

ID=35182853

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004095245A Pending JP2005284520A (en) 2004-03-29 2004-03-29 Method, program, program recording medium, apparatus and system for log collection

Country Status (1)

Country Link
JP (1) JP2005284520A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217118A (en) * 2007-02-28 2008-09-18 Mitsubishi Electric Corp Log file management device, log file transmission device, log file management method, log file transmission method and program
JP2010073123A (en) * 2008-09-22 2010-04-02 Nec Corp Log managing apparatus, system, method and program
US8307120B2 (en) 2006-03-07 2012-11-06 Nec Corporation Resource information managing device, system, method, and program
JP2013003950A (en) * 2011-06-20 2013-01-07 Nippon Telegr & Teleph Corp <Ntt> Decentralized processing system, log collection server, log collection method, and program
JP2016004453A (en) * 2014-06-18 2016-01-12 株式会社リコー Service provision system, log information provision method and program
JP2016071640A (en) * 2014-09-30 2016-05-09 富士通株式会社 Information processing system, logging control program, and logging control method
KR101744892B1 (en) * 2016-03-17 2017-06-09 주식회사 젠시스템즈 System and method for data searching using time series tier indexing
JP2019159448A (en) * 2018-03-08 2019-09-19 アズビル株式会社 Information processing apparatus, cloud server, data processing terminal, and time information conversion method

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8307120B2 (en) 2006-03-07 2012-11-06 Nec Corporation Resource information managing device, system, method, and program
JP2008217118A (en) * 2007-02-28 2008-09-18 Mitsubishi Electric Corp Log file management device, log file transmission device, log file management method, log file transmission method and program
JP2010073123A (en) * 2008-09-22 2010-04-02 Nec Corp Log managing apparatus, system, method and program
JP4725622B2 (en) * 2008-09-22 2011-07-13 日本電気株式会社 Log management apparatus, system, method, and program
US8126853B2 (en) 2008-09-22 2012-02-28 Nec Corporation Log managing apparatus, log managing system, log managing method and log managing program
JP2013003950A (en) * 2011-06-20 2013-01-07 Nippon Telegr & Teleph Corp <Ntt> Decentralized processing system, log collection server, log collection method, and program
JP2016004453A (en) * 2014-06-18 2016-01-12 株式会社リコー Service provision system, log information provision method and program
JP2016071640A (en) * 2014-09-30 2016-05-09 富士通株式会社 Information processing system, logging control program, and logging control method
KR101744892B1 (en) * 2016-03-17 2017-06-09 주식회사 젠시스템즈 System and method for data searching using time series tier indexing
JP2019159448A (en) * 2018-03-08 2019-09-19 アズビル株式会社 Information processing apparatus, cloud server, data processing terminal, and time information conversion method

Similar Documents

Publication Publication Date Title
US10133622B2 (en) Enhanced error detection in data synchronization operations
CN102385582A (en) Method, server and system for processing production test data
JP6160064B2 (en) Application determination program, failure detection apparatus, and application determination method
CN110865997A (en) Online identification method for hidden danger of power system equipment and application platform thereof
US20090113242A1 (en) Dynamic Partitioning of Event Patterns for Determining Symptoms
JP5331585B2 (en) Fault tolerant computer system and method in fault tolerant computer system
CN104317601A (en) Method and system for developing file interfaces
JP2005284520A (en) Method, program, program recording medium, apparatus and system for log collection
CN103678423A (en) Data file input system, device and method
JP2016045930A (en) Management system and method for controlling management system
US9141452B2 (en) Failure detection method and failure detection system
CN105468502A (en) Log collection method, device and system
JP2009276929A (en) Automatic fault handling system
JP2021140430A (en) Database migration method, database migration system, and database migration program
JP6364727B2 (en) Information processing system, distributed processing method, and program
CN101512450B (en) Data recording device
US9619443B2 (en) Enhanced messaging transaction performance with auto-selected dual-tag fields
US20070233724A1 (en) Computer-readable recording medium recorded with performance information collection program, and performance information collection apparatus and method
CN111241044B (en) Method, device, equipment and readable storage medium for constructing heterogeneous database
JP2009169793A (en) Service management method, system, and program
CN107330089B (en) Cross-network structured data collection system
CN102063427A (en) Exception handling system and method in distributed database system
CN112596867A (en) Suspension transaction processing method and distributed database system
EP2533153B1 (en) Unit for managing messages indicating event situations of monitored objects
JP2669190B2 (en) Patch data transfer control method

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090325

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090826