JP2010066801A - Log recording system, module monitoring means, trace log managing means, recording method, program, and storage medium - Google Patents

Log recording system, module monitoring means, trace log managing means, recording method, program, and storage medium Download PDF

Info

Publication number
JP2010066801A
JP2010066801A JP2008229827A JP2008229827A JP2010066801A JP 2010066801 A JP2010066801 A JP 2010066801A JP 2008229827 A JP2008229827 A JP 2008229827A JP 2008229827 A JP2008229827 A JP 2008229827A JP 2010066801 A JP2010066801 A JP 2010066801A
Authority
JP
Japan
Prior art keywords
log
module
health check
trace
log recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008229827A
Other languages
Japanese (ja)
Inventor
Hisami Ebisu
九美 戎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008229827A priority Critical patent/JP2010066801A/en
Publication of JP2010066801A publication Critical patent/JP2010066801A/en
Withdrawn legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a log recording system, a module monitoring means, a trace log managing means, a recording method, a program, and a storage medium that improve a problem place detection rate when problem arising after product shipment of software on a communication system. <P>SOLUTION: The log recording system includes, for a plurality of modules, a module monitoring means of periodically making a health check and a trace log managing means of receiving log recording requests from the respective modules and recording logs in a plurality of trace files. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、ログ記録システム、モジュール監視手段、トレースログ管理手段、記録方法、プログラム、及び記憶媒体に関する。   The present invention relates to a log recording system, module monitoring means, trace log management means, recording method, program, and storage medium.

プログラムの開発においては、単体、及び結合試験用にログを埋め込むが、そのログは製品出荷後には出力しないログとしてたびたび残したままとなるが、通常使用されることはない。
一方で、出荷後の問題発生時には、ログ出力のディスク容量を考慮し、必要最低限のログ出力に留めるため、プログラム上の異常ルートを通過したときに、必要なログを記録する仕組みをつくっている。
In program development, logs are embedded for unit tests and combination tests, but the logs are often left as logs that are not output after product shipment, but are not normally used.
On the other hand, when problems occur after shipment, in order to keep the log output to the minimum necessary in consideration of the log output disk capacity, create a mechanism to record the necessary logs when passing the abnormal route on the program Yes.

しかし、このようなログだけでは、問題箇所の特定が困難な場合があり、単体・結合試験レベルのログを確認する手段を提供する必要性があった。
そこで、ヘルスチェックを行うことで、プログラムの異常を検知し、再起動を行う機能が特許文献1に記載されている。
また、特許文献1に関連した技術が特許文献2,3に記載されている。
特許文献1の「ソフトウェアシステム」は、「OS(Operation System)と、OS上で動作するアプリケーションプログラムとを含むソフトウェアシステムにおいて、アプリケーションプログラムが正常に動作するときに送出するヘルスチェックコマンドを検出すると共に、ヘルスチェックコマンド非検出時にアプリケーションプログラムを強制終了させる監視プログラムをOS上に備えるように構成した」ものである。
However, there are cases where it is difficult to identify a problem location with such a log alone, and there is a need to provide a means for confirming a log at a unit / combination test level.
Therefore, Patent Document 1 describes a function of detecting a program abnormality by performing a health check and restarting the program.
Further, techniques related to Patent Document 1 are described in Patent Documents 2 and 3.
The “software system” of Patent Document 1 detects a health check command that is sent when an application program operates normally in a software system that includes an OS (Operation System) and an application program that runs on the OS. The monitoring program for forcibly terminating the application program when the health check command is not detected is configured on the OS ”.

特許文献1に記載の発明によれば、アプリケーションプログラムを監視する機能を付加するようにOSを改造することが不可能なソフトウェアシステムに於いても、監視プログラムによりアプリケーションプログラムの異常検出を行うと共に、異常検出時にはアプリケーションプログラムを強制終了させて再立ち上げ(リブート)させることができる。その結果、極めて信頼性の高いソフトウェアシステムを提供することができるとしている。   According to the invention described in Patent Document 1, even in a software system in which the OS cannot be modified so as to add a function for monitoring an application program, an abnormality of the application program is detected by the monitoring program, When an abnormality is detected, the application program can be forcibly terminated and restarted (rebooted). As a result, it is possible to provide a highly reliable software system.

特許文献2に記載の「システムコンソール故障通知方式」は、「コンピュータ装置に接続されたシステムコンソールの故障を保守要員に通知する方式において、コンピュータ装置に設けられてヘルスチェック電文を周期的に送信するヘルスチェック電文送信手段と、システムコンソールに設けられてヘルスチェック電文を受信するヘルスチェック電文受信手段と、システムコンソールに設けられてヘルスチェック電文受信手段がヘルスチェック電文を受信すると応答電文を送信する応答電文返送手段と、コンピュータ装置に設けられて応答電文を受信する応答電文受信手段と、コンピュータ装置に設けられて応答電文受信手段が応答電文を所定時間内に受信しないと警報信号を送信する故障検出手段と、コンピュータ装置に設けられて警報信号を受信すると所定の警報を発する警報装置とを備えた」ものである。   The “system console failure notification method” described in Patent Document 2 is a “method of notifying maintenance personnel of a failure of a system console connected to a computer device” and is periodically provided with a health check message provided in the computer device. Health check message sending means, health check message receiving means provided in the system console for receiving health check messages, and response provided in the system console for sending a response message when the health check message receiving means receives a health check message Failure detection that transmits a warning signal if the response message receiving means provided in the computer device does not receive the response message within a predetermined time. Means and a warning signal provided in the computer device. Upon receiving the one in which "and a warning device which emits a prescribed warning.

特許文献2に記載の発明によれば、ヘルスチェック電文に対するシステムコンソールの応答をコンピュータ装置側で監視し、所定時間内に応答電文が得られないとシステムコンソールの故障と判定し、コンピュータ装置に設けた警報装置を動作させるため、システムコンソールの故障を保守要員に直ちに通知することができるとしている。   According to the invention described in Patent Literature 2, the response of the system console to the health check message is monitored on the computer device side, and if the response message is not obtained within a predetermined time, it is determined that the system console has failed, and is provided in the computer device. In order to operate the alarm device, the maintenance staff can be notified immediately of the system console failure.

特許文献3に記載の「アプリケーションのログレベルの動的変更方法」は、「外部のログレベル設定テーブルを読むことにより、出力基準としてのログレベルを内部設定する機能と、プログラムの要所にログ出力文がレベルを付けて書き込まれ、プログラム実行中に、このログ出力文に出会ったとき、このレベルが出力基準として内部設定されたログレベル以下のとき、このログを外部のログファイルに出力する機能と、外部からログレベル変更の通知を受けたとき、ログレベル設定テーブルを再読込みして、出力基準としてのログレベルの内部設定を変更する機能とを有し、オぺレーティングシステムのカーネルの管理の下に起動するアプリケーションプロセスと、カーネルからアプリケーションプロセスの実行状態の問合せができるようにするため、アプリケーションプロセスを自己の子プロセスとして起動し、実行中に所定周期で行われる、この問合せにより、アプリケーションプロセスに不具合が発生していることを検出したとき、ログレベル設定テーブルにおける、そのアプリケーションの出力基準としてのログレベルを、高いレベルに書換えるとともに、そのアプリケーションプロセスに、ログレベル変更の通知を行うシグナルを送信するアプリケーション不具合検出プロセスを実行する」ものである。   The method for dynamically changing the log level of an application described in Patent Document 3 describes a function for internally setting a log level as an output standard by reading an external log level setting table, and logging at key program points. When an output statement is written with a level and this log output statement is encountered during program execution, this log is output to an external log file when this level is below the log level set internally as the output standard. And a function to re-read the log level setting table and change the internal setting of the log level as an output standard when receiving a log level change notification from the outside. The application process that starts under management and the execution status of the application process can be queried from the kernel Therefore, when an application process is started as its own child process and a failure occurs in the application process by this query that is performed at a predetermined cycle during execution, the application in the log level setting table is detected. The log level as the output standard is rewritten to a high level, and an application defect detection process for transmitting a signal for notifying the application process of the log level change is executed.

特許文献3に記載の発明によれば、ログレベルに従ってログファイルを出力するアプリケーションを実行する場合において、そのログレベルを必要に応じて動的に変更するようにしたから、アプリケーションのパフォーマンス低下、及びログファイルによるハードディスク等の空き容量の圧迫を問題にしないで、アプリケーション・トラブルの原因究明に必要なログをログファイルに十分に書き込めるようになる。これは、24時間体制で連続運転される監視制御システムで実行されるアプリケーションのように、長期間に亘って連続実行されるためログファイルが肥大化し易い場合に、特に有益な方法となるとしている。
特開2003−173274号公報 特開平10−116211号公報 特開平11−327965号公報
According to the invention described in Patent Document 3, when an application that outputs a log file according to a log level is executed, the log level is dynamically changed as necessary. Logs necessary for investigating the cause of an application trouble can be sufficiently written to the log file without causing the problem of compression of free space on the hard disk or the like by the log file. This is a particularly useful method when the log file tends to be enlarged because it is continuously executed over a long period of time, such as an application executed in a monitoring control system that is continuously operated 24 hours a day. .
JP 2003-173274 A JP-A-10-116211 JP 11-327965 A

本発明に関連するログ記録システムでは、通信システムの製品出荷時には通常、課金等のために通信記録を取るなど以外は、異常を検知した場合に、その時点での状態をログとして記録する仕組みを組み込んでいる。たとえば、プログラム上の異常ルートを通過したときに、異常であることをログとして残す仕組みを提供している。しかし、このようなログだけでは、問題箇所の特定が困難な場合があった。   The log recording system related to the present invention has a mechanism for recording the state at that time as a log when an abnormality is detected, except for communication recording for billing etc. Incorporated. For example, it provides a mechanism for leaving a log indicating that there is an abnormality when passing through an abnormal route on the program. However, there are cases where it is difficult to identify the problem part only with such a log.

一方、正常動作時にも単体試験や結合試験レベルのデバッグ用ログを頻繁に記録していれば、問題発生時の解析が容易になるが、出荷時に単体試験や結合試験レベルのデバッグログを出力し続けていると、メモリ容量が枯渇し、重要な情報の記録ができないなどの支障がでてくるという問題があった。   On the other hand, if the debug logs at the unit test and integration test levels are frequently recorded even during normal operation, analysis at the time of the problem will be easier, but the debug logs at the unit test and integration test levels will be output at the time of shipment. If it continues, there is a problem that memory capacity is depleted and troubles such as inability to record important information occur.

そこで、本発明の目的は、通信システム上のソフトウエアにおける、製品出荷後の問題発生時の問題箇所検出率を向上させたログ記録システム、モジュール監視手段、トレースログ管理手段、記録方法、プログラム、及び記憶媒体を提供することを目的とする。   Accordingly, an object of the present invention is to provide a log recording system, a module monitoring unit, a trace log management unit, a recording method, a program, and a program that improve a problem location detection rate when a problem occurs after product shipment in software on a communication system. And a storage medium.

本発明のシステムは、複数のモジュールに対し、定期的にヘルスチェックを行うモジュール監視手段と、各モジュールからのログ記録要求を受信し、ログを複数のトレースファイルに記録するトレースログ管理手段と、を備えたことを特徴とする。   The system of the present invention includes a module monitoring unit that periodically performs a health check for a plurality of modules, a trace log management unit that receives a log recording request from each module and records the logs in a plurality of trace files, It is provided with.

本発明のモジュール監視手段は、各モジュールからのログ記録要求を受信し、ログを複数のトレースファイルに記録するトレースログ管理手段を備えたログ記録システムに用いられるモジュール監視手段において、複数のモジュールに対し、定期的にヘルスチェックを行い、複数のモジュールに対し、定期的にヘルスチェックを行うことを特徴とする。   The module monitoring means of the present invention receives a log recording request from each module, and the module monitoring means used in the log recording system provided with the trace log management means for recording the log in a plurality of trace files includes a plurality of modules. On the other hand, the health check is performed periodically, and the health check is performed periodically for a plurality of modules.

本発明のトレースログ管理手段は、複数のモジュールに対し、定期的にヘルスチェックを行うモジュール監視手段を備えたログ記録システムに用いられるトレースログ管理手段において、各モジュールからのログ記録要求を受信し、ログを複数のトレースファイルに記録することを特徴とする。   The trace log management means of the present invention receives a log recording request from each module in a trace log management means used in a log recording system provided with a module monitoring means for periodically performing a health check on a plurality of modules. The log is recorded in a plurality of trace files.

本発明のログ記録方法は、複数のモジュールに対し、定期的にヘルスチェックを行い、各モジュールからのログ記録要求を受信し、ログを複数のトレースファイルに記録することを特徴とする。   The log recording method of the present invention is characterized by periodically performing a health check on a plurality of modules, receiving a log recording request from each module, and recording the logs in a plurality of trace files.

本発明のプログラムは、コンピュータが読み取り可能なプログラムであって、前記コンピュータが、モジュール監視手段に複数のモジュールに対し、定期的にヘルスチェックを行う手順、トレースログ管理手段に各モジュールからのログ記録要求を受信し、ログを複数のトレースファイルに記録する手順を実行させることを特徴とする。   The program of the present invention is a computer-readable program, in which the computer periodically performs a health check on a plurality of modules in the module monitoring means, and log recording from each module in the trace log management means A procedure for receiving a request and recording a log in a plurality of trace files is executed.

本発明の記憶媒体は、上記プログラムを記憶したことを特徴とする。   The storage medium of the present invention stores the above program.

本発明によれば、通信システム上のソフトウエアにおける、製品出荷後の問題発生時の問題箇所検出率を向上させたログ記録システム、モジュール監視手段、トレースログ管理手段、記録方法、プログラム、及び記憶媒体の提供を実現することができる。   According to the present invention, a log recording system, module monitoring means, trace log management means, recording method, program, and storage with improved problem location detection rate when a problem occurs after product shipment in software on a communication system Provision of a medium can be realized.

<特 徴>
図1は、本発明に係るログ記録システムの一実施の形態を示す概念図である。
本発明に係るログ記録システムの一実施の形態は、各モジュール11のヘルスチェックを行うモジュール監視手段13と、モジュール監視部13があるモジュールのヘルスチェックのタイムアウトを検出すると、トレースログ管理部12にヘルスチェックタイムアウトが発生したことを通知する手段18と、トレースログ管理部12がヘルスチェックタイムアウトしたモジュールのログ記録設定レベルを変更して記録を行う手段16とを備え、異常を検知すると、単体試験、結合試験レベルのログを記録するよう動作することを特徴とする。
<Features>
FIG. 1 is a conceptual diagram showing an embodiment of a log recording system according to the present invention.
An embodiment of the log recording system according to the present invention is configured such that the module monitoring unit 13 that performs the health check of each module 11 and the trace log management unit 12 detect the timeout of the health check of the module having the module monitoring unit 13. The unit 18 for notifying that the health check timeout has occurred and the unit 16 for recording by changing the log recording setting level of the module for which the health check has timed out by the trace log management unit 12 are detected. , Characterized in that it operates to record a log of the binding test level.

<構 成>
次に、本発明に係るログ記録システムの一実施の形態の構成について図面を参照して詳細に説明する。
図1を参照すると、本ログ記録システムは、複数のモジュール11(モジュールA〜モジュールX)と、トレースログ管理部12と、モジュール監視部13と、複数のトレースログファイル14(トレースログファイルA〜トレースログファイルX)とで構成されている。
<Configuration>
Next, the configuration of an embodiment of a log recording system according to the present invention will be described in detail with reference to the drawings.
Referring to FIG. 1, the log recording system includes a plurality of modules 11 (module A to module X), a trace log management unit 12, a module monitoring unit 13, and a plurality of trace log files 14 (trace log files A to And a trace log file X).

モジュール11は、複数のモジュールから構成されており、通信システムの各種機能を提供するためのモジュール群である。各モジュールは11、トレースログ管理部12にログ記録要求を行う手段15と、モジュール監視部13からのヘルスチェックに対して、応答を返却する手段17とを備えている。   The module 11 is composed of a plurality of modules, and is a module group for providing various functions of the communication system. Each module 11 includes means 15 for making a log recording request to the trace log management unit 12 and means 17 for returning a response to the health check from the module monitoring unit 13.

トレースログ管理部12は、各モジュール11からのログ記録要求15を受信し、ログを記録する手段16と、モジュール監視部13からのヘルスチェックタイムアウト通知18を受信する機能を備えている。   The trace log management unit 12 has a function of receiving a log recording request 15 from each module 11 and receiving a log 16 and a health check timeout notification 18 from the module monitoring unit 13.

モジュール監視部13は、各モジュール11に対し、定期的にヘルスチェックを行う手段17を備えている。また。一定時間内に各モジュール11からヘルスチェック応答を受信できない場合に、トレースログ管理部12にヘルスチェックタイムアウト通知18を送信する機能を備えている。   The module monitoring unit 13 includes means 17 for periodically performing a health check on each module 11. Also. A function of transmitting a health check timeout notification 18 to the trace log management unit 12 when a health check response cannot be received from each module 11 within a predetermined time is provided.

トレースログファイル14は、モジュール単位にログを記録するためのファイルであり、トレースログ管理部12によってログが書かれる。   The trace log file 14 is a file for recording a log in module units, and the log is written by the trace log management unit 12.

<動作の説明>
次に、図1、図2、図3及び図4を参照して本実施形態の動作について詳細に説明する。
まず、モジュール監視部13の動作について図2を参照して説明する。
図2は、図1に示したログ記録システムに用いられるモジュール監視部の動作を説明するためのフローチャートの一例である。
モジュール監視部13は、各モジュール11に対し、定期的にヘルスチェックを行い、一定時間内に各モジュール11からヘルスチェック応答受信できている状態がある(ステップ31)。
<Description of operation>
Next, the operation of the present embodiment will be described in detail with reference to FIG. 1, FIG. 2, FIG. 3, and FIG.
First, the operation of the module monitoring unit 13 will be described with reference to FIG.
FIG. 2 is an example of a flowchart for explaining the operation of the module monitoring unit used in the log recording system shown in FIG.
The module monitoring unit 13 periodically performs a health check on each module 11, and there is a state in which a health check response can be received from each module 11 within a predetermined time (step 31).

そのヘルスチェック応答受信できている状態から、あるモジュール(ここではモジュールAとする)が障害を起こすなどして、ヘルスチェック応答の送信ができなくなると、モジュール監視部13のヘルスチェック応答待ちタイマがタイムアウトすることで、モジュールAのヘルスチェックタイムアウトを検出し(ステップS32)、1回目の場合には1回目としてカウントする。(ステップ32/Yes)。   When a health check response cannot be transmitted due to a failure of a certain module (here, module A) from the state in which the health check response can be received, the health check response waiting timer of the module monitoring unit 13 is set. By timeout, the health check timeout of module A is detected (step S32), and the first time is counted as the first time. (Step 32 / Yes).

次にトレースログ管理部へモジュールAのヘルスチェックタイムアウト検出通知を送信する(ステップ33)。
次の定期ヘルスチェックにおいても、ヘルスチェックタイムアウトを検出し(ステップ34)、2回目の場合には2回目とカウントする(ステップ34/Yes)。
Next, a health check timeout detection notification of module A is transmitted to the trace log management unit (step 33).
Also in the next periodic health check, a health check timeout is detected (step 34), and in the second case, it is counted as the second time (step 34 / Yes).

このようにしてヘルスチェックタイムアウトの回数をカウントアップしていき、設定した再開までのカウント値Nに達するか否かを判断し(ステップ35)、カウント値Nに達した場合(ステップ35/Yes)、装置の再起動を行う(ステップ36)。   In this way, the number of health check timeouts is counted up, and it is determined whether or not the count value N until the set restart is reached (step 35). When the count value N is reached (step 35 / Yes) Then, the apparatus is restarted (step 36).

ヘルスチェックタイムアウトの回数カウントがNに満たない間に、モジュールAのヘルスチェック応答を受信すると(ステップ32/No、ステップ33/No、ステップ34/No、ステップ35/No)、モジュールAが復旧したと判断し、トレースログ管理部へ復旧通知を投げ(ステップ37)、正常動作に戻る(ステップ31)。   If the health check response of module A is received while the count count of the health check timeout is less than N (step 32 / No, step 33 / No, step 34 / No, step 35 / No), module A is restored. And a recovery notification is sent to the trace log management unit (step 37), and the normal operation is resumed (step 31).

次に、トレースログ管理部12のログ記録レベルについて図3を参照して説明する。
図3は、図1に示したログ記録システムに用いられるトレースログ管理部のログ記録レベルの一例である。
各モジュールがトレースログ管理部にログ記録要求を行うとき、ログ記録レベルをパラメータに含めて送信する。
図3では、レベルが8段階に分かれている。初期設定において、モジュール単位にログ記録設定レベルを設定する。
トレースログ管理部12は、設定情報に基づいて、受信したログ記録要求をファイルに書き出すか否かの判断を行う。例えば、モジュールAのログ記録設定レベルをエラー(以下、errorと表記する。)に設定した場合、トレースログ管理部は、モジュールAから受信するログ記録要求のうち、error以上のプライオリティのログ記録レベルのパラメータの要求のみを記録し、errorより低いプライオリティのログ記録要求はファイルへの書き出しを行わない。
Next, the log recording level of the trace log management unit 12 will be described with reference to FIG.
FIG. 3 shows an example of the log recording level of the trace log management unit used in the log recording system shown in FIG.
When each module makes a log recording request to the trace log management unit, the log recording level is included in the parameter and transmitted.
In FIG. 3, the level is divided into 8 levels. In the initial setting, the log recording setting level is set for each module.
The trace log management unit 12 determines whether or not to write the received log recording request to a file based on the setting information. For example, when the log recording setting level of module A is set to error (hereinafter referred to as error), the trace log management unit has a log recording level with a priority of error or higher among log recording requests received from module A. Only log parameter requests are recorded, and log recording requests with a priority lower than error are not written to a file.

トレースログ管理部12の動作について図4を参照して説明する。
図4は、図1に示したログ記録システムに用いられるトレースログ管理部の動作を説明するためのフローチャートの一例である。
各モジュール11からログ記録要求を受信するが、ここではモジュールAからのログ記録要求を受信した場合について記述する。
モジュールAからログ記録要求を受信すると(ステップ41)、モジュールAのログ記録レベルの確認を行う。すなわち、受信レベル≧設定レベルか否かの判断を行う(ステップ42)。
受信したログ記録要求のログ記録レベルと、モジュールAのログ記録設定レベルとの比較を行い、ログ記録設定レベルよりプライオリティが高い、または同じのとき(ステップ42/Yes)、ファイル出力を行う(ステップ43)。そうでない場合、すなわちログ記録設定レベルよりプライオリティが低いとき(ステップ42/No)、ファイル出力せずに、次のログ記録要求受信を行う(ステップ41)。
The operation of the trace log management unit 12 will be described with reference to FIG.
FIG. 4 is an example of a flowchart for explaining the operation of the trace log management unit used in the log recording system shown in FIG.
A log recording request is received from each module 11. Here, a case where a log recording request from module A is received will be described.
When a log recording request is received from module A (step 41), the log recording level of module A is confirmed. That is, it is determined whether the reception level ≧ the set level (step 42).
The log recording level of the received log recording request is compared with the log recording setting level of module A. When the priority is higher than or equal to the log recording setting level (step 42 / Yes), file output is performed (step 42). 43). Otherwise, that is, when the priority is lower than the log recording setting level (step 42 / No), the next log recording request is received without outputting the file (step 41).

一方で、トレースログ管理部12は、モジュール監視部13からのメッセージ受信待ちを行っている(ステップ44)。
モジュール監視部13からモジュールAのヘルスチェックタイムアウト検出通知を受信する(ステップ45)と、モジュールAのログ記録設定レベルを下げる。設定によって下げるレベルの変更は可能であり、ここでは最低プライオリティのdebugモードに下げる(ステップ46)。
これによって、次のログ記録要求の受信から、モジュールAの全てのログのファイル出力を行う。
同様にモジュール監視部13から、モジュールAのヘルスチェックタイムアウト復旧通知を受信すると(ステップ45)、モジュールAのログ記録設定レベルを元に戻す(ステップ46)。
On the other hand, the trace log management unit 12 waits for receiving a message from the module monitoring unit 13 (step 44).
When the health check timeout detection notification of module A is received from the module monitoring unit 13 (step 45), the log recording setting level of module A is lowered. The level to be lowered can be changed by setting, and here, the debug mode is lowered to the lowest priority (step 46).
Thus, all log files of module A are output from the reception of the next log recording request.
Similarly, when a health check timeout recovery notification of module A is received from the module monitoring unit 13 (step 45), the log recording setting level of module A is restored (step 46).

このように、本実施の形態では、モジュールの異常を検知したときに、ログ記録レベルを変更する機構があるため、異常検知時に単体試験、結合試験レベルでログを記録することができる。   As described above, in this embodiment, there is a mechanism for changing the log recording level when a module abnormality is detected, so that a log can be recorded at the unit test and the combined test level when the abnormality is detected.

<効果の説明>
本実施形態によれば、モジュールの異常発生時の問題解析を、単体試験、結合試験レベルで実施できることにある。
その理由は、ヘルスチェックタイムアウトが発生したときに、モジュールのログ記録レベルを下げて記録するためである。
<Description of effects>
According to the present embodiment, problem analysis when a module abnormality occurs can be performed at the unit test level and the combined test level.
The reason is that when a health check timeout occurs, the log recording level of the module is lowered and recorded.

<プログラム及び記憶媒体>
以上で説明した本発明のログ記録システムは、コンピュータで処理を実行させるプログラムによって実現されている。コンピュータとしては、例えばパーソナルコンピュータやワークステーションなどの汎用的なものが挙げられるが、本発明はこれに限定されるものではない。
<Program and storage medium>
The log recording system of the present invention described above is realized by a program that causes a computer to execute processing. Examples of the computer include general-purpose computers such as personal computers and workstations, but the present invention is not limited to this.

すなわち、本プログラムは、
コンピュータが読み取り可能なプログラムであって、
コンピュータが、
(1)モジュール監視手段に複数のモジュールに対し、定期的にヘルスチェックを行う手順、
(2)トレースログ管理手段に各モジュールからのログ記録要求を受信し、ログを複数のトレースファイルに記録する手順
を実行させることを特徴とする。
In other words, this program
A computer-readable program,
Computer
(1) Procedure for regularly checking the health of multiple modules in the module monitoring means,
(2) The trace log management means receives a log recording request from each module, and causes the log to be recorded in a plurality of trace files.

また、上記構成に加え、コンピュータが、
(3)モジュール監視手段に、ヘルスチェックタイムアウト通知を行う手順を実行させてもよい。
In addition to the above configuration, the computer
(3) The module monitoring unit may be caused to execute a procedure for notifying the health check timeout.

また、上記構成に加え、コンピュータが、
(4)モジュール監視手段に、ヘルスチェックタイムアウトの回数が所定の回数に達すると再起動を行い、ヘルスチェックタイムアウトの回数が所定の回数に満たない間にヘルスチェック応答を受信するとトレースログ管理手段に復旧通知を行う手順を実行させてもよい。
In addition to the above configuration, the computer
(4) The module monitoring means restarts when the number of health check timeouts reaches the specified number.If the health check response is received while the number of health check timeouts is less than the specified number, the trace log management means You may perform the procedure which performs recovery notification.

また、上記構成に加え、コンピュータが、
(5)モジュール監視手段に、各モジュールがトレースログ管理手段にログ記録要求を行うとき、ログ記録レベルをパラメータに含めて送信する手順を実行させてもよい。
In addition to the above configuration, the computer
(5) The module monitoring means may be caused to execute a procedure in which each module sends a log recording level as a parameter when each module makes a log recording request to the trace log management means.

また、上記構成に加え、コンピュータが、
(6)トレースログ管理手段に、モジュール監視手段からのヘルスチェックタイムアウト通知を受信する手順を実行させてもよい。
In addition to the above configuration, the computer
(6) The trace log management unit may execute a procedure for receiving a health check timeout notification from the module monitoring unit.

これらにより、プログラムが実行可能なコンピュータ環境さえあれば、どこにおいても本発明のシステムを実現することができる。
このようなプログラムは、コンピュータに読み取り可能な記憶媒体に記憶されていてもよい。
ここで、記憶媒体としては、例えば、CD-ROM(Compact Disc Read Only Memory)、フレキシブルディスク(FD)、CD-R(CD Recordable)などのコンピュータで読み取り可能な記憶媒体フラッシュメモリ、RAM(Random Access Memory)、ROM(Read Only Memory)、FeRAM(強誘電体メモリ)等の半導体メモリや、HDD(Hard Disc Drive)、が挙げられる。
Thus, the system of the present invention can be realized anywhere as long as there is a computer environment capable of executing the program.
Such a program may be stored in a computer-readable storage medium.
Here, examples of the storage medium include a computer-readable storage medium flash memory such as a CD-ROM (Compact Disc Read Only Memory), a flexible disk (FD), and a CD-R (CD Recordable), and a RAM (Random Access). Memory, ROM (Read Only Memory), semiconductor memory such as FeRAM (ferroelectric memory), and HDD (Hard Disc Drive).

なお、上述した実施の形態は、本発明の好適な実施の形態の一例を示すものであり、本発明はそれに限定されることなく、その要旨を逸脱しない範囲内において、種々変形実施が可能である。   The above-described embodiment shows an example of a preferred embodiment of the present invention, and the present invention is not limited thereto, and various modifications can be made without departing from the scope of the invention. is there.

<その他>
ここで、本実施の形態と特許文献2,3との相違について説明する。
特許文献2に記載の発明は、異常検知手段について開示しているが、この異常検知手段は本願発明の範囲外であり、ログ記録レベル変更の仕組みの説明をする上での、トリガ機能として例として挙げているにすぎない。
本願発明は、特許文献2に記載の発明とログレベル変更方法の実現方法が異なっている。
<Others>
Here, differences between the present embodiment and Patent Documents 2 and 3 will be described.
The invention described in Patent Document 2 discloses an abnormality detection means, but this abnormality detection means is outside the scope of the present invention, and is an example of a trigger function for explaining the mechanism of changing the log recording level. It is only mentioned as.
The invention of the present application differs from the invention described in Patent Document 2 in the implementation method of the log level changing method.

特許文献3に記載の発明は、異常を検出するとログレベル設定テーブルのログレベルを変更し、各モジュールがテーブルを読み出し、各モジュールがログレベルを変更してログを残している。   In the invention described in Patent Document 3, when an abnormality is detected, the log level of the log level setting table is changed, each module reads the table, and each module changes the log level and leaves a log.

一方、本願発明は、トレースログ記録処理の一元化を行っている。このため、各モジュールは、ログ記録レベルを意識する必要がなく、モジュールの追加、改造が容易であり、生産性の向上、及び保守性の向上を図ることができる。   On the other hand, the present invention unifies trace log recording processing. For this reason, each module does not need to be aware of the log recording level, and it is easy to add and remodel modules, thereby improving productivity and maintainability.

また、特許文献3に記載の発明は、各モジュールがログレベル変更の通知を受け、実際に変更する処理は各アプリケーションに任されているため、変更タイミングはモジュール毎にばらばらとなり、ログレベルの変更同期が取れない。さらに、処理輻輳しているもモジュールのログレベルの変更タイミングが大幅に遅れ、必要なログを取りこぼすおそれがある。
一般に、輻輳モジュールが問題を含んでいることが多いため、このような場合には、特許文献3に記載の発明は、有益なログを残せる可能性が低くなる。
In the invention described in Patent Document 3, each module receives a log level change notification, and the process of actual change is left to each application. Therefore, the change timing varies from module to module, and the log level changes. Cannot synchronize. Furthermore, although the processing is congested, the log level change timing of the module is greatly delayed, and there is a possibility that a necessary log may be missed.
In general, the congestion module often includes a problem, and in such a case, the invention described in Patent Document 3 is less likely to leave a useful log.

これに対し、本願発明は、輻輳しているモジュールのログレベル変更を容易にし、ログレベル変更同期をとり、より解析容易性の向上を図ることができる。また、一元管理を行うことで、生産性、保守性の向上を図ることができる。   On the other hand, the present invention makes it easy to change the log level of a congested module, synchronize the log level change, and further improve the ease of analysis. Moreover, productivity and maintainability can be improved by performing unified management.

本発明は、メモリ制限が厳しい組み込み開発において、ヘルスチェック機能を具備し、ログ記録レベルによってファイル出力の有無の判別を行う機構をもつソフトウエア及びそれを用いたシステムに適用できる。   INDUSTRIAL APPLICABILITY The present invention can be applied to software having a health check function in embedded development with strict memory restrictions and a system having a mechanism for determining the presence / absence of file output according to a log recording level and a system using the software.

本発明に係るログ記録システムの一実施の形態を示す概念図である。It is a conceptual diagram which shows one Embodiment of the log recording system which concerns on this invention. 図1に示したログ記録システムに用いられるモジュール監視部の動作を説明するためのフローチャートの一例である。It is an example of the flowchart for demonstrating operation | movement of the module monitoring part used for the log recording system shown in FIG. 図1に示したログ記録システムに用いられるトレースログ管理部のログ記録レベルの一例である。It is an example of the log recording level of the trace log management part used for the log recording system shown in FIG. 図1に示したログ記録システムに用いられるトレースログ管理部の動作を説明するためのフローチャートの一例である。It is an example of the flowchart for demonstrating operation | movement of the trace log management part used for the log recording system shown in FIG.

符号の説明Explanation of symbols

11 モジュール(モジュールA〜モジュールX)
12 トレースログ管理部
13 モジュール監視部
14 トレースログファイル(トレースログファイルA〜トレースログファイルX)
11 modules (module A to module X)
12 Trace log management unit 13 Module monitoring unit 14 Trace log file (trace log file A to trace log file X)

Claims (20)

複数のモジュールに対し、定期的にヘルスチェックを行うモジュール監視手段と、
各モジュールからのログ記録要求を受信し、ログを複数のトレースファイルに記録するトレースログ管理手段と、を備えたことを特徴とするログ記録システム。
Module monitoring means to periodically check the health of multiple modules,
A log recording system comprising: a trace log management unit that receives a log recording request from each module and records the log in a plurality of trace files.
前記モジュール監視手段は、ヘルスチェックタイムアウト通知を行うことを特徴とする請求項1記載のログ記録システム。   The log recording system according to claim 1, wherein the module monitoring unit issues a health check timeout notification. 前記モジュール監視手段は、ヘルスチェックタイムアウトの回数が所定の回数に達すると再起動を行い、ヘルスチェックタイムアウトの回数が所定の回数に満たない間にヘルスチェック応答を受信すると前記トレースログ管理手段に復旧通知を行うことを特徴とする請求項2記載のログ記録システム。   The module monitoring unit restarts when the number of health check timeouts reaches a predetermined number, and recovers to the trace log management unit when a health check response is received while the number of health check timeouts is less than the predetermined number The log recording system according to claim 2, wherein notification is performed. 前記モジュール監視手段は、各モジュールが前記トレースログ管理手段にログ記録要求を行うとき、ログ記録レベルをパラメータに含めて送信することを特徴とする請求項2記載のログ記録システム。   3. The log recording system according to claim 2, wherein the module monitoring unit transmits a log recording level including a parameter when each module makes a log recording request to the trace log management unit. 前記トレースログ管理手段は、前記モジュール監視手段からのヘルスチェックタイムアウト通知を受信することを特徴とする請求項2記載のログ記録システム。   The log recording system according to claim 2, wherein the trace log management unit receives a health check timeout notification from the module monitoring unit. 各モジュールからのログ記録要求を受信し、ログを複数のトレースファイルに記録するトレースログ管理手段を備えたログ記録システムに用いられるモジュール監視手段において、
複数のモジュールに対し、定期的にヘルスチェックを行い、複数のモジュールに対し、定期的にヘルスチェックを行うことを特徴とするモジュール監視手段。
In the module monitoring means used in the log recording system provided with the trace log management means for receiving the log recording request from each module and recording the log in a plurality of trace files,
A module monitoring unit characterized in that a health check is periodically performed on a plurality of modules, and a health check is periodically performed on the plurality of modules.
前記モジュール監視手段は、ヘルスチェックタイムアウト通知を行うことを特徴とする請求項6記載のモジュール監視手段。   7. The module monitoring unit according to claim 6, wherein the module monitoring unit performs a health check timeout notification. 前記モジュール監視手段は、ヘルスチェックタイムアウトの回数が所定の回数に達すると再起動を行い、ヘルスチェックタイムアウトの回数が所定の回数に満たない間にヘルスチェック応答を受信すると前記トレースログ管理手段に復旧通知を行うことを特徴とする請求項7記載のモジュール監視手段。   The module monitoring unit restarts when the number of health check timeouts reaches a predetermined number, and recovers to the trace log management unit when a health check response is received while the number of health check timeouts is less than the predetermined number The module monitoring means according to claim 7, wherein notification is performed. 前記モジュール監視手段は、各モジュールが前記トレースログ管理手段にログ記録要求を行うとき、ログ記録レベルをパラメータに含めて送信することを特徴とする請求項7記載のモジュール監視手段。   8. The module monitoring unit according to claim 7, wherein when each module makes a log recording request to the trace log management unit, the module monitoring unit includes a log recording level as a parameter. 複数のモジュールに対し、定期的にヘルスチェックを行うモジュール監視手段を備えたログ記録システムに用いられるトレースログ管理手段において、各モジュールからのログ記録要求を受信し、ログを複数のトレースファイルに記録することを特徴とするトレースログ管理手段。   Trace log management means used in a log recording system equipped with a module monitoring means that periodically performs health checks on multiple modules, receives log recording requests from each module, and records logs in multiple trace files Trace log management means characterized by: 前記トレースログ管理手段は、前記モジュール監視手段からのヘルスチェックタイムアウト通知を受信することを特徴とする請求項10記載のトレースログ管理手段。   The trace log management means according to claim 10, wherein the trace log management means receives a health check timeout notification from the module monitoring means. 複数のモジュールに対し、定期的にヘルスチェックを行い、
各モジュールからのログ記録要求を受信し、ログを複数のトレースファイルに記録することを特徴とするログ記録方法。
Regular health checks on multiple modules,
A log recording method comprising receiving a log recording request from each module and recording the log in a plurality of trace files.
ヘルスチェックタイムアウトの回数が所定の回数に達すると再起動を行い、ヘルスチェックタイムアウトの回数が所定の回数に満たない間にヘルスチェック応答を受信すると復旧通知を行うことを特徴とする請求項12記載のログ記録方法。   13. The system is restarted when the number of health check timeouts reaches a predetermined number, and a recovery notification is performed when a health check response is received while the number of health check timeouts is less than the predetermined number. Logging method. 各モジュールがログ記録要求を行うとき、ログ記録レベルをパラメータに含めて送信することを特徴とする請求項12記載のログ記録方法。   13. The log recording method according to claim 12, wherein when each module makes a log recording request, the log recording level is included in a parameter and transmitted. コンピュータが読み取り可能なプログラムであって、
前記コンピュータが、
モジュール監視手段に複数のモジュールに対し、定期的にヘルスチェックを行う手順、
トレースログ管理手段に各モジュールからのログ記録要求を受信し、ログを複数のトレースファイルに記録する手順を実行させることを特徴とするプログラム。
A computer-readable program,
The computer is
Procedure to regularly check the health of multiple modules in the module monitoring means,
A program that causes a trace log management means to receive a log recording request from each module and to execute a procedure for recording logs in a plurality of trace files.
前記コンピュータが、前記モジュール監視手段に、ヘルスチェックタイムアウト通知を行う手順を実行させることを特徴とする請求項15記載のプログラム。   16. The program according to claim 15, wherein the computer causes the module monitoring unit to execute a procedure for performing a health check timeout notification. 前記コンピュータが、前記モジュール監視手段に、ヘルスチェックタイムアウトの回数が所定の回数に達すると再起動を行い、ヘルスチェックタイムアウトの回数が所定の回数に満たない間にヘルスチェック応答を受信すると前記トレースログ管理手段に復旧通知を行う手順を実行させることを特徴とする請求項15記載のプログラム。   If the computer restarts the module monitoring means when the number of health check timeouts reaches a predetermined number, and receives a health check response while the number of health check timeouts is less than the predetermined number, the trace log 16. The program according to claim 15, wherein the management unit is caused to execute a procedure for performing a recovery notification. 前記コンピュータが、前記モジュール監視手段に、各モジュールが前記トレースログ管理手段にログ記録要求を行うとき、ログ記録レベルをパラメータに含めて送信する手順を実行させることを特徴とする請求項16記載のプログラム。   17. The computer according to claim 16, wherein the computer causes the module monitoring unit to execute a procedure of transmitting a log recording level as a parameter when each module makes a log recording request to the trace log management unit. program. 前記コンピュータが、前記トレースログ管理手段に、前記モジュール監視手段からのヘルスチェックタイムアウト通知を受信する手順を実行させることを特徴とする請求項16記載のプログラム。   The program according to claim 16, wherein the computer causes the trace log management unit to execute a procedure of receiving a health check timeout notification from the module monitoring unit. 請求項15から19の何れか一項記載のプログラムを記憶したことを特徴とする記憶媒体。   A storage medium storing the program according to any one of claims 15 to 19.
JP2008229827A 2008-09-08 2008-09-08 Log recording system, module monitoring means, trace log managing means, recording method, program, and storage medium Withdrawn JP2010066801A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008229827A JP2010066801A (en) 2008-09-08 2008-09-08 Log recording system, module monitoring means, trace log managing means, recording method, program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008229827A JP2010066801A (en) 2008-09-08 2008-09-08 Log recording system, module monitoring means, trace log managing means, recording method, program, and storage medium

Publications (1)

Publication Number Publication Date
JP2010066801A true JP2010066801A (en) 2010-03-25

Family

ID=42192377

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008229827A Withdrawn JP2010066801A (en) 2008-09-08 2008-09-08 Log recording system, module monitoring means, trace log managing means, recording method, program, and storage medium

Country Status (1)

Country Link
JP (1) JP2010066801A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012111167A1 (en) * 2011-02-14 2012-08-23 株式会社日立製作所 Trace information acquisition method, computer system, and program
JP2015011367A (en) * 2013-06-26 2015-01-19 三菱電機インフォメーションシステムズ株式会社 Portable information terminal, portable information terminal set, program, and computer system
JP2017129935A (en) * 2016-01-18 2017-07-27 キヤノン株式会社 Server system, and method and program for controlling server system
US11416372B2 (en) 2020-03-23 2022-08-16 Kioxia Corporation Storage device and method of controlling storage device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012111167A1 (en) * 2011-02-14 2012-08-23 株式会社日立製作所 Trace information acquisition method, computer system, and program
JP2015011367A (en) * 2013-06-26 2015-01-19 三菱電機インフォメーションシステムズ株式会社 Portable information terminal, portable information terminal set, program, and computer system
JP2017129935A (en) * 2016-01-18 2017-07-27 キヤノン株式会社 Server system, and method and program for controlling server system
US11416372B2 (en) 2020-03-23 2022-08-16 Kioxia Corporation Storage device and method of controlling storage device

Similar Documents

Publication Publication Date Title
CN102591591B (en) Disk detection system, disk detection method and network store system
JP6333410B2 (en) Fault processing method, related apparatus, and computer
US9189314B2 (en) Electronic device and method for detecting firmware of BMC
JP2017091077A (en) Pseudo-fault generation program, generation method, and generator
CN113595836A (en) Heartbeat detection method of high-availability cluster, storage medium and computing node
JP2010066801A (en) Log recording system, module monitoring means, trace log managing means, recording method, program, and storage medium
JP5366184B2 (en) Data storage system and data storage method
US8732531B2 (en) Information processing apparatus, method of controlling information processing apparatus, and control program
US20100011100A1 (en) Health Check System, Server Apparatus, Health Check Method, and Storage Medium
US20080209254A1 (en) Method and system for error recovery of a hardware device
JP6880961B2 (en) Information processing device and log recording method
US20180081762A1 (en) Information processing device
US8024604B2 (en) Information processing apparatus and error processing
CN112988442B (en) Method and equipment for transmitting fault information in server operation stage
JP2012038362A (en) Hard disk failure sign detection method
JP2010003132A (en) Information processor, and fault detection method of input/output device thereof, and program thereof
JP2013025439A (en) Memory device and program
JP2012108848A (en) Operation log collection system and program
JP2018022402A (en) Information processor, information processing system, control method of information processor and control program information processor
CN117573455B (en) PCIE equipment detection system, method, device and product
JP2002215428A (en) Device and method for monitoring task and recording medium with the method recorded thereon
CN106940666A (en) Internal storage data detection method
JP2017151511A (en) Information processing device, operation log acquisition method and operation log acquisition program
JP2009301079A (en) Electronic computer device and data storage method when software processing delay is detected
JP2002063051A (en) Software operation monitoring system, recording medium therefor and software operation monitoring method

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20111206