JPH03105434A - Error logging system - Google Patents

Error logging system

Info

Publication number
JPH03105434A
JPH03105434A JP1241819A JP24181989A JPH03105434A JP H03105434 A JPH03105434 A JP H03105434A JP 1241819 A JP1241819 A JP 1241819A JP 24181989 A JP24181989 A JP 24181989A JP H03105434 A JPH03105434 A JP H03105434A
Authority
JP
Japan
Prior art keywords
error logging
area
information
storage
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1241819A
Other languages
Japanese (ja)
Inventor
Toyoo Nomura
野村 豊夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1241819A priority Critical patent/JPH03105434A/en
Publication of JPH03105434A publication Critical patent/JPH03105434A/en
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PURPOSE:To attain error logging as against the occurrence of plural faults in a computer system by providing plural error logging storage areas and a storage area control area. CONSTITUTION:Error logging information are recorded and held in the storage areas 41-4n. CPU 1 decides to which area error logging information is to be recorded by referring to the control area 3 controlling the use state of the storage areas, and new error logging information is written so that important information is not impaired. Error logging information outputted from the error logging storage areas by an operator is taken as disuse for storage in the control area 3, and subsequent error logging information when the fault occurs is treated so that it can be overwritten on the information. Error logging is performed as against the occurrence of plural faults according to the system.

Description

【発明の詳細な説明】 〔概要〕 コンピュータシステムの障害発生時のエラーロギングシ
ステムに関し、 複数の障害発生に対してもエラーロギングを可能にする
ことを目的とし、 システム障害発生時にエラーロギング情報を記録保持す
るエラーロギングシステムにおいて、複数のエラーロギ
ング格納領域と、前記複数のエラーロギング格納領域の
使用状態を管理する格納領域管理手段とを有し、システ
ムは、障害発生時には、前記格納領域管理領域を参照し
て、前記複数のエラーロギング格納領域のうち、書き込
み可能な領域にエラーロギング情報を格納するように構
或する。
[Detailed Description of the Invention] [Summary] Regarding an error logging system when a failure occurs in a computer system, the purpose is to record error logging information when a system failure occurs, with the aim of enabling error logging even when multiple failures occur. The error logging system has a plurality of error logging storage areas and a storage area management means for managing the usage status of the plurality of error logging storage areas, and when a failure occurs, the system manages the storage area management area. For reference, error logging information is stored in a writable area among the plurality of error logging storage areas.

〔産業上の利用分野〕[Industrial application field]

本発明は、コンピュータシステムの障害発生時のエラー
ロギングシステムに関する。
The present invention relates to an error logging system when a failure occurs in a computer system.

コンピュータシステムの稼働中に、ハードウエア障害や
プログラムの以上等により、障害が発生した場合、2時
間連続運転を行うようなシステムでは、リカバリ処理と
して、自動IPL (初期プログラムローディング)処
理を行う。
If a failure occurs due to a hardware failure or program error while the computer system is in operation, automatic IPL (initial program loading) processing is performed as a recovery process in systems that operate continuously for two hours.

このような場合、障害発生原因を後で解析可能とするた
めに、障害発生直前の(より正確には自動IPL直前の
)メモリの状態や各種内部レジス′r、さらに、ハード
ウエアエラー情報等をエラー1]ギングとして補助記憶
装置に格納する。そして、システl、運用者は、自動I
PE、完了後、補助記憶装置状のエラー〔・ギングを出
力し、情報を解析することにより、障害筒所の特定等を
行っていた。
In such a case, in order to be able to analyze the cause of the failure later, the memory state immediately before the failure occurred (more precisely, just before automatic IPL), various internal registers'r, and hardware error information, etc. Error 1] Stored in auxiliary storage as logging. The system operator then automatically
After the completion of PE, errors in the auxiliary storage device were output and the information analyzed to identify faulty locations.

〔従来の技術iよび発明が解決しようとする課題〕従来
、前述のようなエラーロギングシステムにおいては、第
5図に示されるように、エラーロギング情報を記録する
領域は1つしか存在せず、単発の障害発生についてはエ
ラーの原因の解析は可能であった。しかしながら、障害
が複数発生し、自動IPLが連続して行われるような場
合は、障害原因の解析が困難となり、システムの信頼度
の低下やMTTR(rr+ean time  to 
 repair)の増大の原因となるという問題があ本
発明は、上記の問題点に鑑み、なされたもので、複数の
障害発生に対してもエラーロギングを可能にするエラー
口ギングンステムを提{Jt4ることを目的とするもの
である。
[Prior Art and Problems to be Solved by the Invention] Conventionally, in the above-mentioned error logging system, there is only one area for recording error logging information, as shown in FIG. For single failures, it was possible to analyze the cause of the error. However, if multiple failures occur and automatic IPL is performed continuously, it becomes difficult to analyze the cause of the failure, resulting in decreased system reliability and MTTR (rr+ean time to
The present invention has been made in view of the above problems, and provides an error logging system that enables error logging even when multiple failures occur. The purpose is to

〔課題を解決するための手段〕[Means to solve the problem]

第1図は本発明の原理説明図である。 FIG. 1 is a diagram explaining the principle of the present invention.

第i図において、1はシステムのCPU.2はシステム
のメモリ、そして、41〜4nは、上記のンステム外に
設けられた、複数のエラーロギングのための格納領域、
3は、前記複数のエラーロギング格納領域の使用状態を
管理する格納領域管理領域(制御エリア)である。
In FIG. i, 1 is the CPU of the system. 2 is a system memory; 41 to 4n are storage areas for multiple error logging provided outside the system;
3 is a storage area management area (control area) that manages the usage status of the plurality of error logging storage areas.

〔作用〕[Effect]

自動IPLに伴いエラーロギング情報を記録保持する場
合、C P U I L!制御エリア3を参照すること
により、複数のエラーロギング情報格納領域4l〜4n
のうち、どの領域にエラーロギングを記録すべきかに関
する判定を行い、重要な情報を書きつぶすことのないよ
うに新たなエラーロギング情報の書き込みを行う。例え
ば、運用者により、エラーロギング格納領域から出力さ
れたエラーロギング情報については、制御エリア3状で
格納不要扱いとし、次に発生した障害時のエラーロギン
グ情報を、その上に上書き可として扱う。
When recording and retaining error logging information along with automatic IPL, CPU By referring to the control area 3, multiple error logging information storage areas 4l to 4n can be stored.
It is determined in which area error logging should be recorded, and new error logging information is written so as not to overwrite important information. For example, the error logging information output from the error logging storage area by the operator is treated as unnecessary to be stored in the control area 3, and the error logging information at the time of the next failure can be overwritten thereon.

〔実施例〕〔Example〕

第2図は、本発明のエラーロギングシステムの実施例に
おいてエラーロギング格納領域と制御エリアの構戊を示
す図である。
FIG. 2 is a diagram showing the structure of an error logging storage area and a control area in an embodiment of the error logging system of the present invention.

第2図において、30は前述の制御エリア、51〜5n
は複数のエラーロギング格納領域である。
In FIG. 2, 30 is the aforementioned control area, 51 to 5n
are multiple error logging storage areas.

エラーロギング領域は、後述するように、最初に発生し
た障害時のエラーロギングを格納するエリア1(51)
と、以後に発生した障害時のエラーロギングを格納する
エリア2〜n(52〜5n)とからなる。そして、制御
エリア30は、先頭格納アドレス、最大登録数、現登録
(格納)数、取り出しポインタ、および登録ポインタを
有する。
As described later, the error logging area is area 1 (51) that stores error logging at the time of the first failure.
and areas 2 to n (52 to 5n) for storing error logging in the event of a subsequent failure. The control area 30 has a start storage address, a maximum number of registrations, a current number of registrations (storage), a retrieval pointer, and a registration pointer.

先頭格納アドレスは、上記のエリア1(51)の先頭ア
ドレスを示し、最大登録数は、エラーロギングを格納し
得る格納領域の数を示し、現登録数は、現在格納されて
いるエラーロギングの数を示し、取り出しポインタは、
運用者によりエラーロギングを読み出すときの格納領域
のアドレスを示し、登録ポインタは、エラーロギング格
納時の格納領域のアドレスを示す。
The start storage address indicates the start address of area 1 (51) above, the maximum number of registrations indicates the number of storage areas that can store error logging, and the current number of registrations indicates the number of error loggings currently stored. and the fetch pointer is
It indicates the address of the storage area when error logging is read by the operator, and the registration pointer indicates the address of the storage area when error logging is stored.

第3図は、本発明の実施例におけるエラーロギング格納
時の手順を示す図である。
FIG. 3 is a diagram showing the procedure for storing error logging in the embodiment of the present invention.

第3図のステップ6lにおいては、制御エリア30の先
頭格納アドレスが初期値xooooに等しいかどうかを
判断する。先頭格納アドレスが初期値xooooであれ
ば、このことは、発生した障害が最初の障害であること
を示すので、ステップ62に進んで、このエラーロギン
グは、特別に、エリア1(51)に格納する。一般に、
最初に発生した障害時のエラーロギングは、障害原因解
析のために特に重要な情報を与えるため、最初に発生し
た障害時のエラーロギングのみは、以後如何に多くの障
害が発生しても上書きされないようにするためである。
In step 6l of FIG. 3, it is determined whether the first storage address of the control area 30 is equal to the initial value xoooo. If the first storage address is the initial value xoooo, this indicates that the failure that has occurred is the first failure, so the process advances to step 62 and this error logging is specially stored in area 1 (51). do. in general,
Error logging when the first failure occurs provides particularly important information for failure cause analysis, so error logging when the first failure occurs will not be overwritten no matter how many failures occur thereafter. This is to ensure that.

もし、ステップ61で、先頭格納アドレスが初期値XO
OOOでなければ、ステップ63に進んで、現登録数が
エリア2〜nにおける最大登録数(n)−1に等しいか
どうかを判断する。
If in step 61, the first storage address is the initial value
If not OOO, the process proceeds to step 63, where it is determined whether the current number of registrations is equal to the maximum number of registrations (n)-1 in areas 2 to n.

もし、ステップ63で、現登録数が上記の最大登録数(
n)−1より小さいならば、ステップ64に進んで、登
録ポインタが示す、2〜nのエリアのうちの1つにエラ
ーロギングを格納する。そして、ステップ65で現登録
数をインクリメントし、ステップ66で登録ポインタを
エリア2〜nの範囲内で更新する。
If in step 63 the current number of registrations is the maximum number of registrations (
n)-1, the process proceeds to step 64 and stores the error logging in one of the areas 2 to n indicated by the registration pointer. Then, in step 65, the current registration number is incremented, and in step 66, the registration pointer is updated within the range of areas 2 to n.

ステップ63で現登録数が上記の最大登録数(n)−1
に等しいときは、ステップ67に進んで、エリア2〜n
のうち最も古いエラーロギングが格納されているエリア
、すなわち、登録ポインタが示す格納領域に、新たなエ
ラーロギングを格納する。そして、ステップ68にて、
取り出しポインタと登録ポインタとを共に更新する。
In step 63, the current number of registrations is set to the maximum number of registrations (n) - 1
If it is equal to
The new error logging is stored in the area where the oldest error logging is stored, that is, the storage area indicated by the registration pointer. Then, at step 68,
Both the retrieval pointer and the registration pointer are updated.

第4図は、本発明の実施例におけるエラーロギング読み
出し時の手順を示す図である。
FIG. 4 is a diagram showing a procedure when reading error logging in an embodiment of the present invention.

第4図のステップ71において、先頭格納アドレスが前
記xo o o oであるならば、障害が発生していな
かった、あるいは、少なくともエラーロギングの格納が
未だ戊されていないことを示すので、処理を終了する。
In step 71 of FIG. 4, if the first storage address is xo o o o, this indicates that no failure has occurred, or at least that the storage of error logging has not been exhausted, so the process is continued. finish.

ステップ71で先頭格納アドレスが前記XOO00でな
いならば、障害が発生してエラーロギングが威されてい
ることを示すので、ステップ72に進んで、前記エリア
1に格納されている、最初の障害に対応するエラーロギ
ングを読み出し、先頭格納アドレスをXO O 0 0
にセットする。
If the first storage address is not XOO00 in step 71, this indicates that a failure has occurred and error logging is disabled, so proceed to step 72 and deal with the first failure stored in area 1. Read the error logging and set the first storage address to XO O 0 0
Set to .

そして、ステップ73にて、制御エリア30に保持され
る現登録数が0かどうかを判断する。もし、0であれば
、それ以上、保持されているエラーロギングがないので
、処理を終了する。
Then, in step 73, it is determined whether the current number of registrations held in the control area 30 is zero. If it is 0, there is no more error logging retained, so the process ends.

ステップ73にて、制御エリア30に保持される現登録
数が0であれば、ステップ74に進んで、登録ポインタ
に取り出しポインタが追いつくまで、エリア2〜n内に
格納されているエラーロギングを読み出す。そして、ス
テップ75にて取り出しポインタを更新して処理を終了
する。
In step 73, if the current number of registrations held in the control area 30 is 0, the process advances to step 74, and the error logging stored in areas 2 to n is read out until the retrieval pointer catches up with the registration pointer. . Then, in step 75, the retrieval pointer is updated and the process ends.

〔発明の効果〕〔Effect of the invention〕

本発明のエラーロギングシステムによれば、複数の障害
発生に対してもエラーロギングが可能になる。
According to the error logging system of the present invention, error logging can be performed even when multiple failures occur.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の原理説明図、 第2図は本発明のエラーロギングシステムの実施例にお
いてエラーロギング格納領域と制御エリアの構或を示す
図、 第3図は、本発明の実施例におけエラーロギング格納時
の手順を示す図、 第4図は、本発明の実施例におけるエラーロギング読み
出し時の手順を示す図、そして、第5図は、従来のエラ
ーロギングシステムの説明図である。 〔符号の説明〕 1・・・システムのCPU, 2・・・システムのメモリ、 41〜4n・・・エラーロギングのための格納領域、3
・・・格納領域管理領域(制御エリア)。
FIG. 1 is a diagram explaining the principle of the present invention. FIG. 2 is a diagram showing the structure of the error logging storage area and control area in an embodiment of the error logging system of the present invention. FIG. 4 is a diagram showing the procedure for reading error logging in an embodiment of the present invention, and FIG. 5 is an explanatory diagram of a conventional error logging system. [Explanation of symbols] 1... System CPU, 2... System memory, 41 to 4n... Storage area for error logging, 3
...Storage area management area (control area).

Claims (1)

【特許請求の範囲】 1、システム障害発生時にエラーロギング情報を記録保
持するエラーロギングシステムにおいて、複数のエラー
ロギング格納領域(41〜4n)と、 前記複数のエラーロギング格納領域の使用状態を管理す
る格納領域管理領域(3)とを有し、システムは、障害
発生時には、前記格納領域管理領域(3)を参照して、
前記複数のエラーロギング格納領域(41〜4n)のう
ち、書き込み可能な領域にエラーロギング情報を格納す
ることを特徴とするエラーロギングシステム。
[Scope of Claims] 1. In an error logging system that records and retains error logging information when a system failure occurs, a plurality of error logging storage areas (41 to 4n) and the usage status of the plurality of error logging storage areas are managed. The system has a storage area management area (3), and when a failure occurs, the system refers to the storage area management area (3) and
An error logging system characterized in that error logging information is stored in a writable area among the plurality of error logging storage areas (41 to 4n).
JP1241819A 1989-09-20 1989-09-20 Error logging system Pending JPH03105434A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1241819A JPH03105434A (en) 1989-09-20 1989-09-20 Error logging system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1241819A JPH03105434A (en) 1989-09-20 1989-09-20 Error logging system

Publications (1)

Publication Number Publication Date
JPH03105434A true JPH03105434A (en) 1991-05-02

Family

ID=17079970

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1241819A Pending JPH03105434A (en) 1989-09-20 1989-09-20 Error logging system

Country Status (1)

Country Link
JP (1) JPH03105434A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08292904A (en) * 1995-04-20 1996-11-05 Hokkaido Nippon Denki Software Kk Dump gathering control system
JP2006120152A (en) * 2004-10-19 2006-05-11 Quantum Corp Method and device for recording state of data storage device in response to device error and computer program product including program code
JP2008182429A (en) * 2007-01-24 2008-08-07 Sharp Corp Receiver
JP2008262287A (en) * 2007-04-10 2008-10-30 Nec Access Technica Ltd Communication control device and communication log storage method
US7752496B2 (en) 2005-03-28 2010-07-06 Fujitsu Limited Method, apparatus, and computer product for managing log data

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61188643A (en) * 1985-02-15 1986-08-22 Fujitsu Ltd Log-out system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61188643A (en) * 1985-02-15 1986-08-22 Fujitsu Ltd Log-out system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08292904A (en) * 1995-04-20 1996-11-05 Hokkaido Nippon Denki Software Kk Dump gathering control system
JP2006120152A (en) * 2004-10-19 2006-05-11 Quantum Corp Method and device for recording state of data storage device in response to device error and computer program product including program code
US7752496B2 (en) 2005-03-28 2010-07-06 Fujitsu Limited Method, apparatus, and computer product for managing log data
JP2008182429A (en) * 2007-01-24 2008-08-07 Sharp Corp Receiver
JP2008262287A (en) * 2007-04-10 2008-10-30 Nec Access Technica Ltd Communication control device and communication log storage method

Similar Documents

Publication Publication Date Title
US7451355B1 (en) System and method for logging disk failure analysis in disk nonvolatile memory
US6950836B2 (en) Method, system, and program for a transparent file restore
US7475387B2 (en) Problem determination using system run-time behavior analysis
US7103811B2 (en) Mechanisms for detecting silent errors in streaming media devices
US6141771A (en) Method and system for providing a trusted machine state
US5421003A (en) Disk storage system with fault tolerant media maintenance
JPH02297770A (en) Optical disk device
US7529966B2 (en) Storage system with journaling
JPH03105434A (en) Error logging system
US20100169572A1 (en) Data storage method, apparatus and system for interrupted write recovery
JPH1185412A (en) Method for controlling disk array device and disk array device
US5590272A (en) Method and system for a high-reliable disk system
CN112562774B (en) Storage device mounting method and device, computer device and storage medium
JPS6051142B2 (en) Logging error control method
JP2910803B2 (en) Highly reliable auxiliary storage device
JP3470698B2 (en) Cartridge library device and cell inspection method thereof
JPH0820933B2 (en) Data writing method and device
JP2833928B2 (en) Diagnostic initialization method
JPS62194557A (en) File trouble recovery system
JPH08147531A (en) Cash processor
JPH07141120A (en) Processing method for fault in information storage medium
JPH07271518A (en) Magnetic disk device
JP3189804B2 (en) Data backup method and device
JP2000163297A (en) File device
JPH10269111A (en) Information managing method at time of program failure occurrence