JPH02173837A - Reserving system for fault information of computer system - Google Patents

Reserving system for fault information of computer system

Info

Publication number
JPH02173837A
JPH02173837A JP63330385A JP33038588A JPH02173837A JP H02173837 A JPH02173837 A JP H02173837A JP 63330385 A JP63330385 A JP 63330385A JP 33038588 A JP33038588 A JP 33038588A JP H02173837 A JPH02173837 A JP H02173837A
Authority
JP
Japan
Prior art keywords
memory
computer system
fault information
fault
remote maintenance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63330385A
Other languages
Japanese (ja)
Inventor
Hiroyuki Ochiai
浩之 落合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63330385A priority Critical patent/JPH02173837A/en
Publication of JPH02173837A publication Critical patent/JPH02173837A/en
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Computer And Data Communications (AREA)
  • Retry When Errors Occur (AREA)

Abstract

PURPOSE:To shorten system stop time at the occurrence of a fault by switching immediately a working memory to a stand-by memory and executing a restart and sending the fault information stored in a memory to a remote maintenance center via a communication channel. CONSTITUTION:A memory 11 being a working memory sets the initial value in a normal state to start a computer system 1 and stops the working of the system 1 at the occurrence of a fault. While a stand-by memory 12 sets the initial value equal to that of the memory 11 in a normal state and is kept in a stand-by state. When the fault occurs, a memory switching device 13 immediately switches the memory 11 to the memory 12 and performs the restart of the system 1. Furthermore the communication controller 15 of the system 1 sends the fault information to a remote maintenance center 3 when a CPU 14 reads out the contents of the memory 11 storing the fault information at the collection of the fault information. In such a manner, the stop time of the system 1 is shortened at the occurrence of a fault.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は計算機システムの障害情報保存方式に関し、特
に障害発生時に得られる障害情報を計算機システムの再
立上げ後も保存して障害解析に使用する計算機システム
の障害情報保存方式に関する。
[Detailed Description of the Invention] [Industrial Application Field] The present invention relates to a fault information storage method for a computer system, and in particular, a method for saving fault information obtained when a fault occurs even after restarting the computer system and using it for fault analysis. This paper relates to a fault information storage method for computer systems.

〔従来の技術〕[Conventional technology]

従来の計算機システムの障害情報保存方式は、障害発生
時に主記憶上に得られる障害情報を、主記憶から磁気テ
ープ装置やフロッピィディスク装置などの補助記憶装置
に転送して、補助記憶装置の記憶媒体に保存してから、
計算機システムの再立上げを行っている。
The conventional failure information storage method for computer systems is to transfer the failure information obtained in main memory when a failure occurs from the main memory to an auxiliary storage device such as a magnetic tape device or a floppy disk device, and then store it in the storage medium of the auxiliary storage device. Save it to
The computer system is being restarted.

また、従来の計算機システムの障害情報保存方式は、磁
気テープやフロッピィディスクなどの障害情報を保存し
た記憶媒体を、障害解析センタまで輸送し、障害情報の
解析を行っている。
Furthermore, in the conventional fault information storage method for computer systems, a storage medium storing fault information, such as a magnetic tape or a floppy disk, is transported to a fault analysis center and the fault information is analyzed.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

上述した従来の計算機システムの障害情報保存方式は、
障害発生時に主記憶上に得られる障害情報を、補助記憶
装置の記憶媒体に保存してから、計算機システムの再立
上げを行っているので、障害発生時に計算機システムが
停止する時間が長いという欠点を有している。
The fault information storage method of the conventional computer system mentioned above is as follows.
Since the computer system is restarted after saving the failure information obtained in the main memory when a failure occurs to the storage medium of the auxiliary storage device, the drawback is that the computer system stops for a long time when a failure occurs. have.

また、従来の計算機システムの障害情報保存方式は、障
害情報を保存した磁気テープやフロッピィディスクなど
の記憶媒体を、障害解析センタまで輸送し、障害情報の
解析を行っているので、障害原因の追求に手間と時間と
がかかるという欠点を有している。
In addition, in the conventional fault information storage method for computer systems, storage media such as magnetic tapes and floppy disks that store fault information are transported to a fault analysis center where the fault information is analyzed, making it easy to track down the cause of the fault. It has the disadvantage that it takes time and effort.

本発明の目的は、障害発生時に動作メモリから待機メモ
リに直ちに切替えて再立上げを行うことにより、障害発
生時に計算機システムが停止する時間を大幅に短縮する
とともに、障害情報をメモリに保存して通信回線でリモ
ートメンテナンスセンタに送付することにより、障害情
報の解析と障害原因の追求とを速やかに実施することが
できる計算機システムの障害情報保存方式を提供するこ
とにある。
The purpose of the present invention is to significantly shorten the time during which a computer system stops when a failure occurs, by immediately switching from operating memory to standby memory and restarting the system when a failure occurs, and to save failure information in memory. It is an object of the present invention to provide a fault information storage method for a computer system that allows fault information to be quickly analyzed and the cause of the fault to be investigated by sending the fault information to a remote maintenance center via a communication line.

〔課題を解決するための手段〕[Means to solve the problem]

本発明の計算機システムの障害情報保存方式(A)平常
時に初期値を設定して計算機システムを立上げることに
より、前記計算機システムの主記憶として動作し、障害
発生時に動作を停止することにより、障害情報を保存す
る動作メモリ、 (B)平常時に初期値を設定して待機し、障害発生時に
前記計算機システムの再立上げを行うことにより、前記
動作メモリに代って、前記計算機システムの主記憶とし
て動作することができる少なくとも一つの待機メモリ、
(C)平常時に前記動作メモリを使用し、障害発生時に
前記待機メモリの一つに切替えて使用することにより、
前記計算機システムの処理を実行するとともに、障害情
報収集時に障害情報を保存する前記動作メモリの内容を
読出す中央処理装置、 (D)前記動作メモリおよび少なくとも一つの前記待機
メモリを必要に応じて切替えて、前記中央処理装置に接
続するメモリ切替え装置、(E)前記中央処理装置に接
続するとともに、通信回線を通じてリモートメンテナン
スセンタに接続し、障害情報収集時に前記中央処理装置
が読出した障害情報を前記リモートメンテナンスセンタ
に送付する通信制御装置、を備えて構成されている。
Fault information storage method for a computer system according to the present invention (A) By setting an initial value and starting up a computer system during normal times, it operates as the main memory of the computer system, and by stopping operation when a fault occurs, (B) A main memory of the computer system that can replace the operational memory by setting initial values and standing by during normal times, and restarting the computer system when a failure occurs. at least one standby memory capable of acting as
(C) By using the operating memory during normal times and switching to one of the standby memories when a failure occurs,
a central processing unit that executes processing of the computer system and reads the contents of the operating memory that stores fault information when collecting fault information; (D) switching between the operating memory and at least one of the standby memories as necessary; (E) a memory switching device connected to the central processing unit; (E) connected to the central processing unit and connected to a remote maintenance center through a communication line; The system includes a communication control device for sending data to a remote maintenance center.

〔実施例〕〔Example〕

次に本発明の実施例について図面を参照して説明する。 Next, embodiments of the present invention will be described with reference to the drawings.

第1図は本発明の計算機システムの障害情報保存方式の
一実施例を示すブロック図である。
FIG. 1 is a block diagram showing an embodiment of a failure information storage method for a computer system according to the present invention.

第1図に示すように、計算機システム1の動作メモリ、
であるメモリ11は、平常時に初期値を設定して計算機
システム1を立上げることにより、計算機システム1の
主記憶として動作するとともに、障害発生時には動作を
停止することにより、障害情報を保存することができる
As shown in FIG. 1, the operating memory of the computer system 1,
The memory 11 operates as the main memory of the computer system 1 by setting initial values and starting the computer system 1 during normal times, and also stores failure information by stopping operation when a failure occurs. Can be done.

一方、計算機システム1の待機メモリであるメモリ12
は、平常時にメモリ11の初期値と同じ初期値を設定し
て待機し、障害発生時に直ちにメモリ切替え装置13で
メモリ11と切替えて計算機システム1の再立上げを行
うことにより、メモリ11に代って、計算機システム1
の主記憶として動作することができる。
On the other hand, the memory 12 which is the standby memory of the computer system 1
Under normal conditions, the memory 11 is set to the same initial value as the initial value of the memory 11 and stands by, and when a failure occurs, the memory switching device 13 immediately switches to the memory 11 and restarts the computer system 1 to replace the memory 11. So, computer system 1
can act as the main memory of

また、計算機システム1のメモリ切替え装置13は、メ
モリ11とメモリ12とを切替えて、中央処理装置14
に接続することができる。
Further, the memory switching device 13 of the computer system 1 switches between the memory 11 and the memory 12, and switches the memory 11 and the memory 12 to
can be connected to.

そこで、計算機システム1の中央処理装置14は、平常
時にメモリ11を使用し、障害発生時にメモリ切替え装
置13でメモリ11からメモリ12に切替えてメモリ】
2を使用して、計算機システム1の処理を実行している
Therefore, the central processing unit 14 of the computer system 1 uses the memory 11 during normal times, and when a failure occurs, the memory switching device 13 switches from the memory 11 to the memory 12.
2 is used to execute the processing of the computer system 1.

さらに、計算機システム1の通信制御装置15は、中央
処理装置14に接続するとともに、通信回線2を通じて
リモートメンテナンスセンタ3に接続し、障害情報収集
時に中央処理装置14がメモリ切替え装置13でメモリ
11へ切替えて障害情報を保存するメモリ11の内容を
読出したときに、読出しな障害情報をリモートメンテナ
ンスセンタ3に送付している。
Furthermore, the communication control device 15 of the computer system 1 is connected to the central processing unit 14 and also to the remote maintenance center 3 through the communication line 2, and when collecting fault information, the central processing unit 14 is connected to the memory 11 by the memory switching device 13. When switching and reading out the contents of the memory 11 for storing fault information, the read fault information is sent to the remote maintenance center 3.

これにより、リモートメンテナンスセンタ3で、速やか
に障害情報の解析と障害原因の追求とを行うことができ
る。
Thereby, the remote maintenance center 3 can quickly analyze the failure information and investigate the cause of the failure.

本実施例ては、待機メモリとしてメモリ12だけを使用
しているが、複数のメモリを待機メモリとして使用する
ことにより、次々に生じた障害に対して、順次メモリ切
替え装置で切替えて、次々に動作メモリとして使用する
こともできる。
In this embodiment, only the memory 12 is used as the standby memory, but by using a plurality of memories as the standby memory, the memory switching device can sequentially switch over the failures that occur one after another. It can also be used as working memory.

以上述べたように、本実施例の計算機システムの障害情
報保存方式は、障害発生時に動作メモリから待機メモリ
に直ちに切替えて再立上げを行うことにより、障害発生
時に計算機システムが停止する時間を大幅に短縮すると
ともに、障害情報をメモリに保存して通信回線でリモー
トメンテナンスセンタに送付することにより、障害情報
の解析と障害原因の追求とを速やかに実施することがで
きる。
As described above, the fault information storage method of the computer system of this embodiment greatly reduces the time it takes for the computer system to stop when a fault occurs by immediately switching from operating memory to standby memory and restarting. By saving the fault information in memory and sending it to a remote maintenance center via a communication line, it is possible to quickly analyze the fault information and find the cause of the fault.

〔発明の効果〕〔Effect of the invention〕

以上説明したように、本発明の計算機システムの障害情
報保存方式は;障害発生時に動作メモリから待機メモリ
に直ちに切替えて再立上げを行うことにより、障害発生
時に計算機システムが停止する時間を大幅に短縮すると
ともに、障害情報をメモリに保存して通信回線でリモー
トメンテナンスセンタに送付することにより、障害情報
の解析と障害原因の追求とを速やかに実施することがで
きるという効果を有している。
As explained above, the failure information storage method of the computer system of the present invention is: When a failure occurs, the computer system is immediately switched from the operating memory to the standby memory and restarted, thereby significantly reducing the time during which the computer system stops when a failure occurs. In addition to shortening the time, by storing the fault information in memory and sending it to a remote maintenance center via a communication line, it is possible to quickly analyze the fault information and find the cause of the fault.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の計算機システムの障害情報保存方式の
一実施例を示すブロック図である。 ]・・・・・・計算機システム、2・・・・・・通信回
線、3・・・・・・リモートメンテナンスセンタ、11
.12・・・・・・メモリ、13・・・・・・メモリ切
替え装置、14・・・・・・中央処理装置、15・・・
・・通信制御装置。
FIG. 1 is a block diagram showing an embodiment of a failure information storage method for a computer system according to the present invention. ]...Computer system, 2...Communication line, 3...Remote maintenance center, 11
.. 12...Memory, 13...Memory switching device, 14...Central processing unit, 15...
...Communication control device.

Claims (1)

【特許請求の範囲】 (A)平常時に初期値を設定して計算機システムを立上
げることにより、前記計算機システムの主記憶として動
作し、障害発生時に動作を停止することにより、障害情
報を保存する動作メモリ、 (B)平常時に初期値を設定して待機し、障害発生時に
前記計算機システムの再立上げを行うことにより、前記
動作メモリに代って、前記計算機システムの主記憶とし
て動作することができる少なくとも一つの待機メモリ、 (C)平常時に前記動作メモリを使用し、障害発生時に
前記待機メモリの一つに切替えて使用することにより、
前記計算機システムの処理を実行するとともに、障害情
報収集時に障害情報を保存する前記動作メモリの内容を
読出す中央処理装置、 (D)前記動作メモリおよび少なくとも一つの前記待機
メモリを必要に応じて切替えて、前記中央処理装置に接
続するメモリ切替え装置、(E)前記中央処理装置に接
続するとともに、通信回線を通じてリモートメンテナン
スセンタに接続し、障害情報収集時に前記中央処理装置
が読出した障害情報を前記リモートメンテナンスセンタ
に送付する通信制御装置、 を備えることを特徴とする計算機システムの障害情報保
存方式。
[Scope of Claims] (A) By setting an initial value and starting up the computer system during normal times, the computer system operates as the main memory of the computer system, and when a failure occurs, the operation is stopped to save failure information. (B) operating memory as the main memory of the computer system in place of the operating memory by setting an initial value and standing by during normal times and restarting the computer system when a failure occurs; (C) by using the operating memory during normal times and switching to one of the standby memories when a failure occurs;
a central processing unit that executes processing of the computer system and reads the contents of the operating memory that stores fault information when collecting fault information; (D) switching between the operating memory and at least one of the standby memories as necessary; (E) a memory switching device connected to the central processing unit; (E) connected to the central processing unit and connected to a remote maintenance center through a communication line; A fault information storage method for a computer system, comprising: a communication control device for sending data to a remote maintenance center.
JP63330385A 1988-12-26 1988-12-26 Reserving system for fault information of computer system Pending JPH02173837A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63330385A JPH02173837A (en) 1988-12-26 1988-12-26 Reserving system for fault information of computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63330385A JPH02173837A (en) 1988-12-26 1988-12-26 Reserving system for fault information of computer system

Publications (1)

Publication Number Publication Date
JPH02173837A true JPH02173837A (en) 1990-07-05

Family

ID=18232008

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63330385A Pending JPH02173837A (en) 1988-12-26 1988-12-26 Reserving system for fault information of computer system

Country Status (1)

Country Link
JP (1) JPH02173837A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07306799A (en) * 1994-05-11 1995-11-21 Nec Corp Information processor
WO2000019318A1 (en) * 1998-09-30 2000-04-06 Hitachi, Ltd. Terminal and maintenance system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07306799A (en) * 1994-05-11 1995-11-21 Nec Corp Information processor
WO2000019318A1 (en) * 1998-09-30 2000-04-06 Hitachi, Ltd. Terminal and maintenance system

Similar Documents

Publication Publication Date Title
JPS6363933B2 (en)
JPH07175728A (en) Disk cache data maintenance system
JPH02173837A (en) Reserving system for fault information of computer system
JPH10133926A (en) Mirror disk restoring method and restoring system
JPH07219802A (en) Duplex control system
JPS6012849A (en) Fault information recording system
JPS63280357A (en) Data save/restore system
JP2775865B2 (en) Fault analysis information collection method for peripheral control devices
JPH05236095A (en) System for saving restart memory information
JPH096651A (en) Scsi tracer device
JPH11222365A (en) Elevator control device
JPH0540670A (en) Processor control system
JPH05265789A (en) Memory copy system
JP2577137B2 (en) Data processing device
JP3664079B2 (en) Job stopping method and apparatus in system freeze
JPS5922149A (en) Alternation control system of history storage device
JP2001147840A (en) Magnetic tape device
JPH11212835A (en) Electric computer and memory control device for sampling memory rewrite information
JPH0481941A (en) Memory device
JPH05128011A (en) Firmware control system
JP2000357058A (en) Disk array device
JPS60254897A (en) Automatic saving system for state monitor data
JPH04239330A (en) Data processing carry-on system
JPS6160154A (en) Control system for access to memory
JPH02306346A (en) Pre-communication processor