JPH0395634A - Restart control system for computer system - Google Patents

Restart control system for computer system

Info

Publication number
JPH0395634A
JPH0395634A JP1231491A JP23149189A JPH0395634A JP H0395634 A JPH0395634 A JP H0395634A JP 1231491 A JP1231491 A JP 1231491A JP 23149189 A JP23149189 A JP 23149189A JP H0395634 A JPH0395634 A JP H0395634A
Authority
JP
Japan
Prior art keywords
processor
restart
fault
computer system
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1231491A
Other languages
Japanese (ja)
Inventor
Naohiko Kaseda
悴田 直彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1231491A priority Critical patent/JPH0395634A/en
Publication of JPH0395634A publication Critical patent/JPH0395634A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To omit the formation of a duplex system to quickly restart of an operation of a computer system at occurrence of a fault with no intervention of an operator and at the same time to analyze the fault later by providing a fault detection means and an action selecting/setting means to a system controller. CONSTITUTION:An action selecting/setting means 24 is provided to a system controller 2 to set the information which shows whether the state of a processor 6 should be previously recorded or not and whether the processor 6 should be restarted or not. When a fault detection means 21 of the controller 2 detects a fault of the processor 6, the contents of the means 24 are read to decide whether the state of the processor 6 should be recorded or not and whether the processor 6 should be restarted or not. When an instruction is received for recording the state of the processor 6, the information on the state of the processor 6 is recorded. Then the processor 6 is restarted if the restart of this processor is instructed. Thus it is possible to properly cope with the occurrence of a fault based on the contents of the means 24 with no duplex system required. Furthermore the fault can be analyzed later and therefore a system operating form is easily selected.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、計算機システムに障害が発生しその運用が停
止した場合、自動的に再起動を行なう計算機システム再
起動制御方式に関する。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to a computer system restart control method for automatically restarting a computer system when a failure occurs and its operation is stopped.

(従来の技術) 計算機システムを構成する場合、ハードウエアの故障や
プログラムの暴走等の障害に対処する対策が講じられる
。例えば、運用が停止し処理の滞るのを防止したい場合
には、通常運用する計算機システムのほかに予備として
同一の計算機システムを設け、障害発生時には、その運
用を直ちに予備の計算機システムに切換えるものがある
。また、運用停止がさほど問題にならない場合には、予
備の計算機システムを持たない単一計算機システムが利
用される。
(Prior Art) When configuring a computer system, measures are taken to deal with failures such as hardware failures and program runaways. For example, if you want to prevent operations from stopping and processing being delayed, you can set up the same computer system as a backup computer system in addition to the computer system that normally operates, and immediately switch the operation to the backup computer system in the event of a failure. be. Furthermore, if the suspension of operation is not a serious problem, a single computer system without a backup computer system is used.

第2図に、従来の単一計算槻システムのブロック図を示
す。
FIG. 2 shows a block diagram of a conventional single calculation system.

図において、計算機システム1は、システム全体の制御
管理を行なうシステム制御装置2と、このシステム制御
装置2に接続されたオペレータ会話装置3と処理装置5
とから構成されている。
In the figure, a computer system 1 includes a system control device 2 that controls and manages the entire system, an operator conversation device 3 and a processing device 5 connected to the system control device 2.
It is composed of.

システム制御装置2は、処理装置5の起動及びその動作
が正常に行なわれているか否かを監視するプロセッサ等
から構戊されたものである。オペレータ会話装置3は、
オペレータが操作するキ−ボードやディスプレイ等から
なり、システム制御装置2に向けて各抽コマンドの入力
等を行なう端末装置である。処理装置5は、実際にデー
タの演算等を行なうもので、プロセッサ6、主記憶装置
7、ディスク装置8とから構威されている。なお、各部
は共通バス4により接続されている。プロセッサ6は、
処理装置5を構成する各部の制御管理を行なうものであ
る。主記憶装置7は、プロセッサ6の動作に必要なプロ
グラムやデータを格納するRAM等から構成されたもの
である。ディスク装置8は、ハードディスク等の記録媒
体を用いてデータの保存を行なうもので、磁気ディスク
9が設けられている。
The system control device 2 is composed of a processor and the like that monitors whether the processing device 5 is activated and its operations are performed normally. The operator conversation device 3 is
This terminal device consists of a keyboard, a display, etc. operated by an operator, and is used to input various drawing commands to the system control device 2. The processing device 5 actually performs data calculations, and is composed of a processor 6, a main storage device 7, and a disk device 8. Note that each part is connected by a common bus 4. The processor 6 is
It controls and manages each part constituting the processing device 5. The main storage device 7 is composed of a RAM and the like that stores programs and data necessary for the operation of the processor 6. The disk device 8 stores data using a recording medium such as a hard disk, and is provided with a magnetic disk 9.

以上の構或の計算機システムlにおいて、システム制御
装置2には、プロセッサ6を起動する為のブートプログ
ラムが予め格納されている。また、ディスク装置8の磁
気ディスク9には、システムの運用操作を司る基本プロ
グラムをロードするためのイニシャルプログラムが格納
されている。
In the computer system I having the above structure, the system control device 2 stores in advance a boot program for starting the processor 6. Further, the magnetic disk 9 of the disk device 8 stores an initial program for loading a basic program that controls the operation of the system.

さて、オペレータ会話装置3からシステム制御装置2に
起動指令が人力されると、システム制御装置2は、ブー
トプログラムを共通バス4を介して主記憶装置7に転送
する。更に、プロセッサ6に起動指令を出す。プロセッ
サ6は、この起動指令を受付けると、主記憶装置7に記
憶されたブートプログラムを実行し、今度は、ディスク
装置8からイニシャルプログラムを読出し、主記憶装置
7に記憶させる。更に、当該イニシャルプログラムを実
行しシステム運用,操作を司る基本プログラムの起動を
終了する。以上の手順により計算機システム1の起動が
終了する。
Now, when a boot command is manually input from the operator conversation device 3 to the system control device 2, the system control device 2 transfers the boot program to the main storage device 7 via the common bus 4. Furthermore, a startup command is issued to the processor 6. When the processor 6 receives this startup command, it executes the boot program stored in the main storage device 7, and then reads the initial program from the disk device 8 and stores it in the main storage device 7. Furthermore, the initial program is executed to finish starting the basic program that controls system operation and operation. The above procedure completes the startup of the computer system 1.

さて、プロセッサ6は、動作が正常であることをシステ
ム制御装置2に通知するため、一定の周期で、システム
制御装置2に設けられた監視用タイマのリセット命令を
発行する。タイマのリセット命令が発行されず、監視用
タイマか所定の計数を行なった場合、システム制御装置
2は、プロセッサ6のプログラムか暴走したものと判断
し、プロセッサ6の動作を強制的に停止させる。また、
プロセッサ6は、処理装置5を構成する各部にハード的
な障害が発生したことを認識すると、自らその運用を停
止する。この場合、システム制御装置2への割込みがか
からないため、システム制御装置2は、プロセッサ6の
停止を認識することができる。
Now, in order to notify the system control device 2 that the operation is normal, the processor 6 issues a reset instruction for the monitoring timer provided in the system control device 2 at regular intervals. If the timer reset command is not issued and the monitoring timer performs a predetermined count, the system control device 2 determines that the program in the processor 6 has gone out of control, and forcibly stops the operation of the processor 6. Also,
When the processor 6 recognizes that a hardware failure has occurred in each part constituting the processing device 5, it stops its operation by itself. In this case, since the system control device 2 is not interrupted, the system control device 2 can recognize that the processor 6 has stopped.

さて、システム制御装置2は、プロセッサ6の動作の停
止を認識し場合、オペレータ会話装置3等を通じて、オ
ペレータに障害発生を認識させる。
Now, when the system control device 2 recognizes that the operation of the processor 6 has stopped, it makes the operator recognize the occurrence of the failure through the operator conversation device 3 or the like.

オペレータは、計算機システム1に障害が発生し、運用
が停止したことを認識した場合、障害原因の調査を行な
った後、再起動、即ちオペレータ会話装置3を用いて起
動指令の入力を行なうことになる。
When the operator recognizes that a failure has occurred in the computer system 1 and the operation has stopped, the operator investigates the cause of the failure and then restarts it, that is, inputs a startup command using the operator conversation device 3. Become.

さて、運用の停止時間が制限されるような場合で、かつ
障害の原因がプロセッサ6のリセット等により解除が可
能な場合には、オペレータが才ベレー夕会話装置3から
プロセッサ6のリセット指令を入力する。この際、後に
障害原因の解析を行なうために、プロセッサ6のリセッ
ト指令をきっかけに、プロセッサ6自身が、現在プロセ
ッサ6がどのような状態にあるかを示す内部レジスタの
内容(状況情報)を主記憶装置7に複写する処理を行な
う。才ベレータは、主記憶装置7に複写された状況情報
データをディスク装置8に格納するためのプログラムの
実行指令をオペレータ会話装置3より人力し、その後シ
ステムの再起動指令の人力を行なうことになる。このデ
ィスク装置8に複写された情報に基づいて、後に保守・
サービス員が計算機システムlの障害の解析を行なうこ
とになる。
Now, in the case where the operation stoppage time is limited and the cause of the failure can be canceled by resetting the processor 6, etc., the operator inputs a reset command for the processor 6 from the conversation device 3. do. At this time, in order to analyze the cause of the failure later, in response to a reset command from the processor 6, the processor 6 itself primarily records the contents of internal registers (status information) indicating what state the processor 6 is currently in. The process of copying to the storage device 7 is performed. The expert will manually issue a command to execute a program to store the status information data copied to the main storage device 7 in the disk device 8 from the operator conversation device 3, and will then manually issue a command to restart the system. . Based on the information copied to this disk device 8, maintenance and
A service person will analyze the failure of the computer system l.

また、オペレータ等が配置されずに、無人で運用されて
いる計算機システム1の場合に、自動的に再起動する方
法としては、プロセッサ6が、障害を検出し、停止時に
プロセッサ6自体が主記憶装置7の固定番地を参照し、
無条件で自動的に再スタート、即ち既に主記憶装置7に
記憶されたイニシャルプログラム等に基づいた動作を行
なうものがある。
In addition, in the case of the computer system 1 that is operated unmanned without an operator or the like, a method for automatically restarting the computer system 1 is that the processor 6 detects a failure, and when the processor 6 is stopped, the main memory of the processor 6 itself is Referring to the fixed address of device 7,
Some systems automatically restart unconditionally, that is, perform operations based on an initial program or the like already stored in the main storage device 7.

(発明が解決しようとする課題) しかしながら、無人で運用されている計算機システム1
の場合には、その運用停止後無条件で再起動してしまう
ため、障害発生時の状況情報を保存できないといった問
題が生じていた。また、運用停止時にプロセッサ6の状
態を示す状況情報を保存し、その後、再び起動を行なう
計算機システム1においては、必ずオペレータが常駐し
なければならないという問題が生じていた。さらに、計
算機システムを2重化して、障害の発生したシステムの
調査中に他のシステムで運用を継続する方法もあるが、
同一システムを2つ用意するために約2倍のコストがか
かるといった問題が生じていた。
(Problem to be solved by the invention) However, computer systems operated unmanned1
In this case, the system restarts unconditionally after its operation is stopped, resulting in the problem that status information at the time of failure cannot be saved. Further, in the computer system 1 which saves status information indicating the state of the processor 6 when the system is stopped and then starts up again, there is a problem in that an operator must always be present. Furthermore, there is a method of duplicating the computer system and continuing operation with another system while the faulty system is being investigated.
A problem has arisen in that it costs about twice as much to prepare two identical systems.

本発明は以上の点に着目してなされたもので、2重化シ
ステムを構築する必要が燕〈、障害が発生した場合にオ
ペレータの介入なしに速やかに運用を再開(再起動)す
ることができ、さらに、後に障害の解析を行なうことが
できる計算機システム再起動制御方式を提供するもので
ある。
The present invention has been made with attention to the above points, and it is necessary to construct a redundant system.In the event of a failure, it is possible to quickly resume operation (restart) without operator intervention. The purpose of the present invention is to provide a computer system restart control method that can perform a failure analysis later.

(課題を解決するための手段) 本発明の計算機システム再起動制御方式は、プロセッサ
と、前記プロセッサの障害検出及び障害復旧の制御を行
なうシステム制御装置とを備え、前記システム制御装置
は、前記障害を検出する障害検出手段と、前記障害発生
時に前記プロセッサの状況の記録及び前記プロセッサの
再起動を実行するか否かの動作選択を設定しておく動作
選択設定手段とを轍えたものである。
(Means for Solving the Problems) A computer system restart control method of the present invention includes a processor and a system control device that controls failure detection and failure recovery of the processor, and the system control device The present invention is a combination of a failure detection means for detecting a failure and an operation selection setting means for setting an operation selection as to whether or not to record the status of the processor and restart the processor when the failure occurs.

(作用) 以上の方式において、予め動作選択設定手段に、プロセ
ッサの状況の記録を実行するか否か及び再起動を実行す
るか否かの情報を設定しておく。そして、システム制御
装置の障害検出手段がプロセッサの障害を検出した場合
、動作選択設定手段の内容を読取り、プロセッサの状況
を記録するか否か及びプロセッサの再起動を実行するか
否かを判断する。プロセッサの状況を記録する指示がな
されていた場合には、プロセッサの状況を示す状況情報
を記録する。また再起動する指示がなされていた場合に
は、プロセッサの再起動の処理を実行する。このように
、動作選択設定手段の内容により、適宜、障害発生時の
対策を講じることができる。
(Operation) In the above method, information on whether to record the status of the processor and whether to restart it is set in advance in the operation selection setting means. When the failure detection means of the system control device detects a failure of the processor, it reads the contents of the operation selection setting means and determines whether to record the status of the processor and whether to restart the processor. . If an instruction to record the status of the processor has been given, status information indicating the status of the processor is recorded. Further, if a restart instruction has been given, the processor restart processing is executed. In this way, depending on the contents of the operation selection setting means, appropriate countermeasures can be taken when a failure occurs.

(実施例) 第1図に、本発明に係る計算機システムのブロック図を
示す。
(Embodiment) FIG. 1 shows a block diagram of a computer system according to the present invention.

図において、計算機システムlは、先に第2図において
説明したものと同様に、システム全体の制御管理を行な
うシステム制御装置2と、このシステム制御装置2に接
続されたオペレータ会話装置3と、共通バス4を介して
接続された処理装置5とから構成されている。なお、第
2図と同一の部分には同一の符号を付し、重複する説明
は省略する。
In the figure, a computer system 1 has a system control device 2 that controls and manages the entire system, an operator conversation device 3 connected to this system control device 2, and a common It is composed of a processing device 5 connected via a bus 4. Note that the same parts as in FIG. 2 are denoted by the same reference numerals, and redundant explanation will be omitted.

システム制御装置2には、障害検出手段21、状況情報
複写手段22、再起動実行手段23、動作選択設定手段
24、そしてブートプログラムを格納したROM25が
設けられている。障害検出手段21は、処理装置5の障
害、例えばプロセッサ6のプログラムの暴走やプロセッ
サ6の動作停止を検出するもので、監視タイマ(例えば
ウォッチドッグタイマ)等から構成されている。状況情
報複写手段22は、障害検出手段21が障害を検出した
場合、プロセッサ6に設けられた内部レジスタ6aの内
容の記録(ディスク装置8への複写)の指示を出すもの
である。なお、内部レジスタ6aは、プロセッサ6の機
能として持つ普通のレジスタである。再起動実行手段2
3は、障害検出手段21が障害を検出した場合、プロセ
ッサ6に再起動命令を出力するものである。動作選択制
御手段24は、状況情報複写手段22が状況情報の複写
を実行するか否か及び再起動実行手段23が再起動を実
行するか否かの設定を行なうレジスタ等から構成された
ものである。
The system control device 2 is provided with a failure detection means 21, a status information copying means 22, a restart execution means 23, an operation selection setting means 24, and a ROM 25 storing a boot program. The fault detection means 21 detects a fault in the processing device 5, such as a program runaway in the processor 6 or a stoppage of the processor 6, and is composed of a monitoring timer (for example, a watchdog timer). The status information copying means 22 issues an instruction to record (copy to the disk device 8) the contents of the internal register 6a provided in the processor 6 when the fault detection means 21 detects a fault. Note that the internal register 6a is a normal register that the processor 6 has as a function. Restart execution means 2
3 outputs a restart instruction to the processor 6 when the failure detection means 21 detects a failure. The operation selection control means 24 is composed of registers and the like for setting whether or not the situation information copying means 22 executes a copy of the situation information and whether or not the restart execution means 23 executes a reboot. be.

第3図に、動作選択設定手段の構成図を示す。FIG. 3 shows a configuration diagram of the operation selection setting means.

図は、システム制御装置2のデータ長(32ビット)に
対応した32ビットのレジスタの構成を示している。
The figure shows the configuration of a 32-bit register corresponding to the data length (32 bits) of the system control device 2.

図において、第30ビットは、再起動を実行するか否か
の設定を行なう再起動指示フラグ24a、第31ビット
は、状況情報の記録を実行するか否かの設定を行なう複
写指示フラグ24bである。
In the figure, the 30th bit is a restart instruction flag 24a for setting whether to execute a restart, and the 31st bit is a copy instruction flag 24b for setting whether to execute recording of status information. be.

どちらのフラグも、その内容が゛1′゛の場合は処理を
実行し、内容が“0゜゜の場合は処理を実行しないこと
を意味する。
For both flags, if the content is ``1'', the process is executed, and if the content is ``0°'', the process is not executed.

ここで再び第1図に戻って、本発明の説明を行なう。Now, returning to FIG. 1 again, the present invention will be explained.

以上の構成の計算機システムエにおいて、動作選択設定
手段24の再起動指示フラグ24a及び複写指示フラグ
24b共に、その内容が゛1”に設定されているものと
する。従って、状況情報複写手段22はプロセッサ6の
内部レジスタ6aの内容を主記憶装置7を介してディス
ク装置8の磁気ディスク9に複写する処理を実行する。
In the computer system with the above configuration, it is assumed that the contents of both the restart instruction flag 24a and the copy instruction flag 24b of the operation selection setting means 24 are set to "1".Therefore, the status information copying means 22 A process of copying the contents of the internal register 6a of the processor 6 to the magnetic disk 9 of the disk device 8 via the main storage device 7 is executed.

同様に、再起動実行手段23は、プロセッサ6の再起動
を実行する。
Similarly, the restart execution means 23 restarts the processor 6.

さて、オペレータ会話装置3からシステム制御装置2に
起動指令が入力されると、システム制御装置2は、ブー
トプログラムを共通バス4を介して主記憶装置7に転送
する。更に、プロセッサ6に起動指令を出す。プロセッ
サ6は、この起動指令を受付けると、主記憶装置7に記
憶されたブートブログラムを参照し、今度は、ディスク
装置8からイニシャルプログラムを読出し、主記憶装置
7に記憶させる。更に、当該イニシャルプログラムを実
行し、システム運用,操作を司る基本プログラムの起動
を終了する。以上の手順により計算機システム1の起動
が終了する。
Now, when a boot command is input from the operator conversation device 3 to the system control device 2, the system control device 2 transfers the boot program to the main storage device 7 via the common bus 4. Furthermore, a startup command is issued to the processor 6. When the processor 6 receives this startup command, it refers to the boot program stored in the main storage device 7, reads the initial program from the disk device 8, and stores it in the main storage device 7. Furthermore, the initial program is executed, and the startup of the basic program that controls system operation and operation is completed. The above procedure completes the startup of the computer system 1.

ところで、プロセッサ6は、動作が正常であることをシ
ステム制御装置2に通知するため、一定の周期で、障害
検出手段21に設けられた監視用タイマのリセット命令
を発行する。タイマのリセット命令が発行されず、例え
ばプロセッサ6が暴走し割込みが発生しない場合には、
監視用タイマはその計数を継続する。そして、この計数
値が所定の値を超えた場合、システム制御装置2は、プ
ロセッサ6に障害が発生したものと判断し、プロセッサ
6の動作を強制的に停止させる。また、プロセッサ6は
、主記憶装置7の異常やディスク装置8のアクセスエラ
ー等が発生した場合には、自らその動作を停止する。こ
の場合にも、システム制御装置2には割込みがかからず
、障害検出手段21が障害を検出することになる。
By the way, in order to notify the system control device 2 that the operation is normal, the processor 6 issues an instruction to reset the monitoring timer provided in the failure detection means 21 at regular intervals. If the timer reset command is not issued and, for example, the processor 6 goes out of control and no interrupt occurs,
The monitoring timer continues counting. If this count value exceeds a predetermined value, the system control device 2 determines that a failure has occurred in the processor 6, and forcibly stops the operation of the processor 6. Further, the processor 6 stops its operation by itself when an abnormality in the main storage device 7 or an access error in the disk device 8 occurs. In this case as well, the system control device 2 is not interrupted, and the fault detection means 21 detects the fault.

障害検出手段21は、処理装置5の障害を検出した場合
、状況情報複写手段22及び再起動実行手段23を起動
する。
When detecting a failure in the processing device 5, the failure detection means 21 activates the status information copying means 22 and the restart execution means 23.

先ず、状況情報複写手段22は、動作選択設定手段24
の内容を読取り、第3lビットの内容が゛1”か否かの
判断を行なう。ここでは、先に内容が”1゛に設定され
ているから、状況情報複写手段22は、状況情報の複写
を実行することになる。具体的には、先ずシステム制御
装置2は、プロセッサ6に内部レジスタ6aの内容(状
況情報)複写の指示を出す。この指示を受けたプロセッ
サ6は、内部レジスタ6aの内容を、一旦、主記憶装置
7の空き領域に転送する。その後、システム制御装置2
は、プロセッサ6のリセットを行なうと同時に、主記憶
装置7に格納された状況情報複写用のプログラムを参照
して動作する起動をかける。プロセッサ6は、この起動
を指示を受けると、ディスク装置8をアクセスし、主記
憶装置7に記憶された状況情報を磁気ディスク9に複写
する。
First, the situation information copying means 22 is configured to copy the operation selection setting means 24.
The content of the third l bit is read and it is determined whether the content of the third l bit is ``1'' or not.Here, since the content is previously set to ``1'', the status information copying means 22 copies the status information. will be executed. Specifically, first, the system control device 2 issues an instruction to the processor 6 to copy the contents (status information) of the internal register 6a. Upon receiving this instruction, the processor 6 temporarily transfers the contents of the internal register 6a to an empty area of the main storage device 7. After that, the system controller 2
At the same time as the processor 6 is reset, the program for copying status information stored in the main storage device 7 is started to operate by referring to it. When processor 6 receives this activation instruction, it accesses disk device 8 and copies the status information stored in main storage device 7 to magnetic disk 9 .

次に、システム制御装置2の再起動実行手段23は、動
作選択設定手段24の内容を読取り、第30ビットの内
容が“1゜゛か否かの判断を行なう。ここでは、先に内
容が゛1゜゜に設定されているから、再起動実行手段2
3は、プロセッサ6に再起動の指示を出すことになる。
Next, the restart executing means 23 of the system control device 2 reads the contents of the operation selection setting means 24 and determines whether the contents of the 30th bit is "1°". Since it is set to 1°, reboot execution method 2
3 instructs the processor 6 to restart.

プロセッサ6は、この再起動の指示を受けると、主記憶
装置7に記憶されたブートプログラムを参照して、その
動作を開始する。
When processor 6 receives this reboot instruction, it refers to the boot program stored in main storage device 7 and starts its operation.

なお、動作選択設定手段24の第30ビットが“O”に
設定されていたような場合、システム制御装置2の再起
動実行手段23は、オペレータ会話装置3を介して障害
発生の表示を行なう。また、再起動のみを実行させる場
合には、動作選択設定手段24の第31ビットを゛゜O
゛゜に設定しておけば良い。
If the 30th bit of the operation selection setting means 24 is set to "O", the restart execution means 23 of the system control device 2 displays the occurrence of a failure via the operator conversation device 3. In addition, when only restarting is to be executed, the 31st bit of the operation selection setting means 24 is set to ゛゜O.
You can set it to ゛゜.

以上の説明のように、動作選択設定手段の内容に基づい
て、状況情報の記録及び再起動を実行する。
As described above, recording of status information and restart are executed based on the contents of the operation selection setting means.

本発明は以上の実施例に限定されない。The present invention is not limited to the above embodiments.

実施例では、プロセッサ6の状況を示す状況情報(内部
レジスク6aの内容)を、一旦主記憶装置7に複写した
後、ディスク装置8に再度複写する手順を説明したが、
例えばプロセッサ6から直接ディスク装置8に複写して
も構わない。
In the embodiment, the procedure for copying the status information indicating the status of the processor 6 (the contents of the internal register 6a) to the main storage device 7 and then copying it again to the disk device 8 was explained.
For example, the data may be directly copied from the processor 6 to the disk device 8.

(発明の効果) 以上構成の本発明の計算機システム再起動制御方式によ
ると、処理装置に障害が発生した場合、無人で自動的に
再起動を行なうことができ、かつ状況情報の記録を行な
うことができる。このため、無人で運用されているシス
テムにおいても、後に障害の解析作業等を行なうことが
できる。また、システム毎に、自動的に再起動を行なう
か否か及び状況情報の記録を行なうか否かの選択を行な
うことができるため、システムの設置された環境に応じ
てその運用形態を容易に選択することができる。
(Effects of the Invention) According to the computer system restart control method of the present invention configured as described above, when a failure occurs in a processing device, it can be automatically restarted without any personnel present, and status information can be recorded. I can do it. Therefore, even in systems that are operated unmanned, failure analysis work can be performed later. In addition, since it is possible to select whether or not to automatically restart each system and whether or not to record status information, it is possible to easily change the operation mode depending on the environment in which the system is installed. You can choose.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明に係る計算機システムのブロック図、第
2図は従来の単一計算機システムのブロック図、第3図
は動作選択設定手段の構戊図である。 2・・・システム制御装置、 3・・・オペレータ会話装置、5・・・処理装置、6・
・・プロセッサ、6a・・・内部レジスタ、7・・・主
記憶装置、8・・・ディスク装置、21・・・障害検出
手段、22・・・状況情報複写手段、23・・・再起動
実行手段、 24・・・動作選択設定手段。
FIG. 1 is a block diagram of a computer system according to the present invention, FIG. 2 is a block diagram of a conventional single computer system, and FIG. 3 is a block diagram of an operation selection setting means. 2... System control device, 3... Operator conversation device, 5... Processing device, 6.
... Processor, 6a... Internal register, 7... Main storage device, 8... Disk device, 21... Fault detection means, 22... Status information copying means, 23... Restart execution Means, 24...Operation selection setting means.

Claims (1)

【特許請求の範囲】 プロセッサと、 前記プロセッサの障害検出及び障害復旧の制御を行なう
システム制御装置とを備え、 前記システム制御装置は、 前記障害を検出する障害検出手段と、 前記障害発生時に前記プロセッサの状況の記録及び前記
プロセッサの再起動を実行するか否かの動作選択を設定
しておく動作選択設定手段とを備えたことを特徴とする
計算機システム再起動制御方式。
[Scope of Claims] A processor; a system control device configured to detect a failure in the processor and control failure recovery; 1. A computer system restart control method, comprising an operation selection setting means for recording the status of the processor and setting an operation selection as to whether or not to restart the processor.
JP1231491A 1989-09-08 1989-09-08 Restart control system for computer system Pending JPH0395634A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1231491A JPH0395634A (en) 1989-09-08 1989-09-08 Restart control system for computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1231491A JPH0395634A (en) 1989-09-08 1989-09-08 Restart control system for computer system

Publications (1)

Publication Number Publication Date
JPH0395634A true JPH0395634A (en) 1991-04-22

Family

ID=16924324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1231491A Pending JPH0395634A (en) 1989-09-08 1989-09-08 Restart control system for computer system

Country Status (1)

Country Link
JP (1) JPH0395634A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006107430A (en) * 2004-09-30 2006-04-20 Microsoft Corp Method, system and device for identification of no response section of computer program
JP2016186688A (en) * 2015-03-27 2016-10-27 日本電気株式会社 Information processing device, device, and recovery method; and computer program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006107430A (en) * 2004-09-30 2006-04-20 Microsoft Corp Method, system and device for identification of no response section of computer program
JP2016186688A (en) * 2015-03-27 2016-10-27 日本電気株式会社 Information processing device, device, and recovery method; and computer program

Similar Documents

Publication Publication Date Title
US20010042198A1 (en) Method for recovering from computer system lockup condition
JP3481737B2 (en) Dump collection device and dump collection method
KR100899582B1 (en) Information processing apparatus, control apparatus therefor, control method therefor and control program
JPH09251443A (en) Processor fault recovery processing method for information processing system
JPH02294739A (en) Fault detecting system
JPS6119061B2 (en)
JPH0395634A (en) Restart control system for computer system
JPH064417A (en) Battery backup control system for memory
JP3185446B2 (en) Computer system
JP2679575B2 (en) I / O channel fault handling system
JP4788516B2 (en) Dynamic replacement system, dynamic replacement method and program
JP2000347758A (en) Information processor
JP2624106B2 (en) Automatic verification method of backup file in exchange system
JP2849780B2 (en) Computer system
JPH0659941A (en) Information processor
JPS585856A (en) Error recovery system for logical device
JPS6119060B2 (en)
JPH0695974A (en) Memory protecting system
JPS62284440A (en) Software resource maintenance system for terminal equipment
JPH07244536A (en) Resume supporting mechanism
JPH06250860A (en) Data processor
JP3340284B2 (en) Redundant system
JPH0721091A (en) Service interruption processing method for electronic computer
JPS62212865A (en) Multiprocessor control system
JPH05324366A (en) Automatic stop restoring system