JPS6156537B2 - - Google Patents

Info

Publication number
JPS6156537B2
JPS6156537B2 JP53162429A JP16242978A JPS6156537B2 JP S6156537 B2 JPS6156537 B2 JP S6156537B2 JP 53162429 A JP53162429 A JP 53162429A JP 16242978 A JP16242978 A JP 16242978A JP S6156537 B2 JPS6156537 B2 JP S6156537B2
Authority
JP
Japan
Prior art keywords
error
cpu
recovery
instruction
logical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP53162429A
Other languages
Japanese (ja)
Other versions
JPS5587251A (en
Inventor
Tsunetaka Fujiwara
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP16242978A priority Critical patent/JPS5587251A/en
Publication of JPS5587251A publication Critical patent/JPS5587251A/en
Publication of JPS6156537B2 publication Critical patent/JPS6156537B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Retry When Errors Occur (AREA)
  • Hardware Redundancy (AREA)

Description

【発明の詳細な説明】 本発明は論理装置用エラー回復システムに関す
る。中央処理装置(以下、CPUと略す)のエラ
ー回復方式の一つとして命令再試行方式がある。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to an error recovery system for logical devices. An instruction retry method is one of the error recovery methods for a central processing unit (hereinafter abbreviated as CPU).

CPUのある命令を実行中に該CPUにエラーが
発生した場合、該命令の再試行を行うためには、
該CPU内の該命令に関係する全ての情報を該命
令実行前の状態に戻し該命令実行前の状態を再現
して再実行すればよく、基本的には、該CPU内
のプログラム操作可能レジスタの状態、メモリ状
態および他装置の内部状態の再現である。
If an error occurs in the CPU while executing a certain instruction, in order to retry the instruction,
All the information related to the instruction in the CPU needs to be returned to the state before the instruction was executed, reproduce the state before the instruction was executed, and then re-executed.Basically, the programmable registers in the CPU This is a reproduction of the state of the device, the memory state, and the internal state of other devices.

命令再試行としては、プログラム操作可能レジ
スタに対するコピーレジスタを設けておき、各命
令の実行前の値を常に保持するようにし、ある命
令を実行中にエラーが発生したならば該コピーレ
ジスタの情報を前述のプログラム操作可能レジス
タへ復帰することにより該命令実行直前の状態に
戻れるようにしておく。さらに命令の再試行が可
能か否かを示す命令再試行不可インデイケータを
設けておく。該命令再試行不可インデイケータは
命令再試行可能または不可能に従つてセツトまた
はリセツトされ、命令実行中のメモリ書換え等該
命令実行前の状態の再現が極めて困難である場合
には該命令再試行不可インデイケータをセツトす
るようにしておく。
For instruction retry, a copy register is provided for the programmable register so that the value before execution of each instruction is always retained, and if an error occurs while executing a certain instruction, the information in the copy register is By returning to the programmable register described above, it is possible to return to the state immediately before the instruction was executed. Furthermore, an instruction retry disabled indicator is provided to indicate whether or not an instruction can be retried. The instruction retryability indicator is set or reset depending on whether the instruction is retryable or not, and if it is extremely difficult to reproduce the state before the instruction is executed, such as when memory is rewritten during instruction execution, the instruction cannot be retried. Make sure to set the indicator.

従来、前述の命令再試行手段を有するCPUに
おいてある命令実行中にエラーが発生した場合、
該命令の再試行可否を前述の命令再試行不可イン
デイケータの内容により判断し、該命令の再試行
が可能であるならば該命令を再試行することによ
り該CPUのエラーを回復していたが、該エラー
が固定故障であるならば命令再試行による該エラ
ーの回復は期待できない、という欠点がある。ま
た、基本的にエラーを含む装置が自ら自装置の回
復処理を行うため該回復を完全には行い得ない、
という欠点もある。
Conventionally, when an error occurs during the execution of a certain instruction in a CPU that has the above-mentioned instruction retry means,
Whether or not the instruction can be retried is determined based on the contents of the instruction retry not possible indicator, and if the instruction can be retried, the CPU error is recovered by retrying the instruction. If the error is a fixed failure, there is a drawback that recovery from the error cannot be expected by retrying the instruction. Additionally, since the device containing the error basically performs its own recovery process, the recovery cannot be completed completely.
There is also a drawback.

本発明の目的はマルチプロセツサシステムにお
いて固定故障に対する回復可能性の低下や回復結
果の信憑性劣下という欠点を解決し、完全に
CPUのエラーを回復することができる論理装置
用エラー回復システムを提供することにある。
The purpose of the present invention is to completely solve the disadvantages of a multiprocessor system, such as a decrease in the possibility of recovery from fixed failures and a decrease in the reliability of recovery results.
An object of the present invention is to provide an error recovery system for logical devices that can recover from errors in a CPU.

本発明のシステムは、複数の論理装置とこれら
の論理装置のエラー回復動作を制御する回復制御
装置とを有する論理装置のエラー回復システムに
おいて、 命令を読み出したり実行させるための情報群を
格納する格納手段と、この格納手段の情報に基づ
いて処理されたときに発生したエラーを通知する
エラー通知手段と、このエラー通知後実行を停止
させる手段と、この停止手段により停止されたエ
ラー発生の命令を再実行できるか否かを表示する
表示情報を送信する送信手段とを有する複数の論
理装置と、 前記エラー通知手段でエラーの通知とともに前
記送信手段からの表示情報が命令を再実行できる
ことを表示しているときには前記論理装置の格納
手段からの情報群を退避させる退避手弾と、この
退避手段に退避させた情報群を前記複数の論理装
置のうちエラーの発生しない論理装置の格納手段
に送りエラーの発生した命令からの再実行を指示
する制御手段とを有する回復制御装置とを含むこ
とを特徴とする。
The system of the present invention is an error recovery system for a logic device that includes a plurality of logic devices and a recovery control device that controls error recovery operations of these logic devices. means, an error notification means for notifying an error that occurs when processing is performed based on the information in the storage means, a means for stopping execution after notification of the error, and an instruction that causes an error to be stopped by the stopping means. a plurality of logical devices having a sending means for sending display information indicating whether or not the command can be re-executed; and the error notification means notifying the error and displaying information from the sending means indicating that the command can be re-executed. When an error occurs, an evacuation grenade is used to evacuate the information group from the storage means of the logical device, and the information group evacuated to the evacuation means is sent to the storage means of the logical device in which the error does not occur among the plurality of logical devices. and a recovery control device having a control means for instructing re-execution from the instruction that has occurred.

次に本発明の一実施例について図面を参照して
詳細に説明する。
Next, one embodiment of the present invention will be described in detail with reference to the drawings.

図を参照すると、本発明のエラー回復装置はエ
ラーを検出したCPU10、エラーの回復処理を
行うCPU20、エラーの回復処理を制御する回
復制御装置30、CPU10のエラーを回復制御
装置30へ報告するためのエラー報告用接続線1
20、CPU10のプログラム操作可能レジスタ
群111〜119、CPU20のプログラム操作
可能レジスタ群211〜219、CPU10のプ
ログラム操作可能レジスタ群111〜119の情
報を退避させるための退避用接続線121、
CPU10のプログラム操作可能レジスタ群11
1〜119の情報をCPU20のプログラム操作
可能レジスタ群211〜219へ回復するための
回復用インタフエース222、CPU10内のエ
ラー検出回路130(従来技術であるパリテイチ
エツク回路等により実現されている)、CPU10
内のクロツク発振回路131、CPU20内のク
ロツク発振回路231および命令再試行不可イン
デイケータ132から構成されている。
Referring to the figure, the error recovery device of the present invention includes a CPU 10 that detects an error, a CPU 20 that performs error recovery processing, a recovery control device 30 that controls error recovery processing, and a system for reporting errors in the CPU 10 to the recovery control device 30. Error reporting connection line 1
20, a saving connection line 121 for saving information of the programmable register group 111 to 119 of the CPU 10, the programmable register group 211 to 219 of the CPU 20, the programmable register group 111 to 119 of the CPU 10;
Programmable register group 11 of CPU 10
A recovery interface 222 for restoring the information of 1 to 119 to the programmable register group 211 to 219 of the CPU 20, and an error detection circuit 130 in the CPU 10 (realized by a conventional parity check circuit, etc.) , CPU10
The CPU 20 includes a clock oscillation circuit 131 within the CPU 20, a clock oscillation circuit 231 within the CPU 20, and an instruction retry disabled indicator 132.

いま、CPU10内でエラーが発生し、エラー
検出回路130にてエラー検出されると制御線1
23を介して与えられる信号でクロツク発振回路
131が停止され、エラー発生時点のCPU10
の内部状態が凍結されるとともに、制御線124
およびインタフエース制御回路133を介して回
復制御装置30にエラー発生報告が行なわれる。
回復制御装置30では、通常入出力制御等別業務
を処理中であるが、CPU10からのエラー発生
報告が与えられると、回復制御装置30の制御部
31では処理中の業務が中断され、回復処理の制
御が開始される。すなわち、退避用インタフエー
ス121を介してCPU10のプログラム操作可
能レジスタ群111〜119の内容が読込まれ
る。
Now, when an error occurs in the CPU 10 and the error detection circuit 130 detects the error, the control line 1
23, the clock oscillation circuit 131 is stopped and the CPU 10 at the time of the error occurs.
The internal state of the control line 124 is frozen, and the control line 124
An error occurrence report is then sent to the recovery control device 30 via the interface control circuit 133.
The recovery control device 30 is normally processing another task such as input/output control, but when an error occurrence report is given from the CPU 10, the control unit 31 of the recovery control device 30 interrupts the task being processed and starts the recovery process. control is started. That is, the contents of the programmable registers 111 to 119 of the CPU 10 are read via the save interface 121.

CPU10内のレジスタの読出し動作は次のよ
うにして行なわれる。すなわち、データバス13
7は36ビツト幅のデータバスであり、レジスタ
111〜119のうち、選択レジスタ136で指
定されたレジスタの値が設定される、外部インタ
フエースは9ビツトであるため外部から前記選択
レジスタ136に格納された読出し対象となるレ
ジスタ番号により読出し指令を出す毎にデータバ
ス137上のデータが選択ゲート群138を介し
て上位から9ビツトずつ4回インタフエースに送
出されデータバス137の値を読出すことができ
る。CPU10のプログラム操作可能レジスタ群
111〜119の読込み処理中は、CPU10の
クロツクは停止させておき、読込み処理により
CPU10の内部状態が変化しないようにしてお
く。
The read operation of the registers within the CPU 10 is performed as follows. That is, the data bus 13
7 is a data bus with a width of 36 bits, and the value of the register specified by the selection register 136 among registers 111 to 119 is set.Since the external interface is 9 bits, data is stored in the selection register 136 from the outside. Each time a read command is issued based on the register number to be read, the data on the data bus 137 is sent to the interface four times from the upper 9 bits via the selection gate group 138, and the value of the data bus 137 is read. I can do it. During the process of reading the programmable registers 111 to 119 of the CPU 10, the clock of the CPU 10 is stopped, and the read process
Make sure that the internal state of the CPU 10 does not change.

回路制御装置30ではエラーの発生時点で
CPU10にて実行されていた命令が再試行可能
か否かが命令再試行不可インデイケータ132の
内容で判断される。命令再試行不可インデイケー
タ132は、各命令実行開始時点でオフにリセツ
トされ、命令実行中メモリ書換え等の条件で命令
再試行不可としてオンにセツトされる。該命令再
試行不可インデイケータ132がオフの場合、エ
ラー発生時での命令は再試行可能であるので、回
復制御装置30からの信号によりCPU10にお
いて該命令の再試行を行わせる指示が出される
が、CPU10での命令の再試行が不成功である
ならば、制御線234を介してCPU10の回復
処理をCPU20へ依頼する。
In the circuit control device 30, at the time of occurrence of the error,
Whether or not the instruction being executed by the CPU 10 can be retried is determined based on the contents of the instruction retryability indicator 132. The instruction retry prohibition indicator 132 is reset to OFF at the start of execution of each instruction, and is set to ON to indicate that the instruction cannot be retried under conditions such as memory rewriting during instruction execution. When the instruction retry not possible indicator 132 is off, the instruction at the time of the error occurrence can be retried, so a signal from the recovery control device 30 instructs the CPU 10 to retry the instruction. If the retry of the instruction by the CPU 10 is unsuccessful, the CPU 20 is requested to perform recovery processing for the CPU 10 via the control line 234.

回復制御装置30からエラーCPU10の回復
依頼を受けたCPU20はCPU10とは独立に本
業務を処理中であり、処理中の業務が区切りのよ
い時点で中断され、その旨制御線234を介して
回復制御装置30へ報告する。その後、クロツク
発振回路231が停止され、それ以後のCPU2
0での本業務処理は一時中断される。ただし、回
復制御装置30によりCPU20が本業務を処理
中でないことが認知できる場合には、CPU20
から回復制御装置30への報告は不要である。
The CPU 20 that has received a recovery request for the error CPU 10 from the recovery control device 30 is processing this task independently of the CPU 10, and the task being processed is interrupted at a good point, and the CPU 20 receives a recovery request via the control line 234. Report to the control device 30. After that, the clock oscillation circuit 231 is stopped, and the CPU 2
The main business process at 0 is temporarily suspended. However, if the recovery control device 30 can recognize that the CPU 20 is not processing this business, the CPU 20
There is no need for a report from to the recovery control device 30.

報告を受けた回復制御装置30では退避用イン
タフエース121を介して退避したCPU10の
プログラム操作可能レジスタ群111〜119の
情報が回復用インタフエース222を介して
CPU20のプログラム操作可能レジスタ群21
1〜219へ書込まれる。
Upon receiving the report, the recovery control device 30 transfers the information of the programmable registers 111 to 119 of the CPU 10 that was saved via the save interface 121 to the recovery interface 222.
Programmable register group 21 of CPU 20
1 to 219.

CPU20へのレジスタ書込みは次のようにし
て行われる。すなわち、データバス235は36ビ
ツト幅のデータバスであり、レジスタ211〜2
19のうち選択レジスタ236の内容で指定され
たレジスタにデータがセツトされる。選択レジス
タ236およびデータレジスタ239は外部から
セツト可能であるが、外部インタフエースは9ビ
ツトであるためデータレジスタ239には選択ゲ
ート群240により4回に分けてセツトする必要
があり、書込みたいレジスタ番号を選択レジスタ
236にセツトし、データレジスタ239に9ビ
ツトづつ4回に分けて書込んだ後、書込み指令を
出すことにより所望のレジスタに書込むことがで
きる。
Register writing to the CPU 20 is performed as follows. That is, data bus 235 is a 36-bit wide data bus, and registers 211 to 2
Data is set in the register designated by the contents of the selection register 236 among the 19 registers. The selection register 236 and data register 239 can be set externally, but since the external interface is 9 bits, it is necessary to set the data register 239 four times using the selection gate group 240. is set in the selection register 236, and written into the data register 239 in four parts of 9 bits each, and then written to a desired register by issuing a write command.

CPU10のプログラム操作可能レジスタ群1
11〜119の情報がCPU20のプログラム操
作可能レジスタ群211〜219へ設定された
後、回復制御装置30では制御線225を介して
CPU20のクロツク発振停止解除を行うことに
よりCPU20に対して命令開始起動がかけら
れ、エラーのためCPU10で中断されていた処
理がCPU20にて処理続行されCPU10の回復
処理が行なわれる。
Programmable register group 1 of CPU10
After the information Nos. 11 to 119 is set to the programmable registers 211 to 219 of the CPU 20, the recovery control device 30 sends the information via the control line 225.
By canceling the clock oscillation stop of the CPU 20, the CPU 20 is activated to start an instruction, and the processing that was interrupted by the CPU 10 due to the error is continued by the CPU 20, and the recovery processing of the CPU 10 is performed.

本発明には各種の回復処理プログラムを作成す
ることなくまた回復処理に対する信憑性の低下を
招くことなくCPUの回復処理を行うことができ
るという効果がある。
The present invention has the advantage that CPU recovery processing can be performed without creating various recovery processing programs and without reducing the credibility of the recovery processing.

【図面の簡単な説明】[Brief explanation of the drawing]

図は本発明の一実施例を示す図である。 図において、10,20……CPU、30……
回復制御回路、31……制御部、111〜11
9,211〜219……レジスタ群、120,2
20……エラー報告用インタフエース、121,
221……退避用インタフエース、122,22
2……回復用インタフエース、123,124,
125,223,224,225……制御線、1
30,230……エラー検出回路、131,23
1……クロツク発振回路、132,232……命
令再試行不可インデイケータ、133,233…
…インタフエース制御回路、124,224……
制御線、135,235……書込みデータバス、
136,236……選択レジスタ、137,23
7……読込みデータバス、138,238……選
択制御ゲート群、139,239……データレジ
スタ、140,240……選択制御ゲート群。
The figure shows an embodiment of the present invention. In the figure, 10, 20... CPU, 30...
Recovery control circuit, 31...control unit, 111-11
9,211-219...Register group, 120,2
20...Error reporting interface, 121,
221... Evacuation interface, 122, 22
2...Recovery interface, 123, 124,
125, 223, 224, 225...control line, 1
30,230...Error detection circuit, 131,23
1...Clock oscillation circuit, 132, 232...Instruction retry impossible indicator, 133, 233...
...Interface control circuit, 124, 224...
Control line, 135, 235...Write data bus,
136, 236...Selection register, 137, 23
7... Read data bus, 138, 238... Selection control gate group, 139, 239... Data register, 140, 240... Selection control gate group.

Claims (1)

【特許請求の範囲】 1 複数の論理装置とこれらの論理装置のエラー
回復動作を制御する回復制御装置とを有する論理
装置のエラー回復システムにおいて、 命令を読み出したり実行させるための情報詳を
格納する格納手段と、この格納手段の情報群に基
づいて処理されたときに発生したエラーを通知す
るエラー通知手段と、このエラー通知後実行を停
止させる手段と、この停止手段により停止された
エラー発生の命令を再実行できるか否かを表示す
る表示情報を送信する送信手段とを有する複数の
論理装置と、 前記エラー通知手段でエラーの通知とともに前
記送信手段からの表示情報が命令を再実行できる
ことを表示しているときには前記論理装置の格納
手段からの情報群を退避させる退避手段と、この
退避手段に退避させた情報群を前記複数の論理装
置のうちエラーの発生しない論理装置の処理の区
切りで該論理装置の格納手段に送りエラーの発生
した命令からの再実行を指示する制御手段とを有
する回復制御装置とを含むことを特徴とする論理
装置のエラー回復システム。
[Scope of Claims] 1. In a logic device error recovery system having a plurality of logic devices and a recovery control device that controls error recovery operations of these logic devices, the system stores information details for reading and executing instructions. a storage means, an error notification means for notifying an error that occurs when processing is performed based on the information group of the storage means, a means for stopping execution after notifying the error, and a means for stopping the execution of the error that is stopped by the stopping means. a plurality of logical devices having a transmitting means for transmitting display information indicating whether or not the command can be re-executed; and a plurality of logical devices having a transmitting means for transmitting display information indicating whether or not the command can be re-executed; When displaying, a saving means saves the information group from the storage means of the logical device, and the information group saved to the saving means is stored at a break point between the processing of the logical device in which an error does not occur among the plurality of logical devices. 1. An error recovery system for a logic device, comprising: a recovery control device having a control means for instructing a storage means of the logic device to re-execute an instruction in which a sending error has occurred.
JP16242978A 1978-12-26 1978-12-26 Error recovery system of logic unit Granted JPS5587251A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16242978A JPS5587251A (en) 1978-12-26 1978-12-26 Error recovery system of logic unit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16242978A JPS5587251A (en) 1978-12-26 1978-12-26 Error recovery system of logic unit

Publications (2)

Publication Number Publication Date
JPS5587251A JPS5587251A (en) 1980-07-01
JPS6156537B2 true JPS6156537B2 (en) 1986-12-03

Family

ID=15754430

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16242978A Granted JPS5587251A (en) 1978-12-26 1978-12-26 Error recovery system of logic unit

Country Status (1)

Country Link
JP (1) JPS5587251A (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6341943A (en) * 1986-08-08 1988-02-23 Nec Corp Error restoring system for logic unit
JPH02157943A (en) * 1988-12-09 1990-06-18 Nec Corp Data manipulation language instruction retesting system

Also Published As

Publication number Publication date
JPS5587251A (en) 1980-07-01

Similar Documents

Publication Publication Date Title
JPS6053339B2 (en) Logical unit error recovery method
US4852092A (en) Error recovery system of a multiprocessor system for recovering an error in a processor by making the processor into a checking condition after completion of microprogram restart from a checkpoint
JPH07117903B2 (en) Disaster recovery method
JPH04338849A (en) Excessive error correction method
JPS6156537B2 (en)
JP3450132B2 (en) Cache control circuit
JPH0644238B2 (en) Instruction re-execution control method
JPS6336014B2 (en)
JPS6128141B2 (en)
JPS622334B2 (en)
JPS585856A (en) Error recovery system for logical device
AU669410B2 (en) Error recovery mechanism for software visible registers in computer systems
JPH07219796A (en) Information processor
JP2544536B2 (en) Method for determining the presence or absence of data in memory
JPS6130296B2 (en)
JPS6130297B2 (en)
JPS5932821B2 (en) information processing equipment
JP2503981B2 (en) Peripheral storage
JPH039433A (en) Information processor
JPS5850049A (en) Multilogic device system
JPH02118745A (en) Memory back-up device
JPS635779B2 (en)
JPS59125453A (en) Retrying system
JPS59144956A (en) Data processing system
JPS6061839A (en) Fault diagnostic processing system of logical device