JPH03130835A - Restarting device for information processor - Google Patents

Restarting device for information processor

Info

Publication number
JPH03130835A
JPH03130835A JP1269585A JP26958589A JPH03130835A JP H03130835 A JPH03130835 A JP H03130835A JP 1269585 A JP1269585 A JP 1269585A JP 26958589 A JP26958589 A JP 26958589A JP H03130835 A JPH03130835 A JP H03130835A
Authority
JP
Japan
Prior art keywords
data
main memory
read
error
processing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1269585A
Other languages
Japanese (ja)
Inventor
Hiroshi Nakajima
浩 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Engineering Ltd
Original Assignee
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Engineering Ltd filed Critical NEC Engineering Ltd
Priority to JP1269585A priority Critical patent/JPH03130835A/en
Publication of JPH03130835A publication Critical patent/JPH03130835A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To quickly restart an information processor by checking the presence or absence of an error after reading successively the data out of a main storage to accurately decide a faulty area and loading the data again only to the main storage address that includes a fault. CONSTITUTION:When a main storage has a fault, a diagnostic read means 101 reads successively the data to be stored in a main storage 103. An error detection means 104 detects the presence or absence of an error of the read data. Then a reloading part 107 of a restart control means 109 sets again the prescribed data to only the corresponding address of the storage 103 where an error is detected out of the read data via the means 104. In such a constitution, the area of a fault can be accurately decided in the storage 103 and then the data are loaded again only in the main storage address including the fault. Thus an information processor can be restarted at a high speed.

Description

【発明の詳細な説明】 〔産業上の利用分野] 本発明は情報処理装置の再立ち上げ装置に関し、特に主
記憶障害発生時における情報処理装置の再立ち上げ装置
に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to an apparatus for restarting an information processing apparatus, and more particularly to an apparatus for restarting an information processing apparatus when a main memory failure occurs.

〔従来の技術〕[Conventional technology]

通常、情報処理装置で障害が検出された場合、この障害
が診断処理装置に報告され、この診断処理装置において
情報処理装置の再立ち上げ処理が実行されるようになっ
ている。即ち、診断処理装置は上記の報告を受けると、
情報処理装置の動作を止め、障害発生時の情報処理装置
内のソフトウェアビジプルな情報をスキャンバスと呼ば
れるパスにより抜き取り、情報処理装置をクリアして障
害を消した後に、抜き取ったソフトウェアビジプルな情
報を情報処理装置内に再設定する。これにより情報処理
装置はソフトウェアから見て障害発生時点と同じ動作状
態に設定される。情報処理装置の障害が固定の場合は再
度同じ障害が検出され動作不能状態となるが、間欠障害
であれば再立ち上げされることにより正常動作可能とな
る。
Normally, when a failure is detected in an information processing device, this failure is reported to a diagnostic processing device, and the diagnostic processing device executes restart processing of the information processing device. That is, when the diagnostic processing device receives the above report,
The operation of the information processing equipment is stopped, the software visible information in the information processing equipment at the time of a failure is extracted through a path called a scan canvas, and after the information processing equipment is cleared and the failure is removed, the extracted software visible information is extracted. Reset the information in the information processing device. As a result, the information processing device is set to the same operating state as it was at the time of the failure from the software perspective. If the fault in the information processing device is fixed, the same fault will be detected again and the device will become inoperable, but if it is an intermittent fault, it will be able to operate normally after being restarted.

また、情報処理装置からの主記憶アクセスで障害が発生
した場合、主記憶データが破壊されている可能性が大の
ため、従来は、再立ち上げ処理の−環として、第3図の
流れ図に示すように主記憶領域のうちの復旧可能な全領
域に対し、外部記憶装置のデータを再ロードすることに
より、主記憶の復旧を行っていた。
Additionally, if a failure occurs when accessing the main memory from an information processing device, there is a high possibility that the main memory data has been destroyed. As shown, the main memory was restored by reloading data from the external storage device to all recoverable areas of the main memory area.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

上述の通り従来は、主記憶アクセスにかかる障害が発生
した場合、主記憶領域のうちの復旧可能な全領域に対し
、データの再ロードを行うことにより主記憶の復旧を行
っており、そのため再ロードに多くの時間を要し、速や
かな再立ち上げが困難になっていた。
As mentioned above, conventionally, when a main memory access failure occurs, main memory is recovered by reloading data to all recoverable areas of the main memory area. It took a long time to load, making it difficult to restart quickly.

本発明はこのような事情に鑑みて為されたものであり、
その目的は、主記憶にかかる障害の箇所を正確に突き止
め、障害が存在する主記憶アドレスのみにデータの再ロ
ードを行うことにより、高速な再立ち上げを可能とした
情報処理装置の再立ち上げ装置を提供することにある。
The present invention has been made in view of these circumstances,
The purpose of this is to accurately locate the fault in main memory and reload data only to the main memory address where the fault exists, thereby enabling a fast restart of the information processing equipment. The goal is to provide equipment.

〔課題を解決するための手段〕[Means to solve the problem]

本発明は上記の目的を遠戚するために、主記憶で障害が
発生した場合に情報処理装置の再立ち上げを行う装置に
おいて、前記主記憶の障害発生時に、前記主記憶に格納
されているデータを順次読み出す参断り−F゛手段と、
この診断リード手段により順次読み出されたデータのエ
ラーを検出するエラー検出手段と、このエラー検出手段
で読み出しデータのエラーが検出された前記主記憶の該
当アドレスに対してのみ所定のデータを再設定する再ロ
ード部を含む再立ち上げ制御手段とを有している。
In order to achieve the above object, the present invention provides an apparatus for restarting an information processing apparatus when a failure occurs in the main memory. A reference-F means for sequentially reading data;
Error detection means for detecting errors in the data sequentially read by the diagnostic read means, and re-setting of predetermined data only for the corresponding address of the main memory where the error detection means detected an error in the read data. and a restart control means including a reload section to perform the restart.

〔作用〕[Effect]

本発明の情報処理装置の再立ち上げ装置においては、主
記憶に障害が発生すると、診断リード手段が主記憶に格
納されているデータを順次読み出し、この読み出された
データについてエラー検出手段がエラーの有無を検出す
る。再立ち上げ制御手段の再ロード部は、エラー検出手
段で読み出しデータのエラーが検出された主記憶の該当
アドレスに対してのみ所定のデータを再設定する。
In the restart device for an information processing device according to the present invention, when a failure occurs in the main memory, the diagnostic read means sequentially reads data stored in the main memory, and the error detection means detects an error in the read data. Detect the presence or absence of. The reload section of the restart control means resets predetermined data only to the corresponding address of the main memory where an error in the read data is detected by the error detection means.

〔実施例) 次に、本発明の実施例について図面を参照して詳細に説
明する。
[Example] Next, an example of the present invention will be described in detail with reference to the drawings.

第1図は本発明を通用した計算機システムの一例を示す
ブロック図であり、診断処理装置101と、情報処理装
置102と、主記憶103と、エラー検出回路104と
を含むシステムを示す。
FIG. 1 is a block diagram showing an example of a computer system to which the present invention can be applied, and shows a system including a diagnostic processing device 101, an information processing device 102, a main memory 103, and an error detection circuit 104.

同図において、エラー検出回路104は、主記憶103
から読み出されたデータ(READ  DATA)にエ
ラーが存在するか否かを検出する回路であり、エラーを
検出したときはその旨の報告(PTYER) をXラー
報告m1loを介して情報処理装置102および診断処
理装置101に出す。
In the same figure, the error detection circuit 104 is connected to the main memory 103.
This is a circuit that detects whether or not there is an error in the data (READ DATA) read from the data processing device 102. When an error is detected, a report to that effect (PTYER) is sent to the information processing device 102 via the X error report m1lo. and output to the diagnostic processing device 101.

情報処理装置102で実行されるソフトウェアは主記憶
103に格納されており、情報処理装置102は主記憶
アクセス用のアドレスレジスタ105にアドレス(ME
M  ADR3)を設定することにより、主記憶103
をアクセスすることができる。即ち、データ(WRIT
E  DATA)を主記憶103に書き込むことができ
、また主記憶103からデータ(READ  DATA
)を読み出すことができる。この読み出されたデータは
情報処理装置102に加えられると共に、前述したエラ
ー検出回路104および診断処理装置101にも加えら
れている。なお、後述する診断リード時に主記憶103
から読み出されたデータは、診断処理袋!101におい
てログ情報として図示しない外部記憶装置に格納される
。また情報処理装置102には障害検出機#IC図示せ
ず)があり、この機構で障害が検出されると、障害報告
(CHECK)が障害報告線111を介して診断処理装
置101に送出される。ここで、主記憶103にかかる
障害時には、先ず主記憶103から読み出されたデータ
(READ  DATA)のエラーがエラー検出回路1
04で検出されて情報処理装置102にエラー報告が為
され、この情報処理装置102から障害報告線111を
介して診断処理装置101に主記憶103に障害が発生
した旨の報告が為される。
Software executed by the information processing device 102 is stored in the main memory 103, and the information processing device 102 stores an address (ME) in the address register 105 for accessing the main memory.
By setting M ADR3), the main memory 103
can be accessed. That is, data (WRIT
E DATA) can be written to the main memory 103, and data (READ DATA) can be written from the main memory 103.
) can be read. This read data is applied to the information processing device 102 and also to the error detection circuit 104 and diagnostic processing device 101 described above. Note that the main memory 103 is
The data read from the diagnostic processing bag! In step 101, the log information is stored in an external storage device (not shown) as log information. The information processing device 102 also includes a fault detector #IC (not shown), and when a fault is detected by this mechanism, a fault report (CHECK) is sent to the diagnostic processing device 101 via the fault report line 111. . Here, when a failure occurs in the main memory 103, an error in data (READ DATA) read from the main memory 103 is detected by the error detection circuit 1.
04, an error report is made to the information processing device 102, and the information processing device 102 reports to the diagnostic processing device 101 via the fault report line 111 that a fault has occurred in the main memory 103.

診断処理装置101は、情報処理装置102の再立ち上
げを実行する装置であり、スキャンパス113により情
報処理装置102のソフトウェアビジプルな情報を抜き
取ったり、逆に元に戻す手段や、情報処理装置102に
対しデータ(DATA)を送出してそれを制御する手段
などに加え、次のような手段を備えている。
The diagnostic processing device 101 is a device that restarts the information processing device 102, and has a means for extracting and restoring software visible information of the information processing device 102 using a scan path 113, and a device for restarting the information processing device 102. In addition to means for sending data (DATA) to and controlling it, the following means are provided.

・診断リード手段(図示せず) 主記憶103内のデータを抜き取るために、情報処理装
置102内の主記憶アクセス用のアドレスレジスタ10
5に診断リードアドレス設定パス+12を介してアドレ
ス(ADR3)を設定することにより、主記憶103に
格納されているデータを読み出す手段である。なお、診
断リードでアドレスレジスタ105に設定した主記憶1
03のアドレス(ADR3)のコピーは診断リードアド
レスレジスタ106に保持される。また、この診断リー
ドの際も読み出しデータのエラー検出がエラー検出回路
104で行われる。
- Diagnosis read means (not shown) Address register 10 for main memory access in information processing device 102 in order to extract data in main memory 103
This is a means for reading data stored in the main memory 103 by setting an address (ADR3) to the main memory 103 via the diagnostic read address setting path +12. Note that the main memory 1 set in the address register 105 in the diagnostic read
A copy of address 03 (ADR3) is held in the diagnostic read address register 106. Also, during this diagnostic read, the error detection circuit 104 detects errors in the read data.

・再立ち上げ制御手段109 情報処理装置102の再立ち上げにかかる主たる制御を
行う手段である。この再立ち上げ制御手段109は、主
記憶103のアドレスに対する診断リード時に、エラー
検出回路104で読み出しデータのエラーが検出された
場合、診断リードを一時中止し、再ロード部107を起
動する。再ロード部107は、診断リードアドレスレジ
スタ106に保持されたアドレス即ちエラーが検出され
た主記憶103のアドレスに対し図示しない外部記憶装
置からその復旧用のデータを再ロードする。
- Restarting control means 109 This is means for performing main control related to restarting the information processing device 102. If the error detection circuit 104 detects an error in the read data during diagnostic reading of an address in the main memory 103, the restart control means 109 temporarily suspends the diagnostic reading and activates the reloading unit 107. The reload unit 107 reloads the address held in the diagnostic read address register 106, that is, the address of the main memory 103 where the error was detected, with recovery data from an external storage device (not shown).

なお、ロード先アドレスは診断リードアドレスレジスタ
106に保持されているアドレスである。
Note that the load destination address is an address held in the diagnostic read address register 106.

再立ち上げ制御手段109は再ロード部107によるデ
ータの再ロードが終わると、次のアドレスに対する診断
リードを再開する。
When the reloading section 107 finishes reloading the data, the restart control means 109 resumes diagnostic reading for the next address.

次に、このように構成された本実施例の動作を説明する
Next, the operation of this embodiment configured as described above will be explained.

情報処理装置102で何らかの障害が検出された場合、
これが障害報告線111を介して診断処理装置101に
報告される0診断処理袋2101はこの報告を受けて、
情報処理装置102内のソフトウェアビジプルな情報を
スキャンパス113にて抜き取る処理、主記憶103内
のデータを診断リードにより読み出しつつ再立ち上げの
可能性を判断する処理を行い、また再立ち上げ可能と判
断した場合に情報処理装置102をクリアする処理、抜
き取ったソフトウェアビジプルな情報を情報処理装置1
02に再設定する処理、主記憶データの再ロード処理を
行った後に情報処理装置102を動作可能な状態にする
処理等を実行する。
When some kind of failure is detected in the information processing device 102,
This is reported to the diagnostic processing device 101 via the fault report line 111.The diagnostic processing bag 2101 receives this report and
A process of extracting software visible information in the information processing device 102 using the scan path 113, a process of determining the possibility of restarting while reading data in the main memory 103 using a diagnostic read, and restarting is possible. The process of clearing the information processing device 102 when it is determined that the information processing device 1
02, reloading the main memory data, and then making the information processing device 102 operational.

第2図は再立ち上げ制御手段109が行う上述した処理
のうち、障害報告線111を介して情報処理装置102
から主記憶103のアクセスエラーが報告された際に実
行される処理の一部を示している。同図に示すように、
主記憶アクセスエラー時には、診断リードによって主記
憶103からデータを1つずつ読み出しくSl)、この
読み出しデータについてエラー検出回路104でエラー
が検出されたか否かをチエツクする(S2)、エラーが
検出されなければ処理S4に進み、エラーが検出されれ
ば、そのリードアドレスのコピーを保持する診断リード
アドレスレジスタ106のアドレスが指し示す主記憶ア
ドレスに対し再ロード部107によって所定のデータの
再ロードを行い(S3)、処理S4に進む、処理S4で
は主記憶103の全アドレスについて診断リードしたか
否かを判定し、終了していなければ診断リードアドレス
をカウントアツプしくS5)、処理S1に戻って次のア
ドレスの診断リードを行う、また全アドレスを終了して
いれば必要な残りの立ち上げ処理を続行する0以上のよ
うに個々の主記憶データを診断リードで抜き取るごとに
、データの正常性を確かめることで主記憶103内の障
害箇所を突き止め、障害箇所のみに対し再ロードを行う
ものである。
FIG. 2 shows that among the above-mentioned processes performed by the restart control means 109, the information processing device 102 is
This shows a part of the processing that is executed when an access error to the main memory 103 is reported from. As shown in the figure,
When a main memory access error occurs, the data is read out one by one from the main memory 103 by diagnostic read (S1), and the error detection circuit 104 checks whether an error has been detected in the read data (S2). If not, the process proceeds to step S4, and if an error is detected, the reload unit 107 reloads the predetermined data to the main memory address pointed to by the address of the diagnostic read address register 106 that holds a copy of the read address ( S3), proceed to process S4. In process S4, it is determined whether diagnostic reading has been performed for all addresses in the main memory 103, and if it has not been completed, the diagnostic read address is counted up. S5), and the process returns to process S1 for the next Perform a diagnostic read of the address, and if all addresses have been completed, continue the remaining startup processing necessary. Check the normality of the data each time you extract individual main memory data with a diagnostic read, such as 0 or more. By doing so, the fault location in the main memory 103 is located, and reloading is performed only for the fault location.

〔発明の効果〕〔Effect of the invention〕

以上説明したように、本発明の情報処理装置の再立ち上
げ装置においては、主記憶にかかる障害の発生時に、主
記憶のデータを順次読み出してエラーの有無をチエツク
することで障害の箇所を正確に突き止め、障害が存在す
る主記憶アドレスのみにデータの再ロードを行うことに
より、速やかな再立ち上げが可能となる効果がある。
As explained above, in the restart device for an information processing device according to the present invention, when a fault occurs in the main memory, the location of the fault can be accurately identified by sequentially reading data in the main memory and checking for errors. By identifying the fault and reloading data only to the main memory address where the fault exists, it is possible to quickly restart the system.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明を適用した計算機システムの一例を示す
ブロック図、 第2図は再立ち上げ制御手段109の処理の一部を示す
流れ図および、 第3図は従来の再立ち上げ処理例の流れ図である。 図において、 101・・・診断処理装置 102・・・情報処理装置 103・・・主記憶 104・・・エラー検出回路 105・・・主記憶アクセス用のアドレスレジスタ10
6・・・診断リードアドレスレジスタ107・・・再ロ
ード部 109・・・再立ち上げ制御手段 110・・・エラー報告線 111・・・障害報告線 112・・・診断リードアドレス設定バス13・・・ス
キャンパス
FIG. 1 is a block diagram showing an example of a computer system to which the present invention is applied, FIG. 2 is a flowchart showing part of the processing of the restart control means 109, and FIG. 3 is a flowchart showing a part of the processing of the restart control means 109. This is a flowchart. In the figure, 101...Diagnostic processing device 102...Information processing device 103...Main memory 104...Error detection circuit 105...Address register 10 for main memory access
6...Diagnostic read address register 107...Reload unit 109...Restart control means 110...Error report line 111...Failure report line 112...Diagnostic read address setting bus 13...・Scan path

Claims (1)

【特許請求の範囲】 主記憶で障害が発生した場合に情報処理装置の再立ち上
げを行う装置において、 前記主記憶の障害発生時に、前記主記憶に格納されてい
るデータを順次読み出す診断リード手段と、 該診断リード手段により順次読み出されたデータのエラ
ーを検出するエラー検出手段と、該エラー検出手段で読
み出しデータのエラーが検出された前記主記憶の該当ア
ドレスに対してのみ所定のデータを再設定する再ロード
部を含む再立ち上げ制御手段とを有することを特徴とす
る情報処理装置の再立ち上げ装置。
[Scope of Claims] In an apparatus for restarting an information processing apparatus when a failure occurs in the main memory, the diagnostic read means sequentially reads data stored in the main memory when a failure occurs in the main memory. and an error detection means for detecting an error in the data sequentially read by the diagnostic read means, and a predetermined data only for the corresponding address of the main memory where an error in the read data is detected by the error detection means. 1. A restarting device for an information processing device, comprising a restarting control means including a reloading section for resetting.
JP1269585A 1989-10-17 1989-10-17 Restarting device for information processor Pending JPH03130835A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1269585A JPH03130835A (en) 1989-10-17 1989-10-17 Restarting device for information processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1269585A JPH03130835A (en) 1989-10-17 1989-10-17 Restarting device for information processor

Publications (1)

Publication Number Publication Date
JPH03130835A true JPH03130835A (en) 1991-06-04

Family

ID=17474411

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1269585A Pending JPH03130835A (en) 1989-10-17 1989-10-17 Restarting device for information processor

Country Status (1)

Country Link
JP (1) JPH03130835A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014035730A (en) * 2012-08-10 2014-02-24 Hitachi Automotive Systems Ltd Vehicle control device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014035730A (en) * 2012-08-10 2014-02-24 Hitachi Automotive Systems Ltd Vehicle control device

Similar Documents

Publication Publication Date Title
US6502208B1 (en) Method and system for check stop error handling
US5948112A (en) Method and apparatus for recovering from software faults
US20080133968A1 (en) Method and system for recovering from operating system crash or failure
JPS6229827B2 (en)
RU2137182C1 (en) Execution of data processing instruction
JP3481737B2 (en) Dump collection device and dump collection method
US7139942B2 (en) Method and apparatus for memory redundancy and recovery from uncorrectable errors
Lee et al. Measurement-based evaluation of operating system fault tolerance
JP3192354B2 (en) Computer system retry processor
JPH03130835A (en) Restarting device for information processor
JP2004252525A (en) Emulator and program
JP3357777B2 (en) Program control system
JPH07117902B2 (en) Rebooting device for information processing equipment
JPS6146535A (en) Pseudo error setting control system
JP2878014B2 (en) RAM test method
JP2922981B2 (en) Task execution continuation method
JPH04365145A (en) Memory fault processing method
JPS62180440A (en) Test system for memory area
SU763902A1 (en) Microprocessor with self-diagnosis means
JPH07152594A (en) Retry control system for control processor
JPH06282451A (en) System-down recovering method for device equipped with microprocessor
JPH0341538A (en) Main storage device
JPH05143197A (en) Arithmetic processor
JPH07244613A (en) Dual-memory control method
JPH0769846B2 (en) Error processing circuit verification device