JPS6162941A - Inspection system of information processor - Google Patents

Inspection system of information processor

Info

Publication number
JPS6162941A
JPS6162941A JP59184810A JP18481084A JPS6162941A JP S6162941 A JPS6162941 A JP S6162941A JP 59184810 A JP59184810 A JP 59184810A JP 18481084 A JP18481084 A JP 18481084A JP S6162941 A JPS6162941 A JP S6162941A
Authority
JP
Japan
Prior art keywords
operating system
tasks
patrol
execution
patrol execution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59184810A
Other languages
Japanese (ja)
Inventor
Naoko Iino
飯野 直子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP59184810A priority Critical patent/JPS6162941A/en
Publication of JPS6162941A publication Critical patent/JPS6162941A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

PURPOSE:To prevent a data change and to take over the state at a stop by actuating a patrol execution task of each processor at constant intervals of time, and saving information required for the next start-up when an error is detected and stopping the execution task. CONSTITUTION:Patrol execution tasks 32 and 33 for testing processors 41 and 42 and an operating system 31 which controls the tasks 32 and 33 are stored in a main storage device 30, and the processors 41 and 42 are connected to the device 30. Then the system 31 actuates the tasks 32 and 33 and an instruction to be tested, etc., are transferred to a message area and executed; when the execution result coincides with an expected value, the same process is repeated a specific time later. When not, the expected value is transferred to a message output area and an error message is outputted to an output device to write information required for the restarting of the system on a disk and also stop the system.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は情報処理装置の検査方式に関し、特にオペレー
ティングシステム制御のもとで検査する〜ルスチェック
方式に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to an inspection method for an information processing device, and more particularly to a Luz check method for inspecting an information processing device under control of an operating system.

〔従来技術〕[Prior art]

従来、この種の情報処理装置の故障は、該装置内のチェ
ック回路による検出と、チェック回路によってチェック
不可能な故障が発生するとオペレーティングシステムな
どのソフトウェアの論理矛盾という形での検出に委ねら
れていた。このため、後者のソフトウェアの論理矛盾と
いう形の検出に期待している故障は、ソフトウェアがハ
ードウェアの故障を検出する目的で作成されていないた
めに、ソフトウェアでも検出されない場合があった。
Conventionally, failures in this type of information processing equipment have been detected by check circuits within the equipment, and when failures that cannot be checked by the check circuits occur, they are detected in the form of logical contradictions in software such as the operating system. Ta. For this reason, the latter faults that are expected to be detected in the form of logical contradictions in software may not be detected even in software because software is not created for the purpose of detecting hardware faults.

この場合はデータ化けとなり、故障の検出が故障発生後
長時間経過して行なわれていたので、データ復旧が困難
になるという致命的な問題があった。
In this case, the data would be garbled, and since the failure was detected a long time after the failure occurred, there was a fatal problem in that data recovery would be difficult.

〔発明の目的〕[Purpose of the invention]

本発明の目的は、ソフトウェアでも検出されないような
故障があった場合にデータ化けとなる境象な防止すると
同時に停止時の状態を引き継いでオペレーティングシス
テムを運転することを可能 ・とじた、情報処理装置の
検査方式を提供することζ二ある。
The purpose of the present invention is to prevent data from becoming garbled in the event of a failure that cannot be detected by software, and at the same time to enable the operating system to continue operating in the same state as when it was stopped. There are two ways to provide an inspection method.

〔発明の構成〕[Structure of the invention]

本発明の情報処理装置の検査方式は、主記憶装置に接続
された処理装置を試験するための処理装置毎のパトロー
ル実行タスクと、これらパトロール実行タスクを制御す
るオペレーティングシステムとを前記主記憶装置に格納
し、オペレーティングシステムは一定時間毎シーこれら
パトロール実行□タスクの全部を起動し、起動されたパ
トロール実行タスクは対応する処理装置の検査を実行し
、パトロール実行タスクがエラーを検出した時には、オ
ペレーティングシステムへ実行停止要求を行ない、これ
によりオペレーティングシステムは直ちに次の立上げに
必要とする情報を退避する緊急停止処理を実行した後、
オペレーティングシステム自身の実行を停止することを
特徴とする。
The information processing device inspection method of the present invention provides patrol execution tasks for each processing device for testing the processing devices connected to the main storage device, and an operating system that controls these patrol execution tasks in the main storage device. The operating system activates all of these patrol execution tasks at regular intervals, and the activated patrol execution task performs inspection of the corresponding processing device. When the patrol execution task detects an error, the operating system The operating system immediately executes an emergency stop process to save information necessary for the next startup.
It is characterized by stopping the execution of the operating system itself.

〔実施例〕〔Example〕

本発明の実施例を図面を参照しながら説明する。 Embodiments of the present invention will be described with reference to the drawings.

第1図は本発明の情報処理装置の検査方式を適用した情
報処理装置のブロック図である。主記憶装置60上には
、オペレーティングシステム(以下、O8という)61
と、主記憶装置6oに接続された処理装置(以下、CP
Uという)41.42を試験するためのパトロール実行
タスク32.33が格納されている。
FIG. 1 is a block diagram of an information processing apparatus to which the information processing apparatus inspection method of the present invention is applied. On the main storage device 60, an operating system (hereinafter referred to as O8) 61
and a processing device (hereinafter referred to as CP) connected to the main storage device 6o.
A patrol execution task 32.33 for testing 41.42 (referred to as U) is stored.

次に、本実施例の情報処理装置におけるパトロール実行
の動作を説明する。
Next, the operation of patrol execution in the information processing apparatus of this embodiment will be explained.

パトロール実行タスク32.36の論理は同一であるの
で、以後パトロール実行タスク62について説明する。
Since the logic of the patrol execution tasks 32 and 36 is the same, the patrol execution task 62 will be described below.

第2図はCPU41用検査プログラムであるパトロール
実行タスク32の動作を示すフローチャートである。先
ず処理11(:よりパトロール実行タスク32を起動す
る。次の処理12に制御が移り、メツセージエリアに試
験対象のCPU番号、試験対象命令の情報を移送する。
FIG. 2 is a flowchart showing the operation of the patrol execution task 32, which is an inspection program for the CPU 41. First, the patrol execution task 32 is activated from process 11 (:). Control is transferred to the next process 12, and information about the CPU number to be tested and the instruction to be tested is transferred to the message area.

処理16では試験対象である命令を実行する。処理14
では前記実行結果と期待値を比較する。判断15により
結果が一致していれば判断20へ移る。判= 3− 断20では最後の試験でなければ次の試験を処理12か
ら繰返し実行する。最後の試験であれば、判断20から
パトロール実行タスク62の制御は処理21に移り、1
時間のタイマをセットする。
In process 16, the instruction to be tested is executed. Processing 14
Now, compare the above execution results with the expected values. If the results match in judgment 15, the process moves to judgment 20. Judgment = 3- In decision 20, if it is not the last test, the next test is repeatedly executed from process 12. If it is the last test, control of the patrol execution task 62 moves from judgment 20 to process 21, and 1
Set the timer.

1時間経過後、判断22から制御は処理11へ戻り、再
度検査が実行されることになる。
After one hour has elapsed, control returns from decision 22 to process 11, and the test is performed again.

判断15において実行結果と期待値が一致しなかった場
合にはプログラムの制御は処理16へと移り、処理16
での実行結果と処理14で用いた期待値をメツセージ出
カニリアへ移送する。この後、処理17にてエラーメツ
セージを編集し、不図示のメツセージ出力装置へ出力す
る。処理18へプログラムの制御が移ると、0861へ
停止要求を出し、0831は緊急停止処理としてシステ
ムを再立上げするために必要な情報、例えばcpUが故
障したこと、故障したCPU番号を不図示のディスクに
書込む。その後、制御が処理19へ移り、os31は直
ちにシステム停止処理を行う。
If the execution result and the expected value do not match in judgment 15, control of the program moves to process 16;
The execution results in step 14 and the expected values used in step 14 are transferred to the message sender. Thereafter, in process 17, the error message is edited and output to a message output device (not shown). When control of the program is transferred to process 18, a stop request is sent to 0861, and 0831 sends information necessary to restart the system as an emergency stop process, such as the fact that a CPU has failed, and the failed CPU number (not shown). Write to disk. Thereafter, control moves to process 19, and the OS 31 immediately performs system stop processing.

これによって、0PU41.42の誤動作によるデータ
化けの発生が防止され、かつ障害発生時の情報を引き継
いで0831を運転することが可能:二なる。
This prevents the occurrence of data corruption due to malfunction of 0PU41.42, and also makes it possible to operate 0831 by taking over the information at the time of failure.

以上の説明はCPU41用検査プログラムであるパトロ
ール実行タスク62についてであったが、CPU42用
検査プログラムであるパトロール実情報処理装置へも本
−発明は適用可能なことは容易に類推できる。
Although the above explanation was about the patrol execution task 62 which is the inspection program for the CPU 41, it can be easily inferred that the present invention is also applicable to the patrol actual information processing device which is the inspection program for the CPU 42.

〔発明の効果〕〔Effect of the invention〕

本発明は以上説明したように、処理装置の正常性を検査
するプログラムを処理装置の数だけ一定時間毎に実行し
、エラーを検出した時には、オペレーティングシステム
へ実行停止要求を行ない、これC−よりオペレーティン
グシステムは直ちに次の立上げに必要とする情報を退避
する緊急停止処理を実行した後、オペレーティングシス
テム自身の実行を停止するようにしたので、故障があっ
た場合(ニデータ化けの発生が防止されると同時に障害
発生時の情報を引き継いでオペレーテイングシステムを
運転することが可能になるという効果がある。
As explained above, the present invention executes a program for checking the normality of processing devices at regular intervals equal to the number of processing devices, and when an error is detected, requests the operating system to stop execution. The operating system immediately executes an emergency stop process to save the information needed for the next startup, and then stops the operating system itself. At the same time, it has the effect of making it possible to take over the information when a failure occurs and run the operating system.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の情報処理装置の検査方式を適用した情
報処理装置のブロック図、第2図は第1図の情報処理装
置における検査を実行するパトロール実行の概略を示す
フローチャートである。 30・・・主記憶装置、 31・・・オペレーティングシステム、62.66・・
・パトロール実行タスク、41.42・・・処理装置。 特許出願人  日本電気株式会社 代 理 人   弁理士 内 原  晋、/ 、 、、
’   :第1図
FIG. 1 is a block diagram of an information processing apparatus to which the information processing apparatus inspection method of the present invention is applied, and FIG. 2 is a flowchart showing an outline of patrol execution for carrying out inspection in the information processing apparatus of FIG. 30...Main storage device, 31...Operating system, 62.66...
-Patrol execution task, 41.42...processing device. Patent applicant: NEC Corporation Representative: Susumu Uchihara, patent attorney
': Figure 1

Claims (1)

【特許請求の範囲】[Claims] 主記憶装置に接続された処理装置を試験するための処理
装置毎のパトロール実行タスクと、これらパトロール実
行タスクを制御するオペレーティングシステムとを前記
主記憶装置に格納し、オペレーティングシステムは一定
時間毎にこれらパトロール実行タスクの全部を起動し、
起動されたパトロール実行タスクは対応する処理装置の
検査を実行し、パトロール実行タスクがエラーを検出し
た時には、オペレーティングシステムへ実行停止要求を
行ない、これによりオペレーティングシステムは直ちに
次の立上げに必要とする情報を退避する緊急停止処理を
実行した後、オペレーティングシステム自身の実行を停
止することを特徴とする情報処理装置の検査方式。
Patrol execution tasks for each processing device for testing the processing devices connected to the main storage device and an operating system that controls these patrol execution tasks are stored in the main storage device, and the operating system executes these tasks at regular intervals. Start all patrol execution tasks,
The activated patrol execution task checks the corresponding processing device, and when the patrol execution task detects an error, it issues a request to the operating system to stop execution, which causes the operating system to immediately restart the next startup. An inspection method for an information processing device, characterized in that the operating system itself stops running after executing an emergency stop process to save information.
JP59184810A 1984-09-04 1984-09-04 Inspection system of information processor Pending JPS6162941A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59184810A JPS6162941A (en) 1984-09-04 1984-09-04 Inspection system of information processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59184810A JPS6162941A (en) 1984-09-04 1984-09-04 Inspection system of information processor

Publications (1)

Publication Number Publication Date
JPS6162941A true JPS6162941A (en) 1986-03-31

Family

ID=16159682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59184810A Pending JPS6162941A (en) 1984-09-04 1984-09-04 Inspection system of information processor

Country Status (1)

Country Link
JP (1) JPS6162941A (en)

Similar Documents

Publication Publication Date Title
JPH0950424A (en) Dump sampling device and dump sampling method
JPS6375963A (en) System recovery system
JPH02294739A (en) Fault detecting system
JPS6162941A (en) Inspection system of information processor
JPS61101845A (en) Test system of information processor
JPS6162942A (en) Inspection system of information processor
JPS6162943A (en) Method for inspecting information processor
JPS58181160A (en) Controlling system of emergency operation
JP3103877B2 (en) Program execution method by multi-configuration system
JPS6162944A (en) Method for inspecting information processor
JPS6162945A (en) Method for inspecting information processor
JPS6139136A (en) Inspection system of information processor
JP2922981B2 (en) Task execution continuation method
JPS6272038A (en) Testing method for program runaway detecting device
JPS61240334A (en) Checking system for information processor
JP2776815B2 (en) Failure recovery method for multiprocessor system
JP3008851B2 (en) Inter-system monitoring method for multi-computer systems
JPS6155748A (en) Electronic computer system
JPH1185713A (en) Multi-computer system
JPS61101844A (en) Fault processing system
CN116483631A (en) Comprehensive electrical system based on cold and hot dual-backup mechanism and operation method thereof
JPS61145650A (en) Test system of information processing unit
JPH0149975B2 (en)
JP2896206B2 (en) On-line diagnostics for multiplexed memory devices.
JPS61168054A (en) System for inspecting information processor