JP2924732B2 - Self-diagnosis method for information processing device - Google Patents

Self-diagnosis method for information processing device

Info

Publication number
JP2924732B2
JP2924732B2 JP7251571A JP25157195A JP2924732B2 JP 2924732 B2 JP2924732 B2 JP 2924732B2 JP 7251571 A JP7251571 A JP 7251571A JP 25157195 A JP25157195 A JP 25157195A JP 2924732 B2 JP2924732 B2 JP 2924732B2
Authority
JP
Japan
Prior art keywords
memory
self
diagnosis
information processing
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP7251571A
Other languages
Japanese (ja)
Other versions
JPH0997197A (en
Inventor
智夫 井上
英生 望月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP7251571A priority Critical patent/JP2924732B2/en
Publication of JPH0997197A publication Critical patent/JPH0997197A/en
Application granted granted Critical
Publication of JP2924732B2 publication Critical patent/JP2924732B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は情報処理装置の自己
診断方法に関し、特にオペレーションシステムを備える
情報処理装置の自己診断方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a self-diagnosis method for an information processing apparatus, and more particularly to a self-diagnosis method for an information processing apparatus having an operation system.

【0002】[0002]

【従来の技術】一般に、現代社会においては、情報処理
装置は、種々のシステムにおける枢要な構成要素として
運用されており、その機能障害により致命的な大損害を
も引き起しかねない重要な役割を果してきている。従っ
て、当該情報処理装置の高信頼性化を図り、システムの
機能を正常に維持するためには、当該情報処理装置に対
する自己診断機能は必要不可欠な要素である。従来の情
報処理装置の自己診断方法の例としては、例えば、何ら
かの要因によりタスク(独立して動作するプログラムの
最小単位)が永久ループに陥った時の異常について自己
診断を行う「特開昭60−171544号公報」と、メ
モリの故障を専用ハードウェアにより自己診断する「ソ
フトウェア技術者のためのハードウェア基礎(小野瀬一
志著、オーム社)」に記述されている二つの方法が知ら
れている。以下に、これらの二つの自己診断方法につい
て説明する。
2. Description of the Related Art In general, in modern society, information processing devices are operated as a key component in various systems, and an important role that can cause fatal and serious damages due to a malfunction of the information processing device. Has been fulfilled. Therefore, in order to increase the reliability of the information processing device and maintain the function of the system normally, the self-diagnosis function for the information processing device is an indispensable element. As an example of a conventional self-diagnosis method of an information processing apparatus, for example, self-diagnosis is performed for an abnormality when a task (the smallest unit of an independently operating program) falls into a permanent loop due to some factor. Japanese Patent Application Laid-Open No. 171544/1991 and "Hardware Fundamentals for Software Engineers (Kazushi Onose, Ohmsha)" for self-diagnosing memory failures using dedicated hardware are known. . Hereinafter, these two self-diagnosis methods will be described.

【0003】図8は、前述の特開昭60−171544
号公報に記述されている自己診断装置の構成を示すブロ
ック図であり、オペレーションシステム1に対応して、
複数のレベル動作診断モジュール2(C1 ,C2 ,C3
,C4 ,C5 ,C6 ,C7 ,C8 ,…………,Ci )
と、同じく複数の動作監視タイマ3(T1 ,T2 ,T
3,T4 ,T5 ,T6 ,T7 ,T8 ,…………,Ti )
と、レベル動作監視レジスタ4と、タスク動作時間メモ
リ5と、システム診断装置6と、異常表示装置7とを備
えて構成される。図8に示されるように、オペレーショ
ンシステム1の制御下において、全タスクの動作レベル
ごとに、レベル動作診断モジュール2と動作監視タイマ
3が設けられており、レベル動作診断モジュール2はオ
ペレーションシステム1の制御によって周期的に起動さ
れ、これにより、所定の一定時間がそれぞれ対応する動
作監視タイマ3にセットされる。動作監視タイマ3がタ
イムアップされると、レベル動作監視レジスタ4には異
常が記憶される。オペレーションシステム1においては
各タスクの動作時間が監視されており、この値は、タス
ク動作時間メモリ5にセットされる。システム診断装置
6は周期的に動作状態となり、上記の異常状態が解析さ
れて、その故障の直接的な原因が探索され、オペレーシ
ョンシステム1に対しては、当該タスクの停止要求が発
行される。また、外部の異常表示装置7に対しては、異
常状態となった故障の内容が表示されて、自己診断が行
われる。一方、レベル動作診断モジュール2はタスクと
同等の動作を行うように構成されており、動作待ち行列
に接続される。また各レベルにおける動作可または動作
不可の状態は、動作監視タイマ3により検出される。
FIG. 8 is a view showing the above-mentioned Japanese Patent Application Laid-Open No. Sho 60-171544.
FIG. 1 is a block diagram showing a configuration of a self-diagnosis device described in Japanese Patent Application Publication No.
A plurality of level operation diagnosis modules 2 (C1, C2, C3
, C4, C5, C6, C7, C8,..., Ci)
And a plurality of operation monitoring timers 3 (T1, T2, T
3, T4, T5, T6, T7, T8,..., Ti)
, A level operation monitoring register 4, a task operation time memory 5, a system diagnosis device 6, and an abnormality display device 7. As shown in FIG. 8, under the control of the operation system 1, a level operation diagnosis module 2 and an operation monitoring timer 3 are provided for each operation level of all tasks, and the level operation diagnosis module 2 It is started periodically by the control, whereby a predetermined fixed time is set in the corresponding operation monitoring timer 3. When the operation monitoring timer 3 times out, an abnormality is stored in the level operation monitoring register 4. In the operation system 1, the operation time of each task is monitored, and this value is set in the task operation time memory 5. The system diagnosis device 6 periodically enters an operating state, the abnormal state is analyzed, a direct cause of the failure is searched, and a request to stop the task is issued to the operation system 1. In addition, the content of the failure that has become abnormal is displayed on the external abnormality display device 7, and self-diagnosis is performed. On the other hand, the level operation diagnosis module 2 is configured to perform an operation equivalent to a task, and is connected to an operation queue. The operation enabled or disabled state at each level is detected by the operation monitoring timer 3.

【0004】また「ソフトウェア技術者のためのハード
ウェア基礎」に記述されている情報処理装置のメモリの
自己診断方法においては、誤り訂正符号(以下、ECC
と云う)を使用することにより実施される。この自己診
断方法においては、メモリに対する書込みの際に、検査
ビット発生回路において、ECCに基づいて情報ビット
より検査ビットを作成し、これらの情報ビットと検査ビ
ットをメモリ内に書込む。そして、これらの情報ビット
および検査ビットの当該メモリからの読出しに際して、
前記検査ビット発生回路において、ECCに基づいて情
報ビットより更にもう一つの検査ビットを作成し、既に
メモリに書込まれている検査ビットとともにシンドロー
ム発生回路に入力して、シンドロームを作成する。この
ようにして得られたシンドロームより、シンドローム解
析回路において故障判定が行われ、前記メモリから読出
された情報ビットに誤りが存在する場合には、誤り訂正
回路において誤った情報ビットが訂正される。
[0004] In a self-diagnosis method for a memory of an information processing apparatus described in "Hardware Basics for Software Engineers", an error correction code (hereinafter referred to as ECC) is used.
This is implemented by using In this self-diagnosis method, at the time of writing to a memory, a check bit generation circuit creates check bits from information bits based on the ECC, and writes these information bits and check bits into the memory. When reading these information bits and check bits from the memory,
In the check bit generation circuit, another check bit is created from the information bit based on the ECC, and the check bit is input to the syndrome generation circuit together with the check bit already written in the memory to create a syndrome. From the syndrome obtained in this way, a failure determination is made in the syndrome analysis circuit, and if an error exists in the information bit read from the memory, the error correction circuit corrects the erroneous information bit.

【0005】[0005]

【発明が解決しようとする課題】上述した従来の情報処
理装置の自己診断方法において、特開昭60−1715
44号公報に記述されている自己診断方法においては、
オペレーションシステムにより監視されている動作監視
タイマは、タスクごとにこれを設けることが必要とな
り、対応するオペレーションシステムの処理内容が煩雑
化するという欠点がある。
In the above-described conventional method of self-diagnosis of an information processing apparatus, Japanese Patent Laid-Open No. 60-1715 discloses a method.
In the self-diagnosis method described in Japanese Patent Publication No. 44-44,
The operation monitoring timer monitored by the operation system needs to be provided for each task, and there is a disadvantage that the processing content of the corresponding operation system becomes complicated.

【0006】また、異常なタスクが実行された状態から
自己診断機能が開始されるので、未然に故障を診断する
ことができないという欠点がある。
Further, since the self-diagnosis function is started from a state where an abnormal task is executed, there is a disadvantage that a failure cannot be diagnosed beforehand.

【0007】更に、当該自己診断においては、故障の修
復に関しては無為であるという欠点がある。
Further, in the self-diagnosis, there is a disadvantage that repair of a failure is ineffective.

【0008】そして、「ソフトウェア技術者のためのハ
ードウェア基礎」に記述されている情報処理装置のメモ
リの自己診断方法においては、自己診断を行う際に、故
障検出用および誤り訂正用として、特別な専用回路を設
けることが必要となり、ハードウェアに要するコストが
増大するという欠点がある。
In the self-diagnosis method for the memory of the information processing apparatus described in "Hardware Basics for Software Engineers", when performing the self-diagnosis, special methods are used for failure detection and error correction. There is a drawback that it is necessary to provide a special dedicated circuit, and the cost required for hardware increases.

【0009】[0009]

【課題を解決するための手段】本発明の情報処理装置の
自己診断方法は、オペレーションシステムを具備する情
報処理装置の自己診断方法として、前記情報処理装置に
より前記オペレーションシステムの制御を介してユ−ザ
プロセスを実行する第1のステップと、前記第1のステ
ップの過程において、情報処理装置により逐次実行され
ているユーザプロセス数がn(任意の正整数)個以下に
減少したか否かを判定する第2のステップと、前記第2
のステップの判定結果において、情報処理装置により逐
次実行されているユーザプロセス数がn個以下に減少し
た場合に、前記オペレーションシステムの管理下におい
て、自己診断プログラムをプロセスとして実行すること
により、前記情報処理装置に含まれるメモリの自己診断
を実行する第3のステップとを有しており、前記第2の
ステップにおいて、逐次実行されているユーザプロセス
数がn個以下に減少してはいないものと判定された場
合、および前記第3のステップにおけるメモリの自己診
断終了後においては、前記第1のステップに戻ることを
特徴としている。
Self-diagnosis method of the present onset light of the information processing apparatus [Means for Solving the Problems], as a self-diagnosis method for an information processing apparatus comprising an operation system, through the control of the operation system by the information processing apparatus Yoo A first step of executing the process; and, in the course of the first step, determining whether or not the number of user processes sequentially executed by the information processing apparatus has decreased to n (any positive integer) or less. A second step of determining;
When the number of user processes sequentially executed by the information processing apparatus is reduced to n or less in the determination result of the step (b), by executing the self-diagnosis program as a process under the management of the operation system, the information A third step of performing a self-diagnosis of a memory included in the processing device, wherein in the second step, the number of sequentially executed user processes has not decreased to n or less. When the determination is made and after the end of the self-diagnosis of the memory in the third step, the process returns to the first step.

【0010】[0010]

【0011】なお、本発明において、前記第3のステッ
プにおける前記情報処理装置に含まれるメモリの自己診
断方法としては、当該メモリに故障が存在するか否かの
検出を行う第4のステップと、前記第4のステップにお
いて前記メモリに故障が検出された場合に、当該故障の
検出されたことを前記オペレーションシステムに伝達す
る第5のステップと、当該故障メモリのブロックが、実
行中のプロセスのメモリの占有領域内に含まれているか
否かを判定する第6のステップと、前記第6のステップ
の判定結果において、故障しているメモリのブロック
が、実行中のプロセスのメモリの占有領域内に含まれて
いる場合に、該当する故障メモリのブロックを占有して
いる実行プロセスを強制的に終了させる第7のステップ
と、前記第6のステップの判定結果において、故障メモ
リのブロックが、実行中のプロセスのメモリの占有領域
内に含まれていない場合、および前記第7のステップに
おける実行プロセスを強制的に終了させた後において、
故障したメモリブロックにおけるデータを訂正して修復
を行い、修復完了か否かを判定する第8のステップと、
前記第8のステップの判定結果において、故障したメモ
リブロックが修復完了である場合には、その修復完了を
前記オペレーションシステムに伝達する第9のステップ
と、前記第8のステップの判定結果において、故障した
メモリブロックが修復不可能である場合に、当該メモリ
の修復不可能箇所を前記オペレーションシステムに伝達
する第10のステップとを有しており、前記第4のステ
ップの終了後または前記第9のステップの終了後、或は
また前記第10のステップの終了後に、前記メモリの自
己診断を終了するようにしてもよい。
[0011] In this onset bright, as a self-diagnosis method for a memory included in the information processing apparatus in the third step, a fourth step of detecting whether the failure in the memory is present A fifth step of, when a failure is detected in the memory in the fourth step, transmitting the detection of the failure to the operation system; and A sixth step of determining whether or not the block is included in the occupied area of the memory; And the sixth step for forcibly terminating the execution process occupying the corresponding block of the faulty memory if In flop determination result, after the block of the failure memory, if not included in the occupied area of the memory of running processes, and to forcibly terminate the execution process in the seventh step,
An eighth step of correcting the data in the failed memory block to perform the repair, and determining whether or not the repair is completed;
If the result of the determination in the eighth step indicates that the failed memory block has been repaired, a ninth step of transmitting the repair completion to the operating system; Transmitting a non-recoverable portion of the memory to the operating system when the memory block obtained is unrecoverable, after the fourth step is completed or the ninth step. The self-diagnosis of the memory may be ended after the end of the step or after the end of the tenth step.

【0012】[0012]

【発明の実施の形態】次に、本発明について図面を参照
して説明する。
Next, the present invention will be described with reference to the drawings.

【0013】図1は本発明の1実施形態における情報処
理装置のメモリに対する自己診断方法の手順を示すフロ
ーチャートである。図1において、まず情報処理装置が
起動開始され、オペレーションシステムの制御によりユ
−ザプロセスが実行される(ステップ11)。次いで、
情報処理装置により実行されているユーザプロセス数が
n(任意の正整数)個以下に減少したか否かが判定され
て(ステップ12)、n個以下に減少していない場合に
は再度ステップ11に戻り、また減少しているものと判
定される場合には、オペレーションシステムにより、自
己診断プログラムをプロセスとして実行することによ
り、メモリの自己診断が行われる(ステップ13)。そ
してステップ13の自己診断プログラムの実行終了に伴
って、再度ステップ11に復帰する。
FIG. 1 is a flowchart showing a procedure of a self-diagnosis method for a memory of an information processing apparatus according to an embodiment of the present invention. In FIG. 1, first, the information processing apparatus is started to be activated, and a user process is executed under the control of the operation system (step 11). Then
It is determined whether the number of user processes executed by the information processing apparatus has decreased to n (arbitrary positive integer) or less (step 12). If the number has not decreased to n or less, step 11 is performed again. When it is determined that the number has decreased, the operation system executes the self-diagnosis program as a process to perform the self-diagnosis of the memory (step 13). When the execution of the self-diagnosis program in step 13 is completed, the process returns to step 11 again.

【0014】図2は、図1に示されるフローチャートの
ステップ13におけるメモリの自己診断手順を示すフロ
ーチャートである。当該メモリの自己診断の開始に伴な
い、まずメモリの故障の有無の検出が行われる(ステッ
プ21)。ステップ21において故障がないものと判定
される場合には、当該メモリの自己診断は終了となる。
またステップ21においてメモリの故障が検出される場
合には、故障が検出されたことがオペレーションシステ
ムに伝達される(ステップ22)。次いで、故障してい
るメモリのブロックが、実行中のプロセスのメモリの占
有領域内に含まれているか否かが判定されて(ステップ
23)、当該実行中のプロセスのメモリの占有領域内に
含まれている場合には、該当する故障メモリブロックを
占有している実行プロセスは強制終了される(ステップ
24)。また、ステップ23において、故障メモリブロ
ックが実行中のプロセスのメモリの占有領域内に含まれ
ていない場合、およびステップ24の手順終了後におい
ては、故障したメモリブロックにおけるデータを訂正し
て修復を行い、修復完了したか否かが判定されて(ステ
ップ25)、故障したメモリブロックが修復完了と判定
される場合には、当該修復完了の旨がオペレーションシ
ステムに伝達されて(ステップ26)、メモリの自己診
断は終了する。また一方、ステップ25において、故障
メモリブロックの修復が不可能であるものと判定される
場合には、当該メモリの修復不可能箇所がオペレーショ
ンシステムに伝達されて(ステップ27)、メモリの自
己診断は終了する。
FIG. 2 is a flowchart showing a self-diagnosis procedure of the memory in step 13 of the flowchart shown in FIG. With the start of the self-diagnosis of the memory, first, the presence or absence of the failure of the memory is detected (step 21). If it is determined in step 21 that there is no failure, the self-diagnosis of the memory ends.
If a memory failure is detected in step 21, the detection of the failure is transmitted to the operation system (step 22). Next, it is determined whether or not the block of the faulty memory is included in the occupied area of the memory of the currently executing process (step 23). If so, the execution process occupying the corresponding failed memory block is forcibly terminated (step 24). In step 23, if the faulty memory block is not included in the occupied area of the memory of the process being executed, and after the procedure of step 24 is completed, the data in the faulty memory block is corrected and repaired. It is determined whether or not the repair has been completed (step 25). If the failed memory block is determined to have been repaired, the fact that the repair has been completed is transmitted to the operation system (step 26). The self-diagnosis ends. On the other hand, if it is determined in step 25 that the failed memory block cannot be repaired, the unrecoverable portion of the memory is transmitted to the operation system (step 27), and the self-diagnosis of the memory is performed. finish.

【0015】図3は、本発明を適用しない場合におい
て、メモリの故障によりユーザプロセスが故障プロセス
として実行され、これにより、情報処理装置において異
常動作が発生した状態を示す図である。図3において、
縦軸にはプロセスの実行レベル(本例においては、8レ
ベルに設定)が示され、横軸には経過時間が示されてい
る。時刻t0 〜t4 の時間帯においては、ユーザプロセ
ス101〜104は正常に実行されており、より高位の
レベル(若いサフィックス番号のレベルを高位とする。
即ち、L1 ,L2 ,………,L8 と順次レベル値が低下
する。)のユーザプロセスが優先的に実行されている。
そして時刻t5 よりユーザプロセス105が実行され
る。このユーザプロセスにより占有されているメモリブ
ロックの一部または全部の領域において、何らかの要因
により故障が生じ、ユーザプロセス105が永久ループ
状態となって、故障プロセスが実行される。その後、ユ
ーザプロセス109は、故障したユーザプロセス105
よりも高位レベルのユーザプロセスであるために正常動
作が継続されるが、ユーザプロセス106〜108と、
ユーザプロセス110〜113は、故障したユーザプロ
セス105よりも低位レベルのユーザプロセスであるた
めに待ち状態となり、情報処理装置は異常動作状態とな
る。また、時刻t12から実行されるユーザプロセス10
8も、メモリの故障により永久ループの故障プロセスの
状態に置かれている。
FIG. 3 is a diagram showing a state in which, when the present invention is not applied, a user process is executed as a failed process due to a memory failure, and an abnormal operation occurs in the information processing apparatus. In FIG.
The vertical axis indicates the execution level of the process (in this example, set to 8 levels), and the horizontal axis indicates the elapsed time. In the time period of time t 0 ~t 4, user process 101 to 104 are executed normally, the level of higher order level (young suffix number as high.
That is, the level value sequentially decreases in the order of L 1 , L 2 ,..., L 8 . ) User process is being executed with priority.
The user process 105 is performed from time t 5. In some or all areas of the memory block occupied by the user process, a failure occurs for some reason, the user process 105 enters a permanent loop state, and the failure process is executed. After that, the user process 109 becomes the failed user process 105.
Normal operation continues because the user process is a higher-level user process.
The user processes 110 to 113 are in a waiting state because they are lower-level user processes than the failed user process 105, and the information processing apparatus enters an abnormal operation state. Further, the user process 10 to be executed from the time t 12
8 is also placed in a state of a permanent loop failure process due to a memory failure.

【0016】図4は、図3に示される情報処理装置の異
常動作状態を、前述の第1の実施形態における処理手順
により正常動作状態に復帰させた状態を示す図である。
なおここでは、メモリの自己診断の実行開始条件とし
て、ユーザプロセスの減少個数を3個(n=3の場合)
以下と設定する。図4において、時刻t5 より、故障し
た永久ループ状態のユーザプロセス105が実行され
る。時刻t6 においてはユーザプロセス104が終了と
なり、時刻t7 においてユーザプロセス103が終了す
ると、実行ユーザプロセス数が3個(自己診断の実行開
始条件)となり、時刻ta において、オペレーションシ
ステムの制御により、自己診断プログラムが自己診断プ
ロセス201として実行され、メモリの自己診断が開始
される。この自己診断プロセス201により、永久ルー
プ状態に置かれているユーザプロセス105により占有
されていたメモリブロックにおける故障が検出され、当
該故障の検出がオペレーションシステムに伝達される。
FIG. 4 is a diagram showing a state in which the abnormal operation state of the information processing apparatus shown in FIG. 3 is returned to a normal operation state by the processing procedure in the first embodiment.
Here, as the condition for starting execution of the self-diagnosis of the memory, the number of reduced user processes is three (when n = 3).
Set as below. 4, from time t 5, the user process 105 of the failed endless loop is executed. User process 104 is terminated at time t 6, when the user process 103 at time t 7 is completed, execution of the user process number 3 (execution start condition of the self-diagnosis), and at time t a, the control of the operating system The self-diagnosis program is executed as a self-diagnosis process 201, and the self-diagnosis of the memory is started. By the self-diagnosis process 201, a failure in the memory block occupied by the user process 105 placed in the permanent loop state is detected, and the detection of the failure is transmitted to the operation system.

【0017】また、この自己診断プロセス201によ
り、ユーザプロセス108により占有されているメモリ
ブロックに故障が生じている場合にも、同時にその故障
が検出されて、当該故障メモリブロックの修復が行われ
る。自己診断プロセス201の終了後における時刻tb
より、図3において待ち状態に置かれていたユーザプロ
セスも順次実行に移され、メモリの故障により永久ルー
プ状態となっていたユーザプロセス108も、時刻td
において正常に終了し、これにより情報処理装置は正常
動作状態となる。また、時刻tc 〜te においても、実
行ユーザプロセスが3個以下の状態となるので自己診断
プロセス202が実行される。
Further, even if a failure occurs in the memory block occupied by the user process 108 by the self-diagnosis process 201, the failure is simultaneously detected and the failed memory block is repaired. Time t b after completion of self-diagnosis process 201
Thus, the user processes placed in the wait state in FIG. 3 are also sequentially executed, and the user process 108 that has been in the permanent loop state due to the memory failure also has the time t d.
, The information processing apparatus enters a normal operation state. Also, from time t c to t e , the number of executing user processes is three or less, so the self-diagnosis process 202 is executed.

【0018】即ち、上述の第1の実施形態における自己
診断方法においては、情報処理装置に対して自己診断の
ための特別なハードウェアを設けることなく、自己診断
プログラムを用いることにより、オペレーションシステ
ムにより、実行ユーザプロセス数が3個以下に減少した
際には、自動的にメモリの自己診断が実行され、故障に
よる情報処理装置の異常状態の未然防止、異常状態の復
旧および故障箇所の修復等を含む機能が有効に実行され
る。
That is, in the self-diagnosis method according to the above-described first embodiment, a self-diagnosis program is used without providing special hardware for self-diagnosis in the information processing apparatus, and the operation system can be used. When the number of executing user processes is reduced to three or less, the self-diagnosis of the memory is automatically executed to prevent an abnormal state of the information processing apparatus due to a failure, to recover the abnormal state, and to repair a failed part. The included function is executed effectively.

【0019】次に、本発明の関連技術の自己診断方法に
ついて説明する。
Next, a self-diagnosis method according to the related art of the present invention will be described.

【0020】図5は本発明の関連技術の情報処理装置の
メモリに対する自己診断方法の手順を示すフローチャー
トである。図5において、まず情報処理装置が起動開始
され、オペレーションシステムの制御によりユ−ザプロ
セスが実行される(ステップ31)。次いで、情報処理
装置により実行されているユーザプロセス数が0個の状
態において、所定の指定時間が経過したか否かが判定さ
れて(ステップ32)、当該指定時間が経過していない
場合には再度ステップ31に戻り、また前記指定時間が
既に経過している場合には、オペレーションシステムに
より、自己診断プログラムをプロセスとして実行するこ
とにより、メモリの自己診断が行われる(ステップ3
3)。そしてステップ33の自己診断プログラムの実行
終了に伴って、再度ステップ31に復帰する。即ち、
自己診断方法は、ステップ32における判定処理手順
の内容において、前述の第1の実施形態による自己診断
方法とは異なっている。
FIG. 5 is a flowchart showing a procedure of a self-diagnosis method for a memory of an information processing apparatus according to the related art of the present invention . In FIG. 5, first, the information processing apparatus is started up, and a user process is executed under the control of the operation system (step 31). Next, in a state where the number of user processes executed by the information processing apparatus is 0, it is determined whether or not a predetermined designated time has elapsed (step 32). Returning to step 31 again, if the specified time has already elapsed, the operation system executes the self-diagnosis program as a process to perform self-diagnosis of the memory (step 3).
3). Then, when the execution of the self-diagnosis program in step 33 is completed, the process returns to step 31 again. In other words, this
This self-diagnosis method differs from the self-diagnosis method according to the above-described first embodiment in the content of the determination processing procedure in step 32.

【0021】図6は、本関連技術を適用しない場合にお
いて、メモリの故障によりユーザプロセスが故障プロセ
スとして実行され、これにより、情報処理装置において
異常動作が発生した状態を示す図である。図3の場合と
同様に、縦軸にはプロセスの実行レベルが示され、横軸
には経過時間が示されている。時刻t1 より、順次ユー
ザプロセスが実行される。時刻t7 においてはユーザプ
ロセス114が終了し、その後は、ユーザプロセス数が
0個の状態が継続している。また、時刻t8 よりユーザ
プロセスが実行されるが、時刻t10において実行される
ユーザプロセス119は、メモリの故障により永久ルー
プ状態の故障プロセスとなっている。以後においては、
ユーザプロセス120とユーザプロセス121が待ち状
態となり、情報処理装置には異常状態が生じる。
FIG. 6 is a diagram showing a state in which the user process is executed as a failure process due to a memory failure when the related technique is not applied, and an abnormal operation occurs in the information processing apparatus. As in the case of FIG. 3, the vertical axis indicates the execution level of the process, and the horizontal axis indicates the elapsed time. From time t1, user processes are sequentially executed. At time t7, the user process 114 ends, and thereafter, the state in which the number of user processes is 0 continues. Further, the user process is executed at time t8, but the user process 119 executed at time t10 is a failure process in a permanent loop state due to a memory failure. Hereafter,
The user process 120 and the user process 121 enter a waiting state, and an abnormal state occurs in the information processing apparatus.

【0022】図7は、図6に示される情報処理装置の異
常動作状態を、上述の関連技術の自己診断方法により正
常動作状態に復帰させる状態を示す図である。図7にお
いて、時刻t7 においてユーザプロセス114が終了
し、ユーザプロセス数が0となる状態が継続する。時刻
tf において、本関連技術の自己診断方法において規定
される指定時間が経過したものとすると、当該時刻tf
において、オペレーションシステムの制御により、自己
診断プログラムが自己診断プロセス203として実行さ
れ、メモリの自己診断が開始される。この自己診断プロ
セス203により、永久プール状態に置かれていたユー
ザプロセス119により占有されていたメモリブロック
における故障が検出される。当該故障の検出はオペレー
ションシステムに伝達された後に、当該故障メモリブロ
ックの修復が行われ、その修復完了がオペレーションシ
ステムに伝達されて、時刻t8 において自己診断プロセ
ス203は終了する。その後、時刻t10において、永久
ループ状態に置かれていたユーザプロセス119が実行
され、時刻th において正常に終了する。これに伴な
い、待ち状態に置かれていたユーザプロセス120とユ
ーザプロセス121も正常に実行されて、これにより情
報処理装置は正常動作状態となる。
FIG. 7 is a diagram showing a state in which an abnormal operation state of the information processing apparatus shown in FIG. 6 is returned to a normal operation state by the self-diagnosis method of the related art described above. In FIG. 7, the user process 114 ends at time t7, and the state in which the number of user processes becomes 0 continues. At time tf, assuming that a specified time specified in the self-diagnosis method of the related technology has elapsed, the time tf
In, under the control of the operation system, the self-diagnosis program is executed as the self-diagnosis process 203, and the self-diagnosis of the memory is started. The self-diagnosis process 203 detects a failure in the memory block occupied by the user process 119 placed in the permanent pool state. After the detection of the failure is transmitted to the operation system, the failed memory block is repaired, the completion of the repair is transmitted to the operation system, and the self-diagnosis process 203 ends at time t8. Thereafter, at time t10, the user process 119 placed in the permanent loop state is executed, and terminates normally at time th. Along with this, the user process 120 and the user process 121 put in the waiting state are also normally executed, and the information processing apparatus is brought into a normal operation state.

【0023】即ち、上述の関連技術の自己診断方法にお
いては、第1の実施形態の場合と同様に、情報処理装置
に対して自己診断のための特別なハードウェアを設ける
必要がなく、自己診断プログラムを用いることにより、
オペレーションシステムにより、実行ユーザプロセス数
が0個の状態で指定時間経過した時点において、自動的
にメモリの自己診断が実行され、故障による情報処理装
置の異常状態の未然防止、異常状態の復旧および故障箇
所の修復等を含む機能が有効に実行される。
That is, in the self-diagnosis method of the related art described above, similar to the first embodiment, there is no need to provide special hardware for the self-diagnosis in the information processing apparatus, and the self-diagnosis method is not required. By using the program,
The operating system automatically executes the self-diagnosis of the memory when the specified time has elapsed with the number of executing user processes being 0, preventing the abnormal state of the information processing apparatus due to a failure, recovering the abnormal state, and Functions including restoration of a portion are effectively executed.

【0024】[0024]

【発明の効果】以上説明したように、本発明は、オペレ
ーションシステムの制御作用により、プロセッサの稼働
状況に対応して、所定の診断条件を介して自動的に故障
の有無を含む自己診断を行うことができるために、オペ
レーションシステムによる割込み処理を介して自己診断
を行う必要がないという効果がある。
As described above, according to the present invention, the self-diagnosis including the presence / absence of a failure is automatically performed through a predetermined diagnosis condition in accordance with the operation state of the processor by the control operation of the operation system. Therefore, there is an effect that it is not necessary to perform a self-diagnosis through interrupt processing by the operation system.

【0025】また、プロセッサの稼働状況が高い状態に
おいては、自己診断プロセスが実行されることがなく、
従って、ユーザプロセスの実行状況を悪化させることが
ないという効果がある。
In a state where the operating state of the processor is high, the self-diagnosis process is not executed,
Therefore, there is an effect that the execution state of the user process is not deteriorated.

【0026】更に、情報処理装置が異常状態に陥る以前
の状態において自己診断が行われるので、未然に当該情
報処理装置の異常状態を防止することが可能になるとと
もに、自己診断により当該故障の修復を行うことができ
るという効果がある。
Further, since the self-diagnosis is performed before the information processing apparatus falls into an abnormal state, the abnormal state of the information processing apparatus can be prevented beforehand, and the self-diagnosis can repair the fault. There is an effect that can be performed.

【0027】また、自己診断プログラムにより、自動的
に自己診断を行うことができ、自己診断専用のハードウ
ェアを特別に設ける必要がなく、当該ハードウェアの設
備に要するコストを排除することができるという効果が
ある。
Further, the self-diagnosis program can automatically perform the self-diagnosis, so that there is no need to provide special hardware for the self-diagnosis, and it is possible to eliminate the cost required for the hardware equipment. effective.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施形態の自己診断方法の処理
手順のフローチャートを示す図である。
FIG. 1 is a diagram illustrating a flowchart of a processing procedure of a self-diagnosis method according to a first embodiment of the present invention.

【図2】第1の実施形態の自己診断方法における、メモ
リの自己診断実行の処理手順のフローチャートを示す図
である。
FIG. 2 is a diagram illustrating a flowchart of a processing procedure for executing a self-diagnosis of a memory in the self-diagnosis method according to the first embodiment.

【図3】異常状態時の情報処理装置における各プロセス
の動作状態を示す図である。
FIG. 3 is a diagram illustrating an operation state of each process in the information processing apparatus in an abnormal state.

【図4】第1の実施形態による自己診断方法により、情
報処理装置を正常動作状態に復帰させる際の各プロセス
の動作状態を示す図である。
FIG. 4 is a diagram illustrating an operation state of each process when the information processing apparatus is returned to a normal operation state by the self-diagnosis method according to the first embodiment.

【図5】本発明の関連技術の自己診断方法の処理手順の
フローチャートを示す図である。
FIG. 5 is a diagram showing a flowchart of a processing procedure of a self-diagnosis method according to a related technique of the present invention.

【図6】異常状態時の情報処理装置における各プロセス
の動作状態を示す図である。
FIG. 6 is a diagram illustrating an operation state of each process in the information processing apparatus in an abnormal state.

【図7】図5による自己診断方法により、情報処理装置
を正常動作状態に復帰させる際の各プロセスの動作状態
を示す図である。
The self-diagnosis method according to FIG. 7 5 is a diagram showing an operation state of each process when returning the information processing apparatus to a normal operating state.

【図8】従来の自己診断方法における診断システムの構
成を示す図である。
FIG. 8 is a diagram showing a configuration of a diagnostic system in a conventional self-diagnosis method.

【符号の説明】[Explanation of symbols]

1 オペレーションシステム 2 レベル動作診断モジュール 3 動作監視タイマ 4 レベル動作監視レジスタ 5 タスク動作時間メモリ 6 システム診断装置 7 異常表示装置 11〜13、21〜27、31〜33 ステップ 101〜121 ユーザプロセス 201、202、203 自己診断プロセス Reference Signs List 1 operation system 2 level operation diagnosis module 3 operation monitoring timer 4 level operation monitoring register 5 task operation time memory 6 system diagnosis device 7 abnormality display device 11 to 13, 21 to 27, 31 to 33 step 101 to 121 user process 201, 202 , 203 Self-diagnosis process

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06F 11/22 - 11/26 G06F 9/46 - 9/46 360 ──────────────────────────────────────────────────続 き Continued on the front page (58) Field surveyed (Int.Cl. 6 , DB name) G06F 11/22-11/26 G06F 9/46-9/46 360

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 オペレーションシステムを具備する情報
処理装置の自己診断方法として、 前記情報処理装置により前記オペレーションシステムの
制御を介してユ−ザプロセスを実行する第1のステップ
と、 前記第1のステップの過程において、情報処理装置によ
り逐次実行されているユーザプロセス数がn(任意の正
整数)個以下に減少したか否かを判定する第2のステッ
プと、 前記第2のステップの判定結果において、情報処理装置
により逐次実行されているユーザプロセス数がn個以下
に減少した場合に、前記オペレーションシステムの管理
下において、自己診断プログラムをプロセスとして実行
することにより、前記情報処理装置に含まれるメモリの
自己診断を実行する第3のステップと、 を有しており、前記第2のステップにおいて、逐次実行
されているユーザプロセス数がn個以下に減少してはい
ないものと判定された場合、および前記第3のステップ
におけるメモリの自己診断終了後においては、前記第1
のステップに戻ることを特徴とする情報処理装置の自己
診断方法。
1. A self-diagnosis method for an information processing apparatus having an operation system, wherein: a first step of executing a user process by the information processing apparatus through control of the operation system; A second step of determining whether or not the number of user processes sequentially executed by the information processing apparatus has decreased to n (arbitrary positive integer) or less, and in the determination result of the second step, When the number of user processes sequentially executed by the information processing device is reduced to n or less, the memory included in the information processing device is executed by executing a self-diagnosis program as a process under the management of the operation system. And a third step of performing a self-diagnosis of the second step. If the number of user processes being sequentially performed is determined as not is reduced to n or less, and the third in the self-diagnosis after the end of the memory in the step, the first
A self-diagnosis method for the information processing apparatus, wherein the method returns to the step of:
【請求項2】 前記第3のステップにおける前記情報処
理装置に含まれるメモリの自己診断方法として、 当該メモリに故障が存在するか否かの検出を行う第4の
ステップと、 前記第4のステップにおいて前記メモリに故障が検出さ
れた場合に、当該故障の検出されたことを前記オペレー
ションシステムに伝達する第5のステップと、 当該故障メモリのブロックが、実行中のプロセスのメモ
リの占有領域内に含まれているか否かを判定する第6の
ステップと、 前記第6のステップの判定結果において、故障している
メモリのブロックが、実行中のプロセスのメモリの占有
領域内に含まれている場合に、該当する故障メモリのブ
ロックを占有している実行プロセスを強制的に終了させ
る第7のステップと、 前記第6のステップの判定結果において、故障メモリの
ブロックが、実行中のプロセスのメモリの占有領域内に
含まれていない場合、および前記第7のステップにおけ
る実行プロセスを強制的に終了させた後において、故障
したメモリブロックにおけるデータを訂正して修復を行
い、修復完了か否かを判定する第8のステップと、 前記第8のステップの判定結果において、故障したメモ
リブロックが修復完了である場合に、その修復完了を前
記オペレーションシステムに伝達する第9のステップ
と、 前記第8のステップの判定結果において、故障したメモ
リブロックが修復不可能である場合に、当該メモリの修
復不可能箇所を前記オペレーションシステムに伝達する
第10のステップと、 を有しており、前記第4のステップの終了後または前記
第9のステップの終了後、或は前記第10のステップの
終了後に、前記メモリの自己診断を終了することを特徴
とする請求項1記載の情報処理装置の自己診断方法。
2. A self-diagnosis method for a memory included in the information processing apparatus in the third step, wherein a fourth step of detecting whether or not a failure exists in the memory; and a fourth step of A fifth step of transmitting the detection of the failure to the operating system when a failure is detected in the memory, and setting the block of the failed memory in the occupied area of the memory of the process being executed. A sixth step of determining whether or not the block is included; and in the determination result of the sixth step, a block of the faulty memory is included in the occupied area of the memory of the currently executing process. A seventh step of forcibly terminating the execution process occupying the corresponding block of the faulty memory; When the block of the failed memory is not included in the occupied area of the memory of the process being executed, and after forcibly terminating the execution process in the seventh step, the data in the failed memory block is deleted. An eighth step of correcting and repairing and determining whether or not the repair has been completed; and, in the determination result of the eighth step, if the failed memory block has been repaired, the repair completion is determined by the operation system. A ninth step of transmitting a non-recoverable portion of the memory to the operation system when the failed memory block cannot be repaired in the determination result of the eighth step. And after the end of the fourth step or after the end of the ninth step or before After completion of the tenth step, the self-diagnosis method according to claim 1 Symbol placement of the information processing apparatus is characterized in that to end the self-diagnosis of the memory.
JP7251571A 1995-09-28 1995-09-28 Self-diagnosis method for information processing device Expired - Lifetime JP2924732B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7251571A JP2924732B2 (en) 1995-09-28 1995-09-28 Self-diagnosis method for information processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7251571A JP2924732B2 (en) 1995-09-28 1995-09-28 Self-diagnosis method for information processing device

Publications (2)

Publication Number Publication Date
JPH0997197A JPH0997197A (en) 1997-04-08
JP2924732B2 true JP2924732B2 (en) 1999-07-26

Family

ID=17224800

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7251571A Expired - Lifetime JP2924732B2 (en) 1995-09-28 1995-09-28 Self-diagnosis method for information processing device

Country Status (1)

Country Link
JP (1) JP2924732B2 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60171544A (en) * 1984-02-17 1985-09-05 Hitachi Ltd Self-diagnosis device for abnormality of computer system
JPH0353345A (en) * 1989-07-21 1991-03-07 Nec Corp Controller with automatic self-diagnostic function
JPH03149629A (en) * 1989-11-07 1991-06-26 Fujitsu Ltd Memory testing system

Also Published As

Publication number Publication date
JPH0997197A (en) 1997-04-08

Similar Documents

Publication Publication Date Title
US5948112A (en) Method and apparatus for recovering from software faults
US6502208B1 (en) Method and system for check stop error handling
US6880113B2 (en) Conditional hardware scan dump data capture
JPH0820965B2 (en) How to continue running the program
JP5176405B2 (en) Computer error detection and recovery method
JP2924732B2 (en) Self-diagnosis method for information processing device
JPH02294739A (en) Fault detecting system
JPH1078896A (en) Industrial electronic computer
JPH1115661A (en) Self-diagnosis method for cpu
JPS6229820B2 (en)
JPH0561734A (en) Indefinite operation test method for parallel program
JP3381756B2 (en) Parallel processor system
JP2776815B2 (en) Failure recovery method for multiprocessor system
JP3097621B2 (en) Self-diagnosis method
JP2836084B2 (en) Computer inspection equipment
JP2022035576A (en) Firmware test device, firmware test method and firmware test program
JPH10187202A (en) Microprocessor controller
JP2629554B2 (en) Information processing system
JPH0135369B2 (en)
CN116089164A (en) Method and device for recovering fault point forward scrolling and storage medium
JPH0365743A (en) Fault finding method for main storage device
JPH06139089A (en) Fault processing device for information processor
JPS62113241A (en) Fault recovery device
JPH04349538A (en) Recovering system for fault device
JPH05158811A (en) Fault detecting system for data processor

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990406