JPH01177642A - System for diagnosing fault in computer system - Google Patents
System for diagnosing fault in computer systemInfo
- Publication number
- JPH01177642A JPH01177642A JP63001166A JP116688A JPH01177642A JP H01177642 A JPH01177642 A JP H01177642A JP 63001166 A JP63001166 A JP 63001166A JP 116688 A JP116688 A JP 116688A JP H01177642 A JPH01177642 A JP H01177642A
- Authority
- JP
- Japan
- Prior art keywords
- fault
- diagnosis
- information
- micro
- program
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 claims abstract description 44
- 238000004458 analytical method Methods 0.000 claims abstract description 24
- 238000012545 processing Methods 0.000 claims description 10
- 238000000034 method Methods 0.000 claims description 5
- 230000002950 deficient Effects 0.000 abstract description 11
- 230000003213 activating effect Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Landscapes
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
Description
【発明の詳細な説明】
〔概 要〕
計算機システム運用中におけるハード障害発生に際して
、この障害発生を契機として正確かつ迅速に不良箇所の
診断を自動的に行うようにした計算機システムにおける
障害診断方式に関し、ハード障害発生時にのみコントロ
ールストレージに格納されたマイクロ診断プログラムの
うちの最適な診断プログラムを起動して自動的に障害診
断を実行し、かつ一定時間間隔で所定回数だけ繰り返し
実行することにより不良箇所が確証できるようにするこ
とを目的とし、
ハード障害発生時に発生される障害情報を障害情報解析
部により解析し、この解析結果に基づいてコントロール
ストレージに格納されたマイクロ診断プログラムのうち
の最適な診断プログラムを起動して障害診断を実行し、
これを一定時間間隔をおいて所定回数だけ繰り返し行う
ことにより不良箇所を確証できる可能性を高めたもので
ある。[Detailed Description of the Invention] [Summary] This invention relates to a fault diagnosis method for a computer system that automatically diagnoses the fault accurately and quickly when a hardware fault occurs during the operation of the computer system. , only when a hardware failure occurs, starts the most suitable diagnostic program among the microdiagnostic programs stored in the control storage to automatically perform failure diagnosis, and repeats the execution a predetermined number of times at regular time intervals to identify the defective location. The fault information generated when a hardware fault occurs is analyzed by the fault information analysis section, and based on the analysis results, the most suitable diagnosis is selected from among the micro-diagnosis programs stored in the control storage. Start the program and perform fault diagnosis,
By repeating this a predetermined number of times at regular time intervals, the possibility of confirming the defective location is increased.
本発明は、計算機システム運用中におけるハード障害発
生に際して、この障害発生を契機として正確かつ迅速に
不良箇所の診断を自動的に行うようにした計算機システ
ムにおける障害診断方式に関する。The present invention relates to a fault diagnosis method for a computer system that automatically diagnoses a defective location accurately and quickly when a hardware fault occurs during operation of the computer system.
計算機システムを運用するに際しては、計算機システム
自体の信頼性がきわめて重要な問題となる。この信頼性
を向上するためにはハードの信頼性を向上させることは
言うまでもないが、障害発生時にできるだけ正確かつ迅
速にその不良箇所や、どういった障害かを的確に診断し
保守していくことが重要である。When operating a computer system, the reliability of the computer system itself is an extremely important issue. In order to improve this reliability, it goes without saying that it is necessary to improve the reliability of the hardware, but when a failure occurs, it is important to accurately diagnose the location of the failure and the type of failure as quickly as possible and perform maintenance. is important.
従来より、第3図に示すように、計算機本体101側に
内蔵されRAM等で構成されたコントロールストレージ
(C3)102に格納されたマイクロプログラムと、上
記本体101の外部に設けられたサービスプロセッサ1
03とを備えた計算機システムが知られている。Conventionally, as shown in FIG. 3, a microprogram stored in a control storage (C3) 102 built in the computer main body 101 and configured with RAM, etc., and a service processor 1 provided outside the main body 101 are known.
A computer system equipped with 03 is known.
この計算機システムにおいて、計算機本体101側でハ
ード障害が発生した場合は、障害情報104がサービス
プロセッサ103に通知されここにロギングされる構成
となっているが、この障害情報104を契機として自動
的に計算機システムの障害診断を実行する構成とはなっ
ておらず、この後は保守者による障害診断が行われる。In this computer system, when a hardware failure occurs on the computer main body 101 side, failure information 104 is notified to the service processor 103 and logged there. The computer system is not configured to perform fault diagnosis, and the fault diagnosis will be performed by maintenance personnel after this.
なお、上記のシステムにおいても、運用開始時には一時
的にコントロールストレージ102を用いたマイクロプ
ログラムによる診断が行われるが、運用中における診断
は行われていない。Note that in the above system as well, a diagnosis is temporarily performed by a microprogram using the control storage 102 at the start of operation, but no diagnosis is performed during operation.
近年、計算機システムにおけるハード障害のうちの8割
以上が間欠障害であり、保守者が現場に到着した時には
正常な動作状態にもどっているといったケースが多いも
のである。このため、障害発生からある時間経過した後
での不良箇所の診断は、サービスプロセッサ103に蓄
積されたロギング情報から推定することとなり、不良箇
所の正確な確証が得にくくなってきている。In recent years, more than 80% of hardware failures in computer systems are intermittent failures, and in many cases the system has returned to normal operating condition by the time maintenance personnel arrive at the site. For this reason, diagnosis of the defective location after a certain period of time has elapsed from the occurrence of the failure must be estimated from the logging information accumulated in the service processor 103, making it difficult to obtain accurate confirmation of the defective location.
また、この場合、サービスプロセッサ103に蓄積され
たロギング情報に基づいて推定される不良箇所を持ち帰
って精密な調査を行っても、何らの異常も発見できない
といったケースが多くなってきている。Furthermore, in this case, there are many cases in which no abnormality is found even if the defective location estimated based on the logging information accumulated in the service processor 103 is brought back for detailed investigation.
上記した従来の計算機システムにおいては、計算機本体
にハード障害が発生した場合は障害情報がサービスプロ
セッサに通知されここにロギングされるが、これを契機
として自動的に障害診断を実行する構成とはなっておら
ず、ロギング情報に基づいた保守者による診断が行われ
るので、特に間欠障害に対する不良箇所の確証が困難で
あるといった問題点があった。In the conventional computer system described above, when a hardware failure occurs in the computer itself, failure information is notified to the service processor and logged there, but this is not a configuration that automatically executes failure diagnosis. Since the diagnosis is performed by maintenance personnel based on logging information, there is a problem in that it is difficult to confirm the location of the fault, especially in the case of intermittent faults.
本発明は、ハード障害発生時にのみコントロールストレ
ージに格納されたマイクロ診断プログラムのうちの最適
な診断プログラムを起動して自動的に障害診断を実行し
、かつ一定時間間隔で所定回数だけ繰り返し実行するこ
とにより不良箇所を的確に確証できるようにした計算機
システムにおける障害診断方式を提供することを目的と
する。The present invention is capable of automatically executing a fault diagnosis by activating an optimal diagnostic program among micro-diagnosis programs stored in a control storage only when a hardware fault occurs, and repeating the execution a predetermined number of times at fixed time intervals. The purpose of this invention is to provide a method for diagnosing faults in computer systems that can accurately identify defective locations.
第1図の原理図に示すように、通常処理を実行するマイ
クロプログラム3と、ハード障害発生時のみ障害診断処
理を実行する複数のマイクロ診断プログラム4が格納さ
れたコントロールストレージ2を有する計算機本体1と
、
上記計算機本体1側でハード障害が生じた場合に発生さ
れる障害情報10を蓄積するロギング部6と、このロギ
ング部6からのロギング情報を解析して最適なマイクロ
診断プログラム選択情報11を計算機本体1に送出し上
記マイクロ診断プログラム4を起動する障害情報解析部
7と、上記マイクロ診断プログラム選択情@11を一定
時間経過後に繰り返し計算機本体1に送出するためのタ
イマー8と、上記マイクロ診断プログラム選択情報11
に基づく最適なマイクロ診断プログラム4による障害診
断を所定回数だけ実行するためのカウンタ9とを有する
サービスプロセッサ5とを備え、
ハード障害発生時には、計算機本体1からの障害情@1
0をサービスプロセッサ5のロギング部6でロギングす
るとともに、このロギング情報を障害情報解析部7で解
析して得た最適なマイクロ診断プログラム選択情報11
を計算機本体1に送出し、上記マイクロ診断プログラム
選択情報11に基づいて選択された最適なマイクロ診断
プログラムを起動させ、タイマー8およびカウンタ9に
より一定時間間隔で所定回数だけ上記マイクロ診断プロ
グラムによる障害診断を自動的に実行するようにしたも
のである。As shown in the principle diagram of FIG. 1, a computer main body 1 has a control storage 2 in which a microprogram 3 that executes normal processing and a plurality of microdiagnosis programs 4 that execute fault diagnosis processing only when a hardware failure occurs are stored. and a logging unit 6 that stores failure information 10 generated when a hardware failure occurs on the computer main body 1 side, and analyzes the logging information from this logging unit 6 to obtain optimal micro-diagnosis program selection information 11. a fault information analysis section 7 that sends it to the computer main body 1 and starts the micro-diagnosis program 4; a timer 8 that repeatedly sends the micro-diagnosis program selection information @11 to the computer main body 1 after a certain period of time has elapsed; Program selection information 11
and a service processor 5 having a counter 9 for executing fault diagnosis by an optimal micro-diagnosis program 4 based on a predetermined number of times.
0 is logged by the logging unit 6 of the service processor 5, and this logging information is analyzed by the failure information analysis unit 7 to obtain optimal micro-diagnosis program selection information 11.
is sent to the computer main body 1, the optimum microdiagnosis program selected based on the microdiagnosis program selection information 11 is activated, and the timer 8 and counter 9 perform fault diagnosis using the microdiagnosis program a predetermined number of times at fixed time intervals. It is designed to be executed automatically.
計算機本体1でハード障害が発生した場合は、この状況
がサービスプロセッサ5に対して障害情報10として通
知される。サービスプロセッサ5では上記障害情@10
をロギング部6でロギングするとともに、このロギング
情報を障害情報解析部7で解析し、ここからの上記障害
情報10に対する解析結果である最適なマイクロ診断プ
ログラム選択情報11が計算機本体1に送出される。When a hardware failure occurs in the computer main body 1, this situation is notified to the service processor 5 as failure information 10. For service processor 5, the above failure information @10
is logged by the logging unit 6, and this logging information is analyzed by the failure information analysis unit 7, from which optimal micro-diagnosis program selection information 11, which is the analysis result for the failure information 10, is sent to the computer main body 1. .
そして、上記マイクロ診断プログラム選択情報11に基
づいて、コントロールストレージ2に格納されているマ
イクロ診断プログラム4のうちの上記障害情報10に対
する最適な診断プログラムが起動され、この診断プログ
ラムにより自動的に障害診断が実行される。Based on the micro-diagnostic program selection information 11, the optimal diagnostic program for the fault information 10 among the micro-diagnostic programs 4 stored in the control storage 2 is started, and the fault is automatically diagnosed by this diagnostic program. is executed.
また、このとき、サービスプロセッサ5に設けられたタ
イマー8およびカウンタ9により上記障害情報解析部7
からのマイクロ診断プログラム選択情報11が一定時間
間隔で計算機本体1に送出されるとともに、所定回数だ
け上記最適なマイクロ診断プログラムによる障害診断が
自動的に実行されるので、間欠障害であっても不良箇所
を確証できる可能性が高くなる。At this time, the timer 8 and counter 9 provided in the service processor 5 cause the failure information analysis unit 7 to
The micro-diagnosis program selection information 11 from the computer is sent to the computer main body 1 at fixed time intervals, and fault diagnosis using the optimal micro-diagnosis program is automatically executed a predetermined number of times, so even intermittent faults can be detected. There is a higher possibility of confirming the location.
以下、本発明による一実施例について説明する。 An embodiment according to the present invention will be described below.
第2図は、本発明の一実施例である計算機システムにお
ける障害診断方式の構成図である。FIG. 2 is a block diagram of a fault diagnosis method in a computer system that is an embodiment of the present invention.
計算機本体1においてハード障害が発生した場合は、ハ
ード障害検出部12により障害検出が行われ、ここから
サービスプロセッサ5のロギング部6にハード障害が発
生した旨を示す障害情報10が通知される。When a hardware failure occurs in the computer main body 1, the failure is detected by the hardware failure detection unit 12, and from there the failure information 10 indicating that a hardware failure has occurred is notified to the logging unit 6 of the service processor 5.
サービスプロセッサ5では、上記障害情報10をロギン
グ部6でロギングすると同時に、障害情報解析部7でロ
ギング情報に基づく不良箇所の解析が行われ、ここでの
解析結果である最適なマイクロ診断プログラム選択情報
11が計算機本体1のマイクロ診断プログラム制御部1
3に送出される。そして、上記障害情報解析部7からの
マイクロ診断プログラム選択情報11に基づいて、マイ
クロ診断プログラム制御部13はマイクロ診断プログラ
ム4A、4B、・−’−4Nのうちから最も適した診断
プログラムを起動し、障害情報10に対する障害診断を
自動的に実行する。In the service processor 5, the fault information 10 is logged by the logging unit 6, and at the same time, the fault information analysis unit 7 analyzes the defective location based on the logging information. 11 is a micro diagnostic program control unit 1 of the computer main body 1;
Sent on 3rd. Then, based on the microdiagnosis program selection information 11 from the fault information analysis section 7, the microdiagnosis program control section 13 starts the most suitable diagnosis program from among the microdiagnosis programs 4A, 4B, -'-4N. , automatically executes fault diagnosis for the fault information 10.
上記のように、障害情報解析部7はロギング部6からの
ロギング情報に基づいて不良箇所を解析し、その解析結
果である最適なマイクロ診断プログラム選択情報11を
マイクロ診断プログラム制御部13に送出するが、この
とき、障害情報解析部7は例えばマイクロ診断プログラ
ム4A、4B、・・・4Nに対応して設けられた送信フ
レーム7Aの1,2.・・・Nのフレーム位置に立つビ
ットにより、起動すべきマイクロ診断プログラムを指定
する構成となっており、これをマイクロ診断プログラム
選択情報11として送出する。As described above, the failure information analysis section 7 analyzes the defective location based on the logging information from the logging section 6, and sends the optimal microdiagnosis program selection information 11, which is the analysis result, to the microdiagnosis program control section 13. However, at this time, the failure information analysis section 7 analyzes the transmission frames 1, 2, . . . . The micro-diagnosis program to be activated is designated by the bit placed in the N frame position, and this is sent out as the micro-diagnosis program selection information 11.
したがって、障害情報解析部7での解析結果を示すビッ
トが送信フレーム7Aの1の位置に立つた場合は、これ
を受けたマイクロ診断プログラム制御部13はマイクロ
診断プログラム(1) 4 Aを起動し、同様にして解
析結果を示すビットが送信フレーム7AのNの位置に立
った場合は、マイクロ診断プログラム制御部13はマイ
クロ診断プログラム(N)4Nを起動する。Therefore, when the bit indicating the analysis result in the fault information analysis section 7 stands at the 1 position of the transmission frame 7A, the micro-diagnosis program control section 13 that receives this starts the micro-diagnosis program (1) 4A. Similarly, when the bit indicating the analysis result stands at the N position of the transmission frame 7A, the microdiagnosis program control unit 13 starts the microdiagnosis program (N) 4N.
上記のマイクロ診断プログラムは、計算機本体1におけ
るハード構成上でのブロック別の診断が行われるように
細分化されており、例えばマイクロ診断プログラム(1
)4Aは演算ブロック、マイクロ診断プログラム(2)
4Bは制御ブロック、そしてマイクロ診断プログラム(
N)4Nは駆動ならびに受信ブロックの診断プログラム
である。The above-mentioned micro-diagnosis program is subdivided so that diagnosis is performed for each block on the hardware configuration of the computer main body 1. For example, the micro-diagnosis program (1
) 4A is the calculation block, micro diagnostic program (2)
4B is a control block and a micro diagnostic program (
N) 4N is a diagnostic program for the drive and reception blocks.
いま、ハード障害検出部12からの障害情報10に基づ
く障害情報解析部7での解析結果を示すビットが送信フ
レーム7Aの2の位置に立った場合は、マイクロ診断プ
ログラム制御部13によってマイクロ診断プログラム(
2)4Bが起動され、この場合は計算機本体1の制御ブ
ロックにおける障害診断が実行される。Now, if the bit indicating the analysis result in the failure information analysis unit 7 based on the failure information 10 from the hardware failure detection unit 12 stands at position 2 of the transmission frame 7A, the microdiagnosis program control unit 13 executes the microdiagnosis program. (
2) 4B is activated, and in this case, fault diagnosis in the control block of the computer main body 1 is executed.
上記のように、計算機本体lでハード障害が発生すると
、ハード障害検出部12よりロギング部6に障害情報1
0が通知されるとともに、このロギング情報に基づく障
害情報解析部7での解析結果がマイクロ診断プログラム
選択情報11としてマイクロ診断プログラム制御部13
に送出され、上記障害情報10に対する最適なマイクロ
診断プログラムが起動されて障害診断が自動的に実行さ
れる。As mentioned above, when a hardware failure occurs in the computer main body l, the failure information 1 is sent from the hardware failure detection unit 12 to the logging unit 6.
0 is notified, and the analysis result by the failure information analysis unit 7 based on this logging information is sent to the microdiagnosis program control unit 13 as the microdiagnosis program selection information 11.
The optimum micro-diagnosis program for the fault information 10 is activated and fault diagnosis is automatically executed.
さらに、サービスプロセッサ5はタイマー8により、一
定時間経過後に上記マイクロ診断プログラム選択情報1
1を計算機本体1のマイクロ診断プログラム制御部13
に再度送出し、上記した最適なマイクロ診断プログラム
に基づく障害診断を実行するとともに、これをカウンタ
9で設定された所定回数だけ繰り返し実行する。Further, the service processor 5 uses the timer 8 to set the micro diagnostic program selection information 1 after a certain period of time has elapsed.
1 to the micro-diagnosis program control section 13 of the computer main body 1
The micro-diagnosis program is sent again to execute a fault diagnosis based on the above-mentioned optimal micro-diagnosis program, and this is repeatedly executed a predetermined number of times set by the counter 9.
上記の障害診断において、障害情報解析部7からのマイ
クロ診断プログラム選択情報11に基づく、1回の障害
診断で不良箇所の確証が得られた場合は、その時点でマ
イクロ診断プログラムによ1す
る障害診断を終了する。そして、その診断結果16を診
断結果送出部14よりサービスプロセッサ5のロギング
部15に通知し、ロギング部15はこの診断結果16を
ロギングするとともに適宜表示装置等により表示する。In the above-mentioned fault diagnosis, if the fault location is confirmed in one fault diagnosis based on the micro-diagnosis program selection information 11 from the fault information analysis unit 7, the fault is detected by the micro-diagnosis program at that point. Finish the diagnosis. The diagnosis result 16 is then notified from the diagnosis result sending unit 14 to the logging unit 15 of the service processor 5, and the logging unit 15 logs the diagnosis result 16 and displays it on a display device or the like as appropriate.
上記した1回の障害診断で不良箇所の確証が得られない
場合でも、ハード障害が発生してから最適なマイクロ診
断プログラムによる障害診断が所定回数だけ繰り返し実
行されるので、間欠障害の場合であっても不良箇所を確
証できる可能性が大きくなる。また、−船釣に上記した
マイクロ診断プログラムは実行時間が短く、ハード障害
に対する障害検出率は高いものである。しかし、特に間
欠障害の場合は、所定回数だけの障害診断を繰り返し実
行しても不良箇所の確証が得られない場合もあるが、こ
の場合でもその診断結果を診断結果送出部14よりサー
ビスプロセッサ5のロギング部1゛5に通知し、ここに
ロギングするとともに適宜その旨を表示する。Even if it is not possible to confirm the location of the defect with the above-mentioned one-time fault diagnosis, the fault diagnosis using the optimal micro-diagnosis program is repeated a predetermined number of times after a hardware fault occurs, so it is not possible to confirm the location of the fault in the case of an intermittent fault. However, there is a greater possibility of confirming the location of the defect. Furthermore, the micro-diagnosis program described above has a short execution time and a high failure detection rate for hardware failures. However, especially in the case of intermittent failures, it may not be possible to confirm the location of the failure even if the failure diagnosis is repeated a predetermined number of times. The information is notified to the logging unit 1-5 of the computer, and the information is logged here and a message to that effect is displayed as appropriate.
なお、上記した障害情報解析部7は、ハード障害が重大
でありこれに起因して計算機本体1が動作を停止してい
る場合は、マイクロ診断プログラム選択情報11をマイ
クロ診断プログラム制御部13に送出する必要はない。Note that the above-mentioned failure information analysis unit 7 sends the micro-diagnosis program selection information 11 to the micro-diagnosis program control unit 13 if the hardware failure is serious and the computer main body 1 has stopped operating due to it. do not have to.
また、コントロールストレージ2に格納されたマイクロ
プログラム3は、通常は上記したマイクロ診断プログラ
ム4によらない通常処理を実行しており、この通常処理
は計算機本体1のハードウェアと一体となって本体の仕
様を作り上げている。In addition, the microprogram 3 stored in the control storage 2 normally executes normal processing that is not based on the microdiagnosis program 4 described above, and this normal processing is performed integrally with the hardware of the computer main body 1. We are creating specifications.
そして、オペレーティング・システム(O8)の動作を
保証しているのが上記の通常処理であり、この通常処理
においてはできるだけ時間当りの実行ステップが短い方
が処理速度が速くなるものであるが、上記したマイクロ
診断プログラム4による障害診断は障害発生時のみ実行
されるので、この障害診断による処理速度への影響を極
力低減できるものである。The normal processing described above guarantees the operation of the operating system (O8), and in this normal processing, the processing speed is faster if the execution steps per time are as short as possible. Since the fault diagnosis by the micro-diagnosis program 4 is executed only when a fault occurs, the influence of this fault diagnosis on the processing speed can be reduced as much as possible.
上記したように、ハード障害発生を契機としてマイクロ
診断プログラムのうちの最適な診断プログラムを起動で
きるとともに、タイマーとカウン夕により一定時間間隔
で所定回数だけ繰り返して障害診断を自動的に実行する
ことができるので、不良箇所を確証できる可能性が高く
なり、オペレーティング・システムの低能低下に対する
影響も極力低減することができる。As mentioned above, when a hardware failure occurs, it is possible to start the most suitable diagnostic program among the microdiagnostic programs, and it is also possible to automatically execute failure diagnosis by repeating it a predetermined number of times at regular intervals using a timer and counter. This increases the possibility of confirming the location of the defect, and reduces the impact of low performance of the operating system as much as possible.
以上説明した本発明によれば、ハード障害発生時にのみ
コントロールストレージに格納されたマイクロ診断プロ
グラムのうちの最適な診断プログラムを起動するととも
に、一定時間間隔で所定回数だけ繰り返して自動的に障
害診断を実行する構成としたので、ハード障害に対して
最適な診断プログラムによる障害診断ができるとともに
、ハード障害発生時にのみ障害診断が実行されるのでオ
ペレーティング・システムの低能低下への影響を極力低
減でき、不良箇所を確証できる可能性が高くなるといっ
た格別な効果が得られる。According to the present invention as described above, only when a hardware failure occurs, the most suitable diagnostic program among the microdiagnostic programs stored in the control storage is activated, and the failure diagnosis is automatically repeated a predetermined number of times at regular time intervals. This configuration allows hardware failures to be diagnosed using the most suitable diagnostic program, and since failure diagnosis is executed only when a hardware failure occurs, it is possible to minimize the impact on the operating system's low performance. A special effect can be obtained, such as increasing the possibility of confirming the location.
第1図は本発明の原理図、
第2図は本発明の一実施例を示す構成図、第3図は従来
例を示す構成図である。
■・・・計算機本体、2・・・コントロールストレージ
、3・・・マイクロプログラム、4A、4B・・4N・
・・マイクロ診断プログラム、5・・・サービスプロセ
ッサ、6・・・ロギング部、7・・・障害情報解析部、
8・・・タイマー、9・・・カウンタ、10・・・障害
情報、11・・・マイクロ診断プログラム選択情報。FIG. 1 is a diagram showing the principle of the present invention, FIG. 2 is a block diagram showing an embodiment of the present invention, and FIG. 3 is a block diagram showing a conventional example. ■...Computer body, 2...Control storage, 3...Micro program, 4A, 4B...4N...
...Micro diagnosis program, 5.Service processor, 6.Logging section, 7.Fault information analysis section,
8...Timer, 9...Counter, 10...Fault information, 11...Micro diagnosis program selection information.
Claims (1)
ド障害発生時にのみ障害診断処理を実行する複数のマイ
クロ診断プログラム(4A、4B・・・4N)が格納さ
れたコントロールストレージ(2)を有する計算機本体
(1)と、 ハード障害発生時に上記計算機本体で発生される障害情
報(10)をロギングするロギング部(6)と、該ロギ
ング部からのロギング情報を解析し上記マイクロ診断プ
ログラムのうちから最適な診断プログラムを起動するた
めのマイクロ診断プログラム選択情報(11)を上記計
算機本体に送出する障害情報解析部(7)と、上記マイ
クロ診断プログラム選択情報を一定時間間隔をおいて上
記計算機本体に送出するためのタイマー(8)と、上記
最適なマイクロ診断プログラムによる障害診断を所定回
数だけ実行するためのカウンタ(9)とを有するサービ
スプロセッサ(5)とを備え、 ハード障害発生時にのみ、最適なマイクロ診断プログラ
ムに基づく障害診断を自動的に一定時間間隔で所定回数
だけ繰り返して実行するようにしたことを特徴とする計
算機システムにおける障害診断方式。[Scope of Claims] A control storage (3) that stores a microprogram (3) that executes normal processing and a plurality of microdiagnosis programs (4A, 4B...4N) that executes fault diagnosis processing only when a hardware failure occurs. 2); a logging unit (6) that logs failure information (10) generated in the computer body when a hardware failure occurs; and a logging unit (6) that analyzes the logging information from the logging unit and performs the microdiagnosis described above. A failure information analysis unit (7) sends micro-diagnosis program selection information (11) to the computer main body for starting the most suitable diagnosis program from among the programs; A service processor (5) having a timer (8) for sending data to the computer main body, and a counter (9) for executing fault diagnosis by the optimal microdiagnosis program a predetermined number of times, 1. A fault diagnosis method for a computer system, characterized in that fault diagnosis based on an optimal micro-diagnosis program is automatically repeated a predetermined number of times at fixed time intervals only at certain times.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63001166A JPH01177642A (en) | 1988-01-08 | 1988-01-08 | System for diagnosing fault in computer system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63001166A JPH01177642A (en) | 1988-01-08 | 1988-01-08 | System for diagnosing fault in computer system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH01177642A true JPH01177642A (en) | 1989-07-13 |
Family
ID=11493854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63001166A Pending JPH01177642A (en) | 1988-01-08 | 1988-01-08 | System for diagnosing fault in computer system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH01177642A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012026035A1 (en) * | 2010-08-27 | 2012-03-01 | 富士通株式会社 | Fault processing method, fault processing system, fault processing device and fault processing program |
JP2012168769A (en) * | 2011-02-15 | 2012-09-06 | Nec Computertechno Ltd | Interface failure management system, information processor, and interface failure management method |
-
1988
- 1988-01-08 JP JP63001166A patent/JPH01177642A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012026035A1 (en) * | 2010-08-27 | 2012-03-01 | 富士通株式会社 | Fault processing method, fault processing system, fault processing device and fault processing program |
JP5459405B2 (en) * | 2010-08-27 | 2014-04-02 | 富士通株式会社 | Fault handling method, fault handling system, fault handling apparatus and fault handling program |
JP2012168769A (en) * | 2011-02-15 | 2012-09-06 | Nec Computertechno Ltd | Interface failure management system, information processor, and interface failure management method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2003248600A (en) | Software crash event analysis method and system | |
JPH01177642A (en) | System for diagnosing fault in computer system | |
JP2000358029A (en) | Automatic fault diagnostic network system, and automatic fault diagnostic method for network | |
JPH11258381A (en) | Detector abnormality diagnostic method | |
JP2704005B2 (en) | Man-machine system design support equipment | |
JPS61127041A (en) | Diagnosis system for communication controller | |
JP2007042017A (en) | Fault diagnostic system, fault diagnostic method, and fault diagnostic program | |
JPH0854922A (en) | Process controller | |
JPS61292457A (en) | Diagnosing method for electronic exchange | |
JP2003131729A (en) | Diagnostic method for preecho of abnormity in batch sequence operation and apparatus therefor | |
JP2990008B2 (en) | Processor self-diagnosis method | |
JPS6029133B2 (en) | Fault diagnosis method | |
JPH05216711A (en) | Self-diagnostic device | |
JPS6121550A (en) | Test method of channel sub-system | |
JP2006213469A (en) | Device and method for analyzing failure of elevator | |
JPH01189735A (en) | Microprogram diagnosing system | |
JPS63172306A (en) | Programmable controller | |
JPH08133621A (en) | Elevator control device and elevator maintenance device | |
JPH02110743A (en) | Fault diagnostic processing system | |
JPS6015749A (en) | In-line tmp system | |
JPS60254333A (en) | Data processor | |
JPH0266606A (en) | Monitor control system | |
JPH02129732A (en) | Information processor | |
JPS6284957A (en) | Method of diagnosing abnormality and failure in numerically controlled machine tool | |
JPH0259947A (en) | Automatic diagnostic system for input/output device |