JPH07311697A - Display fault system in computer system - Google Patents

Display fault system in computer system

Info

Publication number
JPH07311697A
JPH07311697A JP6105646A JP10564694A JPH07311697A JP H07311697 A JPH07311697 A JP H07311697A JP 6105646 A JP6105646 A JP 6105646A JP 10564694 A JP10564694 A JP 10564694A JP H07311697 A JPH07311697 A JP H07311697A
Authority
JP
Japan
Prior art keywords
failure
function module
turned
hardware
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6105646A
Other languages
Japanese (ja)
Inventor
Satoshi Mizuno
聡 水野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP6105646A priority Critical patent/JPH07311697A/en
Publication of JPH07311697A publication Critical patent/JPH07311697A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To easily judge a fault part at a main function module level by setting a specific value in the nonvolatile register corresponding to a function module in which the fault has occurred and turning ON a light emission device corresponding to the function module. CONSTITUTION:Light emission devices 112 to 121 are provided nearby the respective function modules 102 to 111 of respective hardware modules (panel) 101 and are made to illuminate by setting a specific value in nonvolatile fault history registers. Then the specific value is set in the nonvolatile fault history register corresponding to the function module, whose fault is detected by a detecting means, among the function modules 102 to 111 to turn ON the light emission device corresponding to the function module which gets out of order among the light emission devices 112 to 121. Consequently, the fault part can easily be judged on the main function module level.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、故障の発生を表示する
計算機システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a computer system for displaying the occurrence of a failure.

【0002】[0002]

【従来の技術】従来、計算機システムに故障が発生した
ことを通知するために、計算機の操作パネルに異常警告
灯を設け、あるいは計算機を構成する複数のハードウェ
アモジュールのそれぞれに異常警告灯を設けて、異常検
出時に点灯するといったことが行なわれてきた。これら
警告灯が点灯されることにより、ユーザは計算機システ
ムの異常を知り、また異常が発生したハードウェアモジ
ュールを確認することができる。
2. Description of the Related Art Conventionally, in order to notify that a failure has occurred in a computer system, an abnormality warning light is provided on an operation panel of the computer, or an abnormality warning light is provided in each of a plurality of hardware modules constituting the computer. Then, it has been performed to turn on the light when an abnormality is detected. By turning on these warning lights, the user can know the abnormality of the computer system and can confirm the hardware module in which the abnormality has occurred.

【0003】なお、ここでハードウェアモジュールと
は、システムバスに接続される各種ボード、バス等を示
しており、各種ボードには、プロセッサ、各種コントロ
ーラ等の、さらに小さな複数のファンクションモジュー
ルが設けられているものとする。
Here, the hardware module indicates various boards, buses, etc. connected to the system bus, and each of the boards is provided with a plurality of smaller function modules such as a processor and various controllers. It is assumed that

【0004】前述した警告灯は、一般的にソフトウェア
操作、あるいはハードウェア機構により点灯され、かつ
異常が検出された時点で点灯するようになっている。す
なわち、一旦電源がOFFになると警告灯は消され、再
度電源をONしても、再び異常を検出する時点まで警告
灯は点灯しない。
The above-mentioned warning light is generally turned on by a software operation or a hardware mechanism, and is turned on when an abnormality is detected. That is, once the power is turned off, the warning light is extinguished, and even if the power is turned on again, the warning light does not turn on until the abnormality is detected again.

【0005】従って、システム電源を落した後に改めて
原因を調査する場合には、警告灯を当てにすることがで
きず、計算機内部に残された稼働状態の記録(システム
ログ)や、異常検出時のコンソール画面に出力された警
告メッセージのハードコピーの情報、あるいは診断プロ
グラムを実行した結果を基に調査する必要があり、故障
箇所を交換可能な最小単位(ファンクションモジュー
ル)で特定することに時間と手間がかかっていた。
Therefore, when investigating the cause again after turning off the system power, it is not possible to rely on the warning light, and the record of the operating state (system log) left inside the computer or when an abnormality is detected is detected. It is necessary to investigate based on the information in the hard copy of the warning message output on the console screen of or the result of executing the diagnostic program. It takes time and time to identify the failure point with the smallest replaceable unit (function module). It took a lot of work.

【0006】すなわち、従来の計算機システムでは、故
障発生時の警告灯による故障表示がハードウェアモジュ
ールの単位、あるいは計算機システム単位のみであり、
しかも電源が一度OFFになると警告灯が再び点灯され
る保証がなかった。
That is, in the conventional computer system, the failure display by the warning light when a failure occurs is only in the unit of the hardware module or in the unit of the computer system,
Moreover, there was no guarantee that the warning light would turn on again when the power was turned off.

【0007】近年、耐故障性に優れた計算機が開発され
ている。このような計算機はフォールトトレラント計算
機と呼ばれている。フォールトトレラント計算機はハー
ドウェア故障発生時に、その故障を検出し、故障要因を
システムから切り離して、残されたハードウェアで処理
を続けられるようなハードウェア/ソフトウェア構成に
なっている。一部のフォールトトレラント計算機は、主
要ハードウェアモジュールを構成する個々の主要ファン
クションモジュールに対する故障検出機能を備えてい
る。
In recent years, computers having excellent fault tolerance have been developed. Such a computer is called a fault tolerant computer. The fault-tolerant computer has a hardware / software configuration in which when a hardware failure occurs, the failure is detected, the cause of the failure is separated from the system, and the remaining hardware can continue the processing. Some fault tolerant computers have a fault detection function for each of the main function modules that make up the main hardware module.

【0008】フォールトトレラント計算機は、一般的に
ハードウェアに冗長性があり、一部のハードウェアモジ
ュールに故障が発生した場合に、冗長ハードウェアモジ
ュールが故障を起こしたモジュールの処理を引き継ぐ。
A fault-tolerant computer generally has hardware redundancy, and when a failure occurs in a part of the hardware modules, the redundant hardware module takes over the processing of the failed module.

【0009】このため、故障発生後にそのモジュールに
関する冗長性が損なわれる場合があり、故障後なるべく
早い時点で故障したモジュールを正常なものと交換する
必要がある。
Therefore, the redundancy of the module may be lost after the failure occurs, and it is necessary to replace the failed module with a normal one as soon as possible after the failure.

【0010】従って、交換すべき構成要素を正確かつな
るべく小さな交換単位で識別する必要がある。さらに、
故障したモジュールが全てシステムから取り除かれたこ
とを容易に確認できる必要がある。また、故障したハー
ドウェアモジュールを持ち帰って調査する際にも、故障
したファンクションモジュールが容易に識別できること
が大切である。
Therefore, it is necessary to identify the components to be replaced accurately and in the smallest possible replacement unit. further,
It should be possible to easily verify that all failed modules have been removed from the system. In addition, it is important that the malfunctioning function module can be easily identified when the malfunctioning hardware module is brought back for investigation.

【0011】しかしながら従来の計算機システムでは、
システムログや異常検出時のコンソール画面の出力メッ
セージのハードコピーの情報、及び異常検出時のみ点灯
するハードウェアモジュール単位の異常警告灯しかな
く、一度電源をOFFにすると、再び故障が発生するま
で異常警告灯は点灯しないため、結局システムログやコ
ンソール画面の出力メッセージで異常を確認して交換す
べき構成要素を判断していた。
However, in the conventional computer system,
There is only the system log and hard copy information of the output message on the console screen when an error is detected, and there is an error warning light for each hardware module that lights up only when an error is detected. Since the warning light does not turn on, the system log and the output message on the console screen were used to check for abnormalities and determine which component to replace.

【0012】このため、故障したモジュールの発見に時
間と手間がかかり、かつ複数の故障モジュールがある場
合には交換し忘れが生じる可能性があった。また、故障
したハードウェアモジュールの持ち帰り後の単体検査に
おいて、故障が再現しにくい場合には、故障箇所を交換
可能な最小単位であるファンクションモジュールレベル
での故障の原因追求が困難である場合があった。
Therefore, it takes time and effort to find a defective module, and if there are a plurality of defective modules, it may be forgotten to replace them. In addition, if it is difficult to reproduce the failure in a single inspection after taking out the failed hardware module, it may be difficult to find the cause of the failure at the function module level, which is the smallest unit that can replace the failed part. It was

【0013】[0013]

【発明が解決しようとする課題】このように従来の計算
機システムでは、計算機システムあるいはハードウェア
モジュールに対して異常警告灯が設けられているもの
の、故障発生時に警告灯による故障表示がされても、電
源が一度OFFにされると警告灯が再び点灯される保証
がなく、また故障箇所を交換可能な最小単位であるファ
ンクションモジュールレベルでの原因追求が困難であっ
た。
As described above, in the conventional computer system, although the computer system or the hardware module is provided with the abnormality warning light, even when the failure is indicated by the warning light when a failure occurs, There is no guarantee that the warning light will be turned on again when the power is turned off once, and it has been difficult to find the cause at the function module level, which is the smallest unit that can replace the failure point.

【0014】本発明は前記のような事情を考慮してなさ
れたもので、主要ファンクションモジュールレベルで故
障箇所を容易に判断できる計算機システムを提供するこ
とを目的とする。
The present invention has been made in consideration of the above circumstances, and it is an object of the present invention to provide a computer system capable of easily determining a failure location at a main function module level.

【0015】[0015]

【課題を解決するための手段】上記目的を達成するため
に本発明は、複数のファンクションモジュールが設けら
れた複数のハードウェアモジュールを有し、システムに
故障が発生した際に前記ファンクションモジュールレベ
ルで故障発生箇所を検出する検出手段を有する計算機シ
ステムにおいて、前記各ハードウェアモジュールの前記
各ファンクションモジュールにそれぞれ対応する不揮発
性レジスタと、前記各ハードウェアモジュールの前記各
ファンクションモジュールのそれぞれの近傍に設けら
れ、前記不揮発性レジスタに所定の値を設定することに
より点灯する第1の発光デバイスと、前記検出手段によ
り検出された故障が発生したファンクションモジュール
に対応する不揮発性レジスタへ所定の値を設定し、故障
が発生したファンクションモジュールに対応する前記第
1の発光デバイスを点灯させる制御手段とを具備したこ
とを特徴とする。
To achieve the above object, the present invention has a plurality of hardware modules provided with a plurality of function modules, and at the function module level when a system failure occurs. In a computer system having a detection means for detecting a failure occurrence point, a nonvolatile register corresponding to each of the function modules of each of the hardware modules, and provided in the vicinity of each of the function modules of each of the hardware modules A first light emitting device which is turned on by setting a predetermined value in the non-volatile register, and a predetermined value is set in the non-volatile register corresponding to the function module in which the failure detected by the detection means has occurred, Funk with a failure Characterized by comprising a control means for lighting the first light emitting device corresponding to ® emission module.

【0016】また、前記ハードウェアモジュール毎に対
応する第2の発光デバイスを各ハードウェアモジュール
毎に設け、ハードウェアモジュールを構成するファンク
ションモジュールに対応する前記第1の発光デバイスが
1つでも点灯していれば、そのハードウェアモジュール
に対応する前記第2の発光デバイスを点灯させることを
特徴とする。
A second light emitting device corresponding to each of the hardware modules is provided for each hardware module, and even one of the first light emitting devices corresponding to the function module constituting the hardware module is turned on. If so, the second light emitting device corresponding to the hardware module is turned on.

【0017】また、システム全体に対応する第3の発光
デバイスを設け、前記ハードウェアモジュールに対応す
る前記第2の発光デバイスが1つでも点灯していれば、
前記第3の発光デバイスを点灯させることを特徴とす
る。
Further, if a third light emitting device corresponding to the entire system is provided and at least one of the second light emitting devices corresponding to the hardware module is turned on,
The third light emitting device is turned on.

【0018】[0018]

【作用】このような構成によれば、故障が発生するとシ
ステムにより故障診断が行なわれて、故障原因のデバイ
スに対応する不揮発性レジスタをセットして、対応する
発光デバイスを点灯する。
According to this structure, when a failure occurs, the system performs failure diagnosis, sets the nonvolatile register corresponding to the device causing the failure, and turns on the corresponding light emitting device.

【0019】この結果、一目見るだけで容易に主要ファ
ンクションモジュールレベルで故障発生箇所が判断で
き、かつ一度電源をOFFにした後に、再び電源投入し
ても故障を示す発光デバイスが点灯するので、電源再投
入ですぐに故障が再発しなくとも故障原因となったハー
ドウェアモジュール/ファンクションモジュールの確認
を容易に行なうことができる。
As a result, the location of the failure can be easily determined at the level of the main function module at a glance, and even if the power is turned off once and then the power is turned on again, the light emitting device indicating the failure lights up. Even if the failure does not reoccur immediately after the power is turned on again, the hardware module / function module that caused the failure can be easily confirmed.

【0020】さらに、故障が発生したハードウェアモジ
ュールを計算機システムから外して故障原因を特定する
持ち帰りテスト時など、ハードウェアモジュール単位で
電源投入しても同様に発光デバイスが点灯するので、故
障箇所が判断でき、故障したチップモジュール(ファン
クションモジュール)の判定が容易である。
Further, even when the hardware module in which the failure has occurred is removed from the computer system and the cause of the failure is specified, such as a take-out test, the light emitting device is turned on even when the power is turned on for each hardware module. It is possible to judge, and it is easy to judge the defective chip module (function module).

【0021】また、ハードウェアモジュールに対応する
発光デバイスは、そのハードウェアモジュール中に故障
原因のファンクションモジュールが存在する限り(例え
ば故障が再発しなくとも)点灯し、かつ計算機システム
に発光デバイスが点灯しているハードウェアモジュール
が1つでも存在する限りシステム全体に対応する発光デ
バイスが点灯する。
The light emitting device corresponding to the hardware module is turned on as long as the function module causing the failure exists in the hardware module (for example, even if the failure does not reoccur), and the light emitting device is turned on in the computer system. As long as there is even one hardware module running, the light emitting device corresponding to the entire system lights up.

【0022】このため、故障したハードウェアモジュー
ルを全て交換しなければシステムに対応する発光デバイ
スは消灯しない。すなわち、計算機システム全体に対応
する発光デバイスにより全ての故障ハードウェアモジュ
ールを交換し終ったことを確認できる。
Therefore, the light emitting device corresponding to the system will not be turned off unless all the defective hardware modules are replaced. That is, it can be confirmed that all the defective hardware modules have been replaced by the light emitting devices corresponding to the entire computer system.

【0023】[0023]

【実施例】以下、図面を参照して本発明の一実施例を説
明する。図1は本実施例に係わる計算機システムを構成
するボード(ハードウェアモジュール)101の1つを
示している。計算機システムは、図1に示すボード10
1が、計算機本体に複数収納されて構成される(後述す
る図2参照)。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 shows one of the boards (hardware modules) 101 constituting the computer system according to this embodiment. The computer system is a board 10 shown in FIG.
1 is stored in the computer main body in a plurality (see FIG. 2 described later).

【0024】計算機システムは、故障が発生した際、図
1に示したボード単位でハードウェアモジュールを交換
するものとする。また、計算機システムは、故障検出/
故障箇所発見のための手段を有しており、各ボードの主
要ファンクションモジュールの単位で故障箇所を探し出
すことができるものとする。ここでは、故障検出のため
の手段はハードウェアで構成され、故障箇所を発見する
ための手段はソフトウェアによって構成されているもの
として説明する。
In the computer system, when a failure occurs, the hardware module is replaced on a board basis as shown in FIG. In addition, the computer system is
It shall have means for finding a failure point and shall be able to find the failure point in units of the main function module of each board. Here, description will be made assuming that the means for detecting a failure is configured by hardware and the means for discovering a failure location is configured by software.

【0025】図1に示すように、ボード101には、複
数のファンクションモジュール102〜111が実装さ
れている。ファンクションモジュール102〜111
は、故障発生時には、故障検出/故障箇所発見の手段に
より、何れのファンクションモジュールに問題が発生し
たか判定することが可能である。
As shown in FIG. 1, a board 101 is mounted with a plurality of function modules 102 to 111. Function modules 102-111
When a failure occurs, it is possible to determine in which function module the problem has occurred by means of failure detection / failure location finding.

【0026】また、各ファンクションモジュール102
〜111の近傍には、発光デバイスとして、LED11
2〜121が備え付けられている。図1中には図示され
ていないが、LED112〜121のそれぞれに対応す
る不揮発性の故障履歴レジスタが、ボード101上にフ
ァンクションモジュール102〜111の個数分(=L
ED112〜121の個数分)用意されている。なお、
ここで「不揮発性なレジスタ」とは、電源供給の断絶を
経ても(電源がOFFとなっても)レジスタ内のデータ
が保存されることを意味する。
Further, each function module 102
LED111 as a light emitting device near
2 to 121 are provided. Although not shown in FIG. 1, nonvolatile failure history registers corresponding to the LEDs 112 to 121 are provided on the board 101 by the number of function modules 102 to 111 (= L).
EDs 112 to 121 are prepared). In addition,
Here, the “non-volatile register” means that the data in the register is saved even after the power supply is cut off (even when the power is turned off).

【0027】また、ボード101の前面には、ボード故
障履歴警告灯122が実装されている。ボード故障履歴
警告灯122は、ファンクションモジュール102〜1
11に設けられたLED112〜121が、何れか1つ
でも点灯している時に点灯されるようになっている。
A board failure history warning lamp 122 is mounted on the front surface of the board 101. The board failure history warning light 122 includes the function modules 102 to 1
The LEDs 112 to 121 provided in 11 are turned on when any one of them is turned on.

【0028】また、ボード101の後面には、ボード1
01を計算機本体のシステムバスに接続するためのバス
コネクタ123〜125が設けられている。次に、ソフ
トウェア(故障箇所発見の手段)から見た故障履歴レジ
スタのアドレスを図2に示している。各ファンクション
モジュールに対応するレジスタの大きさには4バイトで
あり、最上位ビット(MSB)に“1”をセットするこ
とにより、その故障履歴レジスタに対応する(ファンク
ションモジュールの)LEDが点灯する様になってい
る。
On the rear surface of the board 101, the board 1
Bus connectors 123 to 125 for connecting 01 to the system bus of the computer main body are provided. Next, FIG. 2 shows the addresses of the failure history registers as seen from the software (means for finding failure points). The size of the register corresponding to each function module is 4 bytes. By setting the most significant bit (MSB) to "1", the LED (of the function module) corresponding to the failure history register lights up. It has become.

【0029】ここでは、16進数の1000番地(シス
テム全体のアドレス)から、ボード101の故障履歴レ
ジスタのアドレスが始まっているものとしている。図2
に示すように、ファンクションモジュール102(LE
D112)から順に、アドレス“1000”から並んで
いる各故障履歴レジスタに対応している。各故障履歴レ
ジスタは、プロセッサから、それぞれのアドレスでアク
セスすることができる。
Here, it is assumed that the address of the failure history register of the board 101 starts from the hexadecimal address 1000 (address of the entire system). Figure 2
As shown in, the function module 102 (LE
It corresponds to each failure history register arranged from the address “1000” in order from D112). Each fault history register can be accessed by the processor at its respective address.

【0030】図3は計算機システム本体201の外観図
(正面からみた図)を示している。図3に示す計算機本
体201は、6枚のボード202〜207から構成され
ている。各ボード202〜207は、図1に示すボード
101と同様の構成となっているものとする。
FIG. 3 shows an external view (view from the front) of the computer system main body 201. The computer main body 201 shown in FIG. 3 is composed of six boards 202 to 207. Each of the boards 202 to 207 has the same configuration as the board 101 shown in FIG.

【0031】各ボード202〜207の前面には、図1
で説明したように、ボード故障履歴警告灯208〜21
3が設けられている。計算機本体201のコントロール
パネル214には、システム故障履歴警告灯215が設
けられている。
The front of each board 202-207 is shown in FIG.
As described above, the board failure history warning lights 208 to 21
3 is provided. A system failure history warning light 215 is provided on the control panel 214 of the computer main body 201.

【0032】システム故障履歴警告灯215は、各ボー
ド202〜207の何れか1つのボード故障履歴警告灯
208〜213が点灯している時に点灯するようになっ
ている。
The system failure history warning light 215 is lit when any one of the boards 202 to 207 board failure history warning lights 208 to 213 is lit.

【0033】次に、本実施例の動作について、図4に示
すフローチャートを参照しながら説明する。図4に計算
機システムにおいて故障が発生した際の、故障表示のた
めの処理の手順を示している。本実施例の計算機システ
ムでは、ハードウェアが故障検出を行ない、ソフトウェ
アによって故障箇所を発見するものとして説明する。
Next, the operation of this embodiment will be described with reference to the flow chart shown in FIG. FIG. 4 shows a procedure of processing for displaying a failure when a failure occurs in the computer system. In the computer system of this embodiment, it is assumed that the hardware detects the failure and the software finds the failure location.

【0034】まず、計算機システムのプロセッサは、ハ
ードウェア(故障検出の手段)から故障発生を通知され
ると(ステップS301)、診断プログラム(故障箇所
発見の手段)を実行してシステム全体の診断を始める
(ステップS302)。
First, when the processor of the computer system is notified of the failure occurrence by the hardware (failure detection means) (step S301), it executes the diagnostic program (failure location finding means) to diagnose the entire system. Start (step S302).

【0035】その結果、ファンクションモジュールレベ
ルで故障箇所(複数箇所の場合もあある)を判定するこ
とができる(ステップS303)。プロセッサは、故障
と判定されたファンクションモジュールに対応する故障
履歴レジスタの最上位ビット(MSB)を“1”にする
(ステップS304)。
As a result, it is possible to determine the failure location (there may be multiple locations) at the function module level (step S303). The processor sets the most significant bit (MSB) of the failure history register corresponding to the function module determined to have a failure to "1" (step S304).

【0036】その後、故障したファンクションモジュー
ルを含むボードをシステムからソフトウェア的に切り離
して(ステップS305)、残されたボードで通常処理
を再開し(ステップS306)、故障発生時の処理を終
了する(ステップS307)。
After that, the board including the failed function module is separated from the system by software (step S305), the normal processing is restarted on the remaining boards (step S306), and the processing when the failure occurs is ended (step S305). S307).

【0037】こうして本実施例の計算機システムでは、
実際に故障が発生すると、故障と判定したファンクショ
ンモジュールに対応する故障履歴レジスタの最上位ビッ
トがセットされる。
Thus, in the computer system of this embodiment,
When a failure actually occurs, the most significant bit of the failure history register corresponding to the function module determined as the failure is set.

【0038】この結果、故障したファンクションモジュ
ールの近傍のLEDが点灯すると共に、故障したファン
クションモジュールを含むボードのボード故障履歴警告
灯が点灯し、かつシステム故障履歴警告灯215も点灯
する。
As a result, the LED near the failed function module is turned on, the board failure history warning lamp of the board including the failed function module is turned on, and the system failure history warning lamp 215 is also turned on.

【0039】従来と同様に、システム故障履歴警告灯2
15を参照することにより、ユーザは故障発生を知り、
故障が発生した問題のボードを識別することができる。
さらに、本発明では故障したボード上の故障したファン
クションモジュールを識別することも可能である。
As in the conventional case, the system failure history warning lamp 2
By referring to 15, the user knows that a failure has occurred,
The offending board in which the failure occurred can be identified.
In addition, the present invention can identify a failed function module on a failed board.

【0040】故障が発生したボードを交換する際には、
問題のボードを全て交換して始めてシステム故障履歴警
告灯215が消えるので、確実に故障したボードを全て
交換したことが確認できる。
When replacing a board in which a failure has occurred,
The system failure history warning light 215 goes out only after all the problem boards have been replaced, so that it can be confirmed that all the failed boards have been replaced.

【0041】また、一時的な故障であっても、故障履歴
レジスタに故障が発生したことを示す値が残っているの
で、電源を再投入すれば、例えすぐに故障が再発しなく
とも、故障を起こしたボード及びファンクションモジュ
ールを判定することができる。
Further, even if it is a temporary failure, a value indicating that a failure has occurred remains in the failure history register. Therefore, if the power is turned on again, the failure will not occur immediately even if the failure does not occur again. It is possible to determine the board and function module that caused the error.

【0042】このため、故障したボード単体でも故障し
たファンクションモジュールを判定することが可能であ
り、メンテナンス作業時の効率が改善される。なお、本
実施例において図4のステップS302〜S304はソ
フトウェアで処理を行なうものとして説明したが、ハー
ドウェアでこれらの処理を行なっても何ら問題ない。
For this reason, it is possible to determine the failed function module even with the failed board alone, and the efficiency of maintenance work is improved. In the present embodiment, steps S302 to S304 in FIG. 4 have been described as being performed by software, but there is no problem if these processes are performed by hardware.

【0043】このようにして、各ボード202〜207
の各ファンクションモジュール毎に対応する不揮発性レ
ジスタを設け、故障が発生した場合に、故障ファンクシ
ョンモジュールに対応する不揮発性レジスタに値を設定
することにより、各ファンクションモジュールの近傍に
設けられた発光デバイスを点灯させることができる。
In this way, each board 202-207 is
A non-volatile register corresponding to each function module is provided, and when a failure occurs, a value is set in the non-volatile register corresponding to the failed function module so that the light-emitting device provided near each function module can be installed. Can be turned on.

【0044】これにより、一目見るだけでファンクショ
ンモジュール単位で故障発生箇所が容易に判断できる。
また、不揮発性レジスタに値がセットされているので、
一度電源OFFにした後に、再び電源投入しても故障を
示す発光デバイスが点灯し、電源再投入後すぐに故障が
再発しなくとも故障原因となったハードウェアモジュー
ル/ファンクションモジュールの確認が容易となる。
This makes it possible to easily determine the location of a failure in function module units at a glance.
Also, since the value is set in the non-volatile register,
Even if the power is turned off and then turned on again, the light-emitting device that indicates a failure lights up, and even if the failure does not recur immediately after the power is turned on again, it is easy to check the hardware module / function module that caused the failure. Become.

【0045】さらに、持ち帰りテスト時など、ハードウ
ェアモジュール単位で電源投入しても同様に発光デバイ
スが点灯するので、モジュール単体の試験でもモジュー
ルの故障箇所が判断でき、故障したファンクションモジ
ュールの判定が容易となるものである。
Further, even when the power is turned on in units of hardware modules, such as during a take-out test, the light emitting device is also turned on, so that the failure location of the module can be determined even in the test of the module alone, and the determination of the failed function module is easy. It will be.

【0046】[0046]

【発明の効果】以上詳述したように本発明によれば、主
要ファンクションモジュールレベルで故障箇所を容易に
判断できるようになるものである。
As described above in detail, according to the present invention, it becomes possible to easily determine the failure location at the main function module level.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例に係わる計算機システムを構
成するボード(ハードウェアモジュール)の外観構成を
示す図。
FIG. 1 is a diagram showing an external configuration of a board (hardware module) that constitutes a computer system according to an embodiment of the present invention.

【図2】本実施例における故障履歴レジスタのアドレス
マップを示す図。
FIG. 2 is a diagram showing an address map of a failure history register in this embodiment.

【図3】本発明による計算機本体の外観構成(正面)を
示す図。
FIG. 3 is a diagram showing an external configuration (front) of a computer main body according to the present invention.

【図4】本実施例における故障発生時の処理手順を示す
フローチャート。
FIG. 4 is a flowchart showing a processing procedure when a failure occurs in this embodiment.

【符号の説明】[Explanation of symbols]

101,202〜207…ボード、102〜111…フ
ァンクションモジュール、112〜121…LED、2
01…計算機本体、122,208〜213…ボード故
障履歴警告灯、214…コントロールパネル、215…
システム故障履歴警告灯。
101, 202-207 ... Board, 102-111 ... Function module, 112-121 ... LED, 2
01 ... Computer main body, 122, 208 to 213 ... Board failure history warning light, 214 ... Control panel, 215 ...
System failure history warning light.

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 複数のファンクションモジュールが設け
られた複数のハードウェアモジュールを有し、システム
に故障が発生した際に前記ファンクションモジュールレ
ベルで故障発生箇所を検出する検出手段を有する計算機
システムにおいて、 前記各ハードウェアモジュールの前記各ファンクション
モジュールにそれぞれ対応する不揮発性レジスタと、 前記各ハードウェアモジュールの前記各ファンクション
モジュールのそれぞれの近傍に設けられ、前記不揮発性
レジスタに所定の値を設定することにより点灯する第1
の発光デバイスと、 前記検出手段により検出された故障が発生したファンク
ションモジュールに対応する不揮発性レジスタへ所定の
値を設定し、故障が発生したファンクションモジュール
に対応する前記第1の発光デバイスを点灯させる制御手
段と、 を具備したことを特徴とする計算機システムの故障表示
方式。
1. A computer system having a plurality of hardware modules provided with a plurality of function modules, and having a detection means for detecting a failure occurrence location at the function module level when a failure occurs in the system, Non-volatile registers respectively corresponding to the respective function modules of the respective hardware modules, and lighted by setting a predetermined value in the non-volatile registers provided in the vicinity of the respective function modules of the respective hardware modules. First to do
And a non-volatile register corresponding to the malfunctioning function module detected by the detecting means are set to a predetermined value, and the first light emitting device corresponding to the malfunctioning function module is turned on. A failure display method for a computer system, comprising: a control means.
【請求項2】 前記ハードウェアモジュール毎に対応す
る第2の発光デバイスを各ハードウェアモジュール毎に
設け、ハードウェアモジュールを構成するファンクショ
ンモジュールに対応する前記第1の発光デバイスが1つ
でも点灯していれば、そのハードウェアモジュールに対
応する前記第2の発光デバイスを点灯させることを特徴
とする請求項1記載の計算機システムの故障表示方式。
2. A second light emitting device corresponding to each of the hardware modules is provided for each hardware module, and even one of the first light emitting devices corresponding to a function module constituting the hardware module is turned on. If it is, the failure display method of the computer system according to claim 1, wherein the second light emitting device corresponding to the hardware module is turned on.
【請求項3】 システム全体に対応する第3の発光デバ
イスを設け、前記ハードウェアモジュールに対応する前
記第2の発光デバイスが1つでも点灯していれば、前記
第3の発光デバイスを点灯させることを特徴とする請求
項2記載の計算機システムの故障表示方式。
3. A third light emitting device corresponding to the entire system is provided, and if any one of the second light emitting devices corresponding to the hardware module is turned on, the third light emitting device is turned on. The fault display method for a computer system according to claim 2, wherein
JP6105646A 1994-05-19 1994-05-19 Display fault system in computer system Pending JPH07311697A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6105646A JPH07311697A (en) 1994-05-19 1994-05-19 Display fault system in computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6105646A JPH07311697A (en) 1994-05-19 1994-05-19 Display fault system in computer system

Publications (1)

Publication Number Publication Date
JPH07311697A true JPH07311697A (en) 1995-11-28

Family

ID=14413225

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6105646A Pending JPH07311697A (en) 1994-05-19 1994-05-19 Display fault system in computer system

Country Status (1)

Country Link
JP (1) JPH07311697A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007519997A (en) * 2003-12-31 2007-07-19 インテル・コーポレーション PCI / PCI-X Standard Hot Plug Controller (SHPC) Command Status Signaling Method
JP2008084080A (en) * 2006-09-28 2008-04-10 Nec Computertechno Ltd Failure information storage system, service processor, failure information storage method, and program
JP2008299599A (en) * 2007-05-31 2008-12-11 Fujitsu Ltd Information processor, failure report circuit, failure report method, failure report program, and computer-readable storage medium recording this program
JPWO2008120337A1 (en) * 2007-03-28 2010-07-15 富士通株式会社 Host bus adapter management program, host bus adapter management method, host bus adapter management device, and light emitting component management program
JP2011034599A (en) * 2010-11-18 2011-02-17 Fujitsu Ltd Information processor and failure notification method
CN104199755A (en) * 2014-08-25 2014-12-10 广东欧珀移动通信有限公司 Method and system for diagnosing hardware module faults based on indicator lights

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007519997A (en) * 2003-12-31 2007-07-19 インテル・コーポレーション PCI / PCI-X Standard Hot Plug Controller (SHPC) Command Status Signaling Method
JP2008084080A (en) * 2006-09-28 2008-04-10 Nec Computertechno Ltd Failure information storage system, service processor, failure information storage method, and program
JPWO2008120337A1 (en) * 2007-03-28 2010-07-15 富士通株式会社 Host bus adapter management program, host bus adapter management method, host bus adapter management device, and light emitting component management program
US8069278B2 (en) 2007-03-28 2011-11-29 Fujitsu Limited Detecting abnormal host adapter operations via light emissions
JP2008299599A (en) * 2007-05-31 2008-12-11 Fujitsu Ltd Information processor, failure report circuit, failure report method, failure report program, and computer-readable storage medium recording this program
JP4684261B2 (en) * 2007-05-31 2011-05-18 富士通株式会社 Information processing apparatus, failure notification circuit, failure notification method, and failure notification program
JP2011034599A (en) * 2010-11-18 2011-02-17 Fujitsu Ltd Information processor and failure notification method
CN104199755A (en) * 2014-08-25 2014-12-10 广东欧珀移动通信有限公司 Method and system for diagnosing hardware module faults based on indicator lights
CN104199755B (en) * 2014-08-25 2017-08-08 广东欧珀移动通信有限公司 A kind of method and system that hardware module failure is diagnosed based on indicator lamp

Similar Documents

Publication Publication Date Title
US5519832A (en) Method and apparatus for displaying module diagnostic results
US7313717B2 (en) Error management
WO2021169260A1 (en) System board card power supply test method, apparatus and device, and storage medium
US5327435A (en) Method for testing a processor module in a computer system
US6829729B2 (en) Method and system for fault isolation methodology for I/O unrecoverable, uncorrectable error
JPH06342381A (en) Majority decision circuit, control unit, and semiconductor integrated circuit for majority decision
US20060136645A1 (en) System and method of retiring events upon device replacement
JP4523659B2 (en) Failure analysis device
JPH07311697A (en) Display fault system in computer system
JP3986898B2 (en) Memory simulated fault injection device
US11726853B2 (en) Electronic control device
JP3664466B2 (en) Memory check test execution method and storage medium
JP2000181806A (en) Semi-conductor device and method for relieving its fault
JPH0257676B2 (en)
JP2000065692A (en) Failure diagnostic apparatus for memory
KR950012495B1 (en) Memory device diagnosis apparatus and method thereof
JP3953467B2 (en) System for detecting and reporting defects in chips
JPH0793225A (en) Memory check system
JPH0254342A (en) Diagnosing system for logical unit
CN116489001A (en) Switch fault diagnosis and recovery method and device, switch and storage medium
US20040078561A1 (en) System PROM integrity checker
JPS6110215Y2 (en)
JPS59206951A (en) Diagnostic system of circuit for detecting control storage error
CN116126643A (en) Method, device, equipment and readable storage medium for controlling status lamp of hard disk
JPH03273344A (en) Fault tolerant system