JPH09138757A - コンピュータシステムの故障検知方法 - Google Patents
コンピュータシステムの故障検知方法Info
- Publication number
- JPH09138757A JPH09138757A JP7321057A JP32105795A JPH09138757A JP H09138757 A JPH09138757 A JP H09138757A JP 7321057 A JP7321057 A JP 7321057A JP 32105795 A JP32105795 A JP 32105795A JP H09138757 A JPH09138757 A JP H09138757A
- Authority
- JP
- Japan
- Prior art keywords
- cpu
- computer system
- failure
- subsystem
- subsystems
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Multi Processors (AREA)
- Debugging And Monitoring (AREA)
Abstract
向上させるとともに、各CPUを稼動させながら、これ
ら各サブシステムのいずれかが故障したとき、これを検
知する。 【解決手段】 第1〜第3サブシステム2〜4によって
各々、指定された処理を実行させながら、これら第1〜
第3サブシステム2〜4が稼動している最中に、予め設
定された周期で、相互にバウンダリスキャンテスト(I
EEE1148.1で規定されるテスト)を行なわせ
て、第1〜第3サブシステム2〜4が正常に動作してい
るかどうかをチェックさせる。
Description
テムの故障を検知するコンピュータシステムの故障検知
方法に関する。
めの故障検知方法として、従来、CPUの数に応じた種
々の故障検知方法が開発されている。例えば、CPUを
1つ使用しているコンピュータシステムでは、図3に示
す如くシステム100内に設けられているCPU101
によって、メモリなどが正常に動作するかどうかなどの
診断を行なわせ、この診断結果に基づき、CPU101
以外の故障有無を判定する方法、ウォッチドックタイマ
を使用して前記CPU101の出力変化やメモリなどの
応答時間などをチェックし、このチェック内容に基づ
き、CPU101以外の故障有無を判定する方法、ある
いはCPU101によって誤り訂正符号を付加したデー
タをメモリに書き込んだ後、これを読み出し、誤り訂正
符号を用いて正しいデータが再生できるかどうかをチェ
ックし、このチェック結果に基づき、前記CPU101
以外の故障有無を判定する方法などがある。また、CP
Uを2つ使用しているコンピュータシステムでは、図4
に示す如くシステム102を構成する第1サブシステム
103と、第2サブシステム104とに、同一の処理を
行なわせながら、一致検出回路105によって前記第1
サブシステム103の処理結果と、前記第2サブシステ
ム104の処理結果とが一致しているかどうかをチェッ
クし、これらの各処理結果が不一致となったとき、前記
第1サブシステム103または前記第2サブシステム1
04のいずれか一方が故障したと判定する。また、CP
Uを3つ以上、使用しているコンピュータシステムで
は、図5に示す如くシステム106を構成する第1サブ
システム107と、第2サブシステム108と、第3サ
ブシステム103などの各サブシステムに、同一の処理
を行なわせながら、多数決回路110によって前記各サ
ブシステムの処理結果の多数決をとり、この多数決結果
と異なる処理結果を出したサブシステムがあれば、この
サブシステムが故障していると判定する。
た従来のコンピュータシステムの故障検知方法において
は、次に述べるような問題があった。まず、図3に示す
如く、CPU101を1つ使用したシステム100で
は、CPU101以外の部分について、故障の有無を検
知することができるものの、CPU101自身の故障を
検出することができない。このため、CPU101自身
が故障しても、その影響が重大な事故に結び付かない、
比較的小規模で、簡易なコンピュータシステムでしか、
この故障検知方法を採用することができないという問題
があった。また、図4、図5に示す如く、CPU101
を2つあるいは3つ以上、使用したシステム102、1
06では、一致検出回路105や多数決回路110など
の専用回路によって、各サブシステムの処理結果を常
時、チェックし、このチェック結果に基づき、各サブシ
ステムの故障有無を判定するようにしているので、各サ
ブシステム毎に、同一のハードウェアと、同一のソフト
ウェアとを設けなければならない。このため、コンピュ
ータシステムを構成するサブシステムの数を増やして
も、サブシステムが1つの場合と、同一の処理能力しか
持たせることができず、その分だけ、ハードウェアとソ
フトウェアとが冗長になってしまい、原子力関係や銀行
などのように、コストより信頼性を重視する特別な分野
でしか、この故障検知方法を採用することができないと
いう問題があった。本発明は上記の事情に鑑み、CPU
の数の分だけ、処理能力を向上させることができるとと
もに、各CPUを稼動させながら、これら各サブシステ
ムのいずれかが故障したとき、これを検知することがで
きるコンピュータシステムの故障検知方法を提供するこ
とを目的としている。
めに本発明は、複数のCPUを使用するコンピュータシ
ステムに故障が発生したとき、これを検知するコンピュ
ータシステムの故障検知方法において、各CPUを稼動
させながら、周期的に各CPUの1つを選択して、この
CPUで実行されていた通常の処理を中断させるととも
に、このCPUにより、バウンダリスキャンテストを実
行させて、他のコンピュータシステムの動作状態をチェ
ックし、このチェック結果に基づき、コンピュータシス
テムの故障有無を判定することを特徴としている。上記
の構成により、各CPUを稼動させながら、周期的に各
CPUの1つを選択して、このCPUで実行されていた
通常の処理を中断させるとともに、このCPUにより、
バウンダリスキャンテストを実行させて、他のコンピュ
ータシステムの動作状態をチェックし、このチェック結
果に基づき、CPUの故障有無を判定することにより、
コンピュータシステムの数の分だけ、処理能力を向上さ
せるとともに、各CPUを稼動させながら、これら各サ
ブシステムのいずれかが故障したとき、これを検知す
る。
例に基づいて詳細に説明する。図1は本発明によるコン
ピュータシステムの故障検知方法の一形態例を適用した
コンピュータシステムの一例を示すブロック図である。
この図に示すコンピュータシステム1は、各種の処理を
行なう第1〜第3サブシステム2〜4と、これら第1〜
第3サブシステム2〜4を電気的に接続する標準システ
ムバス(例えば、VMEバスやPCIバスなど)5と、
プリント基板製造時の検査工程で実施されたバウンダリ
スキャンテスト時のテストデータを持ち、前記第1〜第
3サブシステム2〜4で実施されるバウンダリスキャン
テストをサポートする専用回路(図示は省略する)とを
備えており、第1〜第3サブシステム2〜4によって各
々、指定された処理を実行させながら、これら第1〜第
3サブシステム2〜4が稼動している最中に、予め設定
された周期で、相互にバウンダリスキャンテスト(IE
EE1149.1で規定されるテスト)を行なわせて、
第1〜第3サブシステム2〜4が正常に動作しているか
どうかをチェックさせる。
〜4は、各々、設定されているソフトウェアに基づき、
各種の処理を行なうCPU6と、このCPU6の動作を
規定するROM(図示は省略する)、前記CPU6の作
業エリアなどとして使用されるRAM(図示は省略す
る)などを備えており、前記ROMなどに格納されてい
るアプリケーションソフトウェアなどに基づいた処理を
行ないながら、予め設定されている周期で、これら第1
〜第3サブシステム2〜4のうちの1つを選択させると
ともに、このサブシステムが行なっていた処理を中断さ
せた後、このサブシステムにより、前記専用回路を動作
させながら、前記標準システムバス5に設けられている
バウンダリスキャンテスト信号線を使用させ、他のサブ
システムのバウンダリスキャンテストを行なわせる。そ
して、このバウンダリスキャンテスト結果に基づき、こ
れら第1〜第3サブシステム2〜4を構成するデバイス
の破損、プリントパターン(デバイス内部のボンディン
グワイヤをも含む)のショート、オープン、CPU6の
故障有無、異常動作などを判定させる。この際、各デバ
イスメーカーがオプションとして、自己診断機能などを
用意しているときには、バウンダリスキャンテストを行
なうとき、このバウンダリスキャンテストとともに、自
己診断機能を行なわせて、さらに効率良くきめ細かな故
障検知を行なわせる。
サブシステム2〜4によって各々、指定された処理を実
行させながら、これら第1〜第3サブシステム2〜4が
稼動している最中に、予め設定された周期で、相互にバ
ウンダリスキャンテスト(IEEE1149.1で規定
されるテスト)を行なわせて、第1〜第3サブシステム
2〜4が正常に動作しているかどうかをチェックさせる
ようにしたので、CPU6の数の分だけ、処理能力を向
上させることができるとともに、各CPU6を稼動させ
ながら、これら第1〜第3サブシステム2〜4のいずれ
かが故障したとき、これを検知させることができる。こ
れによって、図2に示す如く冗長性、応答性、コスト、
検知範囲、システム規模、拡張性の全てにおいて、良好
な結果を得ることができる。
の目的が、プリント基板実装工程でのテストを容易化す
るものであることから、プリント基板製造において今後
急激な採用が見込まれている。つまり、本方式を採用す
るためのハードウェアが、今後、生産されるプリント基
板上に標準装備されるものと思われるとともに、複数の
CPU構成をサポートする標準システムバスとして、採
用が予定されているVMEバスやPCIバスなどでは、
既にバウンダリスキャンテスト信号線用のピン割当が行
われていることから、故障検知プログラムと、テストデ
ータとを用意するだけで、本発明によるコンピュータシ
ステムの故障検知方法を利用することができる。これに
より、これまで、高信頼化に対する経験が少ない中小企
業(システムハウス業などのマイコン関連製品開発企
業)などでも、比較的容易にコンピュータシステムの信
頼性を向上させることができる。
自動運転システムや無人観測機器、医療機器(例えば、
人工呼吸器)など、これまで、大企業が独占していた市
場への中小企業の参入を可能にすることができる。さら
に、PL法の施行により、安全性への取り組みが強く求
められる社会情勢となったが、このような社会情勢への
対処方法としても、有効な手段となり得る。また、本発
明で使用したバウンダリスキャンテストは、国際規格と
して、IEEE1149.1で規定され、広く公開され
ているので、だれでもその資料を入手することができ、
これによってコンピュータシステムの高信頼化の知識に
乏しい中小企業であっても、容易に高信頼化システムを
構築させることができ、付加価値の高い製品開発に取り
組ませることができる。
PUの数の分だけ、処理能力を向上させることができる
とともに、各CPUを稼動させながら、これら各サブシ
ステムのいずれかが故障したとき、これを検知すること
ができる。
方法の一形態例を適用したコンピュータシステムの一例
を示すブロック図である。
来のコンピュータシステムの特性とを比較する表図であ
る。
いるコンピュータシステムの一例を示すブロック図であ
る。
いるコンピュータシステムの一例を示すブロック図であ
る。
ているコンピュータシステムの一例を示すブロック図で
ある。
Claims (1)
- 【請求項1】 複数のCPUを使用するコンピュータシ
ステムに故障が発生したとき、これを検知するコンピュ
ータシステムの故障検知方法において、 各CPUを稼動させながら、周期的に各CPUの1つを
選択して、このCPUで実行されていた通常の処理を中
断させるとともに、このCPUにより、バウンダリスキ
ャンテストを実行させて、他のCPU及びその周辺回路
の動作状態をチェックし、このチェック結果に基づき、
CPU及びその周辺回路の故障有無を判定することを特
徴とするコンピュータシステムの故障検知方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32105795A JP3326546B2 (ja) | 1995-11-15 | 1995-11-15 | コンピュータシステムの故障検知方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32105795A JP3326546B2 (ja) | 1995-11-15 | 1995-11-15 | コンピュータシステムの故障検知方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09138757A true JPH09138757A (ja) | 1997-05-27 |
JP3326546B2 JP3326546B2 (ja) | 2002-09-24 |
Family
ID=18128326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP32105795A Expired - Lifetime JP3326546B2 (ja) | 1995-11-15 | 1995-11-15 | コンピュータシステムの故障検知方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3326546B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9797945B2 (en) | 2013-02-28 | 2017-10-24 | Renesas Electronics Corporation | Semiconductor device having circuitry for detecting abnormalities in a power supply wiring network |
-
1995
- 1995-11-15 JP JP32105795A patent/JP3326546B2/ja not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9797945B2 (en) | 2013-02-28 | 2017-10-24 | Renesas Electronics Corporation | Semiconductor device having circuitry for detecting abnormalities in a power supply wiring network |
US10067182B2 (en) | 2013-02-28 | 2018-09-04 | Renesas Electronics Corporation | Semiconductor device having circuitry for detecting abnormalities in a power supply wiring network |
Also Published As
Publication number | Publication date |
---|---|
JP3326546B2 (ja) | 2002-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111414268A (zh) | 故障处理方法、装置及服务器 | |
CN110955571A (zh) | 面向车规级芯片功能安全的故障管理系统 | |
JP3326546B2 (ja) | コンピュータシステムの故障検知方法 | |
CN209343321U (zh) | 一种计算机故障检测装置 | |
CN111865719A (zh) | 一种交换机故障注入自动化测试方法和装置 | |
US6654349B1 (en) | Real time automated checking mechanism for a bus protocol on an integrated bus system | |
JPH0695731A (ja) | 障害要因診断方式 | |
JPH04245309A (ja) | 制御用ディジタルコントローラ | |
JPS5911452A (ja) | パリテイチエツク回路の試験方式 | |
JP3334174B2 (ja) | 障害処理検証装置 | |
JP2826812B2 (ja) | データ処理システム | |
JP2878014B2 (ja) | Ram試験方式 | |
JPS60195649A (ja) | マイクロプログラム制御型デ−タ処理装置におけるエラ−報告方式 | |
JP2000065692A (ja) | メモリの故障診断装置 | |
KR930010950B1 (ko) | 에러위치 및 상태 확인장치 | |
CN118098332A (zh) | 一种固态硬盘故障定位方法、装置、设备及可读存储介质 | |
CN116489001A (zh) | 交换机故障诊断及恢复方法、装置、交换机及存储介质 | |
JPS5916302B2 (ja) | チエツク装置 | |
JP3041340B2 (ja) | 監視制御装置 | |
JPS62182846A (ja) | 電子計算機の自己診断方法 | |
JPH05297901A (ja) | プロセス制御装置 | |
JP2808988B2 (ja) | メモリーic試験システム | |
JPH06103098A (ja) | 情報処理装置 | |
JPH0879281A (ja) | バス故障診断方式 | |
JPH0855040A (ja) | システム運転方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R370 | Written measure of declining of transfer procedure |
Free format text: JAPANESE INTERMEDIATE CODE: R370 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090712 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090712 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100712 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110712 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120712 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120712 Year of fee payment: 10 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120712 Year of fee payment: 10 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130712 Year of fee payment: 11 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |