JP2005078534A - 情報処理装置及びシステム障害監視方法 - Google Patents
情報処理装置及びシステム障害監視方法 Download PDFInfo
- Publication number
- JP2005078534A JP2005078534A JP2003310597A JP2003310597A JP2005078534A JP 2005078534 A JP2005078534 A JP 2005078534A JP 2003310597 A JP2003310597 A JP 2003310597A JP 2003310597 A JP2003310597 A JP 2003310597A JP 2005078534 A JP2005078534 A JP 2005078534A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- occurrence
- information
- buses
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
【課題】 CPU、メモリ及びカスタム化可能な半導体集積回路で発生したシステム障害について速やかに検知することができる情報処理装置を提供する。
【解決手段】 それぞれにCPU2、メモリ3及び周辺装置入出力部5が接続された2以上のバスと、これらのバス間で各デバイスから出力されるアドレスストロ−ブ信号(AS信号)を伝送するバスブリッジ6と、バスブリッジ6を介してバス間で伝送されるAS信号をバスブリッジ6において監視し、このAS信号に基づいてシステム障害の発生を検出する障害検出部7と、障害発生の検出回数を計数するカウンタ10と、障害発生の検出時刻を記憶する障害情報記憶部9と、検出回数に基づいて障害情報11を送信する送信処理部8により構成される。
【選択図】 図1
【解決手段】 それぞれにCPU2、メモリ3及び周辺装置入出力部5が接続された2以上のバスと、これらのバス間で各デバイスから出力されるアドレスストロ−ブ信号(AS信号)を伝送するバスブリッジ6と、バスブリッジ6を介してバス間で伝送されるAS信号をバスブリッジ6において監視し、このAS信号に基づいてシステム障害の発生を検出する障害検出部7と、障害発生の検出回数を計数するカウンタ10と、障害発生の検出時刻を記憶する障害情報記憶部9と、検出回数に基づいて障害情報11を送信する送信処理部8により構成される。
【選択図】 図1
Description
本発明は、情報処理装置及びシステム障害監視方法に係り、さらに詳しくは、プロセッサ、記憶素子、並びに、周辺装置の入出力素子及びバスブリッジを有するカスタム化可能な半導体集積回路からなるCPUボードなどの情報処理装置の改良に関する。
近年、システム機能の大部分をカスタム化可能な半導体集積回路(Application Specific IC)で構成した情報処理装置が広く普及している。この様なカスタムICで構成された情報処理装置において、動作異常などのシステム障害が発生した場合、有効な情報が失われる前に速やかに障害原因を特定するため、障害発生の時刻などの障害情報を情報処理装置外に通知することは重要である。特に、カスタム化可能な半導体集積回路内の周辺装置の入出力素子やバスブリッジで発生した障害についての障害情報を通知することはシステム機能の検証に欠かせない。しかし、この様なシステム障害を検出通知するための簡単で有効な手段がなかった。
従来の情報処理装置においてシステム障害を監視するものとしては、例えば、特許文献1に記載のデジタルシステムがある。このデジタルシステムは、システム内のCPUの動作を監視し、動作異常などの障害が発生すると、バウンダリスキャンによりカスタム化可能な半導体集積回路内のレジスタの内容を読み出すものである。従って、カスタム化可能な半導体集積回路内の周辺装置入出力素子やバスブリッジで発生した障害について検出通知できるものではない。
特開2000−148532号公報
上述した通り、従来の情報処理装置では、情報処理装置を構成するプロセッサ、記憶素子、並びに、周辺装置入出力素子及びバスブリッジを有するカスタム化可能な半導体集積回路において発生したシステム障害を検出通知することができないという問題があった。
本発明は、上記事情に鑑みてなされたものであり、保守性を向上させた情報処理装置及びシステム障害監視方法を提供することを目的としている。特に、カスタム化可能な半導体集積回路内で発生したシステム障害についても速やかに検知することができる情報処理装置を提供することを目的としている。
本発明による情報処理装置は、それぞれにデバイスが接続された2以上のバスと、これらのバス間でデバイスから出力される制御信号を伝送するバス接続制御手段と、上記バス接続制御手段を介して上記バス間で伝送される制御信号をバス接続制御手段において監視し、この制御信号に基づいてシステム障害の発生を検出する障害検出手段と、障害発生の検出結果に基づいて、障害情報を送信する障害情報送信手段により構成される。
この様な構成によれば、バス間で伝送される制御信号をバス接続制御手段において監視することによりシステム障害の発生の検出が行われるので、デバイス間におけるトランザクションに応じて伝送される制御信号を効果的に監視することができる。すなわち、バス接続制御手段において監視するだけでよいので、各デバイスとバス接続制御手段との間でそれぞれ制御信号を監視するのに比べて、各デバイス及びバス接続制御手段において発生したシステム障害を検出するための構成を簡素なものとすることができる。特に、デバイスがプロセッサ、記憶素子及び周辺装置の入出力素子である場合、制御信号としてのアドレスストローブ信号に基づいて障害発生の検出が行われるようにすれば、通常、アドレスストローブ信号は各デバイス及びバス接続制御手段が正常に動作していれば出力される信号なので、障害発生を確実に検出することができる。
本発明による情報処理装置は、上記構成に加え、障害発生の検出回数を計数する計数手段を備え、上記障害検出手段が、アドレスストローブ信号を所定の周期で監視し、信号出力の停止に基づいて障害発生を検出し、上記障害情報送信手段が、上記検出回数に基づいて障害情報を送信するように構成される。この様な構成によれば、信号出力の停止に基づいて障害発生の検出が行われ複雑な信号処理を伴わないので、障害検出手段を簡素な構成とすることができる。また、障害発生の検出回数に基づいて障害情報が送信されるので、検出ごとに送信するのに比べて送信回数を絞り込むことができる。
本発明によるシステム障害監視方法は、それぞれにデバイスが接続された2以上のバス間でデバイスから出力される制御信号を伝送するバス接続制御ステップと、上記バス間で伝送される制御信号をバス間における伝送時に監視し、この制御信号に基づいてシステム障害の発生を検出する障害検出ステップと、障害発生の検出結果に基づいて、障害情報を送信する障害情報送信ステップにより構成される。この様な構成によれば、バス間で伝送される制御信号をバス間における伝送時に監視することによってシステム障害の発生の検出が行われるので、デバイス間で伝送される制御信号を効果的に監視することができる。
本発明による情報処理装置及びシステム障害監視方法によれば、バス間で伝送される制御信号をバス接続制御手段において監視することによりシステム障害の発生の検出が行われるので、簡素な構成でありながら、障害発生を確実に検出することができる。特に、周辺装置の入出力素子及びバス接続制御手段を有するカスタム化可能な半導体集積回路内で発生したシステム障害についても速やかに検知することができるので、システムの保守性を向上させることができる。
実施の形態1.
図1は、本発明の実施の形態1によるCPUボードを含む情報処理システムの一構成例を示したブロック図である。本実施の形態のCPUボード1は、ボード状の情報処理装置であり、ボード内において発生したシステム障害についての障害情報11をパーソナルコンピュータA1に対して送信することができる。パーソナルコンピュータA1では、CPUボード1から通知された障害情報11に基づいてCPUボード1の信頼性などを評価することができる。
図1は、本発明の実施の形態1によるCPUボードを含む情報処理システムの一構成例を示したブロック図である。本実施の形態のCPUボード1は、ボード状の情報処理装置であり、ボード内において発生したシステム障害についての障害情報11をパーソナルコンピュータA1に対して送信することができる。パーソナルコンピュータA1では、CPUボード1から通知された障害情報11に基づいてCPUボード1の信頼性などを評価することができる。
CPUボード1は、各種演算を行う演算用プロセッサであるCPU2と、その演算結果などを記憶する記憶素子であるメモリ3と、カスタム化可能な半導体集積回路の1つであるFPGA4とを備え、このFPGA(Field Programmable Gate Array)4は、複数の周辺装置入出力部5、バスブリッジ6、障害検出部7、送信処理部8、障害情報記憶部9及びカウンタ10からなる。FPGA4は、ユーザ側において多数の論理ゲート間の配線を容易に書き換えられるセミカスタムICである。
周辺装置入出力部5は、キー入力装置、表示装置、磁気記憶装置及び通信装置などの周辺装置A2の入出力を制御する入出力素子である。各種周辺装置A2は、それぞれ周辺装置入出力部5を介してバスブリッジ6に接続される。
バスブリッジ6は、2以上のバス間でデバイスから出力される制御信号を伝送するバス接続制御手段であり、CPU2、メモリ3及び周辺装置入出力部5がそれぞれバスを介して接続されている。このバスブリッジ6では、入出力時の動作速度に差がある場合にデバイス間で整合をとる処理や、プロトコルの変換を伴った接続切替処理が行われる。例えば、高速バスと低速バスとの間で整合をとる接続制御が行われる。
CPU2、メモリ3及び周辺装置入出力部5間におけるデータ伝送の際には、制御信号としてアドレスストローブ(Address Strobe)信号がバスブリッジ6を介して伝送される。アドレスストローブ(AS)信号は、アドレスを取り込むタイミングを指示するタイミング信号であり、通常、CPU2、周辺装置入出力部5及びバスブリッジ6によってトランザクションに同期して出力され、デバイス間で伝送される。例えば、バスブリッジ6がCPU2からのアクセス要求に応じて周辺装置入出力部5に対してAS信号をドライブする。
障害検出部7は、バスブリッジ6を介して伝送されるAS信号に基づいて、システム障害の発生の検出を行っている。障害発生の検出は、AS信号を所定の周期で監視することにより行われ、この監視期間内にAS信号が出力されなかった場合、信号出力が停止したとみなされる。この様なAS信号の出力停止に基づいて、CPU2、メモリ3、周辺装置入出力部5及びバスブリッジ6における動作異常などのシステム障害の発生が検出される。つまり、バスブリッジ6を介して伝送されるAS信号を監視することによって、CPU2、メモリ3、並びに、FPGA4内の周辺装置入出力部5及びバスブリッジ6で発生したシステム障害を効果的に検出することができる。
送信処理部8は、障害情報を記憶させるとともに、システム障害発生の検出回数に基づいて、障害情報の送信を行っている。この障害情報は、障害検出部7によるシステム障害発生の検出結果に基づいて障害情報記憶部9に書き込まれ、例えば、障害発生の検出時刻データ及びカウント数が障害情報として記憶される。また、障害発生の検出回数は、カウンタ(計数手段)10をインクリメントすることにより計数され、この検出回数に基づいて、障害情報11がCPUボード1外のパーソナルコンピュータA1に対して送信される。パーソナルコンピュータA1では、この障害情報11に基づいて、障害発生を速やかに検知することができるとともに、CPUボード1の信頼性などを評価することができる。
ここでは、AS信号がシステム障害によらず偶然に上記監視期間中出力されなかった場合も、システム障害とみなされるので、この様な場合を考慮して、監視期間及び検出回数が定められるものとする。例えば、検出回数が2以上の所定数(例えば、5回)となった時点で障害情報11が送信される。この様にすれば、検出ごとに送信するのに比べて送信回数が低減されるので、パーソナルコンピュータA1での処理負担を削減することができる。また、監視期間を長くすれば誤検出の割合を低減することができると考えられるが、障害発生時刻と検出時刻とのタイムラグが大きくなってしまう。そこで、監視期間を短く設定して障害情報を所定数蓄積することにより、障害発生時刻を高精度で特定することができる。なお、カウンタ10は、CPUボード1の起動と同時にリセットされるものとする。
図2のステップS101〜S108は、図1のCPUボードにおけるシステム障害の監視動作の一例を示したフローチャートである。まず、CPUボード1の起動と同時にカウンタ10がリセットされる(ステップS101,S102)。次に、障害検出部7は、バスブリッジ6を介してCPU2、メモリ3及び周辺装置入出力部5間で伝送されるAS信号を監視し、AS信号が正常に出力されているか否かを判別する(ステップS103,S104)。
このとき、所定の監視期間内にAS信号が出力されれば、トランザクションに応じてCPU2、メモリ3、周辺装置入出力部5及びバスブリッジ6が正常に機能していると判別され、所定の周期でAS信号の監視が続けられる。一方、所定の監視期間内にAS信号が出力されなければ、信号出力が停止したとみなし、CPU2、メモリ3、周辺装置入出力部5及びバスブリッジ6においてシステム障害が発生したと判別される。
送信処理部8は、障害検出部7によりシステム障害が検出されると、障害発生の時刻データ及びカウント数を障害情報11として障害情報記憶部9に記憶させる(ステップS105)。このとき、カウンタ10がインクリメントされ、障害発生の検出回数が記録される(ステップS106)。
この検出回数が5回となるまでは、ステップS103からステップS106の処理手順が繰り返される(ステップS107)。送信処理部8は、検出回数が5回となると、障害情報11をパーソナルコンピュータA1に対して送信する(ステップS108)。
本実施の形態によれば、バスブリッジ6を介して伝送されるAS信号に基づいて、システム障害の発生の検出が行われるので、CPU2、メモリ3及び周辺装置入出力部5間におけるトランザクションに応じて伝送されるAS信号を効果的に監視することができ、CPU2、メモリ3、周辺装置入出力部5及びバスブリッジ6におけるシステム障害の発生を確実に検出することができる。また、障害発生の検出回数に基づいて、障害情報11の送信が行われるので、送信回数を低減することができる。また、障害検出部7、送信処理部8、障害情報記憶部9及びカウンタ10をFPGA4内に設けたので、簡素な構成とすることができる。
なお、本実施の形態では、バスブリッジ6を介して伝送されるAS信号を包括的に監視する場合の例について説明したが、本発明はこれに限られるものではない。すなわち、CPU2、周辺装置入出力部5及びバスブリッジ6が出力するAS信号を個別に監視するようなものであっても良い。この場合、例えば、周辺装置入出力部5がバスブリッジ6に対して出力するAS信号の出力停止から、周辺装置入出力部5における障害発生を検出することができるので、障害発生場所の特定が可能となる。従って、障害情報としてAS信号の生成元データを含めることによって、障害発生場所を特定することができる。
また、本実施の形態では、障害発生の検出回数が所定数となった時点で障害情報11が送信される場合について説明したが、本発明はこれに限られるものではない。例えば、明らかに動作異常と考えられる程度に十分長い一定期間内にAS信号が出力されなかった場合に、カウンタ10のカウント数にはよらずに障害情報が送信されるようなものであっても良い。この様にすれば、速やかにシステム障害の発生を検知することができる。
また、本実施の形態では、AS信号を監視する場合について説明したが、本発明はこれに限られるものではない。例えば、バスブリッジ6がPCIバスを介してデバイスと接続されている場合に、バスブリッジ6を介して伝送されるフレーム信号を監視するようなものであっても良い。この様にしても、トランザクションに応じてドライブされる様子を監視することができ、システム障害の発生を効果的に検知することができる。
また、本実施の形態では、バスブリッジ6にCPU2、メモリ3及び周辺装置入出力部5がそれぞれ接続される場合について説明したが、本発明はこれに限られるものではない。例えば、CPU及びメモリなどが接続される高速バスと、複数の周辺装置入出力部などが接続される低速バスとの間にバスブリッジが設けられるようなものであっても良い。図3は、本発明による情報処理装置の他の構成例を示したブロック図である。この情報処理装置20では、CPU2及びメモリ3が接続された高速バス22と、複数の周辺装置入出力部5が接続された低速バス23との間にバスブリッジ21が設けられ、動作速度が異なるバス間で接続制御が行われる。この様な構成によっても、バスブリッジ21を介して伝送されるAS信号を監視することにより、システム障害の発生を効果的に検出することができる。
1 CPUボード、2 CPU、3 メモリ、4 FPGA、5 周辺装置入出力部、
6,21 バスブリッジ、7 障害検出部、8 送信処理部、9 障害情報記憶部、
10 カウンタ、11 障害情報、20 情報処理装置、22 高速バス、
23 低速バス、A1 パーソナルコンピュータ、A2 周辺装置
6,21 バスブリッジ、7 障害検出部、8 送信処理部、9 障害情報記憶部、
10 カウンタ、11 障害情報、20 情報処理装置、22 高速バス、
23 低速バス、A1 パーソナルコンピュータ、A2 周辺装置
Claims (6)
- それぞれにデバイスが接続された2以上のバスと、
これらのバス間でデバイスから出力される制御信号を伝送するバス接続制御手段と、
上記バス接続制御手段を介して上記バス間で伝送される制御信号をバス接続制御手段において監視し、この制御信号に基づいてシステム障害の発生を検出する障害検出手段と、
障害発生の検出結果に基づいて、障害情報を送信する障害情報送信手段とを備えたことを特徴とする情報処理装置。 - 上記デバイスがプロセッサ、記憶素子及び周辺装置入出力素子であり、
上記バス接続制御手段は、これらのデバイスについてバス間の接続を制御し、
上記障害検出手段は、制御信号としてのアドレスストローブ信号に基づいて、障害発生を検出することを特徴とする請求項1に記載の情報処理装置。 - 障害発生の検出回数を計数する計数手段を備え、
上記障害検出手段は、アドレスストローブ信号を所定の周期で監視し、信号出力の停止に基づいて障害発生を検出し、
上記障害情報送信手段は、上記検出回数に基づいて障害情報を送信することを特徴とする請求項2に記載の情報処理装置。 - 上記障害検出手段、障害情報送信手段及び計数手段が、上記周辺装置入出力素子及びバス接続制御手段を有するカスタム化可能な半導体集積回路内に設けられることを特徴とする請求項3に記載の情報処理装置。
- 障害発生の検出時刻を記憶する障害情報記憶手段を備え、
上記障害情報送信手段は、障害情報として上記検出時刻を送信することを特徴とする請求項1に記載の情報処理装置。 - それぞれにデバイスが接続された2以上のバス間でデバイスから出力される制御信号を伝送するバス接続制御ステップと、
上記バス間で伝送される制御信号をバス間における伝送時に監視し、この制御信号に基づいてシステム障害の発生を検出する障害検出ステップと、
障害発生の検出結果に基づいて、障害情報を送信する障害情報送信ステップとを備えたことを特徴とするシステム障害監視方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003310597A JP2005078534A (ja) | 2003-09-02 | 2003-09-02 | 情報処理装置及びシステム障害監視方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003310597A JP2005078534A (ja) | 2003-09-02 | 2003-09-02 | 情報処理装置及びシステム障害監視方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005078534A true JP2005078534A (ja) | 2005-03-24 |
Family
ID=34412425
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003310597A Pending JP2005078534A (ja) | 2003-09-02 | 2003-09-02 | 情報処理装置及びシステム障害監視方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005078534A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5494808B2 (ja) * | 2010-08-11 | 2014-05-21 | 富士通株式会社 | 集積回路,障害情報処理方法および障害情報収集装置 |
JP2014123499A (ja) * | 2012-12-21 | 2014-07-03 | Hitachi High-Technologies Corp | 演算装置及び荷電粒子線応用装置 |
-
2003
- 2003-09-02 JP JP2003310597A patent/JP2005078534A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5494808B2 (ja) * | 2010-08-11 | 2014-05-21 | 富士通株式会社 | 集積回路,障害情報処理方法および障害情報収集装置 |
JP2014123499A (ja) * | 2012-12-21 | 2014-07-03 | Hitachi High-Technologies Corp | 演算装置及び荷電粒子線応用装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20060106578A1 (en) | Machine management device, communication line diagnosis device and machine management method | |
JP4291384B2 (ja) | 数値制御装置に接続されたioユニットの断線と電源断の検出方法 | |
JP2007135190A (ja) | シングルイベント機能割込み検出システム | |
JPH10269100A (ja) | ボード配線故障検出装置 | |
JP2011145208A (ja) | 基板 | |
JP2005078534A (ja) | 情報処理装置及びシステム障害監視方法 | |
CN111522757A (zh) | 一种基于i2c总线的中断读取与清除的控制方法 | |
CN115699124A (zh) | 基于硬件的传感器分析 | |
JP6133614B2 (ja) | 障害ログ採取装置、障害ログ採取方法、及び、障害ログ採取プログラム | |
JP4432354B2 (ja) | ウオッチドッグタイマ回路の状態監視方式 | |
JP2692576B2 (ja) | 複数クロックパルス監視装置 | |
JP6453633B2 (ja) | 自動販売機 | |
JP2006209524A (ja) | カウンタを備える診断装置 | |
JP2000276260A (ja) | リモートリセット方式 | |
JP2004185318A (ja) | Cpuシステムの障害監視装置 | |
KR200379385Y1 (ko) | 전자보드의 신호검출 및 에러 통보 장치 | |
JP4419892B2 (ja) | 電子機器 | |
JP2001043104A (ja) | コンピュータシステムのバス監視装置 | |
JP2004094695A (ja) | ハードウェア保護制御回路 | |
JPH087185A (ja) | アラーム監視回路 | |
JPS58221533A (ja) | 遠方監視制御方式 | |
JP2019040336A (ja) | バス接続装置及びバス接続方法 | |
JP2004013394A (ja) | 診断装置 | |
JPH0283646A (ja) | メモリエラー監視回路 | |
JPH1011324A (ja) | 信号送出回路 |