WO2007099578A1

WO2007099578A1 - 故障解析装置

Info

Publication number: WO2007099578A1
Application number: PCT/JP2006/303553
Authority: WO
Inventors: Masato Nakagawa
Original assignee: Fujitsu Limited
Priority date: 2006-02-27
Filing date: 2006-02-27
Publication date: 2007-09-07
Also published as: JP4523659B2; US20090006896A1; EP1990722A4; EP1990722B1; US8166337B2; EP1990722A1; JPWO2007099578A1

Abstract

　論理回路の実装されるボード番号及びボード上搭載位置に対応付けて、その論理回路から収集するログ情報について、そのログ情報が発生するときに処理すべき情報と、そのログ情報が有効なものとなる条件の情報と、そのログ情報が無効なものとなる条件の情報とについて記述する解析情報を定義して、この解析情報を使って、論理回路を単位として故障解析を行うようにする。そして、この解析情報がさらにログ情報の優先度の情報を記述するようにすることで、この論理回路を単位とする故障解析の実現にあたって、重大な故障を漏れのない形で解析することを実現する。

Description

明細書

故障解析装置

技術分野

[0001] 本発明は、複数の論理回路を搭載する複数のボードを具備する情報処理装置に実装されて、それらの論理回路にどのような故障が発生したのかを解析する故障解析装置に関し、特に、メモリ資源の削減、処理の高速ィ匕および開発工数の削減を実現するとともに、重大な故障を漏れなく解析することを実現し、さらに、解析不可能範囲を小さくすることを実現する故障解析装置に関する。

[0002] 今日、高密度に集積化され複雑化した ASIC (Application Specific Integrated Circ uit：特定用途向け IC)などのような LSIを搭載する情報処理装置においては、停止時間や復旧時間の削減のために、 LSIに故障が発生するときに、その正確な故障箇所を自律的に速やかに判定するとともに、その影響範囲を自律的に速やかに判定する故障解析機能の実現が強く求められている。

[0003] LSIの集積ィ匕が進むことで、 LSIの故障解析に必要となる解析情報は増加の一途を迪つており、それらの大量の解析情報の入力作業が必要となっている。し力も、各 LSIの設計者と LSIを搭載するシステムの設計者と LSIの故障解析を行うファームゥエアの設計者との間に意思の疎通が避けられないことから、そのような故障解析機能を実現するためには膨大な開発工数が要求されることになる。

[0004] これから、そのような故障解析機能を効率的に実現するための新たな技術の構築が叫ばれている。

背景技術

[0005] ASICを搭載する情報処理装置では、通常、複数種類の複数の ASICを搭載するシステムボードを複数枚具備することになる。

[0006] これから、従来では、 ASICに故障が発生する場合に、各システムボード用に用意する 1枚又は数枚の解析用テーブルを用いてシステムボードを単位にして故障解析を行い、そのシステムボードを単位にして行った解析結果を集めて、システム全体としての解析結果を導出するようにしてヽた。 [0007] 図 15に、従来技術の構成を図示する。

[0008] ここで、図 15中、 100は情報処理装置内に実装される解析対象となる複数のシステムボードを示し、 110はボード解析情報テーブルを示し、 120はシステム解析情報テ一ブルを示し、 130は解析処理部を示す。

[0009] このシステムボード 100には、通常、複数種類の複数の ASICが搭載されて!、る。

ボード解析情報テーブル 110は、システムボード 100毎に定義されて、そのシステムボード 100に搭載される ASICに発生した故障の解析に必要となる情報を記憶する。システム解析情報テーブル 120は、システムボード 100間の故障解析に必要となる情報を記憶する。解析処理部 130は、システムボード 100毎の故障解析を行う解析処理機能と、システム全体の故障解析を行う解析処理機能とで構成される。

[0010] ここで、解析処理部 130については、具体的には、情報処理装置に実装されるファームウェア（以下、監視ファームウェアと称することがある）により実現され、ボード解析情報テーブル 110およびシステム解析情報テーブル 120については、そのファームウェアの持つメモリ上に展開されることになる。

[0011] このように構成される従来技術では、システムボード 100を単位にして ASICのログ情報 (後述するハード故障フラグ)を収集して、システムボード 100毎に定義されるボード解析情報テーブル 110を使ってシステムボード 100につ!/、ての故障解析を行うことで、そのシステムボード 100で発生した故障を特定する。

[0012] そして、このシステムボード 100についての故障解析を終了すると、続いて、システム解析情報テーブル 120を使い、例えば、受信側で検出される故障は送信側で発生した故障に伴って発生することを考慮して、受信側で検出される故障については故障解析から除外するとヽうようなシステム全体の故障解析を行うことで、最終的にどのような故障が発生したのかを特定する。

[0013] このようにして、従来技術では、 ASICに故障が発生する場合に、先ず最初に、システムボード 100を単位にして故障解析を行い、続いて、そのシステムボード 100を単位にして行った解析結果を集めて、システム全体としての解析結果を導出するようにしていた。

[0014] この故障解析を行うときに必要となるボード解析情報テーブル 110については、 AS ICの設計者やシステムボード 100の設計者が作成し、システム解析情報テーブル 12 0については、システムの設計者やシステムボード 100の設計者が作成することになる。

[0015] すなわち、従来技術では、図 16に示すように、ボード解析情報テーブル 110のコンパイル前のデータであるボード解析定義については、 ASICの種類毎に、各 ASICの設計者が独自に、あるいはシステムボード 100の設計者と協議しながら個別に作成する。そして、システムをとりまとめるシステム設計者が独自に、あるいはシステムボード 100の設計者と協議しながら、それらのボード解析定義を編集することで、システム解析情報テーブル 120のコンパイル前のデータであるシステム解析定義を作成する。そして、このようにして作成したボード解析定義とシステム解析定義とを監視ファームウェアが取り込める形にコンパイルすることで、ボード解析情報テーブル 110とシステム解析情報テーブル 120とを作成するようにして、た。

[0016] 解析処理部 130は、このようにして作成されたボード解析情報テーブル 110を使つてシステムボード 100についての故障解析を行うことになる力この場合、図 17に示すように、 ASIC力も収集するハード故障フラグ (ハード故障時に故障原因を残すノヽード内フラグ群)を、故障解析で確保する故障フラグバッファに格納していくことで、どのような故障が発生したのかを特定するという処理を行うことになる。

[0017] この処理を行う場合、従来の解析処理部 130では、先行して検出されたノヽード故障フラグを故障フラグバッファに格納していって、故障フラグバッファが満杯になる場合には、それ以降に検出されたハード故障フラグについては破棄するようにして、故障フラグバッファにどのようなハード故障フラグが格納されているのかを抽出することにより、どのような故障が発生したのかを特定するようにしてヽた。

[0018] すなわち、従来の解析処理部 130では、ハード故障フラグが大量に立った場合には、一定の検出個数をもって故障解析を中断して、そこまでの故障解析結果を報告するようにして、たのである。

[0019] また、解析処理部 130は、図 16に示すような方法により作成されたボード解析情報テーブル 110およびシステム解析情報テーブル 120を使って故障解析を行うことになるが、従来の解析処理部 130では、図 18に示すように、その故障解析がシステムに異常が発生した場合に実行する一時的な処理であるのにもかかわらず、その故障解析で使用する情報であるボード解析情報テーブル 110およびシステム解析情報テ一ブル 120については、システムの起動直後に監視ファームウェアのメモリに常駐させるようにしていた。

[0020] ここで、図 18中に示すメモリ空間は、監視ファームウェアのシステムメモリ空間を示し、図 18中に示す解析情報は、故障解析で使用する情報であるボード解析情報テ一ブル 110およびシステム解析情報テーブル 120を示し、図 18中に示す解析ワークは、監視ファームウェアが故障解析で用いる作業用メモリ域を示している。

[0021] 以上に説明したように、従来技術では、 ASICに故障が発生する場合に、先ず最初に、システムボード 100を単位にして故障解析を行い、続いて、そのシステムボード 1 00を単位にして行った解析結果を集めて、システム全体としての解析結果を導出するようにしていた。

[0022] このように、従来技術では、システムボード 100を単位にして故障解析を行って、ること力、図 19に示すように、例えば、システムボード 100に搭載されるある一つの A SIC (例えば、図中に示す ASIC— D)力もハード故障フラグを収集できな、ような事態が起こると、そのシステムボード 100についての故障解析全体が不可能となってしまうことになる。

発明の開示

発明が解決しょうとする課題

[0023] このような従来技術に従っていると、次のような問題がある。

[0024] (1)メモリ資源、処理時間についての問題

システムボード 100を単位とする従来の故障解析方法に従っていると、故障解析を行うときに、システムボード 100にかかる全てのハード故障フラグを故障解析に用いる作業用メモリ域（図 18に示す解析ワーク）に書き込まなくてはならないことになる。

[0025] しかるに、システムボード 100内には数個力も数十個の ASICが搭載されるため、システムボード 100全体でのハード故障フラグ数は非常に多い。

[0026] これから、システムボード 100を単位とする従来の故障解析方法に従っていると、故障解析に要するメモリが大きくなるという問題がある。 [0027] し力も、システムボード 100内には同種の ASICが搭載されることがある力システムボード 100を単位とする従来の故障解析方法に従っていると、ボード解析情報テーブル 110はシステムボード 100を単位にして生成されることから、同じ ASICのボード解析情報テーブル 110が冗長に含まれることになる。これも大きなメモリ資源を要求される原因となっている。

[0028] すなわち、同じ ASICであっても、その搭載位置に応じてボード解析情報テーブル 110は異なるものとなる力システムボード 100を単位とする従来の故障解析方法では、ボード解析情報テーブル 110に ASICの搭載位置に応じた解析定義を記述する t 、う構成を採ってヽな、ので、これらのボード解析情報テーブル 110を共通化することができない。これから、同じ ASICのボード解析情報テーブル 110が冗長に含まれることになることで大きなメモリ資源を要求されていたのである。

[0029] しかも、システムボード 100を単位とする従来の故障解析方法に従っていると、図 1 8で説明したように、故障解析がシステムに故障が発生した場合に実行する一時的な処理であるのにもかかわらず、その故障解析で使用する情報であるボード解析情報テーブル 110およびシステム解析情報テーブル 120につ!/、ては、システムの起動直後に監視ファームウェアのメモリに常駐させるようにして、た。

[0030] このときに常駐させるボード解析情報テーブル 110およびシステム解析情報テープル 120は、情報処理装置に搭載される ASICの種類や版数が予め分力ている場合には、それに応じた数で済むものの、予め分力つていない場合には、情報処理装置に搭載される可能性のあるものの全てを常駐させる必要があることから、その常駐に大きなメモリ量を要求されることになる。

[0031] この点力もしても、システムボード 100を単位とする従来の故障解析方法に従って V、ると、大きなメモリ資源を要求されることになると!/、う問題がある。

[0032] また、 1つの ASIC当たり数千力数万のハード故障フラグを搭載するため、システムボード 100全体では数十万個のハード故障フラグの解析となり、し力も、ボード解析情報テーブル 110もシステムボード 100を単位にして持つことから、その検索に多大な計算量を要することになる。

[0033] これから、システムボード 100を単位とする従来の故障解析方法に従っていると、故障解析に膨大な処理時間を要するという問題がある。

[0034] (2)開発工数にっ、て

システムボード 100を単位とする従来の故障解析方法では、ボード解析情報テーブル 110とシステム解析情報テーブル 120と!、う 2つのテーブルを使って故障解析を行うことになるが、図 16で説明したように、ボード解析情報テーブル 110については、 ASICの設計者やシステムボード 100の設計者が作成し、システム解析情報テープル 120については、システムの設計者やシステムボード 100の設計者が作成することになる。

[0035] これから、システムボード 100を単位とする従来の故障解析方法に従っていると、これらのテーブル 110, 120の初期設計時や変更設計時に、それぞれに工数が発生して各設計者に負担を強、ると!/、う問題がある。

[0036] し力も、各設計者の間で解析情報の記述定義の認識に違いがでることが避けられず、これから、システムボード 100を単位とする従来の故障解析方法に従っていると、この認識の違、〖こよる障害を発生する、う問題もある。

[0037] (3)解析漏れについて

従来の故障解析方法では、図 17で説明したように、ハード故障フラグが大量に立つた場合には、故障フラグバッファに格納できなくなることに合わせて、一定の検出個数をもって故障解析を中断するようにしていた。

[0038] これから、従来の故障解析方法に従っていると、故障フラグバッファが満杯になった後に検出される、より重大な故障を見逃してしまうという問題がある。

[0039] (4)解析不可能範囲について

システムボード 100を単位とする従来の故障解析方法では、図 19で説明したように、何らかの二次的な問題で、システムボード 100に搭載されるある一つの ASICからでもハード故障フラグを収集できな、ような事態が起こると、そのシステムボード 100 につ、ての故障解析全体が不可能になってしまうと、う問題がある。

[0040] 本発明は力かる事情に鑑みてなされたものであって、情報処理装置に搭載される L SIのような論理回路に発生する故障を解析するという機能を実現するときに、メモリ資源の削減、処理の高速ィ匕および開発工数の削減を実現するとともに、重大な故障を漏れなく解析することを実現し、さらに、解析不可能範囲を小さくすることを実現する新たな故障解析技術の提供を目的とする。

課題を解決するための手段

[0041] この目的を達成するために、本発明の故障解析装置は、複数の論理回路を搭載する複数のボードを具備する情報処理装置に実装されて、それらの論理回路にどのような故障が発生したのかを解析する処理を行うために、（1)論理回路の搭載されるボード番号及びボード上搭載位置に対応付けて、その論理回路力も収集するログ情報について、そのログ情報が発生するときに処理すべき情報と、そのログ情報の優先度の情報と、そのログ情報が有効なものとなる条件の情報と、そのログ情報が無効なものとなる条件の情報とについて記述する解析情報を記憶する記憶手段と、（2)論理回路の故障発生時に、論理回路から故障発生を表示するログ情報を収集する収集手段と、（3)収集手段の収集したログ情報と、記憶手段に記憶される解析情報とに基づいて、論理回路にどのような故障が発生したのかを解析する解析手段とを備えるように構成する。

[0042] この構成を採るときに、さらに、（4)装置起動時に、解析対象となる情報処理装置に搭載される可能性のある論理回路に適用される解析情報の索引に用いられる索引情報を、記憶手段に記憶させる第 1の展開手段と、（5)論理回路の故障発生時に、解析対象となる情報処理装置に搭載される論理回路の情報と索引情報とに従って、解析手段の解析に必要となる解析情報を特定して、その特定した解析情報を記憶手段に記憶させる第 2の展開手段とを備えることがある。

[0043] そして、この構成を採るときに、記憶手段は、ログ情報が有効なものとなる条件の情報として、どのログ情報が故障発生を示す場合という条件の情報について記述することがあり、また、ログ情報が無効なものとなる条件の情報として、どのログ情報が故障発生を示す場合とヽぅ条件の情報にっヽて記述することがある。

[0044] このように構成される本発明の故障解析装置では、装置起動時に、解析情報の索引に用いられる索引情報のみを記憶手段に記憶させる。

[0045] この後、情報処理装置が処理を開始するので、その処理の実行中に、ある論理回路に故障が発生すると、各論理回路から故障発生を表示するログ情報を収集する。 [0046] このとき、そのログ情報の収集に合わせて、情報処理装置でどのような論理回路が用いられているのかという情報を取得して、記憶手段に記憶される索引情報に従って、その取得した情報の指す論理回路に適用される解析情報を特定し、その特定した解析情報を記憶手段に記憶させる。

[0047] 続ヽて、記憶手段の記憶する解析情報を参照することで、収集した故障発生を表示するログ情報の内、解析情報に記述される条件情報に基づいて有効となるものを抽出することで、論理回路にどのような故障が発生したのかを解析する。

[0048] このとき、解析情報に記述される優先度情報に基づいて、優先度の高いログ情報を抽出することで、重大な故障の解析漏れが起こらな！/ヽようにする。

[0049] この抽出処理は、例えば、収集した故障発生を表示するログ情報の内、解析情報に記述される条件情報に基づいて有効となるログ情報を抽出すると、その抽出した口グ情報の優先度が規定のメモリ容量を持つバッファに格納されるログ情報の優先度よりも高い場合には、そのノッファに格納される最も優先度の低いログ情報と入れ替える形でその抽出したログ情報を格納し、その抽出したログ情報の優先度がそのバッファに格納されるログ情報の優先度よりも低い場合には、その抽出したログ情報をバッファに格納しな、ようにすることで行うことが可能である。

[0050] このようにして、本発明の故障解析装置では、論理回路の搭載されるボード番号及びボード上搭載位置に対応付けて、その論理回路力収集するログ情報について、そのログ情報が発生するときに処理すべき情報と、そのログ情報が有効なものとなる条件の情報と、そのログ情報が無効なものとなる条件の情報とについて記述する解析情報を定義して、従来技術ではシステムボードを単位として行って、た故障解析を、この解析情報を使って、論理回路を単位として行うようにするという構成を採るのである。

[0051] そして、この解析情報がさらにログ情報の優先度の情報を記述するようにすることで、この論理回路を単位とする故障解析の実現にあたって、重大な故障を漏れのない形で解析するようにするとヽぅ構成を採るのである。

発明の効果

[0052] 本発明によれば、次のような効果を実現できるようになる。 [0053] (1)メモリ資源、処理時間についての効果

本発明では、論理回路を単位とする故障解析方法を用いるので、故障解析を行うベく故障発生を表示するログ情報を作業用メモリに書き込むときに、システムボードを単位とする従来の故障解析方法に比べて、大幅に少ない量のログ情報を書き込めば足りることになる。

[0054] このようにして、本発明によれば、システムボードを単位とする従来の故障解析方法に比べて、故障解析に要するメモリを大幅に削減できるようになる。

[0055] しカゝも、本発明では、論理回路の搭載されるボード番号及びボード上搭載位置に対応付ける形で故障解析に必要となる解析情報を定義して、そのような記載形式をとる解析情報を用いて故障解析を行うので、システムボードに同じ論理回路が搭載される場合に、それらの論理回路についての解析情報を共通化できるようになる。

[0056] この点力しても、本発明によれば、システムボードを単位とする従来の故障解析方法に比べて、故障解析に要するメモリを大幅に削減できるようになる。

[0057] し力も、本発明では、解析情報を記憶する記憶手段に対して解析情報を常駐させないようにして、故障発生時点に、記憶手段に対して必要な解析情報のみを展開するようにする。

[0058] この点力しても、本発明によれば、使用しない解析情報までも含める形で記憶手段に解析情報を常駐させるという従来の故障解析方法に比べて、故障解析に要するメモリを大幅に削減できるようになる。

[0059] そして、本発明では、論理回路を単位とする故障解析方法を用いるので、システムボードを単位とする従来の故障解析方法に比べて、大幅に少な!ヽ量のログ情報を解析すれば足りることになり、し力も、単一の論理回路に限定した解析情報の検索を行うことで足りること〖こなる。

[0060] このようにして、本発明によれば、システムボードを単位とする従来の故障解析方法に比べて、故障解析に要する処理時間を大幅に削減できるようになる。

[0061] (2)開発工数にっ、て

本発明では、論理回路を単位とする故障解析方法を用いており、さらに、故障解析に用いる解析情報として、規定の内容にっ、て記述するものを用いるようにする。 [0062] これから、本発明によれば、論理回路の設計者の入力する解析情報の定義フォーマットを共通化できるようになるので、その入力作業を統合ィ匕でき、その入力作業をサポートするツールを用いることで、論理回路の設計者による一貫した解析情報の作成を実現できるようになり、開発工数を大幅に削減できるようになる。

[0063] し力も、本発明によれば、定義フォーマットによって、各設計者の間における解析情報の記述定義の認識の違、を小さくできるようになるので、この認識の違いによる障害の発生を防止できるようになる。

[0064] (3)解析漏れについて

本発明では、解析情報に定義された優先度の順番に従って、故障発生を表示するログ情報をチェックすることで故障解析を行うようにする。

[0065] これから、本発明によれば、より重大な故障を見逃してしまうというような不都合の発生を防止できるようになる。

[0066] (4)解析不可能範囲について

本発明では、論理回路を単位とする故障解析方法を用いるので、ログ情報の欠落による故障解析の不可能範囲が論理回路単位となる。

[0067] これから、本発明によれば、従来技術に比べて、故障解析の不可能範囲を大幅に /J、さくすることができるよう〖こなる。

[0068] このようにして、本発明によれば、情報処理装置に搭載される LSIのような論理回路に発生する故障を解析するという機能を実現するときに、メモリ資源の削減、処理の高速ィ匕および開発工数の削減を実現できるようになるとともに、重大な故障を漏れなく解析することを実現できるようになり、さらに、解析不可能範囲を小さくすることを実現でさるよう〖こなる。

図面の簡単な説明

[0069] [図 1]本発明の構成図である。

[図 2]故障解析用ファームウェアの構成の一例を示す図である。

[図 3]RAS— DBファイルのデータ構造の説明図である。

[図 4]共通定義ブロックで定義される情報の一例を示す図である。

[図 5]データ定義ブロックで定義される解析情報の一例を示す図である。 [図 6]ASICを搭載するシステムボードの一例を示す図である。圆 7]解析情報の一例を示す図である。

圆 8]解析情報の一例を示す図である。

圆 9]解析情報の作成方法の説明図である。

[図 10]本体ログ解析プロセスの実行する処理フローである。

[図 11]本体ログ解析プロセスの実行する処理フローである。

[図 12]本体ログ解析プロセスの実行する処理の説明図である。

[図 13]本体ログ解析プロセスの実行する処理の説明図である。圆 14]本発明による故障解析不可能範囲の説明図である。圆 15]従来技術の説明図である。

圆 16]従来技術の説明図である。

圆 17]従来技術の説明図である。

圆 18]従来技術の説明図である。

圆 19]従来技術の説明図である。

符号の説明

10 ASIC

11 RAS— DBファイル

12 解析処理部

20 故障解析用ファームウェア

30 割込ハンドラ

31 本体ログプロセス

32 解析用ログファイル

33 詳細ログファイル

34 本体ログ解析プロセス

40 ノッファ

41 作業用メモリ

50 RAS— DB定義ファイル

51 RAS DBジェネレータ 60 宣言部

61 定義部

62 データ定義ブロック

63 共通定義ブロック

発明を実施するための最良の形態

[0071] 以下、実施の形態に従って本発明を詳細に説明する。

[0072] 本発明では、 ASICを搭載する情報処理装置において、 ASICに故障が発生する場合に、 ASICを単位にして故障解析を行うことで、システム全体としての解析結果を導出するという処理を行い、これにより、従来のシステムボードを単位にして行っていた故障解析で必要とされていたシステム全体の故障解析を不要にすることを実現する。

[0073] 図 1に、この処理を行う本発明の構成を図示する。

[0074] ここで、図 1中、 10は情報処理装置内に搭載される解析対象となる N個の ASICを示し、 11は RAS— DBファイルを示し、 12は解析処理部を示す。

[0075] RAS(Reliability Availability Serviceability)—DBファイル 11は、 ASICIO毎に定義されて、その ASICIOに発生した故障の解析に必要となる解析情報を記憶するとともに、この解析情報に含める形で、システム全体の故障の解析に必要となる解析情報を記憶する。

[0076] 解析処理部 12は、 RAS— DBファイル 11に格納される解析情報を使って、 ASIC1

0に発生した故障を解析するとともに、その故障解析を行うことで、システム全体の故障解析を同時に実現する。

[0077] このように構成される本発明では、故障発生時に、 N個の ASICIOからログ情報を収集し、解析処理部 12は、その収集したログ情報のそれぞれについて故障解析を行うように処理する。

[0078] このとき行う故障解析は、 RAS— DBファイル 11に格納される解析情報に従って、 ASICIO内の故障解析にとどまらずに、システム全体の故障解析までも含めたものとなる。

[0079] このようにして、本発明では、 RAS— DBファイル 11に格納される解析情報を使つて、 ASIC10に発生した故障を解析するとともに、その故障解析を行うことで、システム全体の故障解析を同時に実現するのである。

[0080] この本発明に特徴的な故障解析を行う解析処理部 12は、具体的には、情報処理装置に実装されるファームウェアにより実現され、 RAS— DBファイル 11につ!/、ては

、そのファームウェアの備える ROM上に記憶されることになる。

[0081] 図 2に、この故障解析処理を司る故障解析用ファームウェア 20の構成の一例を図示する。

[0082] ここで、図 2中、図 1で示したものと同じものについては同一の記号で示してある。ま、図 2中に示す実線は処理の流れを示し、図 2中に示す破線はデータの流れを示している。

[0083] 図 2に示すように、本発明の故障解析処理を司る故障解析用ファームウェア 20は、図 1で説明した RAS— DBファイル 11に加えて、割込ハンドラ 30と、本体ログプロセス 31と、解析用ログファイル 32と、詳細ログファイル 33と、本体ログ解析プロセス 34とを備える。

[0084] 割込ハンドラ 30は、 ASIC10から故障が発生したことを示す割り込みを受信する。

本体ログプロセス 31は、割込ハンドラ 30からの割込受信通知を受けて、 ASIC10力らログ情報を読み出す。解析用ログファイル 32は、故障解析用ファームウェア 20の備える ROM上に構成されて、本体ログプロセス 31の読み出したログ情報の内の故障解析に必要となるものを格納する。詳細ログファイル 33は、故障解析用ファームゥエア 20の備える ROM上に構成されて、本体ログプロセス 31の読み出したログ情報の内の故障解析に必要とならないものを格納する。本体ログ解析プロセス 34は、 RA S— DBファイル 11に格納される解析情報を参照して、解析用ログファイル 32に格納されるログ情報について故障解析を行う。

[0085] ここで、本体ログ解析プロセス 34には、故障解析の結果となるログ情報を格納する規定の容量の大きさを持つバッファ 40と、故障解析の作業用に用意される作業用メモリ 41とが備えられることになる。

[0086] また、 RAS— DBファイル 11に格納される解析情報については、 RAS— DB定義フアイル 50と RAS - DBジェネレータ 51とが用意されて、 ASIC 10の設計者の作成した解析定義が RAS— DB定義ファイル 50に格納されると、 RAS— DBジェネレータ 5 1がその解析定義をコンパイルして RAS - DBファイル 11に格納することで、 RAS - DBファイル 11に格納されることになる。

[0087] このように構成される故障解析用ファームウェア 20では、割込ハンドラ 30が ASIC1 0から故障発生の割り込みを受信すると、本体ログプロセス 31は、割込ハンドラ 30からの割込受信通知を受けて、 ASIC10からログ情報を読み出す。

[0088] 続いて、本体ログプロセス 31は、 ASIC10から読み出したログ情報の内の故障解祈に必要となるものを解析用ログファイル 32に格納し、故障解析に必要とならないものを詳細ログファイル 33に格納してから、本体ログ解析プロセス 34に対して故障解析を行うことを指示する。

[0089] この指示を受けて、本体ログ解析プロセス 34は、 RAS— DBファイル 11に格納される解析情報を参照して、解析用ログファイル 32に格納されるログ情報について故障解析を行い、その解析結果を報告先に報告する。

[0090] 次に、 RAS— DBファイル 11に格納される解析情報にっ、て説明する。

[0091] 図 3に、 RAS— DBファイル 11のデータ構造を図示する。

[0092] RAS— DBファイル 11は、図 3に示すように、ファイル名などについて宣言する宣言部 60と、解析情報の具体的な内容について定義する定義部 61とで構成され、さらに、定義部 61は、解析情報の本体について定義するデータ定義ブロック 62と、データ定義ブロック 62の各項目で用いる共通の値につ!、て定義する共通定義ブロック 63とで構成される。

[0093] 共通定義ブロック 63で定義した値については、データ定義ブロック 62の項目を省略した場合のデフォルト値として使用されることになる。これから、共通定義ブロック 6 3が用意されることで、解析情報を作成する ASIC10の設計者は、作成する解析情報で共通的に使用する情報については、その記載を省略することが可能になる。

[0094] 図 4に、共通定義ブロック 63で定義される情報の一例を図示する。

[0095] 図 4に示す共通定義ブロック 63では、 ASIC10の種別'版数 (ASIC)、 ASIC10を搭載する情報処理装置のモデル種別 (MODEL), ASIC10を搭載するシステムボードの番号（BORAD)、 ASIC10のシステムボード上の搭載位置（PLACE)、どのハード機能が有効かを示す機能モード（FUNCTION TYPE), ASICスキャンループの IRコード（IR:ログの種類を示すもの）、 ASIC間インタフェースの方向（DIRECTION), QU IETコード（QUIET)、エラー事象のレベル（LEVEL)、変換ルールの番号（CONVERT )、交換部品を示す故障マーク (MARK)のそれぞれにつヽて定義可能であることを示している。

[0096] 図 5に、データ定義ブロック 62で定義される解析情報の一例を図示する。

[0097] データ定義ブロック 62では、 ASIC種別、 ASIC版数、モデル種別、機能モード、搭載ボード (bd)、搭載位置（pi)、 IRコード（ir)、スキャンアドレス（adrs)、 RCZRT表示 (rcrt)、優先度 (pr)、エントリ抑止条件 (dis)、エントリ許可条件 (enb)、事象レベル (lvl) 、メッセージ番号（msg)、アクション種別（action)、変換ルール番号（conv)、故障マーク（mark)などの各項目について値を定義することで、 ASIC10の故障解析に用いる解析情報を定義するとヽぅ構成を採る。

[0098] ここで、図 5に示すデータ定義ブロック 62の例では、 ASIC版数 (ver)、 ASIC10を搭載する情報処理装置のモデル種別 (mdl)、どのハード機能が有効かを示す機能モード (fonc)については共通定義ブロック 63で定義されていることで、データ定義ブロック 62ではその定義が省略されて、ることを想定して、る。

[0099] 図 5に示す第 7番目の解析情報を具体例にして説明するならば、この第 7番目の解析情報は、 ASIC10の種別が" SC"で、その ASIC10を搭載する情報処理装置のモデル種別が" DC2"で、その ASIC10を搭載するシステムボードの番号が" 0001"で、その ASIC10のシステムボード上の搭載位置が" F"であるという ASIC10に適用されて、 IR番号" 59"に従ってその ASIC10から収集されたログの中の" 0373"のアドレスビット位置に故障フラグが立っている場合に適用される解析情報であるということを示している。

[0100] そして、この第 7番目の解析情報は、このログのビットが RC (Region Code)ビットであることで故障解析の対象となるものであることを示し、このログの優先度が" 10"で、 " ZXCZRC— COPY— LOCK— CE "と!/、うビットが立って!/、た場合にはこの解析情報が無効となり、 "/XC/RC_RETRY_LOCK_CE" t 、うビットが立って！/、た場合にはこの解析情報が有効となるもので、この解析情報が有効である場合には、 " アラーム"という事象で、 2Aというメッセージ番号のメッセージを報告先に報告し、 "S C— FTL 1— INTF" t ヽぅァクションを行って、そのときに用!、る交換部品は "ZCM U # 0"になると、うことにつ、て記述する解析情報であると!/、うことを示して！/、る。

[0101] このように、本発明で用いられる解析情報では、 ASIC10の搭載されるシステムボード番号及びそのボード上搭載位置に対応付けて、その ASIC10から収集するログ情報について、こういう別のあるログ情報が故障発生を表示しているときにはそのログ情報についての解析情報が無効となり、こういう別のあるログ情報が故障発生を表示して、るときにはそのログ情報にっ、ての解析情報が有効となると、う条件にっ、て記述しつつ、そのログ情報が発生するときに処理すべき情報と、そのログ情報の優先度の情報とについて定義するという構成を採る。

[0102] このときに、他のシステムボードに搭載される ASIC10から収集されるログ情報についても含める形で、こういう別のあるログ情報が故障発生を表示しているときには解析情報が無効となり、こういう別のあるログ情報が故障発生を表示しているときには解析情報が有効となると、うことにつ、て記述して、る。

[0103] この記述形式に従って、解析処理部 12が RAS— DBファイル 11に格納される解析情報を使って ASIC10に発生した故障を解析すると、自ずとシステム全体の故障解析につヽても同時に実現できるようになる。

[0104] 次に、図 6に示す CMU#0というシステムボードを具体例にして、このことが実現できるようになると、うことにつ、て説明する。

[0105] 図 6に示す CMU#0というシステムボードでは、 CPU #0という ASIC 10と、 CPU

# 1という ASIC10と、じ？11# 2とぃぅ八31じ10と、 CPU# 3という ASIC10と、 SC# 0と!、う 5つの ASIC10が搭載されて!、ることを想定して、る。

[0106] ここで、 CPU#0, 1, 2, 3は、それぞれ"/ AO/BUS— SND"というバスの送信口を持ち、その送信口をチェックするチェッカ力その送信口に故障が発生した場合には、信号名" ZAOZRC— OUT"、 IR番号" 58"およびアドレスビット位置" 10"の指すフラグ域にフラグを書き込むものとする。

[0107] また、 SC # 0は、 CPU # 0の持つバスの送信口に合わせて" ZXOZBUS— RSV

"というバスの受信口を持ち、その受信口をチェックするチェッカ力その受信口に故障が発生した場合には、信号名" ZXOZRC— RSV"、 IR番号" 10"およびアドレスビット位置" 123"の指すフラグ域にフラグを書き込むものとする。

[0108] そして、 SC # 0は、 CPU # 1の持つバスの送信口に合わせて" ZXlZBUS— RS V"というバスの受信口を持ち、その受信口をチェックするチェッカ力その受信口に故障が発生した場合には、信号名" ZX1ZRC— RSV"、 IR番号" 11"およびァドレスビット位置" 123"の指すフラグ域にフラグを書き込むものとする。

[0109] そして、 SC # 0は、 CPU # 2の持つバスの送信口に合わせて" ZX2ZBUS— RS V"というバスの受信口を持ち、その受信口をチェックするチェッカ力その受信口に故障が発生した場合には、信号名" ZX2ZRC— RSV"、 IR番号" 12"およびァドレスビット位置" 123"の指すフラグ域にフラグを書き込むものとする。

[0110] そして、 SC # 0は、 CPU # 3の持つバスの送信口に合わせて" ZX3ZBUS— RS V"というバスの受信口を持ち、その受信口をチェックするチェッカ力その受信口に故障が発生した場合には、信号名" ZX3ZRC— RSV"、 IR番号" 13"およびァドレスビット位置" 123"の指すフラグ域にフラグを書き込むものとする。

[0111] さらに、 SC # 0は、内部における故障の発生を示すフラグを書き込むためのフラグ域として、（1)信号名" ZAZRC— XX"、 IR番号" 20"およびアドレスビット位置" 20 0"の指すフラグ域と、（2)信号名" ZAZRC— YY"、 IR番号" 50"およびアドレスビット位置" 044"の指すフラグ域と、（3)信号名" ZBZRC— XX"、 IR番号" 20"およびアドレスビット位置" 300"の指すフラグ域と、（4)信号名" ZBZRC— YY"、 IR番号" 50"およびアドレスビット位置" 144"の指すフラグ域という 4つのフラグ域を持つことを想定している。

[0112] この場合、 RAS— DBファイル 11には、 CPU # 0, 1, 2, 3の解析情報として、図 7 に示すものが格納される。ここで、図 7では、 DCモデル用の解析情報と、 FFモデル用の解析情報とを定義して、るが、この 2つの違ヽは表示メッセージが異なる点だけである。

[0113] 一方、 RAS— DBファイル 11には、 SC # 0の解析情報として、図 8に示すものが格納される。

[0114] 図 8に示す SC # 0の解析情報では、エントリ抑止条件として、 CPU # 0, 1, 2, 3の送信口側に故障が発生した場合には、受信口側である sc#oで発生した故障につ

Vヽては無効にすると!/、うことが定義されて、る。

[0115] この定義に従って、 CPU # 0, 1, 2, 3の送信口側に故障が発生した場合には、受信口側である SC # 0でも故障が発生することになるが、それについては付随的に発生したものであって本質的なものではないことから無視して、送信口側で発生した本質的な故障のみを解析することが可能になるのである。

[0116] この具体例では、エントリ抑止条件が同一のシステムボード内で定義されることを示したが、エントリ抑止条件やエントリ許可条件については、同一のシステムボード内に限られるものではなぐ異なるシステムボード間で定義されてもょ、。

[0117] このこと〖こより、本発明によれば、システムボードを単位とする従来の故障解析方法で必要とされてヽたシステム全体の故障解析を行うことを省略することができるようになるのである。

[0118] 次に、図 9に従って、図 3ないし 5に示したデータ構造を持つ解析情報の作成方法について説明する。

[0119] 図 2で説明したように、 RAS— DBファイル 11に格納される解析情報については、 ASIC 10の設計者が RAS— DB定義フアイル 50に格納する解析定義を作成すると、 RAS - DBジェネレータ 51がその解析定義をコンパイルして RAS - DBファイル 11 に格納することで、 RAS - DBファイル 11に格納されることになる。

[0120] この解析情報の作成にあたって、 ASIC10の搭載される情報処理装置のモデルによって、システムボートの枚数やそこに搭載される ASIC10の搭載位置が変わることで、解析情報に記述されるエントリ抑止 (dis)やエントリ許可条件 (enb)や故障マーク（ mark)などの項目値が変更されることになる。

[0121] しかし、そのような変更に合わせて、 ASIC10の設計者に対して、情報処理装置のモデル毎に、別々の解析情報を作成させるように要求して、たのでは多大な負荷を強ヽること〖こなる。

[0122] そこで、本発明では、 ASIC10の設計者に対して、エントリ抑止（dis)やエントリ許可条件（enb)や故障マーク (mark)などの項目値にっ、て、情報処理装置のモデルに合わせた読み替えの変換ルールを作成させるとともに、解析情報については情報処理装置のモデルに依らな、一般的な形で作成させて、この変換ルールを利用することで、情報処理装置のモデルに合った解析情報の作成を実現すると、う方法を用いるようにしている。

[0123] すなわち、本発明では、図 9に示すように、 ASIC10の設計者に対して、 ASIC10 に固有の RAS— DB定義（情報処理装置のモデルに依らな、一般的な形の RAS— DB定義）を作成させて、それをフォーマットチェックすることで ASIC10に固有の RA S— DB定義を作成する。

[0124] そして、 ASIC 10の設計者 (システムの設計者でもよい）に対して、エントリ抑止（dis) やエントリ許可条件 (_enb)や故障マーク (mark)などの項目値にっ、て、情報処理装置のモデルに合わせた読み替えの変換ルール定義を作成させて、それをフォーマツトチェックすることで情報処理装置のモデルに合わせた読み替えの変換ルール定義を作成する。

[0125] そして、作成した RAS— DB定義と作成した変換ルール定義とを組み合わせて、それをコンパイルすることで、解析対象となる情報処理装置のモデルに合った解析情報を作成して、それを RAS - DBファイル 11に格納するようにして、る。

[0126] この構成に従って、本発明によれば、 ASIC10の設計者は情報処理装置のモデル毎に別々の解析情報を作成しなくても済むようになる。

[0127] 次に、図 10及び図 11の処理フローに従って、図 2に示す本体ログ解析プロセス 34 の実行する処理について詳細に説明する。

[0128] 本体ログ解析プロセス 34は、本体ログプロセス 31から解析用ログファイル 32に格納されるログ情報 (故障発生を表示するログ情報)の解析指示が発行されると、先ず最初に、ステップ S 10で、バッファ 40をクリアする。

[0129] 続いて、ステップ S11で、解析用ログファイル 32に格納される全てのログ情報を処理したのカゝ否かを判断する。

[0130] このステップ S11の判断処理に従って、解析用ログファイル 32に格納される全てのログ情報を処理していないことを判断するときには、ステップ S12に進んで、解析用口グファイル 32から、未処理のログ情報を 1つ読み出す。

[0131] 続いて、ステップ S13で、 RAS— DBファイル 11から、ステップ S12で読み出した口グ情報に対応付けられる解析情報を取得する。

[0132] 続いて、ステップ S14で、ステップ S13で取得した解析情報にエントリ抑止条件が記述されて!ヽるのか否かを判断する。

[0133] このステップ S14の判断処理に従って、ステップ S 13で取得した解析情報にエントリ抑止条件が記述されていることを判断するときには、ステップ S15に進んで、解析用ログファイル 32に格納されるログ情報を参照することで、そのエントリ抑止条件が成立するの力否かを判断する。

[0134] 続いて、ステップ S16で、ステップ S15の判断処理に従って、ステップ S13で取得した解析情報に記述されるエントリ抑止条件が成立することを判断するときには、次のログ情報について処理すベぐステップ S11の処理に戻る。

[0135] すなわち、ステップ S13で取得した解析情報に記述されるエントリ抑止条件が成立する場合には、その解析情報が無効となることで、ステップ S12で読み出したログ情報を解析する必要がないので、次のログ情報について処理すベぐステップ S 11の処理に戻るのである。

[0136] 一方、ステップ S14の判断処理に従って、ステップ S 13で取得した解析情報にェントリ抑止条件が記述されていないことを判断し、あるいは、ステップ S 16の判断処理に従って、ステップ S13で取得した解析情報に記述されるエントリ抑止条件が成立しないことを判断するときには、ステップ S17に進んで、ステップ S 13で取得した解析情報にエントリ許可条件が記述されているのか否かを判断する。

[0137] このステップ S17の判断処理に従って、ステップ S 13で取得した解析情報にエントリ許可条件が記述されていることを判断するときには、ステップ S18に進んで、解析用ログファイル 32に格納されるログ情報を参照することで、そのエントリ許可条件が成立するの力否かを判断する。

[0138] 続いて、ステップ S19で、ステップ S18の判断処理に従って、ステップ S13で取得した解析情報に記述されるエントリ許可条件が成立しないことを判断するときには、次のログ情報について処理すベぐステップ S11の処理に戻る。

[0139] すなわち、ステップ S13で取得した解析情報に記述されるエントリ許可条件が成立しない場合には、その解析情報が無効となることで、ステップ S12で読み出したログ情報を解析する必要がないので、次のログ情報について処理すベぐステップ S 11 の処理に戻るのである。

[0140] 一方、ステップ S17の判断処理に従って、ステップ S 13で取得した解析情報にェントリ許可条件が記述されていないことを判断し、あるいは、ステップ S 19の判断処理に従って、ステップ S13で取得した解析情報に記述されるエントリ許可条件が成立することを判断するときには、ステップ S20に進んで、バッファ 40が満杯であるのか否かを判断する。

[0141] すなわち、ステップ S13で取得した解析情報が最終的に有効なものであると判断する場合には、ステップ S20に進んで、バッファ 40が満杯であるのか否かを判断するのである。

[0142] このステップ S20の判断処理に従って、バッファ 40が満杯でないことを判断するときには、ステップ S21に進んで、ステップ S13で取得した解析情報をバッファ 40に格納することで、ステップ S12で読み出したログ情報の解析を行ってから、次のログ情報について処理すベぐステップ S 11の処理に戻る。

[0143] すなわち、ステップ S12で読み出したログ情報に対応付けられる解析情報には、そのログ情報が発生するときには、このような故障が発生したので、このような処理を行えと!/、うことが記述されて、るので、それを解析結果としてバッファ 40に格納してから、次のログ情報について処理すベぐステップ S 11の処理に戻るのである。

[0144] 一方、ステップ S20の判断処理に従って、バッファ 40が満杯であるということを判断するときには、ステップ S22に進んで、ステップ S 13で取得した解析情報に記述される優先度情報に従って、ステップ S12で読み出したログ情報の持つ優先度を特定する。

[0145] 続いて、ステップ S23で、ノッファ 40の最後尾にソートされる解析情報 (最も低い優先度のものがソートされている）に従って、ノッファ 40に解析結果が格納されている口グ情報の持つ最も低、優先度を特定する。

[0146] 続!、て、ステップ S24で、ステップ S22で特定した優先度がステップ S23で特定した優先度よりも低、の力否かを判断する。

[0147] このステップ S24の判断処理に従って、ステップ S22で特定した優先度がステップ S23で特定した優先度よりも低いことを判断するときには、次のログ情報について処理すべぐステップ S11の処理に戻る。

[0148] すなわち、ステップ S22で特定した優先度がステップ S23で特定した優先度よりも低いことを判断する場合には、ステップ S12で読み出したログ情報がバッファ 40に解析結果が格納されて!、るログ情報よりも重要でな、ことを判断して、何の処理も行うことなぐ直ちに、ステップ S 11の処理に戻るのである。

[0149] 一方、ステップ S24の判断処理に従って、ステップ S22で特定した優先度がステツプ S23で特定した優先度よりも高いことを判断するときには、ステップ S25に進んで、ノッファ 40の最後尾にソートされる解析情報 (最も低、優先度のものがソートされている）と入れ替える形で、ステップ S 13で取得した解析情報をバッファ 40に格納することで、ステップ S 12で読み出したログ情報の解析を行う。

[0150] すなわち、ステップ S22で特定した優先度がステップ S23で特定した優先度よりも高いことを判断する場合には、ステップ S12で読み出したログ情報がバッファ 40に解析結果が格納されて!ヽる最も低!ヽ優先度を持つログ情報よりも重要であることを判断して、そのログ情報と入れ替える形で、解析結果をバッファ 40に格納するのである。

[0151] 続いて、ステップ S26で、ノッファ 40に格納される解析情報を優先度に従ってソートしてから、次のログ情報について処理すベぐステップ S 11の処理に戻る。

[0152] そして、ステップ S 11〜ステップ S26の処理を繰り返していくときに、ステップ S 11で、解析用ログファイル 32に格納される全てのログ情報を処理したことを判断するときには、ステップ S27に進んで、バッファ 40に格納される解析情報を故障解析の解析結果として報告先に報告して、処理を終了する。

[0153] このようにして、本体ログ解析プロセス 34は、本体ログプロセス 31から解析用ログフアイル 32に格納されるログ情報 (故障発生を表示するログ情報)の解析指示が発行されると、図 12に示すように、 RAS— DBファイル 11から、優先度の順番に従ってログ情報に対応付けられる解析情報を取得して、それをバッファ 40に格納することで故障解析を行うように処理するのである。

[0154] この処理に従って、本発明によれば、優先度の高!、ログ情報の解析が漏れなく行われることを保証できるようになる。 [0155] 以上に説明した処理の実行にあたって、本体ログ解析プロセス 34は、作業用メモリ 41の容量を削減するために、図 13に示すように、システムの起動時には、 RAS-D Bファイル 11に格納される解析情報にっ、ては作業用メモリ 41に読み出さな、ようにして、解析情報の索引に用いられる索引テーブルのみを作業用メモリ 41に書き込むようにする。

[0156] そして、故障が発生すると、自プロセスを実装する情報処理装置にどのような ASIC 10が搭載されて、るのかと、う情報を取得して、作業用メモリ 41に読み出してある索引テーブルに従って、その取得した情報の指す ASIC10に適用される解析情報を特定して、それを RAS— DBファイル 11から読み出して作業用メモリ 41に書き込むようにする。

[0157] この構成に従って、本発明によれば、使用しない解析情報までも含める形で作業用メモリ 41に解析情報を常駐させるという従来の故障解析方法に比べて、故障解析に要する作業用メモリ 41の容量を大幅に削減できるようになる。

[0158] 本発明は、従来技術のように、システムボードを単位とする故障解析を行うのではなくて、システムボードに搭載する ASIC10のようなハードウェア回路を単位とする故障解析を行うことを特徴とする。

[0159] これから、本発明では、ログ情報の欠落による故障解析の不可能範囲がハードゥエァ回路単位となる。

[0160] したがって、本発明では、図 14に示すように、例えば、システムボード 100に搭載されるある一つの ASIC10 (例えば、図中に示す ASIC— D)からハード故障フラグを収集できないような事態が起こるときには、その ASIC10のみが解析不可能になるだけであって、従来技術のように、システムボード全体について解析不可能になるようなことはない。

[0161] このように、本発明によれば、従来技術に比べて、故障解析の不可能範囲を大幅に小さくすることができるようになる。

産業上の利用可能性

[0162] 本発明によれば、情報処理装置に搭載される LSIのような論理回路に発生する故障を解析するという機能を実現するときに、メモリ資源の削減、処理の高速化および開発工数の削減を実現できるようになるとともに、重大な故障を漏れなく解析することを実現できるようになり、さらに、解析不可能範囲を小さくすることを実現できるようになる。

Claims

請求の範囲

[1] 複数の論理回路を搭載する複数のボードを具備する情報処理装置に実装されて、それらの論理回路にどのような故障が発生したのかを解析する故障解析装置であつて、

論理回路の搭載されるボード番号及びボード上搭載位置に対応付けて、その論理回路力収集するログ情報について、そのログ情報が発生するときに処理すべき情報と、そのログ情報が有効なものとなる条件の情報と、そのログ情報が無効なものとなる条件の情報とについて記述する解析情報を記憶する記憶手段と、

論理回路の故障発生時に、論理回路力故障発生を表示するログ情報を収集する収集手段と、

上記収集手段の収集したログ情報と、上記記憶手段に記憶される解析情報とに基づいて、論理回路にどのような故障が発生したのかを解析する解析手段とを備えることを、

特徴とする故障解析装置。

[2] 複数の論理回路を搭載する複数のボードを具備する情報処理装置に実装されて、それらの論理回路にどのような故障が発生したのかを解析する故障解析装置であつて、

論理回路の搭載されるボード番号及びボード上搭載位置に対応付けて、その論理回路力収集するログ情報について、そのログ情報が発生するときに処理すべき情報と、そのログ情報の優先度の情報と、そのログ情報が有効なものとなる条件の情報と、そのログ情報が無効なものとなる条件の情報とについて記述する解析情報を記憶する記憶手段と、

特徴とする故障解析装置。

[3] 請求項 2に記載の故障解析装置において、

上記記憶手段は、上記ログ情報が有効なものとなる条件の情報として、どのログ情報が故障発生を示す場合という条件の情報について記述することを、

特徴とする故障解析装置。

[4] 請求項 2に記載の故障解析装置において、

上記記憶手段は、上記ログ情報が無効なものとなる条件の情報として、どのログ情報が故障発生を示す場合という条件の情報について記述することを、

特徴とする故障解析装置。

[5] 請求項 2な、し 4の、ずれか 1項に記載の故障解析装置にぉ、て、

上記解析手段は、上記収集手段の収集したログ情報の内、上記解析情報に記述される条件情報に基づいて有効となるものを抽出することで、論理回路にどのような故障が発生したのかを解析することを、

特徴とする故障解析装置。

[6] 請求項 5に記載の故障解析装置において、

上記解析手段は、上記抽出したログ情報の内、上記解析情報に記述される優先度情報に基づ、て優先度の高、ものを抽出することを、

特徴とする故障解析装置。

[7] 請求項 6に記載の故障解析装置において、

上記解析手段は、上記収集手段の収集したログ情報の内、上記解析情報に記述される条件情報に基づいて有効となるログ情報を抽出すると、その抽出したログ情報の優先度が規定のメモリ容量を持つバッファに格納されるログ情報の優先度よりも高い場合には、そのバッファに格納される最も優先度の低いログ情報と入れ替える形でその抽出したログ情報を格納し、その抽出したログ情報の優先度がそのノッファに格納されるログ情報の優先度よりも低い場合には、その抽出したログ情報をバッファに格納しな、ようにすることで、優先度の高、ログ情報を抽出することを、

特徴とする故障解析装置。

[8] 請求項 2な、し 7の、ずれか 1項に記載の故障解析装置にぉ、て、

装置起動時に、解析対象となる情報処理装置に搭載される可能性のある論理回路に適用される上記解析情報の索引に用いられる索引情報を、上記記憶手段に記憶させる第 1の展開手段と、

論理回路の故障発生時に、解析対象となる情報処理装置に搭載される論理回路の情報と上記索引情報とに従って、上記解析手段の解析に必要となる上記解析情報を特定して、その特定した解析情報を上記記憶手段に記憶させる第 2の展開手段とを備えることを、

特徴とする故障解析装置。