JPH08297598A - 計算機システム解析装置 - Google Patents

計算機システム解析装置

Info

Publication number
JPH08297598A
JPH08297598A JP7103791A JP10379195A JPH08297598A JP H08297598 A JPH08297598 A JP H08297598A JP 7103791 A JP7103791 A JP 7103791A JP 10379195 A JP10379195 A JP 10379195A JP H08297598 A JPH08297598 A JP H08297598A
Authority
JP
Japan
Prior art keywords
data
computer system
file
failure
collection target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7103791A
Other languages
English (en)
Other versions
JP3532289B2 (ja
Inventor
Kazuya Izuta
和也 伊豆田
Toshiya Ito
敏也 伊藤
Yoshio Endo
義雄 遠藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP10379195A priority Critical patent/JP3532289B2/ja
Priority to US08/575,225 priority patent/US5790777A/en
Publication of JPH08297598A publication Critical patent/JPH08297598A/ja
Application granted granted Critical
Publication of JP3532289B2 publication Critical patent/JP3532289B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
    • G06F11/0724Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU] in a multiprocessor or a multi-core unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0745Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in an input/output transactions management context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【目的】 計算機システムにおける障害発生時の早期の
状態解析とシステムの高信頼化とを図れる計算機システ
ム解析装置を得る。 【構成】 解析対象となる計算機システム7aに対し
て、それを監視する計算機システム7bを設け、計算機
システム7aに障害が発生した場合、計算機システム7
bが計算機システム7aの動作を代替するとともに、デ
ータ検索部10が、入出力部9から入力されたデータ項
目に対して、カーネルロードモジュールファイル8aか
ら得たアドレス情報をもとにデータ収集対象ファイルと
して生成されたクラッシュダンプファイル8bまたはデ
バイスファイル8cからデータ値を取得し、入出力部9
に表示する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、計算機システムの障
害発生時に、システム解析を行うことのできる計算機シ
ステム解析装置に関するものである。
【0002】
【従来の技術】図9は、例えば特開昭57−12016
3号公報に示された従来の計算機システム解析装置のシ
ステム構成図であり、図において、1は主記憶装置、2
はCPU、3は入出力装置4を制御する入出力制御部で
ある。5は障害発生時に障害解析記録を行うデータ収集
部で、主記憶装置1の読み出し番地を保持するメモリア
ドレスレジスタを内部に持つ主記憶装置制御部5a、命
令・データを保持するメモリデータレジスタ5b、出力
機構制御部5c、ダンプ命令であるか否かを判定する復
号器5d、オペランドサイズを保持する計数器レジスタ
5e、および制御部5fから構成されている。
【0003】このような従来の計算機システム解析装置
において障害が発生した場合、主記憶装置制御部5aが
主記憶装置1から障害発生時の内部状況を読み出す。こ
の時、内部に保持しているメモリアドレスレジスタ、命
令・データを記憶・保持しているメモリデータレジスタ
5b、サイズ情報をもつ計数器レジスタ5e、およびダ
ンプ命令か否かを判定する復号器5dの判定結果をもと
に、解析に必要なプログラムで使用するフラッグおよび
データをログアウト(記憶し出力すること)する。この
ログアウトデータを解析対象として、障害発生の原因を
追究する。
【0004】
【発明が解決しようとする課題】従来の計算機システム
解析装置では、ログアウトした一連のデータから必要な
データの値を取得することが困難なため解析に時間がか
かり、ログアウトするデータを作業領域のデータ部分に
限定せざるを得なかった。さらに、ログアウトするデー
タを限定するので、解析に必要なデータの収集が不十分
であったり、データの事前の見極めが必要となり、十分
な解析機能を達成できるものではなかった。
【0005】この発明は、上述のような問題点を解消す
るためになされたもので、その目的は、障害発生時の早
期の状態解析とシステムの高信頼化とを図れる計算機シ
ステム解析装置を得ることを目的とする。
【0006】
【課題を解決するための手段】この発明に係る計算機シ
ステム解析装置においては、解析対象となる動作中の計
算機システムの障害を検知し、その障害の解析に必要な
データを格納するデータ収集対象ファイルを生成する手
段、入力手段から入力したデータ項目に対する該データ
値を上記データ収集対象ファイルから取得する手段、お
よび取得した該データを出力手段に表示する手段を備え
ている。
【0007】また、入力手段から入力したデータ項目の
データ収集対象ファイルにおけるアドレス情報を計算機
システムの核(カーネル)のロードモジュールファイル
(実行ファイル)をもとに取得する手段、取得されたア
ドレス情報をもとに上記データ収集対象ファイルを検索
する手段を備えている。
【0008】また、計算機システムの障害発生時のメモ
リイメージであるクラッシュダンプファイルを生成する
手段を備えている。
【0009】また、計算機システムの動作中のメモリイ
メージを取得するデバイスファイルを生成する手段を備
えている。
【0010】また、計算機システムが正常動作中である
場合の内部データの許容範囲を定義した状態リファレン
スファイルを保持し、データ収集対象ファイルから取得
したデータ値と上記状態リファレンスファイルのデータ
値とを比較する手段を備えている。
【0011】また、システムの障害とそれぞれの障害に
関連するデータ項目とを障害管理テーブルとして保持
し、入力装置から入力した障害情報に対してその原因と
なるデータ項目を出力装置に表示するものである。
【0012】また、入力装置から入力した障害情報に対
してその原因となるデータ項目を表示する際、データ収
集対象ファイルから取得した該データ値をデータ項目と
ともに表示するものである。
【0013】また、システムの障害とそれぞれの障害に
関連するデータ項目とを障害管理テーブルとして保持
し、入力装置から入力したデータ項目に対して発生し得
る障害リストを出力装置に表示するものである。
【0014】また、解析対象となる計算機システムとデ
ータ収集対象ファイルの生成手段とデータ取得手段とを
有するプロセッサ、上記計算機システムの障害発生時に
上記計算機システムの動作を代替する手段とデータ収集
対象ファイルの生成手段とデータ取得手段とを有するプ
ロセッサ、およびデータ収集対象ファイルをバスで接続
するものである。
【0015】また、解析対象となる計算機システムとデ
ータ収集対象ファイルの生成手段とデータ取得手段とを
有する計算機、上記計算機システムの障害発生時に上記
計算機システムの動作を代替する手段とデータ収集対象
ファイルの生成手段とデータ取得手段とを有する計算
機、およびデータ収集対象ファイルをネットワークで接
続するものである。
【0016】
【作用】この発明においては、解析対象となる動作中の
計算機システムの障害を検知した場合は、解析に必要な
データ収集対象ファイルを生成し、入力手段から入力さ
れたデータ項目に対する該データ値が上記データ収集対
象ファイルから取得され出力手段に表示される。
【0017】また、入力手段から入力されたデータ項目
のデータ収集対象ファイルにおけるアドレス情報が計算
機システムの核(カーネル)のロードモジュールファイ
ル(実行ファイル)をもとに取得され、そのアドレス情
報をもとにデータ収集対象ファイルが検索されて該デー
タ値が得られる。
【0018】また、計算機システムの障害発生時のメモ
リイメージであるクラッシュダンプファイルが生成さ
れ、このクラッシュダンプファイルがデータ収集対象フ
ァイルとして解析される。
【0019】また、計算機システムの動作中のメモリイ
メージを取得するデバイスファイルが生成され、計算機
システム動作中もこのデバイスファイルがデータ収集対
象ファイルとして解析される。
【0020】また、計算機システムが正常動作中である
場合の内部データの許容範囲を定義した状態リファレン
スファイルのデータと、データ収集対象ファイルから取
得したデータ値とが比較される。
【0021】また、入力装置から入力された障害情報に
対して、障害管理テーブルをもとにその原因となるデー
タ項目が出力装置に表示される。
【0022】また、入力された障害の原因となるデータ
項目を表示する際、データ収集対象ファイルから取得し
た該データ値がデータ項目とともに表示される。
【0023】また、入力装置から入力されたデータ項目
に対して、障害管理テーブルをもとに発生し得る障害リ
ストが出力装置に表示される。
【0024】また、解析対象の計算機システムとその代
替手段とがそれぞれプロセッサにより実現され、上記計
算機システムに障害が発生した場合には、速やかに障害
の解析が行われる。
【0025】また、解析対象の計算機システムとその代
替手段とがネットワークを介して接続され、上記計算機
システムに障害が発生した場合には、速やかに障害の解
析が行われる。
【0026】
【実施例】
実施例1.図1はこの発明の一実施例による計算機シス
テム解析装置を示すシステム構成図であり、概して解析
部6とシステム部7とから構成され、それにデータ収集
対象ファイル群8と解析の指示入力やデータ表示を行う
入出力部9とが接続されている。システム部7には解析
対象となるシステム7aとこのシステム7aの障害発生
を検知した場合にシステム7aの動作を代替するシステ
ム7b、解析対象となるシステム7aに障害が発生した
場合にクラッシュダンプファイル8bを作成するクラッ
シュファイル生成部7cおよびシステム7a動作時のメ
モリイメージを表すデバイスファイル8cを作成するメ
モリイメージ生成部7dが存在する。システム7aに障
害が発生した場合は、点線の矢印に示すように、システ
ム7bがクラッシュファイル生成部7cおよびメモリイ
メージ生成部7dを通じて解析部6と接続される。ファ
イル群8には上記クラッシュダンプファイル8b、上記
デバイスファイル8c、カーネルの実行ファイルである
カーネルロードモジュールファイル8a、および入出力
部9からのデータ要求によりデバイスファイル8cを検
索して得られたデータ値を格納している状態ファイル8
dが存在する。10は解析部6において解析に必要なデ
ータを検索するデータ検索部で、データ検索管理部10
a、アドレス・シンボル取得部10bおよびデータ取得
部10cとからなる。また、11はデータ検索部10か
ら得たデータを処理して入出力部9に出力する単一ペー
ジ化表示機能部である。
【0027】次に動作について説明する。まず、システ
ム部7の動作について図2を参照しながら述べる。解析
対象となるシステム7aが正常動作時には、図2(a)
に示すように、システム7a内部で保持しているモード
が通常実行モードを示しており、システム7aを監視す
るシステム7bはシステム7aの動作状態を監視する状
態にあるので、システム7bの内部に保持しているモー
ドは監視モードとなっている。システム7bは、システ
ム7aから監視データを受け取ることによって、システ
ム7aが何らかの影響で停止しないかどうかを監視して
いる。また、メモリイメージ生成部7dによってデバイ
スファイル8cが生成されている。何らかの影響でシス
テム7aが停止した場合は、クラッシュファイル生成部
7cによりクラッシュダンプファイル8bが生成され
る。そして、図2(b)に示すように、システム7aか
らの監視データが停止し、システム7a内のモードが停
止モードとなる。このとき、システム7b内のモードは
通常実行モードとなり、システム7aに代わってシステ
ム7bがクラッシュファイル生成部7aおよびメモリイ
メージ生成部7dを通じて解析部6と接続され、システ
ム7bがシステム7aの代替を行うことになる。また、
解析部6は、後述するように、システム7aの停止によ
り生成されたカーネルのクラッシュダンプファイル8b
により、システム7aの障害発生時の解析を行うことが
できる。
【0028】次に、解析部6の動作について図3を参照
しながら述べる。図3(a)はシステム7aの正常動作
時のシステム状態を解析する場合を示している。データ
検索管理部10aは入出力部9から入力されたデータを
アドレス・シンボル取得部10bに要求し、アドレス・
シンボル取得部10bはそのデータのシンボルまたはア
ドレスデータをカーネルロードモジュールファイル8a
から得る。得られたシンボルまたはアドレスデータはデ
ータ検索管理部10aからデータ取得部10cに送ら
れ、そのデータをもとにメモリイメージを取得するデバ
イスファイル8cを検索することによって、入出力部9
から要求されたデータを取得することができる。取得さ
れたデータは単一ページ化表示機能部11により入出力
部9に表示される。システム動作中に上記の動作を周期
的に行うことにより、取得したいデータのデータ項目を
入出力装置から入力するだけで該データを周期的に表示
することができ、システムの異常が検出できる。
【0029】図3(b)はシステム7aが何らかの影響
で停止した場合にシステムの状態を解析する場合を示し
たもので、この場合も入出力部9から入力されたデータ
のアドレスまたはシンボルデータをもとにファイルを検
索することになるが、この場合は、システム停止時に生
成されたクラッシュダンプファイル8bを検索する。こ
れにより、障害発生によるシステム停止時のデータが迅
速に得られ、早期解析が可能になる。また、システム正
常動作中に入出力部9からデータ項目を要求入力して取
得したデータ値を状態ファイル8dとして保存してお
き、必要な時にその状態ファイル8dをデータ項目によ
り検索することによって、常にシステム正常時のデータ
値を得ることができる。図3(c)に状態ファィル8d
を検索する構成例を示す。以上のように、計算機システ
ムの障害発生時にはそのシステムを監視するシステムが
迅速に代替し、障害の状態解析時に収集するデータがシ
ステム全体のデータが対象となっているにもかかわら
ず、データ項目を入力するだけでその値を取得できるの
で、障害の状態解析が迅速にかつ正確に行える。なお、
上記単一ページ化表示機能部11は解析部6の内部の構
成としているが、解析部6の外部の構成にしても差し支
えない。
【0030】実施例2.図4は、本実施例2による計算
機システム解析装置を示す構成図で、図1で示したもの
に、状態ファイル8dからのデータと状態リファレンス
ファイル12からの参照データとを比較する比較推定部
13を追加したものである。状態リファレンスファイル
12とは、システム正常動作時のデータ値の許容範囲が
定義されたファィルである。例えば、電圧、温度、振動
について正常な範囲が指定され、最大プロセス、スレッ
ド数、オープン可能なファイル数など、予め決められた
最大値が明記されている。その他の負荷やデータについ
ても同様に指定されている。
【0031】上記のように構成された解析装置において
は、データ検索管理部10aが入出力部9からの要求を
受けて、データ取得部10cにより状態ファイル8dを
検索し、状態データを取得する。取得された状態データ
は、比較推定部13において状態リファレンスファイル
12の正常時の値と比較される。状態ファイル8dは、
入出力部9から要求したデータ項目に対してデバイスフ
ァイル8cを検索して得られたデータ値を格納したファ
イルであるので、上記比較により、状態ファイル作成時
のシステムが正常に動作しているかどうかの検査が行え
る。比較したデータに違いがあれば異常と診断され、異
常データを入出力部9に表示して障害の推定を行うこと
で解析を容易にする。また、振動検知の場合などは、上
記のようにして状態比較・解析をおこなった結果、例え
ば予め決められた震度以上の地震については緊急停止な
どの処理を行わせることが可能となる。なお、入出力部
9からの処理要求は周期的に行う事ができるので迅速な
解析が行える。また、比較推定部13で状態リファレン
スファイル12と比較するデータは、状態ファイル8d
からのデータだけでなく、クラッシュダンプファイル8
bやデバイスファイル8cからのデータを直接用いるこ
ともできる。ただし、クラッシュダンプファイル8bを
用いた場合はシステムがクラッシュした時の異常データ
の検査を、また、デバイスファイル8cを用いた場合は
システムが正常に動作しているか否かの検査を行うこと
となる。
【0032】実施例3.上記実施例1および2において
は、システムの異常時にはデータを検索して表示等を行
うことにより障害の原因を追及したが、障害の原因とそ
れに関連するデータ項目との対応を得ることによって、
より早期に解析を行うことが可能となる。図5は本実施
例3による解析装置の構成の一部を示したもので、14
は障害管理テーブルである。この障害管理テーブル14
は、各障害に対してその原因および関連するデータ項目
を記述したテーブルであり、データ検索管理部10aに
管理されている。図6に障害管理テーブルの一例を示
す。上記のような解析装置においては、入出力部9から
の処理要求によりデータ検索管理部10aは障害管理テ
ーブル14を検索し、要求のあったデータ項目に対応す
る障害および原因の一覧を入出力部9に出力する。さら
に、出力された障害および原因に関連するその他のデー
タ項目をも障害管理テーブル14を検索して表示するこ
とにより、解析時に必要なデータの提案を行うことがで
き、解析が容易となる。また、それぞれの障害原因に関
連するデータ項目とともにそのデータの値を取得し表示
することができるので、システムの不具合点を早期に発
見することが可能となる。
【0033】実施例4.なお、上記実施例1による解析
装置におけるシステム7aとシステム7bとを複数のプ
ロセッサ(マルチプロセッサ)で構成することにより、
よりシステムの信頼性が向上する。図7は本実施例4に
よる解析装置の構成の一部を示したもので、解析対象と
なるシステム7aと解析部6とを有するプロセッサ15
aと、システム7aを監視し障害発生時に動作を代替す
るシステム7bと解析部6とを有するプロセッサ15b
と、ディスク16とがバスによって接続されている。デ
ィスク16には、検索対象となるファイルが格納されて
おり、プロセッサ15aおよびプロセッサ15bの双方
からのデータ取得が可能である。これによると、システ
ム7aに障害が発生した場合には速やかにシステム7b
に動作が移り、システムの信頼性が向上する。なお、シ
ステム7aの動作を代替するシステム7bを有するプロ
セッサを複数個設けることにより、より信頼性が向上す
る。
【0034】実施例5.また、図8に示すように、上記
実施例1による解析装置のシステム7aとシステム7b
とを別個の計算機17a,17bに設け、それらをネッ
トワークを介して接続するようにしてもよい。この場合
は、ネットワークで接続された各計算機17a,17b
に入出力部9を設け、システム7aを監視するシステム
7bをもった計算機17bにディスク16が接続され
る。これにより、距離的に離れた場所においても障害の
解析を容易に行うことが可能である。
【0035】
【発明の効果】この発明は、以上説明したように構成さ
れているので、以下に示すような効果を奏する。
【0036】解析対象となる計算機システムの障害を検
知した場合は、障害の解析に必要なデータを格納するデ
ータ収集対象ファイルを入力手段から入力されたデータ
項目をもとに検索し、該データ値を表示できるようにし
たので、障害発生時の早期の状態解析が行える。
【0037】また、入力装置から入力されたデータ項目
の存在するアドレス情報を取得してデータ収集対象ファ
イルを検索するので、必要なデータの値が即座に得られ
る。
【0038】また、障害発生時のクラッシュダンプファ
イルをデータ収集対象ファイルとしたので、障害の原因
解析が迅速に行える。
【0039】また、計算機システムの動作中のメモリイ
メージを取得するデバイスファイルをデータ収集対象フ
ァイルとしたので、計算機システム動作中もシステム異
常が検知できる。
【0040】また、システム正常時のデータを定義した
状態リファレンスファイルのデータ値とデータ収集対象
ファイルのデータ値とを比較するようにしたので、障害
の原因となるデータ項目が即座に分かる。
【0041】また、システムの障害とその障害に関連す
るデータ項目とを記述した障害管理テーブルを保持して
いるので、障害の原因解析が容易に行える。
【0042】また、入力されたシステムの障害に対し
て、それに関連するデータ項目だけでなくデータ値をも
表示できるようにしたので、障害の原因解析が迅速に行
える。
【0043】また、入力されたデータ項目に対して発生
し得る障害リストを表示できるようにしたので、障害の
状態が確実に行える。
【0044】また、解析対象となる計算機システムとそ
れを代替する手段とをマルチプロセッサにより実現した
ので、システムの信頼性が向上する。
【0045】また、解析対象となる計算機システムとそ
れを代替する手段とをネットワークで接続したので、距
離的に離れた地点においても障害解析が行える。
【図面の簡単な説明】
【図1】 この発明の実施例1による計算機システム解
析装置を示す構成図である。
【図2】 図1のシステム部の動作を説明する図であ
る。
【図3】 図1の解析部の動作を説明する図である。
【図4】 この発明の実施例2による計算機システム解
析装置を示す構成図である。
【図5】 この発明の実施例3による計算機システム解
析装置の動作を説明する図である。
【図6】 障害管理テーブルの例を示す図である。
【図7】 この発明の実施例4による計算機システム解
析装置を示す構成図である。
【図8】 この発明の実施例5による計算機システム解
析装置を示す構成図である。
【図9】 従来の計算機システム解析装置を示す構成図
である。
【符号の説明】
6 解析部、7 システム部、8 データ収集対象ファ
イル、9 入出力部、10 データ検索部、11 単一
ページ化表示機能部、12 状態リファレンスファイ
ル、13 比較推定部、14 障害管理テーブル、15
プロセッサ。

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 解析対象となる動作中の計算機システム
    の障害を検知し、その障害の解析に必要なデータを格納
    するデータ収集対象ファイルを生成する手段、入力手段
    から入力したデータ項目に対する該データを上記データ
    収集対象ファイルから取得する手段、および取得した該
    データ値を出力手段に表示する手段を備えたことを特徴
    とする計算機システム解析装置。
  2. 【請求項2】 入力手段から入力されたデータ項目のデ
    ータ収集対象ファイルにおけるアドレス情報を計算機シ
    ステムの核(カーネル)のロードモジュールファイル
    (実行ファイル)をもとに取得する手段、取得されたア
    ドレス情報をもとに上記データ収集対象ファイルを検索
    する手段を備えたことを特徴とする請求項1記載の計算
    機システム解析装置。
  3. 【請求項3】 計算機システムの障害発生時のメモリイ
    メージであるクラッシュダンプファィルを生成する手段
    を備え、上記クラッシュダンプファイルをデータ収集対
    象ファイルとして解析を行うことを特徴とする請求項1
    または2に記載の計算機システム解析装置。
  4. 【請求項4】 計算機システムの動作中のメモリイメー
    ジを取得するデバイスファイルを生成する手段を備え、
    上記計算機システム動作中にも上記デバイスファイルを
    データ収集対象ファイルとして解析を行うことを特徴と
    する請求項1または2に記載の計算機システム解析装
    置。
  5. 【請求項5】 計算機システムが正常動作中である場合
    の内部データの許容範囲を定義した状態リファレンスフ
    ァイルを保持し、データ収集対象ファイルから取得した
    データ値と上記状態リファレンスファイルのデータ値と
    を比較する手段を備えたことを特徴とする請求項1ない
    し4のいずれかに記載の計算機システム解析装置。
  6. 【請求項6】 システムの障害とそれぞれの障害に関連
    するデータ項目とを障害管理テーブルとして保持し、入
    力装置から入力した障害情報に対してその原因となるデ
    ータ項目を出力装置に表示するようにしたことを特徴と
    する請求項1ないし5のいずれかに記載の計算機システ
    ム解析装置。
  7. 【請求項7】 入力装置から入力した障害情報に対して
    その原因となるデータ項目を表示する際、データ収集対
    象ファイルから取得した該データ値をデータ項目ととも
    に表示するようにしたことを特徴とする請求項6記載の
    計算機システム解析装置。
  8. 【請求項8】 システムの障害とそれぞれの障害に関連
    するデータ項目とを障害管理テーブルとして保持し、入
    力装置から入力したデータ項目に対して発生し得る障害
    リストを出力装置に表示するようにしたことを特徴とす
    る請求項1ないし5のいずれかに記載の計算機システム
    解析装置。
  9. 【請求項9】 解析対象となる計算機システムとデータ
    収集対象ファイルを生成する手段とデータ取得手段とを
    有するプロセッサ、上記計算機システムの障害発生時に
    上記計算機システムの動作を代替する手段とデータ収集
    対象ファイルを生成する手段とデータ取得手段とを有す
    るプロセッサ、および上記データ収集対象ファイルをバ
    スで接続することを特徴とする請求項1ないし8のいず
    れかに記載の計算機システム解析装置。
  10. 【請求項10】 解析対象となる計算機システムとデー
    タ収集対象ファイルを生成する手段とデータ取得手段と
    を有する計算機、上記計算機システムの障害発生時に上
    記計算機システムの動作を代替する手段とデータ収集対
    象ファイルを生成する手段とデータ取得手段とを有する
    計算機、および上記データ収集対象ファイルをネットワ
    ークを介して接続することを特徴とする請求項1ないし
    8のいずれかに記載の計算機システム解析装置。
JP10379195A 1995-04-27 1995-04-27 計算機システム解析装置 Expired - Fee Related JP3532289B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP10379195A JP3532289B2 (ja) 1995-04-27 1995-04-27 計算機システム解析装置
US08/575,225 US5790777A (en) 1995-04-27 1995-12-20 Computer system analysis device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10379195A JP3532289B2 (ja) 1995-04-27 1995-04-27 計算機システム解析装置

Publications (2)

Publication Number Publication Date
JPH08297598A true JPH08297598A (ja) 1996-11-12
JP3532289B2 JP3532289B2 (ja) 2004-05-31

Family

ID=14363231

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10379195A Expired - Fee Related JP3532289B2 (ja) 1995-04-27 1995-04-27 計算機システム解析装置

Country Status (2)

Country Link
US (1) US5790777A (ja)
JP (1) JP3532289B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9261944B2 (en) 2014-01-16 2016-02-16 Ricoh Company, Ltd. Information processing apparatus, control method, and recording medium storing a control program

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3547989B2 (ja) * 1998-04-10 2004-07-28 Dxアンテナ株式会社 マルチビームアンテナ用反射鏡
US6581156B1 (en) 1998-09-18 2003-06-17 Siemens Aktiengesellschaft Method for recording a data state in a data processing system
US6460146B1 (en) * 1998-12-04 2002-10-01 Cisco Technology, Inc. System and method for establishing processor redundancy
US6457138B1 (en) * 1999-04-19 2002-09-24 Cisco Technology, Inc. System and method for crash handling on redundant systems
US7111307B1 (en) 1999-11-23 2006-09-19 Microsoft Corporation Method and system for monitoring and verifying software drivers using system resources including memory allocation and access
US6523141B1 (en) * 2000-02-25 2003-02-18 Sun Microsystems, Inc. Method and apparatus for post-mortem kernel memory leak detection
US6728907B1 (en) * 2000-04-14 2004-04-27 Microsoft Corporation System and method for self-diagnosing system crashes
US6792559B1 (en) * 2000-04-25 2004-09-14 Ncr Corporation Performing operations in an environment recreated from system dump information
US6633876B1 (en) * 2000-06-07 2003-10-14 Sun Microsystems, Inc. Analyzing post-mortem information on a remote computer system using a downloadable code module
US6618823B1 (en) 2000-08-15 2003-09-09 Storage Technology Corporation Method and system for automatically gathering information from different types of devices connected in a network when a device fails
US6681348B1 (en) * 2000-12-15 2004-01-20 Microsoft Corporation Creation of mini dump files from full dump files
US6738932B1 (en) 2000-12-22 2004-05-18 Sun Microsystems, Inc. Method and system for identifying software revisions from memory images
US6763517B2 (en) 2001-02-12 2004-07-13 Sun Microsystems, Inc. Automated analysis of kernel and user core files including searching, ranking, and recommending patch files
US6950847B2 (en) * 2001-07-12 2005-09-27 Sun Microsystems, Inc. Service provider system for delivering services in a distributed computing environment
US20030135823A1 (en) * 2002-01-14 2003-07-17 Richard Marejka Loader and provider configuration for remotely provided services
US6973598B2 (en) * 2002-01-28 2005-12-06 Dell Products L.P. Computer system with improved data capture system
US7231634B2 (en) * 2002-09-17 2007-06-12 Sun Microsystems, Inc. Method for determining scope and cause of memory corruption
DE10340410B4 (de) * 2003-09-02 2005-09-08 Infineon Technologies Ag Prozessorsystem zum Stabilisieren eines Betriebes eines Prozessorsystems
US7793229B1 (en) * 2003-12-19 2010-09-07 Unisys Corporation Recording relevant information in a GUI window of a panel dump browser tool
US8745703B2 (en) * 2008-06-24 2014-06-03 Microsoft Corporation Identifying exploitation of vulnerabilities using error report
US8862930B2 (en) * 2010-11-24 2014-10-14 Red Hat, Inc. Crash recovery memory reservation based on device drivers for an operational kernel
US9026860B2 (en) * 2012-07-31 2015-05-05 International Business Machines Corpoation Securing crash dump files
JP6405851B2 (ja) * 2014-09-30 2018-10-17 富士通株式会社 予兆検知支援プログラム、方法、装置、及び予兆検知プログラム、

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57120163A (en) * 1981-01-16 1982-07-27 Toshiba Corp Computer system
US4628511A (en) * 1984-09-06 1986-12-09 Shell Oil Company Apparatus for analysis of computer channel failures
US4949252A (en) * 1985-10-17 1990-08-14 Technology 80, Inc. Computer channel analyzer with monitoring and selective display of predetermining events and related data
US4821269A (en) * 1986-10-23 1989-04-11 The Grass Valley Group, Inc. Diagnostic system for a digital signal processor
US4967414A (en) * 1989-01-06 1990-10-30 International Business Machines Corp. LRU error detection using the collection of read and written LRU bits
US5119377A (en) * 1989-06-16 1992-06-02 International Business Machines Corporation System and method for software error early detection and data capture
US5218605A (en) * 1990-01-31 1993-06-08 Hewlett-Packard Company Software modules for testing computer hardware and software
US5280486A (en) * 1990-03-16 1994-01-18 Teradyne, Inc. High speed fail processor
US5157667A (en) * 1990-04-30 1992-10-20 International Business Machines Corporation Methods and apparatus for performing fault isolation and failure analysis in link-connected systems
US5200958A (en) * 1990-09-28 1993-04-06 Xerox Corporation Method and apparatus for recording and diagnosing faults in an electronic reprographic printing system
US5245615A (en) * 1991-06-06 1993-09-14 International Business Machines Corporation Diagnostic system and interface for a personal computer
US5390323A (en) * 1991-08-05 1995-02-14 Amdahl Corporation Microstore reference logging
US5339406A (en) * 1992-04-03 1994-08-16 Sun Microsystems, Inc. Reconstructing symbol definitions of a dynamically configurable operating system defined at the time of a system crash
US5491793A (en) * 1992-07-31 1996-02-13 Fujitsu Limited Debug support in a processor chip
KR960005014B1 (ko) * 1992-11-27 1996-04-18 삼성전자주식회사 도트매트릭스 이미지 데이타를 페이지 프린터에서 처리하는 방법 및 회로
GB9301286D0 (en) * 1993-01-22 1993-03-17 Int Computers Ltd Data processing system
US5473771A (en) * 1993-09-01 1995-12-05 At&T Corp. Fault-tolerant processing system architecture
US5533193A (en) * 1994-06-24 1996-07-02 Xerox Corporation Method of saving machine fault information including transferring said information to another memory when an occurrence of predetermined events or faults of a reproduction machine is recognized

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9261944B2 (en) 2014-01-16 2016-02-16 Ricoh Company, Ltd. Information processing apparatus, control method, and recording medium storing a control program

Also Published As

Publication number Publication date
US5790777A (en) 1998-08-04
JP3532289B2 (ja) 2004-05-31

Similar Documents

Publication Publication Date Title
JP3532289B2 (ja) 計算機システム解析装置
JP2010086099A (ja) ログ管理方法、ログ管理装置、ログ管理装置を備えた情報処理装置、及びプログラム
EP2175372A2 (en) Computer apparatus and processor diagnostic method
US7970582B2 (en) Diagnosis system for at least one technical system
CN116775141A (zh) 异常检测方法、装置、计算机设备及存储介质
JP5733515B2 (ja) Ras機能を備える組み込み機器
JP2868114B2 (ja) 監視診断機能付計算機
JP2702432B2 (ja) 故障診断方式
JP2010055305A (ja) 診断項目登録システム、方法及びプログラム
JP2000081992A (ja) コンピュータ性能チェック方式
JP2947571B2 (ja) 障害診断装置
JPS59220850A (ja) 障害情報収集装置
JP2024057132A (ja) メンテナンス情報作成装置、方法およびプログラム
JPH07248810A (ja) 数値制御装置
US20210200603A1 (en) Preemptive Self-Healing of Application Server Hanging Threads
JPH03293524A (ja) プラント異常診断装置
CN117155628A (zh) 一种容器化应用交互式安全测试方法、装置及相关系统
JP2023075775A (ja) 不具合分析装置
JPS63213039A (ja) 診断装置の障害解析方式
JPH0581051A (ja) リソース破壊監視方式
CN117130810A (zh) 报错信息的收集方法、装置、电子设备及可读存储介质
CN118193316A (zh) 服务器状态监控方法、装置和计算机设备
JP3243022B2 (ja) 原因診断装置
JPH0667921A (ja) 障害処理機能を有する情報処理装置
JPH0293898A (ja) 監視装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040302

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040303

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees