JP3532289B2 - 計算機システム解析装置 - Google Patents

計算機システム解析装置

Info

Publication number
JP3532289B2
JP3532289B2 JP10379195A JP10379195A JP3532289B2 JP 3532289 B2 JP3532289 B2 JP 3532289B2 JP 10379195 A JP10379195 A JP 10379195A JP 10379195 A JP10379195 A JP 10379195A JP 3532289 B2 JP3532289 B2 JP 3532289B2
Authority
JP
Japan
Prior art keywords
data
computer system
failure
target file
collection target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP10379195A
Other languages
English (en)
Other versions
JPH08297598A (ja
Inventor
和也 伊豆田
敏也 伊藤
義雄 遠藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP10379195A priority Critical patent/JP3532289B2/ja
Priority to US08/575,225 priority patent/US5790777A/en
Publication of JPH08297598A publication Critical patent/JPH08297598A/ja
Application granted granted Critical
Publication of JP3532289B2 publication Critical patent/JP3532289B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
    • G06F11/0724Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU] in a multiprocessor or a multi-core unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0745Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in an input/output transactions management context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、計算機システムの障
害発生時に、システム解析を行うことのできる計算機シ
ステム解析装置に関するものである。
【0002】
【従来の技術】図9は、例えば特開昭57−12016
3号公報に示された従来の計算機システム解析装置のシ
ステム構成図であり、図において、1は主記憶装置、2
はCPU、3は入出力装置4を制御する入出力制御部で
ある。5は障害発生時に障害解析記録を行うデータ収集
部で、主記憶装置1の読み出し番地を保持するメモリア
ドレスレジスタを内部に持つ主記憶装置制御部5a、命
令・データを保持するメモリデータレジスタ5b、出力
機構制御部5c、ダンプ命令であるか否かを判定する復
号器5d、オペランドサイズを保持する計数器レジスタ
5e、および制御部5fから構成されている。
【0003】このような従来の計算機システム解析装置
において障害が発生した場合、主記憶装置制御部5aが
主記憶装置1から障害発生時の内部状況を読み出す。こ
の時、内部に保持しているメモリアドレスレジスタ、命
令・データを記憶・保持しているメモリデータレジスタ
5b、サイズ情報をもつ計数器レジスタ5e、およびダ
ンプ命令か否かを判定する復号器5dの判定結果をもと
に、解析に必要なプログラムで使用するフラッグおよび
データをログアウト(記憶し出力すること)する。この
ログアウトデータを解析対象として、障害発生の原因を
追究する。
【0004】
【発明が解決しようとする課題】従来の計算機システム
解析装置では、ログアウトした一連のデータから必要な
データの値を取得することが困難なため解析に時間がか
かり、ログアウトするデータを作業領域のデータ部分に
限定せざるを得なかった。さらに、ログアウトするデー
タを限定するので、解析に必要なデータの収集が不十分
であったり、データの事前の見極めが必要となり、十分
な解析機能を達成できるものではなかった。
【0005】この発明は、上述のような問題点を解消す
るためになされたもので、その目的は、障害発生時の早
期の状態解析とシステムの高信頼化とを図れる計算機シ
ステム解析装置を得ることを目的とする。
【0006】
【課題を解決するための手段】この発明に係る計算機シ
ステム解析装置においては、解析対象となる動作中の計
算機システムの障害を検知し、その障害の解析に必要な
データを格納するデータ収集対象ファイルを生成する手
と、上記計算機システムの起こり得る障害およびこの
各障害に関連するデータ項目を格納した障害管理テーブ
ルと、上記障害の解析に必要なデータ項目を入力する入
力手段と、該入力手段により入力されたデータ項目に対
するデータを上記データ収集対象ファイルから取得する
と共に、上記入力されたデータ項目に対応する障害を上
記障害管理テーブルから取得するデータ取得手段と、取
得した該データおよび該障害を上記データ項目と共に表
示する出力手段とを備えている。
【0007】また、データ取得手段は、入力されたデー
タ項目に対応する障害と共に、該障害に関連する他のデ
ータ項目を障害管理テーブルから取得し、上記障害及び
その原因となる上記データ項目の一覧を出力手段により
表示するものである。
【0008】また、解析対象となる計算機システムとデ
ータ収集対象ファイルを生成する手段とデータ取得手段
とを有するプロセッサ、上記計算機システムの障害発生
時に上記計算機システムの動作を代替する手段とデータ
収集対象ファイルを生成する手段とデータ取得手段とを
有するプロセッサ、および上記データ収集対象ファイル
をバスで接続するものである。
【0009】また、解析対象となる計算機システムとデ
ータ収集対象ファイルを生成する手段とデータ取得手段
とを有する計算機、上記計算機システムの障害発生時に
上記計算機システムの動作を代替する手段とデータ収集
対象ファイルを生成する手段とデータ取得手段とを有す
る計算機、および上記データ収集対象ファイルをネット
ワークを介して接続するものである。
【0010】
【作用】この発明においては、解析対象となる動作中の
計算機システムの障害を検知した場合は、解析に必要な
データ収集対象ファイルを生成し、入力手段から入力さ
れたデータ項目に対する該データ値が上記データ収集対
象ファイルから取得され出力手段に表示される。また、
入力されたデータ項目に対して、障害管理テーブルから
発生し得る障害が取得され出力手段に表示される。
【0011】また、入力されたデータ項目に対応する障
害と共に、この障害に関連する他のデータ項目が障害管
理テーブルから取得され、発生し得る障害及びその原因
の一覧が表示される。
【0012】また、解析対象の計算機システムとその代
替手段とがそれぞれプロセッサにより実現され、上記計
算機システムに障害が発生した場合には、速やかに障害
の解析が行われる。
【0013】また、解析対象の計算機システムとその代
替手段とがネットワークを介して接続され、上記計算機
システムに障害が発生した場合には、速やかに障害の解
析が行われる。
【0014】
【実施例】実施例1. 図1はこの発明の一実施例による計算機システム解析装
置を示すシステム構成図であり、概して解析部6とシス
テム部7とから構成され、それにデータ収集対象ファイ
ル群8と解析の指示入力やデータ表示を行う入出力部9
とが接続されている。システム部7には解析対象となる
システム7aとこのシステム7aの障害発生を検知した
場合にシステム7aの動作を代替するシステム7b、解
析対象となるシステム7aに障害が発生した場合にクラ
ッシュダンプファイル8bを作成するクラッシュファイ
ル生成部7cおよびシステム7a動作時のメモリイメー
ジを表すデバイスファイル8cを作成するメモリイメー
ジ生成部7dが存在する。システム7aに障害が発生し
た場合は、点線の矢印に示すように、システム7bがク
ラッシュファイル生成部7cおよびメモリイメージ生成
部7dを通じて解析部6と接続される。ファイル群8に
は上記クラッシュダンプファイル8b、上記デバイスフ
ァイル8c、カーネルの実行ファイルであるカーネルロ
ードモジュールファイル8a、および入出力部9からの
データ要求(すなわちデータ項目の入力)によりデバイ
スファイル8cを検索して得られたデータ値を格納して
いる状態ファイル8dが存在する。10は解析部6にお
ける障害の解析に必要なデータを検索するデータ検索部
で、データ検索管理部10a、アドレス・シンボル取得
部10bおよびデータ取得部10cとからなる。また、
11はデータ検索部10から得たデータを処理して入出
力部9に出力する単一ページ化表示機能部である。
【0015】次に動作について説明する。まず、システ
ム部7の動作について図2を参照しながら述べる。解析
対象となるシステム7aが正常動作時には、図2(a)
に示すように、システム7a内部で保持しているモード
が通常実行モードを示しており、システム7aを監視す
るシステム7bはシステム7aの動作状態を監視する状
態にあるので、システム7bの内部に保持しているモー
ドは監視モードとなっている。システム7bは、システ
ム7aから監視データを受け取ることによって、システ
ム7aが何らかの影響で停止しないかどうかを監視して
いる。また、メモリイメージ生成部7dによってデバイ
スファイル8cが生成されている。何らかの影響でシス
テム7aが停止した場合は、クラッシュファイル生成部
7cによりクラッシュダンプファイル8bが生成され
る。そして、図2(b)に示すように、システム7aか
らの監視データが停止し、システム7a内のモードが停
止モードとなる。このとき、システム7b内のモードは
通常実行モードとなり、システム7aに代わってシステ
ム7bがクラッシュファイル生成部7aおよびメモリイ
メージ生成部7dを通じて解析部6と接続され、システ
ム7bがシステム7aの代替を行うことになる。また、
解析部6は、後述するように、システム7aの停止によ
り生成されたカーネルのクラッシュダンプファイル8b
により、システム7aの障害発生時の解析を行うことが
できる。
【0016】次に、解析部6の動作について図3を参照
しながら述べる。図3(a)はシステム7aの正常動作
時のシステム状態を解析する場合を示している。データ
検索管理部10aは入出力部9から入力されたデータ
をアドレス・シンボル取得部10bに要求し、アドレ
ス・シンボル取得部10bはそのデータ項目のシンボル
またはアドレスデータをカーネルロードモジュールファ
イル8aから得る。得られたシンボルまたはアドレスデ
ータはデータ検索管理部10aからデータ取得部10c
に送られ、そのデータをもとにメモリイメージを取得す
るデバイスファイル8cを検索することによって、入出
力部9から要求されたデータ項目に対するデータを取得
することができる。取得されたデータは単一ページ化表
示機能部11により入出力部9に表示される。システム
動作中に上記の動作を周期的に行うことにより、取得し
たいデータのデータ項目を、障害の解析に必要なデータ
として入出力装置から入力するだけで該データを周期的
に表示することができ、システムの異常が検出できる。
【0017】図3(b)はシステム7aが何らかの影響
で停止した場合にシステムの状態を解析する場合を示し
たもので、この場合も入出力部9から入力されたデータ
のアドレスまたはシンボルデータをもとにファイルを検
索することになるが、この場合は、システム停止時に生
成されたクラッシュダンプファイル8bを検索する。こ
れにより、障害発生によるシステム停止時のデータが迅
速に得られ、これをシステムの停止に係る障害の解析に
必要なデータとして、早期解析が可能になる。また、シ
ステム正常動作中に入出力部9からデータ項目を要求入
力して取得したデータ値を状態ファイル8dとして保存
しておき、必要な時にその状態ファイル8dをデータ項
目により検索することによって、常にシステム正常時の
データ値を得ることができる。図3(c)に状態ファィ
ル8dを検索する構成例を示す。以上のように、計算機
システムの障害発生時にはそのシステムを監視するシス
テムが迅速に代替し、障害の状態解析時に収集するデー
タがシステム全体のデータが対象となっているにもかか
わらず、データ項目を入力するだけでその値を取得でき
るので、障害の状態解析が迅速にかつ正確に行える。な
お、上記単一ページ化表示機能部11は解析部6の内部
の構成としているが、解析部6の外部の構成にしても差
し支えない。
【0018】実施例2. 図4は、本実施例2による計算機システム解析装置を示
す構成図で、図1で示したものに、状態ファイル8dか
らのデータと状態リファレンスファイル12からの参照
データとを比較する比較推定部13を追加したものであ
る。状態リファレンスファイル12とは、システム正常
動作時のデータ値の許容範囲が定義されたファィルであ
る。例えば、電圧、温度、振動について正常な範囲が指
定され、最大プロセス、スレッド数、オープン可能なフ
ァイル数など、予め決められた最大値が明記されてい
る。その他の負荷やデータについても同様に指定されて
いる。
【0019】上記のように構成された解析装置において
は、データ検索管理部10aが入出力部9からの要求を
受けて、データ取得部10cにより状態ファイル8dを
検索し、状態データを取得する。取得された状態データ
は、比較推定部13において状態リファレンスファイル
12の正常時の値と比較される。状態ファイル8dは、
入出力部9から要求したデータ項目に対してデバイスフ
ァイル8cを検索して得られたデータ値を格納したファ
イルであるので、上記比較により、状態ファイル作成時
のシステムが正常に動作しているかどうかの検査が行え
る。比較したデータに違いがあれば異常と診断され、異
常データを入出力部9に表示して障害の推定を行うこと
で解析を容易にする。また、振動検知の場合などは、上
記のようにして状態比較・解析をおこなった結果、例え
ば予め決められた震度以上の地震については緊急停止な
どの処理を行わせることが可能となる。なお、入出力部
9からの処理要求は周期的に行う事ができるので迅速な
解析が行える。また、比較推定部13で状態リファレン
スファイル12と比較するデータは、状態ファイル8d
からのデータだけでなく、クラッシュダンプファイル8
bやデバイスファイル8cからのデータを直接用いるこ
ともできる。ただし、クラッシュダンプファイル8bを
用いた場合はシステムがクラッシュした時の異常データ
の検査を、また、デバイスファイル8cを用いた場合は
システムが正常に動作しているか否かの検査を行うこと
となる。従って、これらのファイル8b、8c、8dに
格納されたデータで入力により要求されるデータが障害
の解析に必要なデータとなる。
【0020】実施例3. 上記実施例1および2においては、システムの異常時に
はデータを検索して表示等を行うことにより障害の原因
を追及したが、障害の原因とそれに関連するデータ項目
との対応を得ることによって、より早期に解析を行うこ
とが可能となる。図5は本実施例3による解析装置の構
成の一部を示したもので、14は障害管理テーブルであ
る。この障害管理テーブル14は、各障害に対してその
原因および関連するデータ項目を記述したテーブルであ
り、データ検索管理部10aに管理されている。図6に
障害管理テーブルの一例を示す。図6の障害管理テーブ
ルには、障害要因別に、障害のリストと、その障害に関
連するデータ項目が示されている。障害のリストには起
こり得る障害の原因が記載されている。尚、障害の要因
は、内部要因と外部要因に大別してあり、計算機システ
ム自身に障害の原因がある場合を内部要因、計算機シス
テム外に障害の要因がある場合を外部要因として分類し
てある。従って、例えば、計算機システムの障害に関連
するデータ項目という場合、図6の内部要因に分類され
ている各障害リストに対応する各データ項目がそれに該
当する。障害に関連するデータ項目を入力することによ
り、実施例1および2で既に述べたように、そのデータ
項目に対するデータを、障害の解析に必要なデータとし
てデータ収集対象ファイル群から取得することができ、
更に、上記のような解析装置においては、入出力部9か
らの処理要求によりデータ検索管理部10aは障害管理
テーブル14を検索し、要求のあったデータ項目に対応
する障害のリストから、障害および原因の一覧を入出力
部9に出力することができるまた、出力された障害お
よび原因に関連するその他のデータ項目をも障害管理テ
ーブル14を検索して表示することにより、障害の解析
必要な別のデータの提案行うことができ、障害の
析が容易となる。また、それぞれの障害に関連するデー
タ項目とともにそのデータの値を取得し表示することが
できるので、システムの不具合点を早期に発見すること
が可能となる。
【0021】実施例4. なお、上記実施例1による解析装置におけるシステム7
aとシステム7bとを複数のプロセッサ(マルチプロセ
ッサ)で構成することにより、よりシステムの信頼性が
向上する。図7は本実施例4による解析装置の構成の一
部を示したもので、解析対象となるシステム7aと解析
部6とを有するプロセッサ15aと、システム7aを監
視し障害発生時に動作を代替するシステム7bと解析部
6とを有するプロセッサ15bと、ディスク16とがバ
スによって接続されている。ディスク16には、検索対
象となるファイルが格納されており、プロセッサ15a
およびプロセッサ15bの双方からのデータ取得が可能
である。これによると、システム7aに障害が発生した
場合には速やかにシステム7bに動作が移り、システム
の信頼性が向上する。なお、システム7aの動作を代替
するシステム7bを有するプロセッサを複数個設けるこ
とにより、より信頼性が向上する。
【0022】実施例5. また、図8に示すように、上記実施例1による解析装置
のシステム7aとシステム7bとを別個の計算機17
a,17bに設け、それらをネットワークを介して接続
するようにしてもよい。この場合は、ネットワークで接
続された各計算機17a,17bに入出力部9を設け、
システム7aを監視するシステム7bをもった計算機1
7bにディスク16が接続される。これにより、距離的
に離れた場所においても障害の解析を容易に行うことが
可能である。
【0023】
【発明の効果】この発明は、以上説明したように構成さ
れているので、以下に示すような効果を奏する。
【0024】解析対象となる計算機システムの障害を検
知した場合は、障害の解析に必要なデータを格納するデ
ータ収集対象ファイルを入力手段から入力されたデータ
項目をもとに検索し、該データ値を表示できるようにし
たので、障害発生時の早期の状態解析が行える。また、
システムの障害とその障害に関連するデータ項目とを記
述した障害管理テーブルを保持しているので、障害の原
因解析が容易に行える。
【0025】また、入力されたデータ項目に対して発生
し得る障害及びその原因の一覧を表示できるようにした
ので、障害解析が確実に行える。
【0026】また、解析対象となる計算機システムとそ
れを代替する手段とをマルチプロセッサにより実現した
ので、システムの信頼性が向上する。
【0027】また、解析対象となる計算機システムとそ
れを代替する手段とをネットワークで接続したので、距
離的に離れた地点においても障害解析が行える。
【図面の簡単な説明】
【図1】 この発明の実施例1による計算機システム解
析装置を示す構成図である。
【図2】 図1のシステム部の動作を説明する図であ
る。
【図3】 図1の解析部の動作を説明する図である。
【図4】 この発明の実施例2による計算機システム解
析装置を示す構成図である。
【図5】 この発明の実施例3による計算機システム解
析装置の動作を説明する図である。
【図6】 障害管理テーブルの例を示す図である。
【図7】 この発明の実施例4による計算機システム解
析装置を示す構成図である。
【図8】 この発明の実施例5による計算機システム解
析装置を示す構成図である。
【図9】 従来の計算機システム解析装置を示す構成図
である。
【符号の説明】
6 解析部、7 システム部、8 データ収集対象ファ
イル、9 入出力部、10 データ検索部、11 単一
ページ化表示機能部、12 状態リファレンスファイ
ル、13 比較推定部、14 障害管理テーブル、15
プロセッサ。
フロントページの続き (56)参考文献 特開 昭57−152055(JP,A) 特開 昭60−72042(JP,A) 特開 昭63−311449(JP,A) 特開 昭63−317855(JP,A) 特開 平4−48343(JP,A) 特開 昭52−22843(JP,A) 特開 昭59−69848(JP,A) 特開 平7−36721(JP,A) 特開 平1−282652(JP,A) 特開 平5−127945(JP,A) 特開 昭63−189950(JP,A) 特開 平4−175834(JP,A) 特開 平4−287354(JP,A) 特開 平3−105406(JP,A) 特開 平4−359328(JP,A) 実開 昭61−143251(JP,U) Samuel J. Leffle r, Marshall Kirk M cKusick, Michael J. Karels John S. Quarterman,UNIX 4. 3BSD の設計と実装,日本,丸善株 式会社,1995年 4月 5日,P.432 (58)調査した分野(Int.Cl.7,DB名) G06F 11/34 G06F 11/30 G06F 11/28

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 解析対象となる動作中の計算機システム
    の障害を検知し、その障害の解析に必要なデータを格納
    するデータ収集対象ファイルを生成する手段と、上記計
    算機システムの起こり得る障害およびこの各障害に関連
    するデータ項目を格納した障害管理テーブルと、上記障
    害の解析に必要なデータ項目を入力する入力手段と、該
    入力手段により入力されたデータ項目に対するデータを
    上記データ収集対象ファイルから取得すると共に、上記
    入力されたデータ項目に対応する障害を上記障害管理テ
    ーブルから取得するデータ取得手段と、取得した該デー
    タおよび該障害を上記データ項目と共に表示する出力手
    段とを備えたことを特徴とする計算機システム解析装
    置。
  2. 【請求項2】 データ取得手段は、入力されたデータ項
    目に対応する障害と共に、該障害に関連する他のデータ
    項目を障害管理テーブルから取得し、上記障害及びその
    原因となる上記データ項目の一覧を出力手段により表示
    することを特徴とする請求項1記載の計算機システム解
    析装置。
  3. 【請求項3】 解析対象となる計算機システムとデータ
    収集対象ファイルを生成する手段とデータ取得手段とを
    有するプロセッサ、上記計算機システムの障害発生時に
    上記計算機システムの動作を代替する手段とデータ収集
    対象ファイルを生成する手段とデータ取得手段とを有す
    るプロセッサ、および上記データ収集対象ファイルをバ
    スで接続することを特徴とする請求項1または2記載の
    計算機システム解析装置。
  4. 【請求項4】 解析対象となる計算機システムとデータ
    収集対象ファイルを生成する手段とデータ取得手段とを
    有する計算機、上記計算機システムの障害発生時に上記
    計算機システムの動作を代替する手段とデータ収集対象
    ファイルを生成する手段とデータ取得手段とを有する計
    算機、および上記データ収集対象ファイルをネットワー
    クを介して接続することを特徴とする請求項1または2
    記載の計算機システム解析装置。
JP10379195A 1995-04-27 1995-04-27 計算機システム解析装置 Expired - Fee Related JP3532289B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP10379195A JP3532289B2 (ja) 1995-04-27 1995-04-27 計算機システム解析装置
US08/575,225 US5790777A (en) 1995-04-27 1995-12-20 Computer system analysis device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10379195A JP3532289B2 (ja) 1995-04-27 1995-04-27 計算機システム解析装置

Publications (2)

Publication Number Publication Date
JPH08297598A JPH08297598A (ja) 1996-11-12
JP3532289B2 true JP3532289B2 (ja) 2004-05-31

Family

ID=14363231

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10379195A Expired - Fee Related JP3532289B2 (ja) 1995-04-27 1995-04-27 計算機システム解析装置

Country Status (2)

Country Link
US (1) US5790777A (ja)
JP (1) JP3532289B2 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3547989B2 (ja) * 1998-04-10 2004-07-28 Dxアンテナ株式会社 マルチビームアンテナ用反射鏡
CN1143214C (zh) 1998-09-18 2004-03-24 西门子公司 测定数据状态的方法
US6460146B1 (en) * 1998-12-04 2002-10-01 Cisco Technology, Inc. System and method for establishing processor redundancy
US6457138B1 (en) * 1999-04-19 2002-09-24 Cisco Technology, Inc. System and method for crash handling on redundant systems
US7111307B1 (en) 1999-11-23 2006-09-19 Microsoft Corporation Method and system for monitoring and verifying software drivers using system resources including memory allocation and access
US6523141B1 (en) * 2000-02-25 2003-02-18 Sun Microsystems, Inc. Method and apparatus for post-mortem kernel memory leak detection
US6728907B1 (en) * 2000-04-14 2004-04-27 Microsoft Corporation System and method for self-diagnosing system crashes
US6792559B1 (en) * 2000-04-25 2004-09-14 Ncr Corporation Performing operations in an environment recreated from system dump information
US6633876B1 (en) * 2000-06-07 2003-10-14 Sun Microsystems, Inc. Analyzing post-mortem information on a remote computer system using a downloadable code module
US6618823B1 (en) 2000-08-15 2003-09-09 Storage Technology Corporation Method and system for automatically gathering information from different types of devices connected in a network when a device fails
US6681348B1 (en) * 2000-12-15 2004-01-20 Microsoft Corporation Creation of mini dump files from full dump files
US6738932B1 (en) 2000-12-22 2004-05-18 Sun Microsystems, Inc. Method and system for identifying software revisions from memory images
US6763517B2 (en) 2001-02-12 2004-07-13 Sun Microsystems, Inc. Automated analysis of kernel and user core files including searching, ranking, and recommending patch files
US6950847B2 (en) * 2001-07-12 2005-09-27 Sun Microsystems, Inc. Service provider system for delivering services in a distributed computing environment
US20030135823A1 (en) * 2002-01-14 2003-07-17 Richard Marejka Loader and provider configuration for remotely provided services
US6973598B2 (en) * 2002-01-28 2005-12-06 Dell Products L.P. Computer system with improved data capture system
US7231634B2 (en) * 2002-09-17 2007-06-12 Sun Microsystems, Inc. Method for determining scope and cause of memory corruption
DE10340410B4 (de) * 2003-09-02 2005-09-08 Infineon Technologies Ag Prozessorsystem zum Stabilisieren eines Betriebes eines Prozessorsystems
US7793229B1 (en) * 2003-12-19 2010-09-07 Unisys Corporation Recording relevant information in a GUI window of a panel dump browser tool
US8745703B2 (en) * 2008-06-24 2014-06-03 Microsoft Corporation Identifying exploitation of vulnerabilities using error report
US8862930B2 (en) * 2010-11-24 2014-10-14 Red Hat, Inc. Crash recovery memory reservation based on device drivers for an operational kernel
US9026860B2 (en) * 2012-07-31 2015-05-05 International Business Machines Corpoation Securing crash dump files
JP6264896B2 (ja) 2014-01-16 2018-01-24 株式会社リコー 情報処理装置、制御方法及び制御プログラム
JP6405851B2 (ja) * 2014-09-30 2018-10-17 富士通株式会社 予兆検知支援プログラム、方法、装置、及び予兆検知プログラム、

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57120163A (en) * 1981-01-16 1982-07-27 Toshiba Corp Computer system
US4628511A (en) * 1984-09-06 1986-12-09 Shell Oil Company Apparatus for analysis of computer channel failures
US4949252A (en) * 1985-10-17 1990-08-14 Technology 80, Inc. Computer channel analyzer with monitoring and selective display of predetermining events and related data
US4821269A (en) * 1986-10-23 1989-04-11 The Grass Valley Group, Inc. Diagnostic system for a digital signal processor
US4967414A (en) * 1989-01-06 1990-10-30 International Business Machines Corp. LRU error detection using the collection of read and written LRU bits
US5119377A (en) * 1989-06-16 1992-06-02 International Business Machines Corporation System and method for software error early detection and data capture
US5218605A (en) * 1990-01-31 1993-06-08 Hewlett-Packard Company Software modules for testing computer hardware and software
US5280486A (en) * 1990-03-16 1994-01-18 Teradyne, Inc. High speed fail processor
US5157667A (en) * 1990-04-30 1992-10-20 International Business Machines Corporation Methods and apparatus for performing fault isolation and failure analysis in link-connected systems
US5200958A (en) * 1990-09-28 1993-04-06 Xerox Corporation Method and apparatus for recording and diagnosing faults in an electronic reprographic printing system
US5245615A (en) * 1991-06-06 1993-09-14 International Business Machines Corporation Diagnostic system and interface for a personal computer
US5390323A (en) * 1991-08-05 1995-02-14 Amdahl Corporation Microstore reference logging
US5339406A (en) * 1992-04-03 1994-08-16 Sun Microsystems, Inc. Reconstructing symbol definitions of a dynamically configurable operating system defined at the time of a system crash
US5491793A (en) * 1992-07-31 1996-02-13 Fujitsu Limited Debug support in a processor chip
KR960005014B1 (ko) * 1992-11-27 1996-04-18 삼성전자주식회사 도트매트릭스 이미지 데이타를 페이지 프린터에서 처리하는 방법 및 회로
GB9301286D0 (en) * 1993-01-22 1993-03-17 Int Computers Ltd Data processing system
US5473771A (en) * 1993-09-01 1995-12-05 At&T Corp. Fault-tolerant processing system architecture
US5533193A (en) * 1994-06-24 1996-07-02 Xerox Corporation Method of saving machine fault information including transferring said information to another memory when an occurrence of predetermined events or faults of a reproduction machine is recognized

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Samuel J. Leffler, Marshall Kirk McKusick, Michael J. Karels John S. Quarterman,UNIX 4.3BSD の設計と実装,日本,丸善株式会社,1995年 4月 5日,P.432

Also Published As

Publication number Publication date
US5790777A (en) 1998-08-04
JPH08297598A (ja) 1996-11-12

Similar Documents

Publication Publication Date Title
JP3532289B2 (ja) 計算機システム解析装置
US8296104B2 (en) Rule-based engine for gathering diagnostic data
JPH0756636B2 (ja) データ処理方法
US7506215B1 (en) Method for health monitoring with predictive health service in a multiprocessor system
US20050144264A1 (en) Diagnosis system for at least one technical system
KR20000063253A (ko) 시스템 장애 자가 진단/복구기능을 갖는 컴퓨터 시스템 및그 방법
JP2868114B2 (ja) 監視診断機能付計算機
US20030014694A1 (en) Process monitor module
JP5733515B2 (ja) Ras機能を備える組み込み機器
JP2702432B2 (ja) 故障診断方式
CN108804288B (zh) 一种信息处理装置、方法及电子设备
WO2022085218A1 (ja) 情報処理システムおよびデータベースの構築方法
JP2947571B2 (ja) 障害診断装置
JP2000081992A (ja) コンピュータ性能チェック方式
JP3489727B2 (ja) ソフトウェア障害判定方法およびそのプログラムを記録した記録媒体
JPS59220850A (ja) 障害情報収集装置
JPH07325730A (ja) マルチプロセッサ装置
JPH05342025A (ja) 仮想計算機システムの障害処理方式
JPS63213039A (ja) 診断装置の障害解析方式
JPH07248810A (ja) 数値制御装置
JPH03293524A (ja) プラント異常診断装置
CN115543759A (zh) 操作系统的日志查阅方法、装置、电子设备及存储介质
CN112540846A (zh) 一种控制服务器性能稳定的方法、装置及介质
Abrams zOS RAS Guidelines and Debug Guide for Ported Software
JPS6398764A (ja) マルチ計算機システムにおけるフアイルリカバリ方式

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040302

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040303

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees