JPH10260861A - 障害調査情報装置 - Google Patents

障害調査情報装置

Info

Publication number
JPH10260861A
JPH10260861A JP9063078A JP6307897A JPH10260861A JP H10260861 A JPH10260861 A JP H10260861A JP 9063078 A JP9063078 A JP 9063078A JP 6307897 A JP6307897 A JP 6307897A JP H10260861 A JPH10260861 A JP H10260861A
Authority
JP
Japan
Prior art keywords
information
investigation
setting
failure
trace
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9063078A
Other languages
English (en)
Other versions
JP3704871B2 (ja
Inventor
Keizo Koike
敬藏 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP06307897A priority Critical patent/JP3704871B2/ja
Publication of JPH10260861A publication Critical patent/JPH10260861A/ja
Application granted granted Critical
Publication of JP3704871B2 publication Critical patent/JP3704871B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

(57)【要約】 【課題】 従来の障害調査に於いては、そのエラー原因
を究明するに際し、関連しそうな情報が、その都度利用
者の能力・経験により判断・抽出され、利用者の能力・
経験に頼るところが極めて大きく、未経験者には非常に
難しい作業という問題があった。 【解決手段】 コンピュータ障害に対する障害調査情報
装置であって、障害調査の動作環境を予め設定テーブル
に設定する動作環境設定手段と、障害発生時に前記設定
テーブルの内容に従って調査情報を採取するログ採取手
段と、起動の指定時にトレース情報を採取するトレース
採取手段と、前記ログ採取手段及びトレース採取手段に
より採取された調査情報を前記設定テーブルの内容に従
って記憶媒体へ出力する調査情報記録手段とを備えるこ
とにより課題を解決する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、コンピュータシス
テムに於けるハード、ソフトの各種障害(異常)を調査
・特定するための各種情報の一元的一括採取方式に関す
る。
【0002】
【従来の技術】コンピュータシステムに於けるハード、
ソフトの各種障害(異常)を調査・特定するための各種
関連情報を採取するツールは、従来から多数開発、利用
されている。この様な中で現在最も一般的に利用されて
いるものに次の様なものがある。即ち、障害検出時点に
於けるハード、ソフトの各種状態を障害ログ情報として
静的に採取するログ採取ツールや障害を引き起こす原因
とも成り得るプログラム自身の動作又はその動作に関連
して変化するハード、ソフト資源の各種状態を動的・連
続的に追跡情報として採取するトレースツール(トレー
サ)及びメモリの任意領域の内容を出力するメモリダン
プツールなどが、その代表例である。
【0003】従来の障害調査に於いては、その障害の種
類や性格等を考慮して、これ等ツールは利用者の能力・
経験などによる裁量で、状況に応じて組み合わせて使い
分けされているのが実態である。
【0004】図6は、クライアント・サーバシステムに
於けるクライアントとサーバ間の情報の授受に於いて障
害(エラー)が発生した場合を想定して、従来、障害調
査がどの様な手順で行われていたかを説明したものであ
る。
【0005】同図(1)は一例としてのクライアント・
サーバシステムの構成図であり、クライアント60がL
AN61を経由してサーバ62に接続されている。同図
(2)は前記システムに於けるクライアント・サーバ間
の情報授受に際し、エラーが発生した場合の障害調査手
順を説明する為のものである。
【0006】その情報授受の内容として、クライアント
側からのコマンドA及びBに対してサーバ側から、その
コマンドに呼応するレスポンスをクライアント側に返
し、その後のクライアント側からの情報発信時にエラー
が発生・検出されたケースを想定したものである。
【0007】同図(2)では、トレーサは非起動(ト
レーサ起動時は処理効率が低下するため) であり、その
後障害調査のため、同に於いてトレーサを起動させた
例である。
【0008】この様な条件下に於ける障害調査の一般的
な処理手順は次の様になる。即ち、 ログ採取ツールにより採取された障害ログ情報からエ
ラーの内容を調査する。 情報授受を制御・管理している制御テーブルの内容を
メモリダンプツールにより出力し、相手方アプリケーシ
ョンとの接続状態を調査する。その結果から未だ情報不
足で障害を推定出来ない場合には、更にそのエラーを誘
引したと思われる原因を突き止めるためトレーサを起
動させて再現テストを行いトレース情報を採取した後、
先のエラー内容、制御テーブル内容と一致しているか確
認する。トレース情報を時系列に追跡調査した結果と
エラー内容、制御テーブル内容とを突き合わせ調査す
る。
【0009】この様に従来の障害調査に於いては、その
エラー原因を究明するに際し、関連しそうな情報が、そ
の都度利用者の能力・経験により判断・抽出され、これ
等得られた情報を互いに突き合わせて調査して行く手法
が採られている。
【0010】
【発明が解決しようとする課題】前述の如く、従来の障
害調査は、先ず利用者によるエラー内容の確認から始ま
り、その後は利用者の能力・経験に頼るところが極めて
大きく、未経験者には非常に難しい作業という問題があ
った。
【0011】本発明はこのような点にかんがみて、障害
調査に関する経験者のノウハウを整理し、事前に設定し
て置くことにより、エラーが発生・検出された時、当該
エラーに関連する障害調査情報を一括採取する手段を提
供することを目的とする。
【0012】
【課題を解決するための手段】上記の課題は下記の如く
に構成された障害調査情報装置によって解決される。図
1は、本発明の原理図である。即ち、コンピュータ障害
に対する障害調査情報装置であって、障害調査の動作環
境を予め設定テーブル11に設定する動作環境設定手段
10と、障害発生時に前記設定テーブル11の内容に従
ってログデータ13を採取するログ採取手段12と、起
動の指定時にトレースデータ15を採取するトレース採
取手段14と、前記ログ採取手段12及びトレース採取
手段14により採取された調査情報を前記設定テーブル
11の内容に従って記憶媒体17へ出力する調査情報記
録手段16とを備えることにより、未経験者でも障害調
査に必要な情報が一括採取出来る。
【0013】
【発明の実施の形態】先ず最初に、障害調査に関する能
力・経験と同時にノウハウを十分持ち合わせた利用者に
よりセットアップされる本発明の中心となる設定テーブ
ルの内容から説明する。図2は、予め動作環境設定手段
により設定される設定テーブルの内容を示したものであ
り、設定される内容を大別すると、エラーの種別毎にど
の様な情報があれば原因究明に役立つかを設定する調査
設定情報と、この設定に基づき主メモリ上に採取された
障害調査情報を磁気ディスク装置などの記憶媒体に出力
する際の出力条件情報とがある。更に出力条件情報に
は、出力のタイミングを規定する出力契機情報と、出力
の対象とするデータを規定する出力対象情報とがある。
【0014】調査設定情報としては、OSなどから通知
されるハード/ソフトのエラー番号を種類別(例えば、
ディスク、通信回線、チャネル、アプリケーション、デ
ータ、ディバイス・ドライバ、アクセス・パラメータ、
応答パラメータなどの各エラー)に分類、整理したエラ
ー種別毎にログ番号(ログの種類別番号)を対応させ、
前記記憶媒体への出力時の優先度、そして一つ以上の関
連テーブル名と関連トレース名が記憶・保持出来る様に
なっており、これ等がログ番号の種類だけ存在する。
尚、本発明に於けるログ情報とは、エラー発生時の基本
ログデータに加え、その関連テーブル類の内容データを
含めたデータを指している。
【0015】又、出力契機情報には、一定のログ件数以
上になった場合、指定優先度(又は以上)のログデータ
が発生した場合、指定ログ番号(又は指定範囲)のログ
データが発生した場合、或いは一定時刻になった場合な
どがあり、これ等はOR条件で出力契機を設定するもの
である。
【0016】更に出力対象情報としては、過去何件分、
指定優先度以上のもの、指定ログ番号(又は指定範囲)
のもの、及び指定時刻範囲のもの、などがAND条件で
与えられ、又、先の出力契機に対応して、複数の出力対
象情報を設定することも可能としている。
【0017】又、図では省略しているが、各ログ番号毎
の調査設定情報に対して、前記基本ログデータ以外の情
報採取及び出力条件を無効とするモードフラグを持ち、
普段の運用時は、このモードフラグを無効(OFF)にセッ
トして置くことにより、基本ログデータのみを採取・出
力することにより処理能力の低下を防止することが可能
となっている。
【0018】次に、この設定テーブルに従いログ情報が
採取される過程及びトレース情報が採取される過程を図
3のフローチャートにより説明する。先ずログ情報の採
取であるが、同図(1)のステップ30でOSなどから
通知されるハード/ソフトのエラー番号が認識され、ス
テップ31に於いて、このエラー番号をキーに、設定テ
ーブルから該当する調査設定情報が抽出される。
【0019】そしてステップ32で、この調査設定情報
中のログ番号、優先度をヘッダーとして、先ず基本ログ
データと採取時刻が採取され、ステップ33に於いて調
査設定情報で指定された関連テーブル名から、そのテー
ブルデータが採取された後、調査設定情報中に指定され
た関連トレース名をその儘セットし、一件分のログ情報
が主メモリ上に完成する。
【0020】続いて、ステップ34で設定テーブルから
出力契機情報が呼び出され、ステップ35で、この出力
契機情報に設定された条件に合致するものがあるか判定
され、条件が合致すればステップ36に於いて、調査情
報記録プログラムを起動した後、条件不一致の場合と共
に元の状態にリターンし、次のログ採取に備える。
【0021】次にトレース情報が採取される過程である
が、これはトレーサの起動が外部から指定された場合の
み動作するもので、同図(2)に示す様にステップ37
で、発生した事象に対応するトレース名が認識され、ス
テップ38で、当該トレースデータを採取時刻と共に主
メモリ上の所定の領域にセットした後、元の状態にリタ
ーンして次のトレース採取に備える。
【0022】図4は、この様にして採取されたログとト
レース情報の出力例である。同図(1)はログ採取プロ
グラムの出力例であり、ログ番号、優先度をヘッダー
に、採取時刻、基本ログデータ、指定数の関連テーブル
名とそのデータ、及び指定数の関連トレース名がセット
されている。
【0023】又、同図(2)はトレース採取プログラム
の出力例であり、各トレース名毎に、そのデータと採取
時刻がセットされている。この採取されたログ及びトレ
ース情報は、先に述べた出力契機情報に設定された条件
に合致、或いは指定された時刻( 起動時刻) になった場
合に、調査情報記録プログラムにより磁気ディスク装置
などの記憶媒体に出力される。
【0024】この調査情報記録プログラムの動作をフロ
ーチャート化したものが図5である。ステップ50で時
刻起動か判別され、出力契機別に複数の出力対象情報が
設定されている場合に、ステップ51で、該当出力契機
に対応する出力対象情報が選定され、ステップ52に於
いて、この選定された出力対象情報が設定テーブルから
呼び出される。この呼び出された出力対象情報に設定さ
れた条件に従って、ステップ53で出力対象データが検
索・抽出される。そしてステップ54で、出力対象デー
タが検索された場合には、ステップ55で当該出力対象
データ中に関連トレース名が指定されているか判別さ
れ、指定があればステップ56で、当該関連トレース名
から所定のトレースデータを抽出した後、ステップ55
で関連トレース名指定無しの場合と共に、次の出力対象
データ検索のためステップ53に戻る。この処理を繰返
し、ステップ54で検索データが無くなった場合には、
ステップ57に於いて、これ等抽出された出力対象デー
タが、磁気ディスク装置などの記憶媒体に出力され、次
の起動待ちに入る。
【0025】以上が本発明の説明であるが、実際のシス
テム運用時に、本発明の様な詳細な障害調査情報を採取
していたのでは、システムの処理能力を低下させてしま
うので、通常の運用に際しては、前述の様に基本ログデ
ータのみを採取(例えばモードフラグOFF)しておき、基
本ログデータで障害の有無を確認した後、実際の運用に
差し支えない様な方法、例えば負荷の軽い時間帯を選ぶ
などして、モードフラグON/トレーサ起動を行うことに
より、障害調査情報を一括採取するように利用される。
【0026】
【発明の効果】以上の説明から明らかなように本発明に
よれば、経験者のノウハウを活用し、事前に設定して置
くことにより、障害調査に必要な情報が一括採取される
ため、未経験者でもバラツキのない調査情報を容易に得
ることが可能となり、障害に対する原因究明が的確且つ
容易に行え、作業負荷が軽減されるという著しい工業的
効果がある。
【図面の簡単な説明】
【図1】 本発明の原理図
【図2】 本発明の設定テーブルの内容説明図
【図3】 本発明のログ及びトレース採取プログラムの
フローチャート
【図4】 本発明のログ及びトレース採取プログラムの
出力例
【図5】 本発明の調査情報記録プログラムのフローチ
ャート
【図6】 従来の障害調査手順例の説明図
【符号の説明】
10 動作環境設定手段 11 設定テーブル 12 ログ採取手段 13 ログデータ 14 トレース採取手段 15 トレースデータ 16 調査情報記録手段 17 記憶媒体

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 コンピュータ障害に対する障害調査情報
    装置であって、 障害調査の動作環境を予め設定テーブルに設定する動作
    環境設定手段と、 障害発生時に前記設定テーブルの内容に従って調査情報
    を採取するログ採取手段と、 起動の指定時にトレース情報を採取するトレース採取手
    段と、 前記ログ採取手段及びトレース採取手段により採取され
    た調査情報を前記設定テーブルの内容に従って記憶媒体
    へ出力する調査情報記録手段と、を備えたことを特徴と
    する障害調査情報装置。
  2. 【請求項2】 前記設定テーブルは、障害時の調査情報
    を設定する調査設定情報と、採取された調査情報の前記
    記憶媒体への出力条件を設定する出力条件情報を保持す
    ることを特徴とする請求項1記載の障害調査情報装置。
  3. 【請求項3】 前記出力条件情報は、出力のタイミング
    を規定する出力契機情報と、出力の対象情報を規定する
    出力対象情報を保持することを特徴とする請求項2記載
    の障害調査情報装置。
  4. 【請求項4】 コンピュータ障害に対する障害調査情報
    採取プログラムを記憶した媒体であって、コンピュータ
    に、 障害調査の動作環境を予め設定テーブルに設定する動作
    環境設定機能と、 障害発生時に前記設定テーブルの内容に従って調査情報
    を採取するログ採取機能と、 起動の指定時にトレース情報を採取するトレース採取機
    能と、 前記ログ採取機能及びトレース採取機能により採取され
    た調査情報を前記設定テーブルの内容に従って記憶媒体
    へ出力する調査情報記録機能と、を実現させるためのコ
    ンピュータプログラムを記録したコンピュータ可読型記
    録媒体。
JP06307897A 1997-03-17 1997-03-17 障害調査情報装置 Expired - Fee Related JP3704871B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06307897A JP3704871B2 (ja) 1997-03-17 1997-03-17 障害調査情報装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06307897A JP3704871B2 (ja) 1997-03-17 1997-03-17 障害調査情報装置

Publications (2)

Publication Number Publication Date
JPH10260861A true JPH10260861A (ja) 1998-09-29
JP3704871B2 JP3704871B2 (ja) 2005-10-12

Family

ID=13218950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06307897A Expired - Fee Related JP3704871B2 (ja) 1997-03-17 1997-03-17 障害調査情報装置

Country Status (1)

Country Link
JP (1) JP3704871B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146474A (ja) * 2006-12-12 2008-06-26 Oki Data Corp 情報処理装置
JP2009070230A (ja) * 2007-09-14 2009-04-02 Ricoh Co Ltd 動作履歴情報記録装置、動作履歴情報記録装置の制御方法、制御プログラム及び記録媒体
JPWO2007099578A1 (ja) * 2006-02-27 2009-07-16 富士通株式会社 故障解析装置
JP2009193395A (ja) * 2008-02-15 2009-08-27 Denso Corp 通信データ収集装置
JP2014182646A (ja) * 2013-03-19 2014-09-29 International Business Maschines Corporation ソフトウェアの実行を監視する装置、方法およびプログラム
JP2019152995A (ja) * 2018-03-01 2019-09-12 オムロン株式会社 コンピュータおよびその制御方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2007099578A1 (ja) * 2006-02-27 2009-07-16 富士通株式会社 故障解析装置
JP4523659B2 (ja) * 2006-02-27 2010-08-11 富士通株式会社 故障解析装置
JP2008146474A (ja) * 2006-12-12 2008-06-26 Oki Data Corp 情報処理装置
JP2009070230A (ja) * 2007-09-14 2009-04-02 Ricoh Co Ltd 動作履歴情報記録装置、動作履歴情報記録装置の制御方法、制御プログラム及び記録媒体
JP2009193395A (ja) * 2008-02-15 2009-08-27 Denso Corp 通信データ収集装置
JP2014182646A (ja) * 2013-03-19 2014-09-29 International Business Maschines Corporation ソフトウェアの実行を監視する装置、方法およびプログラム
JP2019152995A (ja) * 2018-03-01 2019-09-12 オムロン株式会社 コンピュータおよびその制御方法
US11023335B2 (en) 2018-03-01 2021-06-01 Omron Corporation Computer and control method thereof for diagnosing abnormality

Also Published As

Publication number Publication date
JP3704871B2 (ja) 2005-10-12

Similar Documents

Publication Publication Date Title
US7016957B2 (en) Distributed data processing system and error analysis information saving method appropriate therefor
US20080065928A1 (en) Technique for supporting finding of location of cause of failure occurrence
US6735719B2 (en) Method and system for performing load testings on software applications
JP2001188765A (ja) 分散コンピューティング環境で複数の関係する障害を表す障害情報を参照する技法
CN110011853B (zh) 一种面向多平台和集群的交叉故障排查方法及装置
JPH10260861A (ja) 障害調査情報装置
US20020178407A1 (en) Method for system obstacle correspondence support
JPH0887423A (ja) ソフトウエアツールのトラブル対応支援システム
CN100576182C (zh) 计算机文件的实时监控系统和方法
CN114448775B (zh) 设备故障信息处理方法、装置、电子设备及存储介质
CN115587028A (zh) 接口自动化测试方法、系统、介质及终端
JP3867868B2 (ja) 障害統合管理装置
WO2021171366A1 (ja) 業務プロセス識別装置、業務プロセス識別方法及びプログラム
JP2002312205A (ja) アクセスログ情報の保存処理方法とその保存処理装置およびその処理プログラム
US20050076006A1 (en) Task oriented log retrieval utilizing a self-learning search tool
JP2002351702A (ja) オンライン利用の端末稼働統計データ作成方法及び装置
JP2002319940A (ja) 情報共有化システムと情報共有化の方法、及びこの方法を実行させるプログラム
CN112416762B (zh) Api测试方法及装置、设备、计算机可读存储介质
JP2001022613A (ja) ログファイル内ログ情報の検索方法
JPH0194453A (ja) トレース収集出力方式
JP2011203911A (ja) 障害情報収集システムと方法およびプログラム
JPH09265415A (ja) 異常診断方法及び異常診断装置
CN117746532A (zh) 故障记录方法、装置、设备及存储介质
JP3130870B2 (ja) メモリダンプファイル再構成方式
JP2004362495A (ja) エラーログ情報解析支援方法及び実施装置並びに処理プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050414

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050419

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050705

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050718

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090805

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090805

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100805

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110805

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120805

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120805

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130805

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees