JPH05108398A - 情報処理装置の障害情報ログ方式 - Google Patents

情報処理装置の障害情報ログ方式

Info

Publication number
JPH05108398A
JPH05108398A JP3292410A JP29241091A JPH05108398A JP H05108398 A JPH05108398 A JP H05108398A JP 3292410 A JP3292410 A JP 3292410A JP 29241091 A JP29241091 A JP 29241091A JP H05108398 A JPH05108398 A JP H05108398A
Authority
JP
Japan
Prior art keywords
log
information
failure
bus
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3292410A
Other languages
English (en)
Inventor
Koji Iguchi
香二 井口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Ibaraki Ltd
Original Assignee
NEC Ibaraki Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Ibaraki Ltd filed Critical NEC Ibaraki Ltd
Priority to JP3292410A priority Critical patent/JPH05108398A/ja
Publication of JPH05108398A publication Critical patent/JPH05108398A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

(57)【要約】 【目的】 同一障害が繰り返し発生した場合、前回の障
害で採取済のログの一部又は全部の情報の代りに、詳細
解析を可能とするための内容の異なった新たなログ情報
の自動採取を行う。 【構成】 障害検出時,診断処理装置が障害内容に応じ
て予め定められた内容の情報を各ユニットから採取する
機能と、同一障害発生時に同一障害であることを障害内
容から判定する機能と、次回の同一障害発生に備え、新
たに採取すべきログ情報の設定を行う機能とを有し、最
初の障害発生時点で採取したログ情報の解析により原因
究明に到らなかった場合、以降の障害発生毎に採取すべ
きログ情報を追加して、原因の解析を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、情報処理装置の障害情
報ログ方式に関し、特に同一障害の繰り返し発生時、既
採取情報では障害解析に不足した情報を新たに追加して
情報の採取を行うログ方式に関する。
【0002】
【従来の技術】従来のログ方式は、発生した障害に対す
るログ情報が固定であり、同一障害が繰り返して発生し
ても採取されるログ情報が全く同一内容であった。
【0003】
【発明が解決しようとする課題】従来のログ方式では、
障害毎又は、ユニット毎にログ内容が固定であるため、
装置設計時に設定したログ内容が、その原因解析に十分
な範囲の情報を包含していれば良いが、そうでない場合
は、原因の究明に長時間を要する。
【0004】また不足情報の採取のために、専用のログ
採取のための仕掛を個別に組み込むか、或いは、実際の
装置に測定器等を接続して障害の発生を待つ必要があ
り、多大な労力を要する。
【0005】情報処理装置の高機能化,複雑化により、
障害解析のためのログ情報は、増加傾向にあり、全ての
ケースに対応可能なログ・データを採取するためには、
ログ・エリアの容量,ログ動作の所要時間等制約条件が
多く、一般的には実現が困難である。
【0006】特に、この種の仕掛は、単なる故障ユニッ
トの指摘のためによりも、むしろ稀に発生する設計に起
因した問題の早期解決のために必要となることが多い。
【0007】本発明の目的は、従来解析が困難であった
複雑な問題の解析を容易に行える情報処理装置の障害情
報ログ方式を提供することにある。
【0008】
【課題を解決するための手段】前記目的を達成するた
め、本発明に係る情報処理装置の障害情報ログ方式にお
いては、障害発生時、障害解析のための情報を診断処理
装置がログする情報処理装置において、障害検出時、診
断処理装置が障害内容に応じて予め定められた内容の情
報を各ユニットから採取する手段と、同一障害発生時に
同一障害であることを障害内容から判定する手段と、次
回同一障害発生に備え、新たに採取すべきログ情報の設
定を行う手段とを有し、最初の障害発生時点で採取した
ログ情報の解析により原因究明に到らなかった場合、以
降の障害発生毎に採取すべきログ情報を追加して原因の
解析を行うことを可能としたものである。
【0009】
【作用】最初の障害発生時点で採取したログ情報の解析
により、原因の究明に到らなかった場合、以降の障害発
生毎に採取すべきログ情報を追加して、従来解析が困難
であった複雑な問題の解析を容易に行う。
【0010】
【実施例】次に本発明について図面を参照して説明す
る。
【0011】図1及び図2は、本発明の一実施例に係る
ログ処理を示すフローチャートである。図3(a),
(b)及び図4(a),(b)は、図1及び図2のログ
処理過程で参照、又は更新されるテーブルを示す図であ
る。図5は、本発明の一実施例に係る情報処理装置を示
す構成図、図6は、図5に示すIOPユニットの内部ブ
ロック図、図7は、図5に示すSVPユニットの内部ブ
ロック図である。
【0012】図5において、S−バス10に、主記憶装
置(MMU)1,演算処理装置(EPU)2,入出力制
御装置(IOP)3,診断処理装置(SVP)4が接続
される。IOP3の配下には、P−バス11を介して周
辺装置との入出力動作を行う複数の入出力アダプタ(I
OA)5,5…が接続され、情報処理装置を構成する。
【0013】S−バス10及びP−バス11には、それ
ぞれのバスの動作をトレース視記録するS−バス・トレ
ーサ6,P−バス・トレーサ7が接続される。
【0014】本実施例では、障害発生時のログ処理は、
診断処理装置(SVP)4が集中的に行うものとする。
障害の検出及び障害情報のログは、S−バス配下のユニ
ットに対しては、S−バス10経由で、P−バス配下の
ユニットに対しては、S−バス10,IOP3,P−バ
ス11経由で行われる。
【0015】またSVP4には、各ユニットからログし
た情報を格納するフロッピーディスク装置(FD)8、
ログした情報を遠隔地や保守センターに転送するための
通信回線(LINE)12、及びSVP4に対しログ条
件等を設定するためのワーク・ステーション(WS)9
が接続される。
【0016】図6において、入出力制御装置(IOP)
3は、IOPの入出力制御を行うためのプロセッサ(P
ROC)21、制御記憶(CS)22、制御テーブル,
入出力バッファを含むR/Wメモリ(LM)24、S−
バス10へのアクセス制御を行うS−バス制御部(S−
CNT)23、及びP−バス11へのアクセス制御を行
うP−バス制御部(P−CNT)26より構成される。
【0017】これらのIOP3の各構成要素は、IOP
ユニット内の内部バスであるI−バス28にて相互接続
される。EIFレジスタ(EIF RG)25は、障害
発生時、IOPユニット内の障害の主要因をまとめたレ
ジスタで、エラーインジケーター・フラグ(ELF)と
呼ばれ、EIF RG25を構成する各ビットがユニッ
ト内の各所で検出されたエラーを1まとめにしたもので
ある。
【0018】また、FWトレーサ27は、PROC21
が実行する一連の命令の軌跡をトレーサ情報として残し
たもので、障害発生時、このトレーサ情報を見ることに
より、IOPユニットのどのような制御過程で障害が発
生したのかを知ることができる。
【0019】EIFレジスタのビット構成を図3(a)
に示す。
【0020】図7は、図5におけるSVP4のユニット
内のブロック図を示したもので、図6のIOPユニット
と同様に、プロセッサ(PROC)31,制御記憶(C
S)32,ローカル・メモリ(LM)34,S−バス制
御部(S−CNT)33により構成される。更にSVP
ユニットには、ログ情報をFD媒体に記録するため、フ
ロッピーディスク装置コントローラ(FDC)36、ワ
ーク・ステーションとのデータ入出力を制御するワーク
・ステーションコントローラ(WSC)37、ログ情報
を遠隔地へ転送するための通信制御部(LA)38がI
−バス39を介して接続される。
【0021】さて、図1に基づいて本発明の実施例につ
いて説明する。図1は、診断処理装置(SVP)4のプ
ロセッサ(PROC)31が、障害発生に伴い実行する
一連の障害処理の中、ログ処理部分について説明したも
のである。
【0022】まず、SVP3は、ログ処理開始時点で、
どのユニットからの処理要求かを判定する。対象ユニッ
トの判定方法についての説明は省略するが、例えば、S
−バス10経由でのIOP3からSVP4への通信時,
発信元及び処理要求コードを通信情報に含めることによ
り簡単に実現できる。
【0023】図1では、IOP3からの要求のみについ
て説明してある。SVP4は、IOP3のEIF RG
25を読取り、有効となっているビットの組合せにより
障害パターンを特定する。このEIFパターンは、図3
(a)に示すように、A,B,C等があるものとする。
【0024】次にSVP4は、予め設定されたログ・ア
クション・テーブルを参照する。図3(b)に示すよう
にログ・アクション・テーブルには、ログ・モード,E
IFパターン,ログ・項目コード,ログ・テーブル・ポ
インタ等が含まれている。
【0025】ログ・アクション・テーブルは、ユニット
毎に考えられる障害・パターンと、障害毎に解析が必要
となるログ情報の組合せを表示するコード・ログ項目コ
ードが含まれる。ログ項目コードに対応するログ項目の
リストを図4(a)に示す。
【0026】図4(a)では、IOP障害時に採取可能
なログ情報が10種類あり、それらのログは、常に同時
に採取の必要がなく、障害種別(EIFパターン)毎
に、ログ項目コードで指定された範囲のログを採取すれ
ば良いことを示す。
【0027】ログ・アクション・テーブルのログ・モー
ドには、0,1,2,9の4種類が定められている。ロ
グ・モード0は、ログ情報の種類が少なく、常時同一ロ
グ・コードに対応するログのみを行えば十分な場合(図
3(b)では、例えばEPUユニット)に指定され、ロ
グ・モード1は、ログ種類が多くて常時採取するのは問
題があるが、同一障害が次回発生した場合に、次にとる
ログ情報を決定するためのログ情報(基本ログ)を採取
する場合(図3(b)では、IOPユニット)にログ処
理プログラムの中で指定される。
【0028】ログ・モード2は、同一障害2回目の場合
に採用すべき追加ログ情報を示し、ログ・モード9は、
障害履歴等とは無関係に、外部から任意設定されるログ
情報を示す。
【0029】図1において、IOP障害の本ケースで
は、IOPのログ・アクション・テーブルのログ・モー
ドは、2と設定されているため、現障害のEIFパター
ンで、IOPのEIF履歴表をサーチする(処理10
1)。
【0030】図4(b)にIOPのEIF履歴表を示
す。EIF履歴表は、ユニット毎に過去において、どの
ようなEIFパターンの障害が発生したのかが登録され
ている。本実施例では、IOPのEIF履歴は、パター
ンA,Bのみが登録されており、今回発生した障害がパ
ターンCであると、初めての障害であるため、仮にログ
・モード=1として処理102に進み、基本ログの採取
を行う。
【0031】次に処理103に進み、図4(b)のEI
F履歴に、今回の障害パターンCを登録する。
【0032】次に新たな障害が発生し、そのEIFパタ
ーンがAであった場合、EIFパターンは、EIF履歴
に既に登録されているため、処理104,105へと進
み、ログ・アクション・テーブル(図3(b))の指定
に従って、ログ項目コード10のログ処理を行い(処理
105)、所望のログを採取したため処理106にてE
IF履歴表よりEIFパターンAのエントリーを削除す
る。
【0033】本実施例では、ログ・モードは、2までで
あるが、これに3,4…と追加することにより、第3回
目,第4回目…の同一障害発生時に更に異なった新たな
ログ採取を行うことができる。
【0034】以上説明したように本発明によれば、EI
FパターンとEIFパターンに対応したログ・項目コー
ドを設定することにより、同一障害の繰り返しに応じて
追加ログ情報の採取が可能となる。
【0035】また、EIFパターンとログ・項目コード
を予め設定し適切なログ採取が困難なケースでは、図2
に示す処理により、ログ・アクション・テーブルのログ
・モードに9を登録し、ログ・項目コードに20を登録
し、且つログ・項目テーブルのログ・項目コード20の
欄に、所望のログ・項目の組合せを設定しておけば、次
回障害発生時、指定通りのログ採取が可能となる。
【0036】更に、図1の処理110により、SVP4
の通信回線を使用して、ログ情報,ログ条件等を、ログ
採取時点でリアル・タイムにリモート保守センターへ送
信することにより、障害状況の把握と次回障害への迅速
な対応が可能となる。
【0037】
【発明の効果】以上説明したように本発明によれば、最
初の障害発生時点で採取したログ情報の解析により原因
の究明に到らなかった場合、以降の障害発生毎に採取す
べきログ情報を追加して、従来解析が困難であった複雑
な問題の解析を容易に行えるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例を示すログ処理フローチャー
トである。
【図2】本発明の一実施例を示すログ処理フローチャー
トである。
【図3】(a)は、IOPユニットのEIFレジスタと
EIFパターンを示す図、(b)は、障害解析結果とし
てのEIFパターンから採取すべきログ項目を決定する
ためのログ・アクション・テーブルを示す図である。
【図4】(a)は、IOPユニットのログ項目・テーブ
ルを示す図、(b)は、IOPユニットのEIF履歴表
を示す図である。
【図5】本発明の一実施例に係る情報処理装置を示すブ
ロック図である。
【図6】IOPユニットを示すブロック図である。
【図7】SVPユニットを示すブロック図である。
【符号の説明】
1 主記憶装置(MMU) 2 演算処理装置(EPU) 3 入出力制御装置(IOP) 4 診断処理装置(SVP) 5 入出力アダプタ(IOA1〜IOAn) 6 S−バストレーサ 7 P−バストレーサ 8 フロッピーディスク装置(FD) 9 ワーク・ステーション(WS) 10 S−バス 11 P−バス 12 通信回線(LINE) 21,31 プロセッサ(PROC) 22,32 制御記憶(CS) 23,33 S−バス制御部(S−CNT) 24,34 ローカル・メモリ(LM) 25 EIFレジスタ(EIF RG) 26 P−バス制御部(P−CNT) 27,35 FWトレーサ 28,39 I−バス 36 フロッピーディスク装置コントローラ(FDC) 37 ワーク・ステーションコントローラ(WSC) 38 通信制御部(LA)

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 障害発生時、障害解析のための情報を診
    断処理装置がログする情報処理装置において、 障害検出時、診断処理装置が障害内容に応じて予め定め
    られた内容の情報を各ユニットから採取する手段と、 同一障害発生時に同一障害であることを障害内容から判
    定する手段と、次回同一障害発生に備え、新たに採取す
    べきログ情報の設定を行う手段とを有し、 最初の障害発生時点で採取したログ情報の解析により原
    因究明に到らなかった場合、以降の障害発生毎に採取す
    べきログ情報を追加して原因の解析を行うことを可能と
    したことを特徴とする情報処理装置の障害情報ログ方
    式。
JP3292410A 1991-10-11 1991-10-11 情報処理装置の障害情報ログ方式 Pending JPH05108398A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3292410A JPH05108398A (ja) 1991-10-11 1991-10-11 情報処理装置の障害情報ログ方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3292410A JPH05108398A (ja) 1991-10-11 1991-10-11 情報処理装置の障害情報ログ方式

Publications (1)

Publication Number Publication Date
JPH05108398A true JPH05108398A (ja) 1993-04-30

Family

ID=17781429

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3292410A Pending JPH05108398A (ja) 1991-10-11 1991-10-11 情報処理装置の障害情報ログ方式

Country Status (1)

Country Link
JP (1) JPH05108398A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006146600A (ja) * 2004-11-19 2006-06-08 Ntt Docomo Inc 動作監視サーバ、端末装置及び動作監視システム
CN102508764A (zh) * 2011-11-04 2012-06-20 哈尔滨工程大学 一种容错移动计算系统记录节点事件日志的方法
DE102016007374A1 (de) 2015-06-23 2016-12-29 Fanuc Corporation Numerische Steuerung und numerisches Steuersystem, in dem die Steuerung über ein Netzwerk verbunden ist

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006146600A (ja) * 2004-11-19 2006-06-08 Ntt Docomo Inc 動作監視サーバ、端末装置及び動作監視システム
CN102508764A (zh) * 2011-11-04 2012-06-20 哈尔滨工程大学 一种容错移动计算系统记录节点事件日志的方法
CN102508764B (zh) * 2011-11-04 2014-06-11 哈尔滨工程大学 一种容错移动计算系统记录节点事件日志的方法
DE102016007374A1 (de) 2015-06-23 2016-12-29 Fanuc Corporation Numerische Steuerung und numerisches Steuersystem, in dem die Steuerung über ein Netzwerk verbunden ist
US10191481B2 (en) 2015-06-23 2019-01-29 Fanuc Corporation Numerical controller and numerical control system in which the controller is connected by network

Similar Documents

Publication Publication Date Title
EP0261335B1 (en) Test method and apparatus for a distributed processing system
EP0031501A2 (en) Diagnostic and debugging arrangement for a data processing system
JPH10105427A (ja) 電子相互接続バス上でのメモリアクセスに関する状態論理データを表示するためのコンピュータ操作可能な方法
CN109976959A (zh) 一种用于服务器故障检测的便携式设备及方法
US20210111967A1 (en) Graphical user interface for traffic capture and debugging tool
US7970582B2 (en) Diagnosis system for at least one technical system
JPH05108398A (ja) 情報処理装置の障害情報ログ方式
JPS6226734B2 (ja)
JP2000056825A (ja) プラント監視装置
JP3099770B2 (ja) ネットワーク監視システムにおける障害情報管理方式
JP2609813B2 (ja) 通信プロトコル障害解析装置
EP0032895A1 (en) Testor for microprocessor-based systems
CN115878430A (zh) Pcie设备故障监控方法、装置、通信设备及存储介质
JP2751861B2 (ja) ネットワークシステム障害検出処理回路
JP3378975B2 (ja) 障害診断器
JPH10340201A (ja) システムテスト自動化装置
JPS63213039A (ja) 診断装置の障害解析方式
JPH0329857A (ja) 自動分析ネットワークシステム
JPH0689239A (ja) 通信トレース自動採取方式
JPS6312037A (ja) 診断装置付電子計算機システム
JPS6332697A (ja) 監視装置の警報表示方法
KR20230040534A (ko) 중장비 관리 시스템 및 IoT 중장비 센서 고장 진단 방법
JPS6134176B2 (ja)
JP2001117635A (ja) モニタ装置
JPS60118959A (ja) 入出力装置における障害解析方式