JP2947571B2 - 障害診断装置 - Google Patents

障害診断装置

Info

Publication number
JP2947571B2
JP2947571B2 JP1242961A JP24296189A JP2947571B2 JP 2947571 B2 JP2947571 B2 JP 2947571B2 JP 1242961 A JP1242961 A JP 1242961A JP 24296189 A JP24296189 A JP 24296189A JP 2947571 B2 JP2947571 B2 JP 2947571B2
Authority
JP
Japan
Prior art keywords
failure
halt
register
devices
svp5
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1242961A
Other languages
English (en)
Other versions
JPH03103933A (ja
Inventor
政義 島村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1242961A priority Critical patent/JP2947571B2/ja
Publication of JPH03103933A publication Critical patent/JPH03103933A/ja
Application granted granted Critical
Publication of JP2947571B2 publication Critical patent/JP2947571B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Description

【発明の詳細な説明】 〔概要〕 複数の入出力装置を制御する計算機システムの障害時
における障害装置の障害診断装置に関し、 真の障害要因となった装置とその波及により障害を起
した装置を的確に判断できる障害診断装置を提供するこ
とを目的とし、 診断インタフェースを介して複数の処理装置と接続さ
れる障害診断装置であって、 前記処理装置の停止状態の発生時点に前記診断インタフ
ェースを介して当該処理装置から送られてくる停止状態
情報を保持する第1の保持手段と、 前記第1の保持手段に保持された停止状態情報を所定
の時間毎に保持していく第2の保持手段とを具えた構成
とする。
〔産業上の利用分野〕
本発明は複数の入出力装置を制御する計算機システム
の障害時における障害装置の障害診断装置に関するもの
である。
〔従来の技術〕
近年、計算機システムは、次第に多数の入出力装置
(I/O)等から構成されるようになり、障害発生時の対
処が難しくなってきた。たとえば、ある一つの装置でハ
ードウェア的の障害が発生し、それが原因で計算機全体
が処理停止状態になった場合、障害の波及効果のため、
計算機システム内の複数の装置で障害が発生したように
見えてしまい、本当の障害要因となった装置を特定する
ことが困難となった。
第3図(a)に従来の計算機システムの1例の構成図
を示す。同図において、中央処理装置(CPU)1の制御
下にアドレス,データの転送されるシステムバス6を通
して、複数の入出力装置(I/O)等が接続される。たと
えば、プログラム,データを格納する主メモリ(MS)
2、表示,記録等各種の機能を果すためのチャンネル
(CH0)3,(CH1)4等である。CPU1を含む各装置の動作
状態を障害時調査するため、(CPU)1,(MS)2,(CH0)
3,(CH1)4の各装置には、それぞれ内部をスキャンす
るスキャンレジスタ111〜114と、装置の動作状態を表示
する状態表示レジスタ121〜124が設けられ、その内容が
SVPインタフェース7を通して計算機システム全体を制
御する装置としてのサービスプロセッサ(SVP)5に送
られ監視される。
同図(b)は各装置内の両レジスタの構成の詳細図を
CPU1を代表例として示したもので、他の装置も同様であ
る。同図(b)において、スキャンレジスタ111は、障
害時SVP5がCPU1の内部のFF(フリップフロップ)〜
直列に走査記録するレジスタである(FF〜には汎用
レジスタの値やCPUの制御レジスタの値等が格納されて
いる)。すなわち、SVP5の指令で、FF〜を走査して
レジスタに記録し、これを信号でSVP5に吸上げる。状
態表示レジスタ121は、CPU1が電源投入時(P.ON),待
機時(iDLE),動作時(BUSY),及び障害による停止
(HALT)に従い、その状態を「0」、「1」で示し、そ
の状態が信号によりSVP5に送られる。
コントロール信号はSVP5が各装置の制御に用いる信
号である。
SVP5は、計算機システムが障害により処理停止状態と
なると、計算機システム内の各装置の状態を状態表示レ
ジスタ121により調べる。そしてHALT状態となっている
装置は障害を発生した可能性がある装置と判断される。
障害を発生した可能性がある装置は、SVP5によりさら
に詳細に装置内部の状態が調べられる。このため前述の
スキャンレジスタ111の走査内容が信号としてSVP5に
送られ解析され、予め用意された正常状態と比較検討す
る。
このように障害が発生した可能性のある装置が調べら
れた後、SVP5はその調査結果を解析し、本当に障害を発
生した装置はどれなのか、また装置内のどの部分が故障
したかを特定する。この解析に成功すると、SVP5は計算
機システムの管理者に対し調査結果を報告し、特定の装
置や部品の交換を要求する。
〔発明が解決しようとする課題〕
計算機システム内のある装置で障害が発生すると、そ
の装置の誤動作の影響を受けて、他の装置までHALT状態
となる場合がある。この波及効果により、計算機システ
ムが処理停止状態となったときには、HALT状態の装置が
複数存在することが多い。
第3図の従来の技術では、障害発生時の静的な状態を
解析することにより、障害を発生した装置の特定を行な
っているが、この方法では、複数の装置の調査,解析や
関連する検査を行なったりして、発生経過を推定しなけ
ればならない。そのため処理が複雑になり解析時間も大
きくなる。また障害の波及効果が複雑な場合には解析が
不可能となることもあり、その場合には障害の要因とな
った装置の特定もできなくなる。これに対し、本発明者
は各装置のHALT発生がどんな順で起ったかという経過情
報をとることが、真の障害要因となった装置を特定する
のに有効であることに着目した。
本発明の目的は、真の障害要因となった装置とその波
及により障害を起した装置を的確に判断できる障害診断
装置を提供することにある。
〔課題を解決するための手段〕
前記目的を達成するため、本発明においては、診断イ
ンタフェースを介して複数の処理装置と接続される障害
診断装置5であって、 前記処理装置の停止状態の発生時点に前記診断インタ
フェースを介して当該処理装置から送られてくる停止状
態情報を保持する第1の保持手段に対応するHALT状態レ
ジスタ13と、 前記第1の保持手段に保持された停止状態情報を所定
の時間毎に保持していく第2の保持手段に対応するメモ
リ14とを具えた構成とする。
〔作用〕
前記停止状態表示レジスタ13の内容を発生順に+1ア
ドレス生成回路15によりアドレスを1つ宛進めてメモリ
14に記憶させることにより、各装置がどのような順番で
HALT状態となっていたかが判断できる。このため、障害
の要因となった装置とこの波及により障害となった装置
とを識別し、該装置のスキャンレジスタ等によりその障
害装置と障害個所を容易に特定することができる。
〔実 施 例〕
第2図(a)は本発明の実施例の構成図であり、同図
(b)は各装置の代表例としてCPU1の詳細図を示す。
第2図(a)において第3図(a)の計算機システム
と異なる点は、第1図に示したSVP5の構成と、第2図
(b)に示す各装置におけるHALT発生時の処理である。
すなわち、SVP5内に、第2図(a)と第1図に示すよ
うに、各装置1〜4のHALT状態を表示する第1の保持手
段に対応するHALT状態表示レジスタ13を設ける。このレ
ジスタ13の各ビットは各装置1〜4内の状態表示レジス
タ121〜124とSVPインタフェース7を介して信号線で接
続され、各装置1〜4にHALT状態が発生すると直ちに通
知されるようになっている。
HALT状態表示レジスタ13の内容は一定時間毎に調べら
れ、第2の保持手段に対応するメモリ14内に記録され
る。この記録はHALT状態の波及状況を明確にするため、
各装置1〜4のHALT発生段階に亘って行なわれ、そのア
ドレスを+1更新して記録する。このため+1アドレス
生成回路15によりアクセスされる。そして記録の更新
は、システムが処理停止となりSTOP信号が発生した場合
や、HALT状態レジスタ13が満杯になった場合に停止す
る。
SVP5は、システムが処理停止になると、HALT状態レジ
スタ13の内容と、メモリ14の内容を調べることにより、
最初にHALTを発生した装置からHALT状態がどのように他
の装置に波及したが判る。これにより障害を発生した確
率の高い装置を特定できる。
このように特定された装置に関しては、従来と同様に
状態表示レジスタ12k(k=1〜4)の内容およびスキ
ャンレジスタ11k(k=1〜4)の走査内容を検査して
詳細な装置の内部情報を収集し、障害装置および障害個
所を特定する。
第2図(b)に各装置1〜4の代表例としてCPU1の詳
細図を示す。
同図において、第3図(b)と異なる点は、状態表示
レジスタ121の内容を一括してSVP5に送る外に、HALT発
生の都度HALT状態信号をSVP5に送り、HALT状態表示レジ
スタ13に記録する機能をもたせたことである。これはHA
LT状態信号線をHALT状態表示レジスタ13に接続すること
により実現される。
この機能とSVP5のHALT状態レジスタ13,メモリ14との
協力により障害発生の履歴を解明することが可能となる
ものである。
〔発明の効果〕
以上説明したように、本発明によれば、各装置はHALT
発生の都度、HALT状態信号をSVPに送り、SVPは各装置の
HALT発生の各段階に亘り、アドレスを更新してメモリに
格納することにより、障害発生の履歴が解明され、最も
障害発生の確率の高い装置が特定できる。その結果詳細
な調査を行なう装置を特定するか最小限の装置数に限定
できる。このようにして、障害を発生した装置を特定す
るまでの時間を短くすることができ、障害の解析処理も
簡単化することができる。
【図面の簡単な説明】
第1図は本発明の原理説明図、第2図(a),(b)は
実施例の構成説明図、第3図(a),(b)は従来例の
説明図であり、図中1はCPU、2はMS、3,4はチャンネ
ル、5はSVP、6はシステムバス、7はSVPインタフェー
ス、11,111〜114はスキャンレジスタ、12、121〜124
状態表示レジスタ、13はHALT状態表示レジスタ、14はメ
モリ、15は+1アドレス生成回路を示す。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】診断インタフェースを介して複数の処理装
    置と接続される障害診断装置であって、 前記処理装置の停止状態の発生時点に前記診断インタフ
    ェースを介して当該処理装置から送られてくる停止状態
    情報を保持する第1の保持手段と、 前記第1の保持手段に保持された停止状態情報を所定の
    時間毎に保持していく第2の保持手段と、 を具えることを特徴とする障害診断装置。
JP1242961A 1989-09-19 1989-09-19 障害診断装置 Expired - Fee Related JP2947571B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1242961A JP2947571B2 (ja) 1989-09-19 1989-09-19 障害診断装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1242961A JP2947571B2 (ja) 1989-09-19 1989-09-19 障害診断装置

Publications (2)

Publication Number Publication Date
JPH03103933A JPH03103933A (ja) 1991-04-30
JP2947571B2 true JP2947571B2 (ja) 1999-09-13

Family

ID=17096806

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1242961A Expired - Fee Related JP2947571B2 (ja) 1989-09-19 1989-09-19 障害診断装置

Country Status (1)

Country Link
JP (1) JP2947571B2 (ja)

Also Published As

Publication number Publication date
JPH03103933A (ja) 1991-04-30

Similar Documents

Publication Publication Date Title
JP3532289B2 (ja) 計算機システム解析装置
JPS5851292B2 (ja) 診断/デバツク計算システム
US8291379B2 (en) Runtime analysis of a computer program to identify improper memory accesses that cause further problems
US6098182A (en) Apparatus for monitoring tests run on a personal computer
CN111290942A (zh) 压力测试方法、装置以及计算机可读介质
JPS6226734B2 (ja)
JP2947571B2 (ja) 障害診断装置
TW200307200A (en) Multiple fault location in a series of devices
JP3342039B2 (ja) ファイルを管理する処理装置
JP2868114B2 (ja) 監視診断機能付計算機
KR960002363B1 (ko) 전전자 교환기의 디바이스 보드의 버스 액세스 상태 감시 및 보고방법
JP2000081992A (ja) コンピュータ性能チェック方式
JPS6125174B2 (ja)
JP2684966B2 (ja) 入出力処理装置のデバッグ装置
JP2017151511A (ja) 情報処理装置、動作ログ取得方法および動作ログ取得プログラム
TW201928669A (zh) 電腦設備、診斷方法以及非暫時性電腦可讀儲存媒體
JP2831480B2 (ja) 情報処理装置の障害検知方法
JPH05108398A (ja) 情報処理装置の障害情報ログ方式
JP2833928B2 (ja) 診断初期化方式
JPH08235016A (ja) 故障診断方式
JP2584466B2 (ja) ディスクコントローラの自己診断方法
JPH07248810A (ja) 数値制御装置
JPS61269746A (ja) 情報処理装置
JPH02129729A (ja) データ処理装置
JPS6111855A (ja) デ−タ処理装置の機能診断方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees