JPH04328646A - 障害情報の採取方式 - Google Patents

障害情報の採取方式

Info

Publication number
JPH04328646A
JPH04328646A JP3123107A JP12310791A JPH04328646A JP H04328646 A JPH04328646 A JP H04328646A JP 3123107 A JP3123107 A JP 3123107A JP 12310791 A JP12310791 A JP 12310791A JP H04328646 A JPH04328646 A JP H04328646A
Authority
JP
Japan
Prior art keywords
processing unit
central processing
area
fault information
peripheral control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3123107A
Other languages
English (en)
Inventor
Tsukasa Yagi
司 八木
Yasuo Imanishi
康雄 今西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Fielding Ltd
Original Assignee
NEC Corp
NEC Fielding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Fielding Ltd filed Critical NEC Corp
Priority to JP3123107A priority Critical patent/JPH04328646A/ja
Priority to EP92107045A priority patent/EP0510679A2/en
Publication of JPH04328646A publication Critical patent/JPH04328646A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/362Software debugging
    • G06F11/3636Software debugging by tracing the execution of the program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、コンピュータシステム
に発生する障害情報を採取する、障害情報の採取方式に
関する。
【0002】
【従来の技術】中央処理装置と複数の周辺制御装置から
なるコンピュータシステムにおいて、特に、周辺制御装
置にて障害が発生した時に、中央処理装置が周辺制御装
置の種別に関わらず共通な方法で各障害現象毎に異なっ
た障害情報を採取する。この種の周辺制御装置で発生し
た障害情報の採取方式により採取され、障害発生した時
に採取される情報は、それぞれの周辺制御装置でその障
害の内容に関わらず常に一定のものであった。
【0003】
【発明が解決しようとする課題】上述した、周辺制御装
置で発生した障害情報の採取方式は、採取される情報が
その障害の内容に関わらず常に一定のものであったので
、それぞれの障害の解析に最適な情報にはなっておらず
、原因解明に手間取るという欠点を持つ。
【0004】本発明の目的は、このような欠点を除去し
、原因解明に要する時間を短縮できる障害情報の採取方
式を提供することにある。
【0005】
【課題を解決するための手段】本発明は、データを処理
する中央処理装置と、この中央処理装置とデータの伝送
をする周辺制御装置とを備える障害情報の採取方式にお
いて、周辺制御装置は、障害が発生した場合、障害内容
毎に異なった領域に障害情報を保持する手段を有し、中
央処理装置は、周辺制御装置に保持されている障害情報
を採取する手段を有することを特徴としている。
【0006】本発明は、データを処理する中央処理装置
と、この中央処理装置とデータの伝送をする周辺制御装
置とを備える障害情報の採取方式において、周辺制御装
置は、ファームウェアの動作を示す内部トレースをメモ
リ内で常時作成する手段と、ファームウェアの各モジュ
ールがそれぞれ2面の作業領域を持ち、異常を検出した
場合に作業領域を切り替えると同時に内部トレースを停
止する手段と、異常を検出した旨を中央処理装置へ障害
報告として通知する手段と、異常が発生した時に使用し
ていた作業領域および内部トレースの格納領域を障害情
報領域として周辺処理装置のメモリ内の異常データ指示
領域に保持し、中央処理装置に異常データ指示領域の内
容を通知する手段と、指定された領域のメモリ内容を中
央処理装置へ転送する手段とを有し、中央処理装置は、
障害報告を受けた後、周辺制御装置の障害情報領域を知
る手段と、障害情報領域のメモリ内容を採取する手段と
を有することを特徴としている。
【0007】本発明は、データを処理する中央処理装置
と、この中央処理装置とデータの伝送をする周辺制御装
置とを備える障害情報の採取方式において、周辺制御装
置は、ファームウェアの動作を示す内部トレースをメモ
リ内で常時作成する手段と、ファームウェアの各モジュ
ールがそれぞれ2面の作業領域を持ち、異常を検出した
場合に作業領域を切り替えると同時に内部トレースを停
止する手段と、異常を検出した旨を中央処理装置へ障害
報告として通知する手段と、異常が発生した時に使用し
ていた作業領域および内部トレースの格納領域を障害情
報領域として周辺処理装置のメモリ内の異常データ指示
領域に保持し、中央処理装置からのセンス指令に従って
異常データ指示領域の内容を通知する手段と、中央処理
装置からダンプ指令で指定された領域のメモリ内容を中
央処理装置へ転送する手段とを有し、中央処理装置は、
障害報告を受けた後、周辺制御装置にセンス指令を発行
して周辺制御装置の障害情報領域を知る手段と、周辺制
御装置にダンプ指令を発行して障害情報領域のメモリ内
容を採取する手段とを有することを特徴としている。
【0008】
【実施例】次に、本発明の実施例について、図面を参照
して説明する。
【0009】図1は、本発明に係るコンピュータシステ
ムの一例を示す構成図である。図1のコンピュータシス
テムは、中央処理装置10と、周辺制御装置50とを備
えている。
【0010】中央処理装置10は、処理部(EPU)1
1と、主記憶装置(MM)12と、入出力制御部13と
を備えている。そして、中央処理装置10は、周辺制御
装置50から障害報告を受けた後、周辺制御装置50に
センス(SENSE)指令を発行して周辺制御装置50
の障害情報領域を知り、周辺制御装置50にダンプ(D
UMP)指令を発行して障害情報領域のメモリ内容を採
取する。
【0011】周辺制御装置50は、コンソール30、通
信制御装置(CCU)20およびディスク制御装置(D
KC)40である。コンソール30には、プリンタ31
および表示部(CRT)32が接続されている。CCU
20には、通信回線#1,#2,#3,#4が接続され
ている。ディスク制御装置40には、ディスク41,4
2が接続されている。このような周辺制御装置40は、
ファームウェアの動作を示す内部トレースをメモリ内で
常時作成し、ファームウェアの各モジュールがそれぞれ
2面の作業領域を持ち、異常を検出した場合に、作業領
域を切り替えると同時に、内部トレースを停止する。そ
れから、異常を検出した旨を中央処理装置10へ障害報
告として通知する。異常が発生した時に使用していた作
業領域および内部トレースの格納領域を障害情報領域と
して、周辺処理装置のメモリ内の異常データ指示領域に
保持し、中央処理装置10からのSENSE指令に従っ
て、異常データ指示領域の内容を通知する。また、中央
処理装置からDUMP指令で、指定された領域のメモリ
内容を中央処理装置10へ転送する。
【0012】次に、本実施例の動作を、図2、図3、図
4を用いて説明する。ここでは、コンピュータシステム
でのCCU20と中央処理装置10との間での動作につ
いて説明する。なお、図2は、通信制御装置20のメモ
リの使用状況を示した図である。モジュールA、モジュ
ールB、モジュールC・・と複数のモジュール構成のプ
ログラム部と各モジュールで使用する作業領域がある。 内部トレース領域には、CCUファームウェア全体の動
作の履歴が残るようなデータが逐次書き込まれ一つの領
域に繰り返して上書きされている。異常データ指示領域
は、何れかのモジュールが異常を検出して作業領域を切
り替えた時、異常検出時に使用していた作業領域の開始
アドレス、大きさおよび内部トレース領域の開始アドレ
ス、大きさが保持される。図3は、モジュールAが異常
を検出した後の異常データ指示領域の内容であり、SE
NSE指令に応答して転送するデータの内容である。こ
の時点では、作業領域A1および内部トレース領域の開
始アドレス、それぞれの大きさが入っている。図4は、
モジュールAが異常を検出した後のDUMP指令の応答
として転送するデータの内容であり、ここでは作業領域
A1および内部トレースの内容になっている。
【0013】前述したように、このシステムでの周辺制
御装置は、CCU20とコンソール30およびディスク
制御装置40である。CCU20は通信回線#1,#2
,#3,#4に接続されている。コンソール30は、プ
リンタ31およびCRT32が接続されている。ディス
ク制御装置40にはディスク41,42が接続されてい
る。
【0014】図2にCCU20内のメモリの使用状況を
示す。モジュールA、モジュールB、モジュールC・・
と複数のモジュール構成のプログラム部と各モジュール
で使用する作業領域がある。作業領域A1,A2は、モ
ジュールAが使用する作業領域であり、同一の内容であ
る。モジュールAがA1,A2を切り替えて使用し、同
時には両方を使用することはない。作業領域B1,B2
および作業領域C1,C2は同様にそれぞれモジュール
BおよびモジュールCの作業領域であり、やはり切り替
えて使用される。内部トレース領域には、CCUファー
ムウェア全体の動作の履歴が残るようなデータが逐次書
き込まれ、一つの領域に繰り返して上書きされている。 異常データ指示領域には、何れかのモジュールが異常を
検出して作業領域を切り替えた時、異常検出時に使用し
ていた作業領域の開始アドレス、大きさおよび内部トレ
ース領域の開始アドレス、大きさが格納される。この内
容は、中央処理装置10からSENSE指令が発行され
た場合、CCU20が中央処理装置10に転送され、そ
の後クリアされる。
【0015】ここでは先ず、モジュールAが作業領域A
1、モジュールBが作業領域B1、モジュールCが作業
領域C1、を使用しているとし、この時、モジュールA
が異常を検出した場合の障害情報の採取について述べる
。モジュールAは、異常を検出すると作業領域をA1か
らA2へ切り替えて以降の動作を継続し、内部トレース
を停止させる。さらに、図3のように異常データ指示領
域に作業領域A1の開始アドレス、その大きさおよび内
部トレース領域の開始アドレス、その大きさが書き込ん
だ後、中央処理装置10に障害報告をする。CCU20
は、以降、通常の動作を続けながら、同時に、中央処理
装置10からのSENSE指令およびDUMP指令にて
、作業領域A1の内容および内部トレースの内容を中央
処理装置10へ転送するのを待つ。
【0016】中央処理装置10は、障害報告を受け取る
と、報告をしたCCU20に対してSENSE指令を発
行して障害情報の格納領域を調べる。SENSE指令で
図3のような障害情報の格納領域を知った中央処理装置
10は、DUMP指令にて障害情報の格納領域を指定し
て図4に示すようなCCU20のメモリ内容を読み取り
障害情報の採取を行う。
【0017】CCU20は、障害情報を中央処理装置1
0へ転送した後、異常データ指示領域の内容をクリアし
、内部トレースの動作を再開させ次の異常検出に備える
【0018】モジュールBまたはモジュールCが異常を
検出した場合も、CCU20の動作は同様であり、それ
ぞれ作業領域B1または作業領域C1と内部トレースの
内容が障害情報として採取できる。
【0019】以上説明したように、障害情報を採取すべ
き異常現象が発生した場合、その異常を検出したモジュ
ールの作業領域を障害情報として採取できるので、それ
ぞれの障害毎に異なった、有効な障害情報を採取するこ
とができる。さらに、障害情報として全体の動作の履歴
が分かる内部トレースも採取できるため、原因の追求に
は有効である。また、この方式では、中央処理装置は、
障害が発生した装置および障害の内容を意識せずに障害
情報を採取できるので、複数の種類の周辺処理装置が接
続されたコンピュータシステムでの障害情報の採取に適
している。
【0020】
【発明の効果】以上説明したように、本発明は、複数の
周辺制御装置の何れかの周辺制御装置で障害情報を採取
すべき障害が発生した場合、それぞれの障害毎に異なっ
た有効な障害情報を採取することにより、障害の原因解
明までの時間が短縮できる効果がある。
【図面の簡単な説明】
【図1】本発明に係るコンピュータシステムの一例を示
す構成図である。
【図2】通信制御装置のメモリの使用状況を示す図であ
る。
【図3】異常データ指示領域の内容を示す図である。
【図4】転送データの内容を示す図である。
【符号の説明】
10  中央処理装置 11  EPU 12  主記憶装置(MM) 13  IOP(入出力制御部) 20  通信制御装置 30  コンソール 31  プリンタ 32  CRT 40  ディスク制御装置(DKC) 41,42  ディスク装置

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】データを処理する中央処理装置と、この中
    央処理装置とデータの伝送をする周辺制御装置とを備え
    る障害情報の採取方式において、周辺制御装置は、障害
    が発生した場合、障害内容毎に異なった領域に障害情報
    を保持する手段を有し、中央処理装置は、周辺制御装置
    に保持されている障害情報を採取する手段を有すること
    を特徴とする障害情報の採取方式。
  2. 【請求項2】データを処理する中央処理装置と、この中
    央処理装置とデータの伝送をする周辺制御装置とを備え
    る障害情報の採取方式において、周辺制御装置は、ファ
    ームウェアの動作を示す内部トレースをメモリ内で常時
    作成する手段と、ファームウェアの各モジュールがそれ
    ぞれ2面の作業領域を持ち、異常を検出した場合に作業
    領域を切り替えると同時に内部トレースを停止する手段
    と、異常を検出した旨を中央処理装置へ障害報告として
    通知する手段と、異常が発生した時に使用していた作業
    領域および内部トレースの格納領域を障害情報領域とし
    て周辺処理装置のメモリ内の異常データ指示領域に保持
    し、中央処理装置に異常データ指示領域の内容を通知す
    る手段と、指定された領域のメモリ内容を中央処理装置
    へ転送する手段とを有し、中央処理装置は、障害報告を
    受けた後、周辺制御装置の障害情報領域を知る手段と、
    障害情報領域のメモリ内容を採取する手段とを有するこ
    とを特徴とする障害情報の採取方式。
  3. 【請求項3】データを処理する中央処理装置と、この中
    央処理装置とデータの伝送をする周辺制御装置とを備え
    る障害情報の採取方式において、周辺制御装置は、ファ
    ームウェアの動作を示す内部トレースをメモリ内で常時
    作成する手段と、ファームウェアの各モジュールがそれ
    ぞれ2面の作業領域を持ち、異常を検出した場合に作業
    領域を切り替えると同時に内部トレースを停止する手段
    と、異常を検出した旨を中央処理装置へ障害報告として
    通知する手段と、異常が発生した時に使用していた作業
    領域および内部トレースの格納領域を障害情報領域とし
    て周辺処理装置のメモリ内の異常データ指示領域に保持
    し、中央処理装置からのセンス指令に従って異常データ
    指示領域の内容を通知する手段と、中央処理装置からダ
    ンプ指令で指定された領域のメモリ内容を中央処理装置
    へ転送する手段とを有し、中央処理装置は、障害報告を
    受けた後、周辺制御装置にセンス指令を発行して周辺制
    御装置の障害情報領域を知る手段と、周辺制御装置にダ
    ンプ指令を発行して障害情報領域のメモリ内容を採取す
    る手段とを有することを特徴とする障害情報の採取方式
JP3123107A 1991-04-26 1991-04-26 障害情報の採取方式 Pending JPH04328646A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP3123107A JPH04328646A (ja) 1991-04-26 1991-04-26 障害情報の採取方式
EP92107045A EP0510679A2 (en) 1991-04-26 1992-04-24 Fault information gathering system for peripheral controllers in a computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3123107A JPH04328646A (ja) 1991-04-26 1991-04-26 障害情報の採取方式

Publications (1)

Publication Number Publication Date
JPH04328646A true JPH04328646A (ja) 1992-11-17

Family

ID=14852356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3123107A Pending JPH04328646A (ja) 1991-04-26 1991-04-26 障害情報の採取方式

Country Status (2)

Country Link
EP (1) EP0510679A2 (ja)
JP (1) JPH04328646A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2300496A (en) * 1995-05-01 1996-11-06 Motorola Gmbh Data processing system
GB9626367D0 (en) * 1996-12-19 1997-02-05 Sgs Thomson Microelectronics Providing an instruction trace
JP4282334B2 (ja) * 2003-02-04 2009-06-17 株式会社アドバンテスト 試験装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS617952A (ja) * 1984-06-15 1986-01-14 インタ−ナシヨナル ビジネス マシ−ンズ コ−ポレ−シヨン 活動トレ−ス収集装置
JPH02294753A (ja) * 1989-05-09 1990-12-05 Fujitsu Ltd 入出力処理装置の初期化方式

Also Published As

Publication number Publication date
EP0510679A2 (en) 1992-10-28
EP0510679A3 (ja) 1994-02-16

Similar Documents

Publication Publication Date Title
JP4107083B2 (ja) 高可用ディスク制御装置とその障害処理方法及び高可用ディスクサブシステム
US7236454B2 (en) Loop diagnosis system and method for disk array apparatuses
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
JP2000181887A5 (ja)
JPH04328646A (ja) 障害情報の採取方式
JP2003288279A (ja) 記憶装置間の障害検出方法、及びこれに用いられる記憶装置
JPS6247759A (ja) 自動回線トレ−ス処理方式
JPS6095663A (ja) 2重化磁気デイスク装置の自動切換装置
JPH05224964A (ja) バス異常通知方式
JP2600614B2 (ja) 障害情報収集可能な交換システム
JPH1027115A (ja) コンピュータシステムの障害情報採取回路
JPS58149529A (ja) チヤネルステ−タスワ−ド折返し診断方式
JPH03156646A (ja) 障害情報の出力方式
JP3084823B2 (ja) オペレータズコンソール
JP2785754B2 (ja) データ処理システム
JPH04125716A (ja) 電源断診断システム
JPH0334012A (ja) ディスクコントローラの自己診断装置
JPS6320647A (ja) デ−タ転送装置
JPS6295641A (ja) システム診断装置の障害情報収集方式
JPH0434184B2 (ja)
JPS6238947A (ja) プロセツサユニツトの診断方法
JPH04242850A (ja) 障害情報転送方式
JPH01244557A (ja) ファイルリカバリ方式
JPS5918741B2 (ja) 自動診断方式
JPH04165444A (ja) 障害情報転送方式