JP3192354B2 - コンピュータシステムのリトライ処理装置 - Google Patents

コンピュータシステムのリトライ処理装置

Info

Publication number
JP3192354B2
JP3192354B2 JP23240095A JP23240095A JP3192354B2 JP 3192354 B2 JP3192354 B2 JP 3192354B2 JP 23240095 A JP23240095 A JP 23240095A JP 23240095 A JP23240095 A JP 23240095A JP 3192354 B2 JP3192354 B2 JP 3192354B2
Authority
JP
Japan
Prior art keywords
data
bus
trace memory
error
main storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23240095A
Other languages
English (en)
Other versions
JPH0981405A (ja
Inventor
祐二 菅谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP23240095A priority Critical patent/JP3192354B2/ja
Publication of JPH0981405A publication Critical patent/JPH0981405A/ja
Application granted granted Critical
Publication of JP3192354B2 publication Critical patent/JP3192354B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Retry When Errors Occur (AREA)
  • Debugging And Monitoring (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、コンピュータシステム
において、エラー発生時にバストレースにより原因解析
を行うリトライ処理装置に関する。
【0002】
【従来の技術】コンピュータシステムの高信頼化技術の
一つに、バストレースによるエラー解析がある。このバ
ストレースによるエラー解析では、各バスサイクルにお
けるデータバス、アドレスバス、制御線のデータをトレ
ースメモリに保持し、エラー発生時にトレースメモリに
保持されたデータを基にエラー原因の解析を行ってい
る。 また、コンピュータシステムに一過性の障害が生
じ、これによって、コンピュータシステムが停止した場
合の対策としては、特開4−4444号公報に記載さ
れた「通信制御システム」がある。この「通信制御シス
テム」においては、システムに障害が生じた場合に、ま
ず、システムを再スタートさせる。そして、システムが
正常に動作すれば、そのまま、システムの稼働が継続さ
れる。システムの再スタートを所定回数繰り返しても、
正常に動作しない場合には、待機機に切り替えて運用さ
れる。これにより、システムが一過性の原因により停止
した場合には、待機機に切り替えて運用が再開できる。
また、障害が一過性では無い場合には、待機機に切り替
えて運用が再開できる。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
バストレースの方式では、コンピュータシステムのエラ
ー発生時の原因解析を行うだけで、エラーの発生後は、
コンピュータシステムのダウンを余儀なくされていた。
コンピュータシステムの応用分野では、その性格上コン
ピュータシステムのダウンが膨大な損失をもたらす分野
がある。このような分野では、エラー発生後も処理が連
続して実行されれば、損失を防ぐか、若しくは損失を最
小限におさえることができる。
【0004】また、上記公報に記載された「通信制御シ
ステム」においては、システムに一過性では無い障害が
発生した場合には、待機機に切り替えられるが、この待
機機が必要となるばかりか、待機機に障害が発生した場
合には、システムのダウンを回避することはできない。
【0005】本発明の目的は、バストレース及びバック
アップメモリにより、エラー発生時においても、コンピ
ュータシステムの処理の連続性の確保を可能にするリト
ライ処理装置、つまり、処理再開装置を実現することで
ある。
【0006】
【課題を解決するための手段】上記目的を達成するた
め、本発明は次のように構成される。レジスタ、プログ
ラムカウンタ、スタックポインタを少なくとも有するデ
ータ処理手段と、主記憶手段と、各バスサイクルにおけ
るデータバス、アドレスバス、制御線のデータを格納す
るトレースメモリと、主記憶手段へのアクセス及びトレ
ースメモリの制御を制御線を介して行うシステム制御部
とを有するコンピュータシステムのリトライ処理装置に
おいて、一定間隔毎に、レジスタ、プログラムカウンタ
及びスタックポインタの内容を、チェックポイントとし
て、主記憶手段の所定アドレスに書き込むレジスタ内容
書き込み手段と、データ処理手段におけるデータ処理に
誤りが発生したことを検知し、トレースメモリへのデー
タバス、アドレスバス及び制御線のデータの格納を停止
し、誤りの発生原因を解析するエラー検知原因解析手段
と、原因解析手段により解析されたエラーの発生前のチ
ェックポイントを判定するチェックポイント判定手段
と、主記憶手段に、トレースメモリに格納されたデータ
を書き込み、チェックポイント判定手段により判定され
たチェックポイントにおける内容に戻すとともに、上記
レジスタ、プログラムカウンタ及びスタックポインタの
内容を、上記チェックポイントにおける内容に戻し、デ
ータ処理を再開させるトレース情報読み出し書き込み制
御部とを備える。
【0007】好ましくは、上記コンピュータシステムの
リトライ処理装置において、主記憶手段とデータ処理手
段との間に配置され、主記憶手段へのデータの流れの切
換を行うデータバスエクスチェンジャーを、さらに備え
る。
【0008】また、好ましくは、上記コンピュータシス
テムのリトライ処理装置において、トレース情報読み出
し書き込み制御部は、上記データ処理手段がデータを上
記主記憶手段に書き込む前に、主記憶手段の書き込みを
行うアドレスに格納されたデータの読み出しを行い、読
み出したデータをトレースメモリに格納する。
【0009】また、好ましくは、上記コンピュータシス
テムのリトライ処理装置において、エラー検知原因解析
手段は、データ処理に誤りが発生したときは、自己診断
等によるエラー原因の解析後、トレースメモリに保持さ
れた各バスサイクル毎のデータバス、アドレスバス、制
御線のデータを基にエラー原因の解析を行う。また、レ
ジスタ、プログラムカウンタ、スタックポインタを少な
くとも有するデータ処理手段と、主記憶手段と、各バス
サイクルにおけるデータバス、アドレスバス、制御線の
データを格納するトレースメモリと、上記主記憶手段へ
のアクセス及びトレースメモリの制御を制御線を介して
行うシステム制御部とを有するコンピュータシステムの
リトライ処理方法において、一定間隔毎に、上記レジス
タ、プログラムカウンタ及びスタックポインタの内容
を、チェックポイントとして、上記主記憶手段の所定ア
ドレスに書き込むことと、データ処理手段におけるデー
タ処理に誤りが発生したことを検知し、トレースメモリ
へのデータバス、アドレスバス及び制御線のデータの格
納を停止し、上記誤りの発生原因を解析することと、上
記原因解析手段により解析されたエラーの発生前のチェ
ックポイントを判定することと、主記憶手段に、上記ト
レースメモリに格納されたデータを書き込み、チェック
ポイント判定手段により判定されたチェックポイントに
おける内容に戻すとともに、上記レジスタ、プログラム
カウンタ及びスタックポインタの内容を、上記チェック
ポイントにおける内容に戻し、データ処理を再開させ
ととを備える。
【0010】
【作用】通常のプログラム実行時に、一定間隔毎にデー
タ処理手段からレジスタ、プログラムカウンタ、スタッ
クポインタの値がチェックポイントとして書き出され
る。また、各バスサイクル毎のデータバス、アドレスバ
ス、制御線のデータをトレースメモリに保持する。更
に、主記憶手段への書き込みアクセス時には、主記憶手
段への書き込みを行う前に、書き込みを行うアドレスか
らの読み出しを行い、トレースメモリに書き込みを行う
前の主記憶手段データを保持する。
【0011】エラー発生時、トレースメモリに保持され
たデータバス、アドレスバス、制御線のデータを基にエ
ラー原因の解析を行うと共に主記憶装置及びデータ処理
手段のレジスタ、プログラムカウンタ、スタックポイン
タの内容をチェックポイントからの処理続行可能なよう
に、リトライ処理を開始するチェックポイントにおける
内容に戻し、チェックポイントからのリトライ処理を行
うことにより、処理の連続性確保を可能にする。
【0012】
【実施例】以下、本発明の実施例を添付図面を用いて説
明する。図1は、本発明の一実施例であるリトライ処理
装置(処理再開装置)の全体概略構成図であり、1はC
PU(データ処理手段)、2は主記憶装置、3はトレー
スメモリである。このトレースメモリ3は、各バスサイ
クルにおけるデータバス6、アドレスバス7、制御線8
のデータを保持するデータバス用トレースメモリ31
と、アドレスバス用トレースメモリ32と、制御線用ト
レースメモリ33とからなる。この図1の例ではトレー
スメモリ3は、FIFO形式のメモリとする。
【0013】また、4はデータバスエクスチェンジャー
であり、主記憶装置2へのデータの流れ、つまり入出力
の切換を行う。5はシステム制御部であり、システム制
御線9を介して、主記憶装置2へのアクセスの制御や、
トレースメモリ3及びデータバスエクスチェンジャー4
の動作制御を行う。
【0014】図2は、本発明におけるリトライ処理用い
て、エラー発生後にエラーの解析及びリトライ処理を行
うときの全体動作フローチャートである。図2のステッ
プ100に示すように、バストレース(通常のプログラ
ム実行)が開始され、ステップ101において、エラー
が発生したとする。
【0015】通常のプログラム実行時は、エラー発生後
にエラーの解析及びリトライ処理の実行が可能となるよ
うに、各バスサイクルにおけるデータバス6、アドレス
バス7、制御線8のデータをトレースメモリ3に保持す
る。また、主記憶装置2への書き込みアクセス時には、
主記憶装置2への書き込みを行う前に、書き込みを行う
アドレスからデータの読み出しを行い、読み出したデー
タをトレースメモリ3に書き込み、そのデータを保持す
る。そして、その後、主記憶装置2に書き込みを行う。
【0016】このため、ステップ102において、エラ
ーの発生時には、トレースメモリ3内の通常動作時のデ
ータバス6、アドレスバス7、制御線8のデータ、書き
込みアクセス時の主記憶装置2の書き込み前データをそ
のまま保持しておくために、データバス6、アドレスバ
ス7、制御線8のデータのトレースメモリ3への保持を
停止する。次に、ステップ103において、エラーの原
因解析を行い、どこまでデータをさかのぼってリトライ
処理を行うか決定する。この際、トレースメモリ3のデ
ータを主記憶装置2に書き込み、主記憶装置2の内容を
リトライ処理を行う点における内容に戻す。
【0017】主記憶データの内容をリトライ処理を行う
点における内容に戻したら、ステップ104において、
リトライ処理を開始し、通常のプログラム実行であるス
テップ100に戻る。リトライ処理開始時は、再びエラ
ーが発生してもエラー原因の解析及びリトライ処理を行
えるように、データバス6、アドレスバス7、制御線8
のデータのトレースメモリ3への保持を再開させる。
【0018】図3は、通常のプログラム実行時のCPU
1の概略動作フローチャートである。図3のステップ2
00において、CPU1は、プログラムを実行し、ステ
ップ201において、プログラム実行中に一定間隔経過
したか否かを判定して、経過したならば、ステップ20
2において、チェックポイントとしてCPU1のレジス
タ、プログラムカウンタ、スタックポインタの値を、主
記憶装置2又は各種データ保持用のメモリの特定アドレ
ス以降に書き込む。本実施例では特定アドレスを主記憶
装置2のアドレスXXXXXとする。そして、ステップ
200に戻る。
【0019】図2に示したリトライ処理動作は、上述し
たチェックポイントを開始点とする。通常のプログラム
実行時は、トレースメモリ3にデータバス6、アドレス
バス7、制御線8のデータが保持されるため、トレース
メモリ3には少なくとも1つのチェックポイントが保持
される。
【0020】データバス用トレースメモリ31には、各
チェックポイントにおけるCPU1のレジスタ、プログ
ラムカウンタ、スタックポインタの値が保持されている
ため、リトライ処理開始時は、CPU1のレジスタ、プ
ログラムカウンタ、スタックポインタの値をデータバス
用トレースメモリ31を参照し、リトライを開始するチ
ェックポイントにおけるレジスタ、プログラムカウン
タ、スタックポインタの値とすれば良い。トレースメモ
リ3を参照する際、アドレスバス用トレースメモリ32
に保持されたデータがXXXXXとなる点を探すことに
より、チェックポイントを探すことができる。
【0021】図4は、本実施例で示すコンピュータシス
テムにおけるアドレスの割付例である。チェックポイン
トにおけるCPU1のレジスタ、プログラムカウンタ、
スタックポインタの値の書き込み用に、アドレスXXX
XX以降にそのデータ容量分だけの空間を割り当てる。
【0022】また、トレースメモリ3の読み出し用にデ
ータバス用トレースメモリ31にアドレスYYYYY、
アドレスバス用トレースメモリ32にアドレスYYYY
Y+4、制御線用トレースメモリ33にアドレスYYY
YY+8を割り当てる。トレースメモリ3はFIFO形
式のメモリであるため、アドレスYYYYY、アドレス
YYYYY+4、アドレスYYYYY+8からの読み出
しを行えば各バスサイクルにおけるデータバス6、アド
レスバス7、制御線8のデータを順を追って読み出すこ
とができる。上記の空間はチェックポイントにおけるC
PU1のレジスタ、プログラムカウンタ、スタックポイ
ンタの保持と、トレースメモリ3の読み出し以外の用途
には使わないものとする。
【0023】図5から図7を用いて、図2における通常
のプログラム実行時のトレースメモリ3へのデータバス
6、アドレスバス7、制御線8のデータの保持を説明す
る。図5は、CPU1の読み出し動作時における説明図
である。バスエクスチェンジャー4は、主記憶装置2か
らの読み出しデータをそのままCPU1に送る。データ
バス6、アドレスバス7、制御線8のデータがそれぞれ
データバス用トレースメモリ31、アドレスバス用トレ
ースメモリ32、制御線用トレースメモリ33に保持さ
れる。
【0024】図6、図7は、CPU1から主記憶装置2
への書き込みアクセス、及び主記憶装置2への書き込み
を行うアドレスの書き込み前データのトレースメモリ3
への保持動作を表している。
【0025】図6において、CPU1は主記憶装置2の
アドレスNNNNNに書き込みアクセスを行う。この
際、主記憶装置2のアドレスNNNNNに書き込みを行
う前に、主記憶装置2のアドレスNNNNNの書き込み
前データが読み出され、トレースメモリ3に保持され
る。この際、CPU1からの書き込みデータと主記憶装
置2からのアドレスNNNNNから読み出された書き込
み前データが衝突しないように、データバスエクスチェ
ンジャー4は、システム制御部5からの制御指令によ
り、CPU1からの書き込みデータを主記憶装置2に送
らないようにしている。
【0026】トレースメモリ3への主記憶装置2の書き
込み前データの保持が終了すると、図7に示すように、
主記憶装置2へのCPU1からの書き込みデータの書き
込みを行う。データバスエクスチェンジャー4は、CP
U1からの書き込みデータをそのまま主記憶装置2に送
る。データバス6、アドレスバス7、制御線8のデータ
が、それぞれデータバス用トレースメモリ31、アドレ
スバス用トレースメモリ32、制御線用トレースメモリ
33に保持される。
【0027】図8は、CPU1の機能ブロック図であ
り、図2におけるエラー原因解析、及びトレースデータ
の主記憶装置2への書き込みの動作を行うブロックであ
る。また、図9は、図8の機能ブロックの動作フローチ
ャートである。図8において、CPU1は、バストレー
ス開始指令部11と、この開始指令部11からの開始指
令に応じて、データバス6、アドレスバス7及び制御線
8からエラー発生を検知するエラー発生検知部12と、
このエラー発生検知部12からのエラー発生検知信号に
応答して、エラー原因を解析するエラー原因解析部13
とを有している。
【0028】さらに、CPU1は、エラー原因解析部1
3等からの指令に基づき、トレースメモリ3に格納され
たデータ等を読み出すトレースメモリ読み出し部14
と、このトレースメモリ読み出し部14が読み出したデ
ータがチェックポイントか否かを判定するチェクポイン
ト判断部15と、チェックポイント判断部15からの指
令信号に基づき、トレースメモリ読み出し部14により
読み出された情報を主記憶部2に書き込むトレース情報
読み出し書き込み制御部16とを有している。
【0029】また、CPU1は、バストレース開始指令
部11の開始指令に応じて、CPU1内のレジスタ、プ
ログラムカウンタ、スタックポインタの内容を、所定の
一定間隔毎に、チェックポイントとして、主記憶装置2
に書き込む書き込み制御部17を有している。
【0030】以下、エラー原因解析、及びトレースデー
タの主記憶装置2への書き込みの動作の詳細を、図8及
び図9を参照して説明する。図9のステップ300にお
いて、バストレース開始指令部11によりバストレース
の開始が指令される。次に、ステップ301において、
エラー発生検知部12がエラーを検知すると、ステップ
302において、バストレース開始指令部11は、シス
テム制御部5にバストレースの停止を指令し、バストレ
ースが停止される。そして、ステップ303において、
エラー原因解析部13によりエラー原因の解析が開始さ
れる。
【0031】エラー原因解析は、初めに自己診断等によ
りトレースメモリ3のデータを使わないで行う。そし
て、ステップ304において、解析できたか否かが判断
され、この時点で、エラー原因が判明した場合にはエラ
ー原因の内容から、どのチェックポイントからリトライ
処理を開始するかを決め、次のステップ305における
処理である、トレース情報の読み出しを行う(トレース
メモリ読み出し部14により実行)。
【0032】ステップ304において、自己診断等によ
るエラー原因解析により、エラー原因が判明しなかった
場合は、ステップ309に進み、トレース情報の読み出
し、を行いながら、トレースデータを基にエラー原因の
解析を行い、エラー原因が判明した場合にはエラー原因
の内容からどのチェックポイントからリトライ処理を開
始するかを決める。エラー原因が判明しなかった場合は
ノイズなどによる一過性のエラーと判断し、最新のチェ
ックポイントからリトライ処理を行うことに決定する。
【0033】トレースデータの読み出しは、データバス
用トレースメモリ31の読み出し、アドレスバス用トレ
ースメモリ32の読み出し、制御線用トレースメモリ3
3の読み出しを一連の動作として、この動作を繰り返す
ことにより行う。トレースメモリ3はFIFO形式のメ
モリであるため、一連の動作を繰り返して行うことによ
り、各バスサイクルにおけるデータバス6、アドレスバ
ス7、制御線8のデータを順を追って読み出すことがで
きる。
【0034】図10、図11、図12に、それぞれデー
タバス用トレースメモリ31の読み出し、アドレスバス
用トレースメモリ32の読み出し、制御線用トレースメ
モリ33の読み出しの動作を示す。データバス用トレー
スメモリ31の読み出し、アドレスバス用トレースメモ
リ32の読み出し、制御線用トレースメモリ33の読み
出しは、それぞれアドレスYYYYY、アドレスYYY
YY+4、アドレスYYYYY+8の読み出しにより行
う。
【0035】ステップ305及び309において、読み
出されたトレース情報がチェックポイントにおけるデー
タであるかどうかが、チェックポイント判断部15によ
り、アドレス用トレースメモリ32からの読み出しデー
タを参照して判断される。チェックポイントでは、アド
レスXXXXX以降にCPU1のレジスタ、プログラム
カウンタ、スタックポインタを書き込むため、アドレス
用トレースメモリ32からの読み出しデータがXXXX
Xであれば、チェックポイントにおけるトレースデータ
を読み出したものと判断する。
【0036】ステップ306において、チェックポイン
トにおけるトレース情報でないと判断された場合は、ス
テップ308に進み、主記憶装置2のアドレスバス用ト
レースメモリ32から読み出したアドレスにデータバス
用トレースメモリ31から読み出したデータを書き戻
す。この際の動作は図13で示される。そして、処理は
ステップ305又は309に戻る。
【0037】ステップ306において、チェックポイン
トであれば、ステップ307に進む。このステップ30
7において、リトライ処理を開始するチェックポイント
か否かが判断され、チェックポイントにおけるトレース
データであってもリトライ処理を開始するチェックポイ
ントでない場合は、ステップ305又は309に戻る。
【0038】リトライ処理を開始するチェックポイント
かどうかの判断は、データバス用トレースメモリ31か
ら読み出したチェックポイントにおけるCPU1のレジ
スタ、プログラムカウンタ、スタックポインタの値を参
照して判断すればよい。以上のようにしてリトライ処理
を開始するチェックポイントまでの各バスサイクルにお
けるデータバス6のデータを主記憶装置2に書き込む。
そして、ステップ307において、リトライ処理を開始
するチェックポイントとなると、ステップ310に進
む。
【0039】ステップ310において、トレース情報読
み出し書き込み制御部16は、トレースメモリ読み出し
部14からリトライ処理を行うチェックポイント以降の
トレースデータの読み出しを行い、データ用トレースメ
モリ31から読み出した、主記憶装置2の各アドレスへ
のアクセスにおける同一アドレスへの最初のアクセスの
際の主記憶装置2からの読み出しデータのみを、主記憶
装置2の当該アドレスに書き込む。
【0040】主記憶装置2への書き込みアクセス時は、
主記憶装置2への書き込みを行う前に、書き込みを行う
アドレスから読み出しを行い、トレースメモリ3に書き
込みを行う前の主記憶装置のデータの保持を行うため、
リトライ処理を行うチェックポイント以降の主記憶装置
2への最初のアクセスの際の主記憶装置2からの読み出
しデータを主記憶装置2に書き戻すことにより、主記憶
装置2の内容をリトライを開始するチェックポイントに
おける内容に戻すことができる。
【0041】以上のようにして主記憶装置2の内容をリ
トライ処理を開始するチェックポイントにおける内容に
戻した後、ステップ311において、トレース情報読み
出し書き込み制御部6は、CPU1のレジスタ、プログ
ラムカウンタ、スタックポインタの値を、データ用トレ
ースメモリ31から読み出した、リトライ処理を開始さ
せるチェックポイントにおけるCPU1のレジスタ、プ
ログラムカウンタ、スタックポインタとする。
【0042】そして、ステップ312において、リトラ
イ処理を開始させる。続いて、ステップ300に戻り、
再びエラーが発生してもエラー原因の解析、及びリトラ
イ処理が可能となるように、データバス6、アドレスバ
ス7、制御線8のデータのトレースメモリ3への保持及
び、主記憶2への書き込み時の書き込み前の主記憶のデ
ータのトレースメモリ3への保持を再開させる。
【0043】以上説明したように、本発明の一実施例に
よれば、トレースメモリ3に保持した各バスサイクルに
おける、データバス6、アドレスバス7、制御線8のデ
ータを基にエラー原因の解析だけでなく、主記憶装置2
及びCPU1のレジスタ、プログラムカウンタ、スタッ
クポインタの内容をリトライ処理を行う点における内容
に戻し、リトライ処理を行うように構成したので、処理
の連続性を確保可能とし、コンピュータシステムの信頼
性を向上可能なリトライ処理装置を実現することができ
る。
【0044】
【発明の効果】本発明は、以上説明したように、構成さ
れているため、次のような効果がある。コンピュータシ
ステムのリトライ処理装置において、一定間隔毎に、レ
ジスタ、プログラムカウンタ及びスタックポインタの内
容を、チェックポイントとして、主記憶手段の所定アド
レスに書き込む手段と、トレースメモリへのデータバ
ス、アドレスバス及び制御線のデータの格納を停止し、
データ処理の誤りの発生原因を解析するエラー検知原因
解析手段と、解析されたエラーの発生前のチェックポイ
ントを判定するチェックポイント判定手段と、主記憶手
段に、トレースメモリに格納されたデータを書き込み、
レジスタ、プログラムカウンタ及びスタックポインタの
内容を、チェックポイント判定手段により判定されたチ
ェックポイントにおける内容に戻し、データ処理を再開
させるトレース情報読み出し書き込み制御部とを備え
る。したがって、エラー発生時においても、コンピュー
タシステムの処理の連続性の確保を可能にし、コンピュ
ータシステムの信頼性を向上可能なリトライ処理装置、
つまり、処理再開装置を実現することができる。
【0045】また、本発明によれば、通常のプログラム
実行時に、データ処理手段が一定間隔毎にチェックポイ
ントとして、レジスタ、プログラムカウンタ、スタック
ポインタの値を主記憶手段に書き出すように構成されて
いるので、チェックポイントにおけるデータ処理手段の
レジスタ、プログラムカウンタ、スタックポインタの値
を知ることができる。
【図面の簡単な説明】
【図1】本発明の一実施例の全体概略ブロック図であ
る。
【図2】エラー発生後にエラーの解析及びリトライ処理
を行う全体動作フローチャートである。
【図3】通常のプログラム実行時のCPUの動作を示す
図である。
【図4】本発明の一実施例におけるコンピュータシステ
ムのアドレスの割付例を示す図である。
【図5】通常プログラム実行時のCPUの読み出し動作
を説明する図である。
【図6】通常プログラム実行時の主記憶装置への書き込
み時の書き込み前データのトレースメモリへの保持を説
明する図である。
【図7】通常プログラム実行時の主記憶装置へのデータ
の書き込みを説明する図である。
【図8】CPU1の機能ブロック図である。
【図9】図8に示した機能ブロックの詳細動作のフロー
チャートである。
【図10】データバス用トレースメモリの読み出し動作
を説明する図である。
【図11】アドレスバス用トレースメモリの読み出し動
作を説明する図である。
【図12】制御線用トレースメモリの読み出し動作を説
明する図である。
【図13】主記憶装置へのデータバス用トレースメモリ
から読み出したデータの書き込みを説明する図である。
【符号の説明】
1 CPU 2 主記憶装置 3 トレースメモリ 4 データバスエクスチェンジャー 5 システム制御部 6 データバス 7 アドレスバス 8 制御線 9 システム制御線 11 バストレース開始指令部 12 エラー発生検知部 13 エラー原因解析部 14 トレースメモリ読み出し部 15 チェックポイント判断部 16 トレース情報読み出し書き込み制御
部 17 レジスタ、プログラムカウンタ、ス
タックポインタ内容書き込み制御部 31 データバス用トレースメモリ 32 アドレスバス用トレースメモリ 33 制御線用トレースメモリ

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】レジスタ、プログラムカウンタ、スタック
    ポインタを少なくとも有するデータ処理手段と、主記憶
    手段と、各バスサイクルにおけるデータバス、アドレス
    バス、制御線のデータを格納するトレースメモリと、上
    記主記憶手段へのアクセス及びトレースメモリの制御を
    制御線を介して行うシステム制御部とを有するコンピュ
    ータシステムのリトライ処理装置において、 一定間隔毎に、上記レジスタ、プログラムカウンタ及び
    スタックポインタの内容を、チェックポイントとして、
    上記主記憶手段の所定アドレスに書き込むレジスタ内容
    書き込み手段と、 データ処理手段におけるデータ処理に誤りが発生したこ
    とを検知し、トレースメモリへのデータバス、アドレス
    バス及び制御線のデータの格納を停止し、上記誤りの発
    生原因を解析するエラー検知原因解析手段と、 上記原因解析手段により解析されたエラーの発生前のチ
    ェックポイントを判定するチェックポイント判定手段
    と、 主記憶手段に、上記トレースメモリに格納されたデータ
    を書き込み、チェックポイント判定手段により判定され
    たチェックポイントにおける内容に戻すとともに、上記
    レジスタ、プログラムカウンタ及びスタックポインタの
    内容を、上記チェックポイントにおける内容に戻し、デ
    ータ処理を再開させるトレース情報読み出し書き込み制
    御部と、 を備えることを特徴とするコンピュータシステムのリト
    ライ処理装置。
  2. 【請求項2】請求項1記載のコンピュータシステムのリ
    トライ処理装置において、上記主記憶手段とデータ処理
    手段との間に配置され、上記主記憶手段へのデータの流
    れの切換を行うデータバスエクスチェンジャーを、さら
    に備えることを特徴とするコンピュータシステムのリト
    ライ処理装置。
  3. 【請求項3】請求項1記載のコンピュータシステムのリ
    トライ処理装置において、トレース情報読み出し書き込
    み制御部は、上記データ処理手段がデータを上記主記憶
    手段に書き込む前に、上記主記憶手段の書き込みを行う
    アドレスに格納されたデータの読み出しを行い、読み出
    したデータを上記トレースメモリに格納することを特徴
    とするコンピュータシステムのリトライ処理装置。
  4. 【請求項4】請求項1記載のコンピュータシステムのリ
    トライ処理装置において、エラー検知原因解析手段は、
    データ処理に誤りが発生したときは、自己診断等による
    エラー原因の解析後、上記トレースメモリに保持された
    各バスサイクル毎の上記データバス、アドレスバス、制
    御線のデータを基にエラー原因の解析を行うことを特徴
    とするコンピュータシステムのリトライ処理装置。
  5. 【請求項5】レジスタ、プログラムカウンタ、スタック
    ポインタを少なくとも有するデータ処理手段と、主記憶
    手段と、各バスサイクルにおけるデータバス、アドレス
    バス、制御線のデータを格納するトレースメモリと、上
    記主記憶手段へのアクセス及びトレースメモリの制御を
    制御線を介して行うシステム制御部とを有するコンピュ
    ータシステムのリトライ処理方法において、 一定間隔毎に、上記レジスタ、プログラムカウンタ及び
    スタックポインタの内容を、チェックポイントとして、
    上記主記憶手段の所定アドレスに書き込むことと、 データ処理手段におけるデータ処理に誤りが発生したこ
    とを検知し、トレースメモリへのデータバス、アドレス
    バス及び制御線のデータの格納を停止し、上記誤りの発
    生原因を解析することと、 上記原因解析手段により解析されたエラーの発生前のチ
    ェックポイントを判定することと、 主記憶手段に、上記トレースメモリに格納されたデータ
    を書き込み、チェックポイント判定手段により判定され
    たチェックポイントにおける内容に戻すとともに、上記
    レジスタ、プログラムカウンタ及びスタックポインタの
    内容を、上記チェックポイントにおける内容に戻し、デ
    ータ処理を再開させることと、 を備えることを特徴とするコンピュータシステムのリト
    ライ処理方法。
JP23240095A 1995-09-11 1995-09-11 コンピュータシステムのリトライ処理装置 Expired - Fee Related JP3192354B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23240095A JP3192354B2 (ja) 1995-09-11 1995-09-11 コンピュータシステムのリトライ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23240095A JP3192354B2 (ja) 1995-09-11 1995-09-11 コンピュータシステムのリトライ処理装置

Publications (2)

Publication Number Publication Date
JPH0981405A JPH0981405A (ja) 1997-03-28
JP3192354B2 true JP3192354B2 (ja) 2001-07-23

Family

ID=16938656

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23240095A Expired - Fee Related JP3192354B2 (ja) 1995-09-11 1995-09-11 コンピュータシステムのリトライ処理装置

Country Status (1)

Country Link
JP (1) JP3192354B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6151390B1 (ja) * 2016-02-10 2017-06-21 レンドリース・ジャパン株式会社 通信装置用架台及び無線基地局

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4030216B2 (ja) * 1999-03-09 2008-01-09 インターナショナル・ビジネス・マシーンズ・コーポレーション マイクロプロセッサとマイクロプロセッサを含むシステム及びマイクロプロセッサのバスサイクル制御方法
US7493439B2 (en) * 2006-08-01 2009-02-17 International Business Machines Corporation Systems and methods for providing performance monitoring in a memory system
JP2009169515A (ja) * 2008-01-11 2009-07-30 Denso Corp コンピュータシステム及びシステム回復装置
JP2011018187A (ja) * 2009-07-09 2011-01-27 Fujitsu Ltd 試験方法、試験プログラム、試験装置、及び試験システム
JP6237230B2 (ja) * 2013-12-27 2017-11-29 富士通株式会社 メモリ管理プログラム、メモリ管理方法、及びメモリ管理装置
JP2019133484A (ja) * 2018-02-01 2019-08-08 Necプラットフォームズ株式会社 情報処理装置、情報処理方法、情報処理プログラム、制御装置及びシステム
JP6966092B2 (ja) * 2019-03-14 2021-11-10 Necプラットフォームズ株式会社 制御装置、制御システム、制御方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6151390B1 (ja) * 2016-02-10 2017-06-21 レンドリース・ジャパン株式会社 通信装置用架台及び無線基地局

Also Published As

Publication number Publication date
JPH0981405A (ja) 1997-03-28

Similar Documents

Publication Publication Date Title
US5437033A (en) System for recovery from a virtual machine monitor failure with a continuous guest dispatched to a nonguest mode
KR970017010A (ko) 데이터 저장 시스템 및 머신 수행 방법
JPH07117903B2 (ja) 障害回復方法
US6615364B1 (en) Computer system and methods for acquiring dump information and system recovery
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
JP3192354B2 (ja) コンピュータシステムのリトライ処理装置
JPH02196355A (ja) 記憶処理システム
JPH0789328B2 (ja) データ処理装置
JP2870202B2 (ja) プロセッサ間相互監視方法及びその装置
EP1208441A2 (en) Method and arrangement for memory management
KR0121442B1 (ko) 멀티프로세서 시스템에서 캐쉬부 오류검출 및 그 처리장치와 방법
JP2510663B2 (ja) エラ―制御方式
JPS588363A (ja) プログラム実行履歴情報収集方式
JPH0324640A (ja) 情報処理装置のデバッグ方式
CN117056113A (zh) Mcu设备程序崩溃点的定位方法
JPH0235547A (ja) スタテイツクramブロツク試験方式
CN116779015A (zh) 存储芯片的测试方法、装置、存储介质与电子设备
JPH04236644A (ja) キャッシュメモリ診断方式
JPH086864A (ja) メモリ制御用アドレスバス診断方式
JPS596411B2 (ja) チヤネルのデ−タ転送制御方式
JPS6130296B2 (ja)
JPH0341538A (ja) 主記憶装置
JPS6074052A (ja) ヒストリ・メモリ制御方式
JP2000353109A (ja) エミュレータ及びエミュレーションシステム
JPH0784727A (ja) ファイルシステム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees