JPH0421895B2 - - Google Patents

Info

Publication number
JPH0421895B2
JPH0421895B2 JP59228526A JP22852684A JPH0421895B2 JP H0421895 B2 JPH0421895 B2 JP H0421895B2 JP 59228526 A JP59228526 A JP 59228526A JP 22852684 A JP22852684 A JP 22852684A JP H0421895 B2 JPH0421895 B2 JP H0421895B2
Authority
JP
Japan
Prior art keywords
error
timer
trace information
timer value
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59228526A
Other languages
English (en)
Other versions
JPS61107444A (ja
Inventor
Junichi Kihara
Kenji Kikuchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP59228526A priority Critical patent/JPS61107444A/ja
Publication of JPS61107444A publication Critical patent/JPS61107444A/ja
Publication of JPH0421895B2 publication Critical patent/JPH0421895B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0745Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in an input/output transactions management context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Description

【発明の詳細な説明】 [発明の技術分野] この発明は、入出力プロセツサにおいてデータ
処理中にエラーが検出された場合のエラートレー
ス方式に関する。
[発明の技術的背景] 第2図に示すように、CPU11、主メモリ1
2、および入出力プロセツサ13,13…が
DMAバス14により相互接続されている計算機
システムでは、入出力プロセツサ13においてデ
ータ処理中にエラーが検出された場合のエラート
レースは、一般に次のように行なわれる。まず、
入出力プロセツサ13は、主メモリ12上のステ
ータス格納エリアにエラー情報(メモリ読出しエ
ラー/DMAバス転送パリテイエラー)を格納
し、CPU11に割込みをかける。これにより
CPU11は、入出力プロセツサ13からの割込
みを受けた時刻を示す時刻情報、および上記ステ
ータス格納エリア内のエラー情報からなるエラー
トレース情報を、主メモリ12上のトレースエリ
アに格納する。そして、CPU11は、主メモリ
12のトレースエリアに格納したトレース情報に
基づいて故障解析を行なう。
[背景技術の問題点] 上記した時刻情報は、一般に50msのシステム
タイマ15からのタイマ割込みをカウントするこ
とにより得られる。したがつてシステムタイマ1
5で指定可能な時刻は50msの整数倍となる。こ
のため、同じ50ms内に2台の入出力プロセツサ
13,13が故障した場合には、エラー発生時刻
は同じになる。このような場合、入出力プロセツ
サ13,13の故障箇所が互いに無関係であれば
問題はないが、例えばDMAバスインタフエース
素子の故障により2次障害を起こす場合には、い
ずれが1次要因であるか判断ができない欠点があ
つた。また、入出力プロセツサ13によるメモリ
ライト機能が正常でない場合には、エラートレー
ス情報の収集が不可能となる欠点もあつた。
[発明の目的] この発明は上記事情に鑑みてなされたものでそ
の目的は、システムタイマより精度の高い共通タ
イマをメモリ制御部に設け、上記共通タイマから
エラートレース情報の構成要素である時刻情報
(タイマ値)を得ることにより、エラー発生時刻
を精度よく知ることができ、もつて故障解析精度
の向上が図れるエラートレース方式を提供するこ
とにある。
この発明の他の目的は、共通タイマから時刻情
報(タイマ値)を得ることができない場合でも、
エラー発生時刻のトレースが行なえるエラートレ
ース方式を提供することにある。
この発明の更に他の目的は、主メモリへのエラ
ートレースが不可能な場合でも、エラー解析が可
能なエラートレース方式を提供することにある。
[発明の概要] この発明では、CPU、主メモリ、および入出
力プロセツサがDMAバスにより相互接続されて
いる計算機システムにおいて、上記主メモリのメ
モリ制御部に、システムタイマより周波数の高い
共通タイマが設けられる。この共通タイマの示す
タイマ値は、入出力プロセツサにおいてデータ処
理中にエラーが検出された場合に、DMAバス経
由で入出力プロセツサに読出され、同タイマ値と
エラー情報からなるエラートレース情報が生成さ
れる。このようにして生成されたエラートレース
情報は、DMAバス経由で主メモリにトレースさ
れる。
[発明の実施例] 第1図はこの発明の一実施例に係る計算機シス
テムを示す。同図において、20はCPU、30
は主メモリ、40は主メモリ30のメモリ制御部
である。メモリ制御部40において、41はシス
テム時刻(50msの整数倍)より精度の高い共通
タイマ、42は主メモリ30と後述するDMAバ
ス80との間のデータ授受に供されるデータレジ
スタである。共通タイマ41は、数10msの周期
で発振する発振器43と、発振器43からの出力
信号に同期してカウント動作を行なうカウンタ4
4とからなる。カウンタ44は、システム電源の
投入に応じて低レベルに遷移するパワーオン信号
45により、カウント可能状態となる。
50,50…は入出力プロセツサである。入出
力プロセツサ50は、同プロセツサ50の中心を
成すマイクロプロセツサ51、マイクロプロセツ
サ51に対するタイマ割込みを発生するタイマ5
2、内部メモリとしてのRAM53、および
DMAバス80とのデータ授受に供されるデータ
レジスタ54を含んでいる。RAM53には、タ
イマ52によつて決定されるタイマ値を格納する
タイマ値格納エリア55、およびエラートレース
情報を格納するトレースエリア56とが用意され
る。60はシステムの保守を司る保守プロセツ
サ、70はCPU20および入出力プロセツサ5
0,50…を保守プロセツサ60に接続するシリ
アルバス、80はDMAバスである。CPU20、
メモリ制御部40、入出力プロセツサ50,50
…、および保守プロセツサ60は、DMAバス8
0により相互接続される。
次に、この発明の一実施例の動作を説明する。
システム電源が投入されると、パワーオン信号4
5が低レベルに遷移する。これにより、メモリ制
御部40に設けられた共通タイマ41内のカウン
タ44はカウント可能状態となる。また、発振器
43が動作を開始する。しかして、発振器43か
らの出力信号がカウンタ44に供給されると、カ
ウンタ44は発振器43からの出力信号の例えば
低レベルから高レベルへの状態遷移に応じてカウ
ントアツプ動作を行なう。即ち、カウンタ44
は、システム電源が投入されると発振器43の発
振周期に同期してカウント動作を行なう。このカ
ウンタ44の内容、即ち、共通タイマ41のタイ
マ値は、システム起動後の時刻を示す。一方、入
出力プロセツサ50において、タイマ52からマ
イクロプロセツサ51に対してタイマ割込みが発
生する毎に、マイクロプロセツサ51はその割込
みを受付け、RAM53内のタイマ値格納エリア
55の内容(即ちタイマ値)を+1する。したが
つて、タイマ値格納エリア55には、常に最新の
タイマ値(時刻情報)が格納される。また、マイ
クロプロセツサ51は、一定時間(例えば30分)
毎に、メモリ制御部40にタイマ読出し指令を発
し、同制御部40内のカウンタ44の内容、即ち
共通タイマ41のタイマ値を、DMAバス80経
由でデータレジスタ54に読込む。そして、マイ
クロプロセツサ51は、データレジスタ54の内
容、即ち共通タイマ41からのタイマ値により、
RAM53内のタイマ値格納エリア55に格納さ
れているタイマ値を補正する。したがつて、タイ
マ値格納エリア55には、共通タイマ41の示す
タイマ値に略一致するタイマ値が常時格納され
る。
さて、入出力プロセツサ50がデータ処理中に
エラーを検出したものとする。この場合、入出力
プロセツサ50のマイクロプロセツサ51は、メ
モリ制御部40に対してタイマ読出し指令を発
し、共通タイマ41のタイマ値をDMAバス80
経由でデータレジスタ54に読込む。次に、マイ
クロプロセツサ51は、データレジスタ54内の
データ、即ち共通タイマ41からのタイマ値(エ
ラー発生時刻情報)と、エラー情報とからなるエ
ラートレース情報を、RAM53内のトレースエ
リア56に格納する。このようにしてトレースエ
リア56に格納されたエラートレース情報は、
CPU20からの指令により、DMAバス80、メ
モリ制御部40経由で主メモリ30に転送され、
そのトレースエリアに格納される。そしてCPU
20は、主メモリ30にトレースされたエラート
レース情報に基づいて、故障解析を行なう。上記
エラートレース情報中のタイマ値、即ちエラー発
生時刻を示す時刻情報は、システムタイマの周期
(50ms)より極めて短い周期(数10ms)の信号
をカウントすることにより生成されるため、シス
テム時刻より著しく精度が高い。したがつて、従
来の方式に比べて、詳細な時系列解析が行なえ
る。
次に、入出力プロセツサ50内のDMAバスイ
ンタフエース機能などに障害があり、入出力プロ
セツサ50内のエラートレース情報を主メモリ3
0に転送することが不可能な場合について説明す
る。この場合には、CPU20からの指令が実行
されないことになり、CPU20においてエラー
が発生する。この場合、CPU20は保守プロセ
ツサ60を起動する。これにより、保守プロセツ
サ60は入出力プロセツサ50に対してエラート
レース情報転送指令を発する。入出力プロセツサ
50内のマイクロプロセツサ51は、保守プロセ
ツサ60からの指令に応じ、(RAM53内の)
トレースエリア56に格納されているエラートレ
ース情報を、シリアルバス70経由で保守プロセ
ツサ60にシリアル転送する。即ち、この実施例
では、エラートレース情報を主メモリ30に転送
できない場合、同情報が保守プロセツサ60に転
送される。このため、主メモリ30にトレースで
きなくてもトレース情報が消滅することがなく、
故障解析が可能となる。なお、保守プロセツサ6
0の起動を、CPU20における上記したエラー
検出に伴うランプ表示などに従い、手動で行なう
ようにしてもよい。また、保守プロセツサ60
が、入出力プロセツサ50,50…およびCPU
20のエラートレース情報を、定期的に収集する
ように構成されていてもよい。
次に、共通タイマ41のタイマ値の読出しがで
きない場合の動作を説明する。入出力プロセツサ
50におけるエラー検出時に、共通タイマ41か
らのタイマ値の読出しができない場合、マイクロ
プロセツサ51はRAM53内のタイマ値格納エ
リア55に格納されている最新のタイマ値を、共
通タイマ41からのタイマ値に代えて使用する。
即ち、マイクロプロセツサ51は、タイマ値格納
エリア55からのタイマ値と、エラー情報とから
なるエラートレース情報を生成し、RAM53内
のトレースエリア56に格納する。以後の動作
は、前記した共通タイマ41からのタイマ値を用
いた場合と同様である。タイマ値格納エリア55
に格納されているタイマ値は、前記したように共
通タイマ41の示すタイマ値に略一致している。
したがつて、エラー検出時に共通タイマ41から
のタイマ値の読出しができない場合でも、精度の
高い故障解析が可能となる。
[発明の効果] 以上詳述したようにこの発明によれば、メモリ
制御部に設けられた共通タイマ41により、エラ
ー発生時刻を精度よく知ることができるので、故
障解析精度が向上する。また、この発明によれ
ば、共通タイマから時刻情報を得ることができな
い場合でも、エラー発生時刻のトレースが行なえ
る。更に、この発明によれば、主メモリへのエラ
ートレースが不可能な場合でも、エラートレース
情報が消滅しないので、故障解析が行なえる。
【図面の簡単な説明】
第1図はこの発明の一実施例に係る計算機シス
テムのブロツク構成図、第2図は従来例を示す図
である。 20……CPU、30……主メモリ、40……
メモリ制御部、41……共通タイマ、50……入
出力プロセツサ、51……マイクロプロセツサ、
52……タイマ、55……タイマ値格納エリア、
60……保守プロセツサ、70……シリアルバ
ス、80……DMAバス。

Claims (1)

  1. 【特許請求の範囲】 1 CPU、主メモリ、および入出力プロセツサ
    がDMAバスにより相互接続されている計算機シ
    ステムにおいて、上記主メモリのメモリ制御部に
    設けられ、システムタイマより周波数の高い共通
    タイマと、上記入出力プロセツサにおいてデータ
    処理中にエラーが検出された場合、上記メモリ制
    御部内の上記共通タイマの示すタイマ値を上記
    DMAバス経由で読出し、同タイマ値とエラー情
    報からなるエラートレース情報を生成するエラー
    トレース情報生成手段と、上記エラートレース情
    報生成手段により生成されたエラートレース情報
    を上記DMAバス経由で上記主メモリにトレース
    する手段とを具備することを特徴とするエラート
    レース方式。 2 CPU、主メモリ、および入出力プロセツサ
    がDMAバスにより相互接続されている計算機シ
    ステムにおいて、上記主メモリのメモリ制御部に
    設けられ、システムタイマより周波数の高い共通
    タイマと、上記入出力プロセツサにおいてデータ
    処理中にエラーが検出された場合、上記メモリ制
    御部内の上記共通タイマの示す第1タイマ値を上
    記DMAバス経由で読出して同第1タイマ値とエ
    ラー情報からなるエラートレース情報を生成し、
    同第1タイマ値の読出しが不可能であれば上記入
    出力プロセツサにより管理されている第2タイマ
    値とエラー情報からなるエラートレース情報を生
    成するエラートレース情報生成手段と、上記エラ
    ートレース情報生成手段により生成されたエラー
    トレース情報を上記DMAバス経由で上記主メモ
    リにトレースする手段とを具備することを特徴と
    するエラートレース方式。 3 上記入出力プロセツサは、上記第2タイマ値
    を、上記メモリ制御部内の上記共通タイマの示す
    第1タイマ値に応じて一定時間毎に補正すること
    を特徴とする特許請求の範囲第2項記載のエラー
    トレース方式。 4 CPU、主メモリ、保守プロセツサ、および
    入出力プロセツサがDMAバスにより相互接続さ
    れ、上記CPU、保守プロセツサ、および入出力
    プロセツサがシリアルバスにより相互接続されて
    いる計算機システムにおいて、上記主メモリのメ
    モリ制御部に設けられ、システムタイマより周波
    数の高い共通タイマと、上記入出力プロセツサに
    おいてデータ処理中にエラーが検出された場合、
    上記メモリ制御部内の上記共通タイマの示す第1
    タイマ値を上記DMAバス経由で読出して同第1
    タイマ値とエラー情報からなるエラートレース情
    報を生成し、同第1タイマ値の読出しが不可能で
    あれば上記入出力プロセツサにより管理されてい
    る第2タイマ値とエラー情報からなるエラートレ
    ース情報を生成するエラートレース情報生成手段
    と、上記エラートレース情報生成手段により生成
    されたエラートレース情報を上記DMAバス経由
    で上記主メモリにトレースする手段と、この手段
    による上記DMAバス経由でのトレースが不可能
    な場合、上記エラートレース情報生成手段により
    生成されたエラートレース情報を上記シリアルバ
    ス経由で上記保守プロセツサに転送する手段とを
    具備することを特徴とするエラートレース方式。
JP59228526A 1984-10-30 1984-10-30 エラ−トレ−ス方式 Granted JPS61107444A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59228526A JPS61107444A (ja) 1984-10-30 1984-10-30 エラ−トレ−ス方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59228526A JPS61107444A (ja) 1984-10-30 1984-10-30 エラ−トレ−ス方式

Publications (2)

Publication Number Publication Date
JPS61107444A JPS61107444A (ja) 1986-05-26
JPH0421895B2 true JPH0421895B2 (ja) 1992-04-14

Family

ID=16877793

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59228526A Granted JPS61107444A (ja) 1984-10-30 1984-10-30 エラ−トレ−ス方式

Country Status (1)

Country Link
JP (1) JPS61107444A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS632263U (ja) * 1986-06-17 1988-01-08

Also Published As

Publication number Publication date
JPS61107444A (ja) 1986-05-26

Similar Documents

Publication Publication Date Title
US5353436A (en) Method and apparatus for synchronizing a plurality of processors
US4703481A (en) Method and apparatus for fault recovery within a computing system
EP0186006B1 (en) Multiprocessor system
US5408645A (en) Circuit and method for detecting a failure in a microcomputer
EP0461792B1 (en) Master/slave checking system
US4979102A (en) Microprocessor operable under direct connection to coprocessor
US4803708A (en) Time-of-day coincidence system
JPH0421895B2 (ja)
EP0130432B1 (en) Apparatus for suspending a system clock when an initial error occurs
JP2845868B2 (ja) エラーマスタ検出装置
JPH06149762A (ja) 計算機システムの競合動作試験方式
JPS642972B2 (ja)
JPS6148740B2 (ja)
JP2979918B2 (ja) 割り込み検出回路
JP3094516B2 (ja) 情報処理装置の再試行方式
JPH07230432A (ja) 計算装置
JPS6043265A (ja) デ−タの読出し・書込み方式
JPH0313798Y2 (ja)
JP2698431B2 (ja) タイムアウト検出装置
JPS6061839A (ja) 論理装置の故障診断処理方式
JPS6136641B2 (ja)
JPS62118447A (ja) 入出力疑似障害の発生方式
JPH06231087A (ja) マルチcpuシステム
JPS6074052A (ja) ヒストリ・メモリ制御方式
JPH0460846A (ja) フォールト・トレラント・コンピュータ

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees