JPS62198944A - 装置異常検出方式 - Google Patents

装置異常検出方式

Info

Publication number
JPS62198944A
JPS62198944A JP61042259A JP4225986A JPS62198944A JP S62198944 A JPS62198944 A JP S62198944A JP 61042259 A JP61042259 A JP 61042259A JP 4225986 A JP4225986 A JP 4225986A JP S62198944 A JPS62198944 A JP S62198944A
Authority
JP
Japan
Prior art keywords
input
abnormality
error
output
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61042259A
Other languages
English (en)
Inventor
Shohei Suzuki
祥平 鈴木
Tetsuo Kaneko
哲夫 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61042259A priority Critical patent/JPS62198944A/ja
Publication of JPS62198944A publication Critical patent/JPS62198944A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [弁明の目的] (産業上の利用分野) この発明は、CPUからの指示に応じて入出力処理を行
なう各種装置を備えた情報処理装置に係り、特に、上記
装置の異常を早期に検出する装置異常検出方式に関する
(従来の技術) 従来、この種の情報処理装置では、ディスク装置等の入
出力装置の異常を早期に検出する手段、即ち装置が完全
な故障状態に陥る前に装置異常を検出する手段として、
以下に述べる方式が適用されていた。即ちCPtJは、
入出力装置に対する入出力コマンドが同装置の故障等で
異常終了となると、ソフトウェアに従って予め指定され
た回数のりトライを行なう。そして、このリトライでも
異常の場合に限り、c p u t、を装置異常として
プログラム実行を中断するが、初期の故障の場合や偶発
的な故障の場合にはりトライで正常終了することが多い
。従来は、このようなりトライによる効果で表面的には
装置異常とならない時期に、間欠的であっても異常終了
となった回数を記録しておき、この回数が一定値以上と
なった時点でオペレータ等に装置異常を通知していた。
しかし、上記した従来の方式では、アクセス頻度の少な
い装置の場合には、たとえあ欠故障が発生しても(もと
もとアクセスVAr!1が少ないことから)異常終了の
回数があまり増加せず、したがって装置異常の通知が遅
れてしまうことがあった。
このため、入出力装置が例えばディスク装置の場合に、
ファイル割付けが変わってアクセス頻度が増加すると、
急に異常終了回数(エラー回数)が増加して手遅れとな
る恐れがあった。
(発明が解決しようとする問題点) したがって、この発明の目的は、アクセス頻度が少ない
装置の場合には装置異常の徴候を検出することが困難で
あるという上記した従来の問題を解決し、アクセス頻度
に影響されずに装置異常が効率的に検出できる装置異常
検出方式を提供することにある。
[発明の構成〕 (問題点を解決するための手段と作用)この発明では、
CPUからの指示に応じて入出力処理を行なう各種装置
を備えた情報処理装置内に、CPLIから上記装置に対
してなされた入出力指示の指示回数を装置毎に記憶する
第1記憶手段と、装置の障害発生回数を装置毎に記憶す
る第2記憶手段と、装置異常検出のための基準端を少な
くとも装置種類別に記憶する第3記憶手段と、異常検出
を行なう異常検出手段とを設けている。
この異常検出手段は、上記装置の障害発生時に、同装置
に関する上記第1および第2記憶手段の記憶内容(入出
力指示の指示回数および障害発生回数)を用いて装置異
常検出用の所定の関数の関数値を求め、この関数値、即
ち障害発生回数だけでなく入出力指示の指示回数の要素
が含まれた値と第3記憶手段に記憶された該当装置に関
する基準値とを比較してその比較結果により装置の異常
判定を行なう。このため、単に障害発生回数だけで異常
判定する従来方式に比べて、入出力指示回数(アクセス
頻度)に彰菅されずに異常判定が行なえる。
(実施例) 第1図(a)はこの発明の一実施例に係る情報処理装置
のブロック構成を示す。同図において、11は装置の中
心を成すCPU、12は各種データ、プログラム、テー
ブル類等が格納される主記憶装置(MM)rある。13
−1.13−2ハCP U 11カラ(7)入出力コマ
ンドに応じて入出力動作(入出力制御)を行なう入出力
制御装置(IOC#1゜10C# 2 > 、14−1
.14−2は入出力制御装置13−1(IOC#1)に
より制御される入出カv装置、例えばli気ディスクH
i)ff(DISK#1.DISK# 2 ) t’ア
ル。c p u il、主記ta装jQ 12オJ: 
ヒ入出力制御I装置13−1.13−2は、システムバ
ス15により相互接続されている。
20は入出力制御装置13−1.13−2および磁気デ
ィスク装ff14−1.14−2W、cPUllがらの
入出力コマンドにより入出力動作を行なう装置の障害状
況を監視するのに供される監視テーブルである。監視テ
ーブル20は、主記憶装置12の所定領域に置かれる。
なお、第1図(a)には入出力制tt11装置13−2
により制御される入出力装置は省略されている。
第1図(1))は第1(a)の監視テーブル20のエン
トリ構造を示す。監視テーブル20の各エントリは、監
視対栗装置frJ(ここでは入出力制御装置13−1.
13−2、磁気ディスク装置14−1.14−2等、C
PU11からの入出力コマンドにより入出力動作を行な
う装置毎)に用意されており、同装置への入出力コマン
ド発行回数(これを10回数と呼、S;〉が設定される
10回数フィールド21と、同装置のエラー(障害)発
生回数が設定されるエラー回教フィールド22と、同装
置が異常であることを判定するための基準値(エラー判
定基準1a )が設定される判定基#=値フィールド2
3から成る。
次に、この発明の一実施例の動作を、磁気ディスク装置
14−1 (D I SK# 1 )の障害監視を例に
とって、第2図のフローチャートを参照して説明する。
今、CPU11が磁気ディスク装置14−1の入出力を
指示する入出力コマンドを入出力制御装置13−1に発
行したものとする。この場合、CPU11は、主記憶装
置12に置かれている監視テーブル20に用意された、
磁気ディスク装置14−1 (および入出力制御08置
13−1)に関するエントリの10回数フィールド21
の設定内容を+1する。さて、入出力制御装置13−1
はCP U 11からの入出力コマンドを受取ると、同
コマンドに応じて磁気ディスク装置14−1と主記憶装
置12との間の入出力制御を行なう。
そして、入出力制御08置13−1はこの入出力制御を
終了すると、主記ij!装置12に対するステータス書
込みを行なった後CPLIIIに対し割込みによる終了
通知を行なう。
CPU11は、入出力制御装置13−1からの終了通知
を受取ると、間装3113−1により主記憶装置12に
1込まれたステータスを調べ、磁気ディスク装置14−
1 (D I SK# 1 )の入出力終了状態が正常
か異常であるかを判断し、正常であれば入出力処理を終
了する。これに対して異常であれば、即ち磁気ディスク
装置14−1でエラーが発生していれば、CPU11は
第2図のフローチャートに示す処理を行なう。
まずCP U 11は、監視テーブル20に用意されて
いる、エラー発生装置(ここでは磁気ディスク装置f1
4−1)に関するエントリのエラー回数フィールド22
の設定内容を+1する(ステップSl )。次にCP 
Ll 11は、エラー発生装置(磁気ディスク装置14
−1 )に関する監視テーブル20内エントリのフィー
ルド21.22の設定1直に従って、所定の関数、例え
ば(エラー発生装置(DISK#1)のエラー発生回数
)/(エラー発生装置(DISK#1)への10回数)
のIf!(これを関数値と呼ぶ)を算出し、この値がエ
ラー発生装置(磁気ディスク装置1114−1)に関す
る監視テーブル20内エントリの判定!!準]aフィー
ルド23の設定内容、即ち磁気ディスク装置14−1(
D ISK#1 )に関するエラー判定基準値より大き
いか否かを判定する(ステップS2>。
ステップS2の判定結果がYESの場合、即ち上記関数
値がエラー発生装置(F11気ディスク装置14−1 
)のエラー判定基準値より大きい場合には、CP U 
11は障害通知ルーチンを実行して(ステップ$3)、
該当装置(磁気ディスク装置14−1 )の異常をオペ
レータ或はマシン管理者に通知し、しかる後リトライル
ーチンを実行する(ステップS4)。このように、この
実施例では、装置の異常終了を検出すると、その装置の
10回数に対するエラー発生回数の比により装置異常判
定するようにしているため、10回数(アクセス頻度)
が少ない場合でも障害の徴候を公平に評価できる。
なお、上記の装置異常通知は、オペレータコンソールへ
のメツセージ、或はマシンの稼働実行レポート中の警告
メツセージ等で行なうことができる。
一方、ステップS2の判定結果がNo場合、即ち上記関
数値がエラー発生装置(Ia気ディスク装置14−1>
のエラー判定基準値以下の場合には、CPU11はステ
ップS4のり1〜ライルーチンを直接実行する。このり
トライルーチンにおいては、CP U 11は再度磁気
ディスク装置14−1(DISK#1)に対する同一の
入出力コマンドを発行するが、このり1−ライに」、る
1o発行回数は10回数フィールド21の設定値には反
映させない。このリトライは、所定回数を上限として、
成功するまで繰返される。
以上は磁気ディスク装置14−1でエラーが発生した場
合について説明したが、入出力制御11 HM 13−
1により主記憶装置12に書込まれたステータスにおい
て間装@ 13−1のエラーが示されていれば、入出力
制御装置13−1について上記した磁気ディスク装[1
4−1の場合と同様の処理が行なわれる。
なお、前記実施例では、エラー判定基準圃フィールドを
装置単位に用意するものとして説明したが、監視対象装
置が多い場合には、装置種類別に用意するだけでもよい
。また、前記実施例では、装置の異常判定を10回数に
対するエラー発生回数の比に基づいて行なうものとして
説明したが、アクセス頻度に対する重み付けを行なう場
合には、他の評価関数を用いることも可能である。
[発明の効果] 以上詳述したようにこの発明によれば、アクセス頻度が
少ない装置の場合でも装置異常のm候をアクセス頻度に
影響されずに効率的に検出できるので、装置の予防保守
の効梁が著しく高まる。
【図面の簡単な説明】
第1図(a)はこの発明を適用する情報処理装置の一実
施例を示すブロック構成図、第1図(b)は第1図(a
)に示す監視テーブル20のエントリ構造を示す図、第
2図は動作を説明するためのフローチャートである。 11・・・CPU、12・・・主記憶装置(MM ) 
、 13−1゜13−2・・・入出力制御I装置(I 
OC# 1 。 10C# 2 ) 、14−1.14−2・・・磁気デ
ィスク装置([)ISK#1.DISK#2>、20・
・・監視テーブル、21・・・10回数フイールド、2
2・・・エラー回数フィールド、23・・・判定基準1
+1フイールド。 出願人代理人 弁理士 鈴江武彦 第1図

Claims (1)

    【特許請求の範囲】
  1. CPUからの指示に応じて入出力処理を行なう各種装置
    を備えた情報処理装置において、上記CPUから上記装
    置に対してなされた入出力指示の指示回数を上記装置毎
    に記憶する第1記憶手段と、上記装置の障害発生回数を
    上記装置毎に記憶する第2記憶手段と、装置異常検出の
    ための基準値を少なくとも上記装置の種類別に記憶する
    第3記憶手段と、上記装置の障害発生時に、同装置に関
    する上記第1および第2記憶手段の内容を用いて装置異
    常検出用の所定の関数の関数値を求め、この関数値と上
    記第3記憶手段に記憶された上記基準値とを比較してそ
    の比較結果により装置の異常検出を行なう異常検出手段
    とを具備することを特徴とする装置異常検出方式。
JP61042259A 1986-02-27 1986-02-27 装置異常検出方式 Pending JPS62198944A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61042259A JPS62198944A (ja) 1986-02-27 1986-02-27 装置異常検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61042259A JPS62198944A (ja) 1986-02-27 1986-02-27 装置異常検出方式

Publications (1)

Publication Number Publication Date
JPS62198944A true JPS62198944A (ja) 1987-09-02

Family

ID=12631034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61042259A Pending JPS62198944A (ja) 1986-02-27 1986-02-27 装置異常検出方式

Country Status (1)

Country Link
JP (1) JPS62198944A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01271828A (ja) * 1988-04-22 1989-10-30 Nec Corp 磁気ディスク装置の予防保守方式
JP2014225133A (ja) * 2013-05-16 2014-12-04 富士通株式会社 情報処理装置、制御装置及び制御プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01271828A (ja) * 1988-04-22 1989-10-30 Nec Corp 磁気ディスク装置の予防保守方式
JP2014225133A (ja) * 2013-05-16 2014-12-04 富士通株式会社 情報処理装置、制御装置及び制御プログラム

Similar Documents

Publication Publication Date Title
US5652833A (en) Method and apparatus for performing change-over control to processor groups by using rate of failed processors in a parallel computer
CA2365427A1 (en) Internal product fault monitoring apparatus and method
JPS62198944A (ja) 装置異常検出方式
JPS6146543A (ja) 転送装置の障害処理方式
JPH0683650A (ja) システム資源の監視方法
JPS6155748A (ja) 電子計算機システム
JPH0619744A (ja) マルチプロセッサシステムの動作監視方式
JP2699291B2 (ja) 電源異常処理装置
JPH0764811A (ja) コンピュータバックアップシステム
JP2746184B2 (ja) 障害ロギングシステム
JPH04102930A (ja) 中央処理装置
JPH04213123A (ja) 電子計算機の故障予防保全方式
JPH02310755A (ja) ヘルスチェック方式
CN117743008A (zh) 多核处理器故障诊断与异常处理方法、主控板卡及设备
JP2830592B2 (ja) 情報処理システムにおける外部記憶装置の経路障害処理方式
JPH03192431A (ja) 割込み処理方式
JPH06250865A (ja) ウインドウシステムの障害時対応方法
JPH0287794A (ja) 電子交換システムの保守用プロセッサ
JPH01183701A (ja) プラント監視装置
JPH0683667A (ja) 情報処理装置の診断方式
JPH02196341A (ja) 情報処理装置の障害復旧方式
JPH01261742A (ja) システム管理装置のエラー処理方法
JPH03156646A (ja) 障害情報の出力方式
JPH03127233A (ja) 計算機システムのパトロール診断装置
JPH0477935A (ja) 故障検出回路