JPS6346860B2 - - Google Patents

Info

Publication number
JPS6346860B2
JPS6346860B2 JP57221150A JP22115082A JPS6346860B2 JP S6346860 B2 JPS6346860 B2 JP S6346860B2 JP 57221150 A JP57221150 A JP 57221150A JP 22115082 A JP22115082 A JP 22115082A JP S6346860 B2 JPS6346860 B2 JP S6346860B2
Authority
JP
Japan
Prior art keywords
error
replacement unit
package
occurrences
diagnostic program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP57221150A
Other languages
English (en)
Other versions
JPS59111552A (ja
Inventor
Takeshi Hayashida
Takeo Seki
Mitsuari Shirata
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Nippon Telegraph and Telephone Corp
Original Assignee
Fujitsu Ltd
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Nippon Telegraph and Telephone Corp filed Critical Fujitsu Ltd
Priority to JP57221150A priority Critical patent/JPS59111552A/ja
Publication of JPS59111552A publication Critical patent/JPS59111552A/ja
Publication of JPS6346860B2 publication Critical patent/JPS6346860B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Description

【発明の詳細な説明】 (1) 発明の技術分野 本発明は、情報処理システムにおける予防保守
用のエラーに関する統計情報の作成方式に係り、
特に取替単位毎のエラー発生回数の作成方式に関
する。
(2) 従来技術の問題点 最近情報処理システムはあらゆる分野で様々な
使われ方をしており、故障によりシステムがダウ
ンしたときの社会的影響もますます大きくなつて
いる。
そのため、システムの保守もシステムがダウン
とならないうち、すなわち故障が固定的になり顕
在化する前に、その故障の修復を行う予防保守へ
の要望が高まつている。
しかし、故障が固定的になつていないうちはテ
ストを行つても故障を検出する保証はなく、故障
位置の指摘も困難である。
したがつて、予防保守を行うためには、過去の
システム運転状況から故障を起しかけている箇所
あるいは故障が起りそうな箇所を推定しなければ
ならない。
このような、システムの運転状況、特にエラー
の発生状況を把握するためには、 いつ、どのようなエラーが発生したか あるエラーが何回発生したか ある取替単位を故障原因とするエラーが何回
発生したか 等のエラーに関する統計情報を必要とする。
上記〜の情報収集を行うため、従来は以下
のもののうちのいくつか、あるいは全てが設けら
れていた。
(1) エラー発生履歴テーブル(以下HTBLと記
す) (2) エラー種類毎のエラー発生回数テーブル(以
下ETBLと記す) (3) パツケージ毎のエラー発生回数テーブル(以
下PTBLと記す) HTBLは、エラー種別、エラー発生日時をエ
ラー発生順に記憶し、ETBLはエラー種類対応に
設けられたカウンターの集合でありエラー種類毎
に該エラーの発生回数を計数保持する。PTBLは
フイールド保守の取替単位であるパツケージ対応
に設けられたカウンターの集合であり該パツケー
ジに故障があると推定されるエラーの発生回数を
計数保持する。なお、パツケージ毎のエラー発生
回数を計数するときは、エラー種類毎にそのエラ
ーの発生原因と考えられるパツケージ群との対応
をあらかじめ調査して格納してあるエラー種類対
応の被疑パツケージテーブル(以下E−PTBLと
記す)を参照する。E−PTBLには、含まれるパ
ツケージ群に対して○イ各パツケージのエラー発生
割合は等しいとしているもの○ロ各パツケージのエ
ラー発生割合に応じて各パツケージに点数を与え
ているものの2通りがあるが、後者は割合の算出
が難しいため一般には前者が用いられている。と
ころが、E−PTBLに格納しておくパツケージ群
は、エラー種別情報をもとに作られるため、パツ
ケージ数が多くなり、実際のエラー原因となつて
いるパツケージ以外のものが含まれている。その
ため、パツケージ毎のエラー発生回数は統計情報
としての精度を落としているという欠点があつ
た。
(3) 発明の目的 本発明は、上記問題点に鑑みてなされたもので
あり、パツケージ毎のエラー発生回数の精度をよ
り高める方式を提供することを目的とする。
(4) 発明の構成 該目的は、エラー検出手段およびプログラムに
より制御されるサービスプロセツサ(以下SVP
と呼ぶ)を備え、該SVPに、 障害時のハードウエア状態を収集する手段 エラー発生履歴を保持する手段とエラー種類
毎のエラー発生回数を計数し保持する手段及び
エラー種類と該エラー種類に対する被疑取替単
位との対応関係を格納するテーブルとハードウ
エアでエラーを検出した時、前記テーブルを参
照して被疑取替単位毎のエラー発生回数を計数
して保持する手段 で収集したハードウエア状態情報を解析し
て故障位置を指摘する機能を具備した診断プロ
グラムを有する情報処理システムにおいて、前
記テーブルに格納されている任意のエラー種類
に対応する取替単位群と診断プログラムが指摘
する取替単位群とを比較する手段と、前記取替
単位毎のエラー発生回数から診断プログラムに
よつて指摘されなかつた取替単位に対するエラ
ー発生回数を減ずるようにして取替単位毎のエ
ラー発生回数を補正する手段を設けたことを特
徴とする予防保守用情報の作成方式により達成
される。
(5) 発明の実施例 本発明は、診断プログラムがE−PTBL作成時
より詳細な情報を用いて、E−PTBLに格納され
ているパツケージ群をさらに局所化して出力する
ことに着目し、診断プログラムの出力とE−
PTBLの出力を比較し、一致しないパツケージの
エラー回数を減算させ、実際のエラー原因となつ
ていないパツケージに対するエラー発生回数の計
数を行つてないと同様な効果をもたせるようにし
たものである。
以下図面を用いて本発明を詳細に説明する。
図は本発明の一実施例を示す機能ブロツク図で
ある。
図において、1はLTBL(エラー発生時のハー
ドウエア状態情報を保持する記憶領域で1回のエ
ラーに対する記憶領域分を1世代と呼びj+1回
分のエラーに対するハードウエア状態情報の保持
が可能である。)、2はハードウエア状態情報のう
ちエラー表示ラツチ群のみを集めたものであり、
2−0〜2−nはエラー表示ラツチEp〜Eo(以下
エラーEp〜Eoと記す。)の状態を保持している、
3はETBL、3−0〜3−nはエラーEp〜Eoの発
生回数を計数するカウンタ、4はHTBLの記憶
領域、5はタイマー(日付と時刻を計数する。)、
6はE−PTBL、6−0〜6−nはエラーEp〜Eo
に対する被疑パツケージを保持するレジスタで、
ここでは説明の便宜上パツケージPp〜Pi分のビツ
ト数をもつとし、各エラー毎に、被疑パツケージ
に相当するビツトに1が格納されている(例え
ば、エラーEpに対する被疑パツケージがPpとPi
あればレジスタ6−0の内容は0…011となる)、
7はPTBL、7−0〜7−iはパツケージPp〜Pi
が被疑パツケージとなつた回数を計数するカウン
タである。8はLTBL1の情報をもとに故障位置
を指摘する診断プログラム、9は比較器(E−
PTBL6に含まれる被疑パツケージと診断プログ
ラム8で指摘したパツケージを比較し、一致しな
いパツケージを出力する。)、10は制御部、11
はコンソール、12はハードウエア状態である。
上記構成において、障害情報および統計情報の
作成は以下のように行う。
′ ハードウエアがエラーを検出すると、エラ
ー検出時点のハードウエア状態情報をLTBL1
の使用されていない最若番世代(但し、LTBL
が全て使用されていれば最も古く使用された世
代)に収集する。このとき、エラー表示ラツチ
群の状態はまとめて、エラー表示ラツチ群領域
2に収集する。また、タイマー5が示す日時も
収集する。
ここで、今仮にエラーEpが発生していたとする
と、 ′ ETBL3内のエラーEpに対応するカウンタ
3−0を+1する。
′ E−PTBL6内のエラーEpに対応するレジ
スタ6−0を読出し、ビツトPpとPiがオンであ
つたとすれば、PTBL7内のパツケージPpとPl
に対応するカウンタ7−0と7−1を+1す
る。
′ HTBL4のアドレスレジスタ(図示はして
いない)が示すHTBL4内の領域に、エラー
Epおよびエラー発生日時を格納する。格納後、
アドレスレジスタは次アドレスを示す。
以下、エラー検出毎に′のハードウエア状態
情報の収集および′〜′をエラー種別に応じて
行い、LTBL1にはハードウエア状態情報を累積
し、ETBL3には各エラーのエラー発生回数を保
持させ、PTBL7には各パツケージのエラー発生
回数を保持させ、HTBL4にはエラー発生順に
エラー種別とエラー発生日時を記憶させる。
上記のごとく収集・累積された情報はコンソー
ル11から、その指示を行えば、制御部10によ
り読出され、コンソール11に (A) いつどのようなエラーが発生したか (B) あるエラーが何回発生したか (C) あるパツケージにエラーが何回発生したか などのエラー発生状況が編集出力される。これに
より、保守員はエラーに関す統計情報を得ること
ができる。
また、より詳細な故障位置を知りたいとき、保
守員は診断プログラム8を起動する。
診断プログラム8は、LTBL1の該当エラーが
含まれる世代のハードウエア状態情報をもとに、
該エラーを解析し、E−PTBL6に含まれている
被疑パツケージをさらに局所化して指摘する。制
御部10は、診断プログラム8が指摘した被疑パ
ツケージを、コンソール11に出力するととも
に、比較器9にも入力し、さらに、E−PTBL6
の該エラーに対応するレジスタを読出して比較器
9に入力する。
比較器9は診断プログラム8が指摘したパツケ
ージとE−PTBL6の該エラーに対応するレジス
タが示すパツケージを比較し、一致しないパツケ
ージを出力する。制御部10はPTBL7内の一致
しないパツケージに対応するカウンタを−1す
る。例えば、診断プログラム8がエラーEpを対象
としたとし、E−PTBL6内のエラーEpに対応す
るレジスタ6−0の内容が前例と同じくPpとPl
あつたとし、診断プログラム8の指摘がPlであつ
たとすれば、PTBL7内のPpに対応するカウンタ
7−0を−1する。
なお、パツケージ毎のエラー発生回数として、
E−PTBLを使用せずに、エラーが発生したとき
すぐに診断プログラム8を走行し、その出力を使
用すればようようにみえるが、以下の理由によ
り、そのことは望ましくない。
エラーの中には、システムの運転続行が可能な
もの、すなわち、システムを停めなくてもよいも
のがある(例えば、間欠エラーや代替機能がある
箇所のエラー等)。
しかし、この場合でも、予防保守を考慮するな
らエラー発生時のハードウエア状態情報を収集
し、エラーに関する統計情報を作成しておく必要
がある。
この場合、上記情報の収集、作成は、システム
性能を低下させないようにするため、システムの
停止時間を最小限にするような方法で行わなけれ
ばならない。
ところが、診断プログラムはハードウエア状態
の解析を主にしているが、試験をしないと故障位
置を局所化できないエラーおよびハードコア部の
確認等のために、試験も行つており、少くとも、
分の単位の処理時間が必要である。
したがつて、短時間でパツケージ毎のエラー発
生回数をとるためには、エラー発生時にすぐ診断
プログラムを走行させるよりも、E−PTBLを使
用した方が得策である。
(6) 発明の効果 以上説明したように、本発明によれば、エラー
種別情報のみから求められている被疑パツケージ
情報をもとにエラー回数を計数している(実際の
エラー原因となつていないパツケージもエラーと
して計数している)パツケージ毎のエラー発生回
数から、診断プログラムが指摘しないパツケージ
については、その回数を差し引くことにより、実
際のエラー原因となつていないパツケージに対し
てエラー発生回数の計数を行つてないと同様にす
る補正を行つているため、パツケージ毎のエラー
発生回数の精度が向上する効果がある。
【図面の簡単な説明】
図は本発明の一実施例を示す機能ブロツク図で
ある。 記号の説明、1はLTBL(エラー時のハードウ
エア状態情報を保持する記憶領域で1回のエラー
に対する記憶領域分を1世代と呼びj+1回分の
エラーに対するハードウエア状態情報の保持が可
能である。)、2はハードウエア状態情報のうちエ
ラー表示ラツチ群のみを集めたものであり、2−
0〜2−nはエラー表示ラツチEp〜Eo(以下エラ
ーEp〜Eoと記す。)の状態を保持している、3は
ETBL、3−0〜3−nはエラーEp〜Eoの発生回
数を計数するカウンタ、4はHTBLの記憶領域、
5はタイマー(日付と時刻を計数する。)、6はE
−PTBL、7はPTBL、8はLTBL1、9は比較
器、10は制御部、11はコンソール、12はハ
ードウエア状態。

Claims (1)

  1. 【特許請求の範囲】 1 エラー検出手段およびプログラムにより制御
    されるサービスプロセツサ(以下SVPと呼ぶ)
    を備え、該SVPに、 障害時のハードウエア状態を収集する手段、 エラー発生履歴を保持する手段と、エラー種類
    毎のエラー発生回数を計数し保持する手段及びエ
    ラー種類と該エラー種類に対する被疑取替単位と
    の対応関係を格納するテーブルとハードウエアで
    エラーを検出した時、前記テーブルを参照して被
    疑取替単位毎のエラー発生回数を計数して保持す
    る手段 前記収集したハードウエア状態情報を解析して
    故障位置を指摘する機能を具備した診断プログラ
    ムを有する情報処理システムにおいて、前記テー
    ブルに格納されている任意のエラー種類に対応す
    る取替単位群と診断プログラムが指摘する取替単
    位群とを比較する手段と、前記取替単位毎のエラ
    ー発生回数から診断プログラムによつて指摘され
    なかつた取替単位に対するエラー発生回数を減ず
    るようにして取替単位毎のエラー発生回数を補正
    する手段を設けたことを特徴とする予防保守用情
    報の作成方式。
JP57221150A 1982-12-17 1982-12-17 予防保守用情報の作成方式 Granted JPS59111552A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57221150A JPS59111552A (ja) 1982-12-17 1982-12-17 予防保守用情報の作成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57221150A JPS59111552A (ja) 1982-12-17 1982-12-17 予防保守用情報の作成方式

Publications (2)

Publication Number Publication Date
JPS59111552A JPS59111552A (ja) 1984-06-27
JPS6346860B2 true JPS6346860B2 (ja) 1988-09-19

Family

ID=16762247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57221150A Granted JPS59111552A (ja) 1982-12-17 1982-12-17 予防保守用情報の作成方式

Country Status (1)

Country Link
JP (1) JPS59111552A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06163964A (ja) * 1992-07-21 1994-06-10 Osaka Shosen Mitsui Senpaku Kk 飛行船用太陽電池装着機構

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62274394A (ja) * 1986-05-22 1987-11-28 オムロン株式会社 自動取引処理装置
JPH02156345A (ja) * 1988-12-08 1990-06-15 Nec Corp データ処理装置
JPH02245838A (ja) * 1989-03-17 1990-10-01 Fujitsu Ltd パッケージ使用履歴管理方式
US5245615A (en) * 1991-06-06 1993-09-14 International Business Machines Corporation Diagnostic system and interface for a personal computer
JP4792981B2 (ja) * 2006-01-12 2011-10-12 富士ゼロックス株式会社 異常診断装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06163964A (ja) * 1992-07-21 1994-06-10 Osaka Shosen Mitsui Senpaku Kk 飛行船用太陽電池装着機構

Also Published As

Publication number Publication date
JPS59111552A (ja) 1984-06-27

Similar Documents

Publication Publication Date Title
US6012148A (en) Programmable error detect/mask utilizing bus history stack
JP2020027615A (ja) サーバハードウェア障害の分析及びリカバリ
US7877636B2 (en) System and method for detecting temporal relationships uniquely associated with an underlying root cause
JPH02105947A (ja) コンピユータ周辺サブシステム及びその例外事象自動検出分析方法
US20110154097A1 (en) Field replaceable unit failure determination
US7350106B2 (en) Device for aiding the locating of failure of a complex system
JP2009075817A (ja) ログ解析方法、ログ格納装置及びプログラム
JPS6346860B2 (ja)
Tendolkar et al. Automated diagnostic methodology for the IBM 3081 processor complex
JPH05260049A (ja) ネットワークシステムにおける故障管理方法
US6009246A (en) Method and system for evaluating intrusive repair for plurality of devices
JPH04149749A (ja) ログデータ採取方式
JPH02221874A (ja) 電力用変電機器の故障診断システム
JP2005293345A (ja) Icタグを用いた故障診断システムおよび故障診断方法
Shepperd et al. Design metrics and software maintainability: an experimental investigation
CN117149490A (zh) 一种服务器内存故障预警方法、装置、设备及存储介质
JPH025148A (ja) 論理装置の診断方式
Hecht et al. Verification and validation guidelines for high integrity systems
Khoumsi et al. A multi-decision approach for decentralized diagnosis of the presence and absence of faults in discrete event systems
Sieniawski et al. An open platform of data quality monitoring for ERP information systems
Heising et al. A method for quantifying the reliability of instrumentation for engineered safety features to improve accident sequence recognition in reactor control rooms
KR20170032608A (ko) 엔터프라이즈 비즈니스 서비스 레벨의 통합 모니터링 방법 및 시스템
EP0473806A1 (en) Apparatus and method for error detection and fault isolation
JP3467848B2 (ja) ネットワーク監視システム
CN114356728A (zh) 一种数据处理方法及装置