JPH06139110A - 障害時における部品手配判別方式 - Google Patents

障害時における部品手配判別方式

Info

Publication number
JPH06139110A
JPH06139110A JP4286199A JP28619992A JPH06139110A JP H06139110 A JPH06139110 A JP H06139110A JP 4286199 A JP4286199 A JP 4286199A JP 28619992 A JP28619992 A JP 28619992A JP H06139110 A JPH06139110 A JP H06139110A
Authority
JP
Japan
Prior art keywords
flag
parts
maintenance
fault
influence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4286199A
Other languages
English (en)
Inventor
Masayuki Oya
昌之 大屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4286199A priority Critical patent/JPH06139110A/ja
Publication of JPH06139110A publication Critical patent/JPH06139110A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【目的】 障害時における部品手配判別方式に関し、障
害のシステムへの影響度、活性保守の有無等により、部
品の自動手配パターンを即時手配、ゆっくり手配、自動
手配不要の3つにわけることである。 【構成】 コンピュータUに障害が発生したとき、これ
を保守センタMCに通知するコンピュータシステムにお
いて、保守センタMCに、フラグコードと、影響度と、
活性保守有無の各項目を有するフラグ部品テーブル1
と、障害の発生した部品の手配を即時に行うべきか否か
を識別する演算部2を設け、保守センタMCに障害の発
生を示すフラグコードが送出されたとき、このフラグコ
ードにもとづき前記フラグ部品テーブル1をアクセスし
てこれに対応する影響度と活性保守有無のデータを求
め、これらの各データにもとづき演算部2がこのフラグ
コードに示された部品の手配対応パターンを求め、この
手配対応パターンをCEに通知する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は障害時における部品手配
判別方式に関し、特に障害発生時において、この障害が
システムに与える影響度や、活性保守の有無等にもとづ
き、障害の発生した部品の手配速度を例えば高速手配、
スロー手配、手配せず等に分類するものである。
【0002】
【従来の技術】従来、コンピュータシステムにハードウ
ェア障害が発生したとき、SVP(サービスプロセッ
サ)がコンピュータシステムのログ情報をチェックし
て、故障の発生した部品名(例えばCPU、MSU、M
CU等)と、エラーの内容(例えばパリティエラー)等
をフラグコードでSVPに表示し、更に通信回線を経由
して、コンピュータシステムの設置場所とは遠隔の場所
にある保守センタにこのフラグコードを送出し、エラー
通知を行う。
【0003】即ち、図4に示す如く、ユーザUにハード
ウェア障害が発生したとき、SVPがそのログ情報を解
析してフラグコードを保守センタMCに送出する。この
フラグコードには、故障の発生した部品名と、エラーの
内容と、この障害の結果がシステムダウンの場所にの
み、システムダウンSDが記入されている。
【0004】保守センタMCでは、このフラグコードを
みて障害の発生した部品を部品手配センタPCに手配し
て、CE(カストマー・エンジニア)が障害の発生した
ユーザUに行き障害を修理回復していた。
【0005】
【発明が解決しようとする課題】この場合、従来では、
システムの影響度及び活性保守の有無に関係なく、部品
手配センタPCに部品が自動手配されていたので、例え
ば障害のケースによっては部品の取り替えを不要とした
り、現場で部品の取替えを検討してからでも間に合う場
合でも、保守部品の手配を行うため、保守部品の在庫量
が増大してコスト面を阻害する原因となっていた。従っ
て本発明の目的は、このような欠点を改善した部品手配
判別方式を提供することである。
【0006】
【課題を解決するための手段】前記目的を達成するた
め、本発明では、保守センタMCに、─フラグ部品テー
ブル1と演算部2を設ける。フラグ部品テーブル1に
は、フラグコード対応に、部品名の外に、影響度と活性
保守の有無が記入されている。
【0007】フラグコードには部品名やエラー内容の外
に、マシンチェック割込コード(MCIC)が記入され
ている。ここでマシンチェック割込コードはSD(シス
テムダメージ)、PD(プロセスダメージ)、SR(シ
ステムリカバリ)、DG(縮退)がある。
【0008】影響度とはその障害がシステムに与える影
響をA、B、Cで示すものであって、SDをA、PDと
DGをB、SRをCで示している。また活性保守の有無
とは、部品を取替えるときにシステムを動作状態に保ち
ながら実行できることを活性保守有(D)とし、システ
ムを停止しないと取替えできない場合を活性保守無
(E)とする。
【0009】演算部2は、障害が発生したとき、フラグ
部品テーブル1から出力された前記A、B、C、及び前
記D、Eにもとづき、A・E、A・D+B・E+B
・D、Cの演算を行い、の場合は即時手配(FAS
T)、の場合はゆっくり手配(SLOW、例えば3時
間以内)、の場合は部品の自動手配不要とする。
【0010】
【作用】これにより、例えばCPUにSD(A)の障害
が発生しても、活性保守有(D)の場合には、のゆっ
くり手配となる。即ち活性保守有の場合は、CPUは少
なくとも2台用意され、一方が停止しても他方で動作可
能の場合であるからである。しかし活性保守無(E)で
CPUにSD(A)の障害が発生すればのケースとな
り部品(この場合はCPUボード)の即時手配を行うこ
とになる。このようにしてフラグコードにより得られた
出力を演算して、このフラグコードに示された部品の手
配状態を定めることができるので、保守部品を不必要に
増加することが改善される。
【0011】
【実施例】本発明の一実施例を図2及び図3にもとづき
説明する。図2は本発明の一実施例構成図であり、図3
は本発明におけるフラグ部品テーブルの説明図である。
【0012】図2において1はフラグ部品テーブル、2
は演算部、3はフラグ受信部、4はテーブル読出部、5
は部品名保持部、6は影響度保持部、7は活性保守保持
部、8は表示部、9はテーブル作成部である。
【0013】フラグ部品テーブル1はフラグコード対応
に部品名、影響度、活性保守有無が記入されているもの
であり、図3に示す如く構成されている。フラグコード
は、複数のXでしめされるエラーコード部分と、YYで
示されるマシンチェック割込コード(MCIC)部分を
有する。
【0014】エラーコード部分は、例えば初めのXで装
置名(CPU、MCU、MSU、CHP、SVP等)
を、次のXでこの装置内のファンクショナルユニット
(例えばCPUの場合には、命令ユニットI、ストレー
ジ・ユニットS、演算ユニットE等)を、次のXでメモ
リエラー、ロジカルエラー等を示している。
【0015】またMCIC部分は、前記の如く、SD、
PD、SR、DGが記入されている。SDは、例えば全
OSが動作停止しているシステム・ダメージ状態を示
し、PDは実行プログラムが動作途中で停止するような
プロセス・ダメージ状態を示し、SRは障害が発生した
もののシステム内でリカバリできたシステム・リカバリ
状態を示す。そしてDGは、2つあるTLBの1つに障
害が発生したとか、キャッシュの特定のウエイに障害が
発生したような機能の一部分における縮退状態を示す。
【0016】影響度は、障害がもたらすコンピュータ・
システムへの影響度を示すものであって、もっとも大き
い場合をA、もっとも小さい場合をC、その中間をBで
示す。具体的にはSDがA、SRがCでPDと、DGが
Bで示される。
【0017】活性保守有無は、システムを停止すること
なく点検修理が可能な場合を有(D)とし、停止しなけ
ればならない場合を無(E)とする。そしてこの活性保
守有無は、ユーザによるシステム構成により異なり、例
えばCPUが2台並列運転可能なシステムでは、1台の
CPUを停止して点検しても他のCPUで動作できるの
で、活性保守有となる。またMCU(メモリ制御装置)
が1台しかないシステムでは、これを停止すればシステ
ム全体が停止するので、活性保守無となる。実際のフラ
グ部品テーブルは1部品名について、図3の場合よりも
行数が多いが、図3では説明簡略化のため、MCIC部
分が前記SD、PD、SR、DGの4つのケースを示す
ため、同一部品名で4行構成の例を示している。そして
このフラグ部品テーブル1は、図2に示す如く、ユーザ
a、b・・・n対応に構成されている。なおこのフラグ
部品テーブルの行数を少なくして小型化するため、アク
セスするときフラグコードの上位桁の部品名と、下位桁
のYYでアクセスするように構成することができる。
【0018】演算部2は、障害の発生した部品を手配す
るパターンを、例えばFAST(即時手配)、SL
OW(ゆっくり手配)NON(部品の自動手配不要)
の3種類に分類するための演算を行うものである。そし
てこのためフラグコードにもとづきフラグ部品テーブル
1から出力したA、B、C、D、Eにもとづき下記の
〜の演算を行い、該当のものを出力する。
【0019】 FAST=A・E SLOW=A・D+B・E+B・D NON=C A・Eは、システム・ダメージ状態で活性保守無の場合
であり、この場合は例えばCPUは1つしかないシステ
ムのため、CPUに対する部品手配が直ちに必要とな
る。またA・Dの場合、同じシステムダウンでも、活性
保守有つまりCPUがもう1台存在して並列運転可能な
場合であるので、ゆっくり手配でよい。システムリカバ
リの場合は、システム内で回復可能なため、部品手配を
行う必要はない。従っての場合はFASTが、の場
合はSLOWがの場合はNONが演算部2より出力さ
れる。
【0020】フラグ受信部3は、ユーザのSVPから送
出されるフラグコードを受信し、これをテーブル読出部
4に送出するものである。テーブル読出部4は、このフ
ラグコードを解読して、そのユーザID(識別子)に対
応したフラグ部品テーブルの1つをフラグコードにもと
づきアクセスし、例えば部品名、影響度、活性保守有無
を出力させるものである。
【0021】部品名保持部5はフラグ部品テーブル1か
ら出力された部品名を一時保持するものであり、影響度
保持部6は同じく出力された影響度(A、B、Cの1
つ)を一時保持するものであり、活性保守保持部7はこ
れまた同じく出力された活性保守有無(D、Eの1つ)
を一時保持するものである。
【0022】表示部8は、演算部2における演算結果が
得られた自動部品手配パターンFAST、SLOW、N
ONの1つをその部品名とともに表示して、部品の自動
手配状態を示すものである。このとき、フラグ受信部3
から得られたフラグコードより部品名を得てもよく、ま
たエラーの詳細情報(エラー原因、発生場所等)を表示
してもよい。
【0023】テーブル作成部9は、フラグ部品テーブル
1をユーザa、b・・・n別に作成するものであり、フ
ラグコード、部品名、影響度、活性保守有無等のデータ
が入力され、図3に示す如きフラグ部品テーブルを作成
するものである。活性保守有無のデータは、システムの
構成により異なるので、例えばCPUが1つの場合、2
つの場合等ユーザにより異なるので、このようなことが
必要である。
【0024】次に本発明の動作について説明する。 (1)ユーザから、ハードエラー障害を示すフラグコー
ドがユーザより遠隔の地にある保守センタのフラグ受信
部3に入力されると、フラグ受信部3がこれを検知して
テーブル読出部4に送出する。テーブル読出部4は、そ
のユーザIDよりアクセス先のフラグ部品テーブル1を
選択して、これをフラグコードにもとづきアクセスす
る。
【0025】(2)これにもとづき、フラグ部品テーブ
ル1より、部品名、影響度、活性保守有無等が出力さ
れ、それぞれ部品名保持部5、影響度保持部6、活性保
守保持部7に一時保持される。
【0026】(3)そして演算部2において、影響度保
持部6、活性保守保持部7に保持されたA、B、Cの1
つ及びD、Eの1つにもとづき、前記、、のいず
れに相当するか判別する演算が行われ、この結果得られ
た自動部品手配パターンの1つを表示部8に送出する (4)表示部8ではこの自動部品手配パターンをその部
品名とともに表示し、CEに通知する。勿論このとき、
フラグコードより得られたエラーの詳細情報を表示する
こともできる。
【0027】
【発明の効果】本発明によれば、保守センタにその障害
の発生した部品とその障害の程度に応じ、システムの構
築状態にもとづき、部品の自動手配パターンを最適の状
態で表示するので、不要な部品の在庫量の増大を抑制す
ることができる。従って従来におけるシステムへの影響
度、活性保守の有無に関係なく部品を自動手配した場合
に比較して、保守部品の適正在庫をはかりコスト面をは
るかに軽減することができる。
【図面の簡単な説明】
【図1】本発明の原理構成図である。
【図2】本発明の一実施例構成図である。
【図3】本発明におけるフラグ部品テーブル説明図であ
る。
【図4】従来例である。
【符号の説明】
1 フラグ部品テーブル 2 演算部 3 フラグ受信部 4 テーブル読出部 5 部品名保持部 6 影響度保持部 7 活性保守保持部 8 表示部 9 テーブル作成部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 コンピュータ(U)に障害が発生したと
    き、これを保守センタ(MC)に通知するコンピュータ
    システムにおいて、 保守センタ(MC)に、 フラグコードと、影響度と、活性保守有無の各項目を有
    するフラグ部品テーブル(1)と、 障害の発生した部品の手配を即時に行うべきか否かを識
    別する演算を行う演算部(2)を設け、 保守センタ(MC)に障害の発生を示すフラグコードが
    送出されたとき、このフラグコードにもとづき前記フラ
    グ部品テーブル(1)をアクセスしてこれに対応する影
    響度と活性保守有無のデータを求め、これらの各データ
    にもとづき演算部(2)がこのフラグコードに示された
    部品の手配対応パターンを求め、この手配対応パターン
    をCEに通知することを特徴とする障害時における部品
    手配判別方式。
  2. 【請求項2】 前記影響度を、システムダメージ(S
    D)、プロセスダメージ(PD)、システムリカバリ
    (SR)及び縮退(DG)にもとづき定めることを特徴
    とする請求項1記載の障害時における部品手配判別方
    式。
  3. 【請求項3】 前記フラグ部品テーブル(1)に部品名
    項目を設け、前記活性保守有無を部品名単位に割当てた
    ことを特徴とする請求項1記載の障害時における部品手
    配判別方式。
  4. 【請求項4】 前記手配対応パターンを、ファースト、
    スロー、手配せずの3種類としたことを特徴とする請求
    項1記載の障害時における部品手配判別方式。
JP4286199A 1992-10-23 1992-10-23 障害時における部品手配判別方式 Withdrawn JPH06139110A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4286199A JPH06139110A (ja) 1992-10-23 1992-10-23 障害時における部品手配判別方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4286199A JPH06139110A (ja) 1992-10-23 1992-10-23 障害時における部品手配判別方式

Publications (1)

Publication Number Publication Date
JPH06139110A true JPH06139110A (ja) 1994-05-20

Family

ID=17701249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4286199A Withdrawn JPH06139110A (ja) 1992-10-23 1992-10-23 障害時における部品手配判別方式

Country Status (1)

Country Link
JP (1) JPH06139110A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10180882B2 (en) 2014-05-16 2019-01-15 Nec Corporation Information-processing device, processing method, and recording medium in which program is recorded
JP2019168928A (ja) * 2018-03-23 2019-10-03 株式会社富士通エフサス 緊急性判定装置、緊急性判定方法および緊急性判定プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10180882B2 (en) 2014-05-16 2019-01-15 Nec Corporation Information-processing device, processing method, and recording medium in which program is recorded
JP2019168928A (ja) * 2018-03-23 2019-10-03 株式会社富士通エフサス 緊急性判定装置、緊急性判定方法および緊急性判定プログラム

Similar Documents

Publication Publication Date Title
US7917811B2 (en) Virtual computer system
US7139940B2 (en) Method and apparatus for reporting global errors on heterogeneous partitioned systems
US7552236B2 (en) Routing interrupts in a multi-node system
CN100373345C (zh) 从同步冗余设备选择状态数据的方法和系统
US20110154097A1 (en) Field replaceable unit failure determination
US20110246835A1 (en) Management server and management system
JPH02297228A (ja) 障害情報格納方式
KR20080061258A (ko) 정보 처리 장치, 장해 처리 방법, 및 장해 처리 프로그램을기록한 컴퓨터 판독 가능한 기록 매체
CN112187933A (zh) 一种多架构云平台中服务的监控方法和系统
JP3720919B2 (ja) コンピュータ・システムのシャットダウンを効率的に管理する方法及び装置
CN105933176A (zh) 一种检测主机状态的方法及装置
JP2017045079A (ja) クラウド管理方法及びクラウド管理システム
JPH06139110A (ja) 障害時における部品手配判別方式
CN102216903B (zh) 响应于并行维护的硬件恢复
US6622257B1 (en) Computer network with swappable components
US20060195849A1 (en) Method for synchronizing events, particularly for processors of fault-tolerant systems
JP6833152B2 (ja) 故障支援装置、故障支援プログラム及び故障支援方法
JP5696492B2 (ja) 故障検出装置、故障検出方法、及び、故障検出プログラム
JP3479842B2 (ja) 計算機システムのクロック切替方式および方法
US20180204127A1 (en) Management of building energy systems through quantification of reliability
EP0423933A2 (en) Personal computer memory bank parity error indicator
JP2004213178A (ja) 計算機システム
CN115686896A (zh) 扩展内存错误处理方法、系统、电子设备及存储介质
CN117827509A (zh) 一种数据库异常检测处理方法、装置、设备及介质
JPS59189455A (ja) 障害デ−タの表示方式

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000104