JPH0916442A - Cpu保守システム - Google Patents

Cpu保守システム

Info

Publication number
JPH0916442A
JPH0916442A JP7183236A JP18323695A JPH0916442A JP H0916442 A JPH0916442 A JP H0916442A JP 7183236 A JP7183236 A JP 7183236A JP 18323695 A JP18323695 A JP 18323695A JP H0916442 A JPH0916442 A JP H0916442A
Authority
JP
Japan
Prior art keywords
cpu
counter
service processor
counting
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7183236A
Other languages
English (en)
Other versions
JP2713250B2 (ja
Inventor
Yoshihiro Nakajima
義博 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7183236A priority Critical patent/JP2713250B2/ja
Publication of JPH0916442A publication Critical patent/JPH0916442A/ja
Application granted granted Critical
Publication of JP2713250B2 publication Critical patent/JP2713250B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 CPUの稼働時間を直接測定して、正確な平
均故障時間や平均システムダウン時間を算出できるよう
にする。 【構成】 本発明は、CPUa及びその保守操作を行
うサービスプロセッサbを有しており、上記CPUaに
は、その稼働状態の変化をサービスプロセッサbに通知
する通知手段1を設けている。また、サービスプロセッ
サbには、CPUaが稼働している時間を累積してカウ
ントするカウンタ5と、上記稼働状態の変化の通知によ
り、カウンタ5のカウント開始及び停止を行わせるカウ
ンタ制御手段4とを設けている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、CPU及びその保守操
作を行うサービスプロセッサとを有するCPU保守シス
テムに関し、特に稼働時間やCPUに発生した障害情報
等を測定,記録するCPU保守システムに関するもので
ある。
【0002】
【従来の技術】コンピュータシステムに使用するCPU
(Central Processing Unit )の信頼度を計る尺度とし
て、次の時間を知ることが有効である。
【0003】 CPUが故障してから次の故障が発生
するまでの無故障で動作している時間の平均である平均
故障間隔(Mean Time Between Failures)。 システムがダウンしてから次のシステムダウンが発
生するまでのノーダウンの時間の平均である平均システ
ムダウン間隔(Mean Time Between System Down)。
【0004】ところで従来のシステムでは、CPUの稼
働状態/非稼働状態を直接測定,監視する方法がなかっ
たため、CPUに併設されているサービスプロセッサに
よって、当該サービスプロセッサ自身の稼働時間を測定
し、この測定時間がCPUの稼働時間と一致すると仮定
して、前記平均故障間隔や平均システムダウン間隔を算
出していた。
【0005】
【発明が解決しようとする課題】しかしながら、サービ
スプロセッサの稼働状態/非稼働状態とCPUの稼働状
態/非稼働状態とは必ずしも一致しないため、CPUの
実際の平均故障間隔や平均システムダウン間隔を正確に
知ることができないという欠点があった。
【0006】そこで本発明は、CPUの稼働時間を直接
測定して、正確な平均故障間隔や平均システムダウン間
隔を算出できるCPU保守システムの提供を目的とす
る。
【0007】
【課題を解決するための手段】本発明は、CPUa及び
その保守操作を行うサービスプロセッサbを有してお
り、上記CPUaには、その稼働状態の変化をサービス
プロセッサbに通知する通知手段1を設けている。
【0008】また、サービスプロセッサbには、CPU
aが稼働している時間を累積してカウントするカウンタ
5と、上記稼働状態の変化の通知により、カウンタ5の
カウント開始及び停止を行わせるカウンタ制御手段4と
を設けている。
【0009】上記稼働状態の変化は、CPUaが稼働を
開始したとき及び稼働を停止したときであり、カウンタ
制御手段4は、稼働を開始したことを示す通知を受けた
ときにカウンタ5のカウントを開始させ、稼働を停止し
たことを示す通知を受けたときにカウンタ5のカウント
を停止させている。
【0010】また、サービスプロセッサbには、ログ記
録部7と、CPUaに障害が発生した際、その障害情報
を読み出すとともにカウンタ5のカウントを停止させ、
かつ、上記障害情報とともに、上記停止させたカウンタ
5のカウント値をログ記録部7に記録する障害処理手段
6とを設けている。
【0011】
【作用】本発明の作用は次の通りである。CPUが起動
されると、該CPUからサービスプロセッサに、そのC
PUの稼働状態の変化が通知される。この通知によっ
て、カウンタ制御手段は、CPUが稼働している時間の
カウント開始及び停止を行う。
【0012】また、カウンタ制御手段に、稼働状態の変
化として稼働を開始したことを示す通知があれば、カウ
ンタのカウントが開始される。また、カウンタ制御手段
に、稼働状態の変化として稼働を停止したことを示す通
知があればカウンタのカウントが停止される。
【0013】CPUに障害が発生すると、その障害情報
が障害処理手段によってCPUから読み出されるととも
に、カウンタのカウントが停止される。そして、これら
障害情報とカウンタのカウント値がログ記録部に記録さ
れる。
【0014】
【実施例】本発明の実施例について図面を参照して説明
する。図1は本発明の一実施例としてのCPU保守シス
テムの構成を示すブロック図、図2,3はその動作状態
を示す動作図である。
【0015】本システムは、CPUaと、このCPUa
と所要の複数のインターフェースを介して接続されたサ
ービスプロセッサ(SVP)bとを有してており、この
サービスプロセッサbが、CPUaに対してシステム操
作や保守操作等を行うようになっている。
【0016】CPUa内には、当該CPUaの稼働状態
の変化をサービスプロセッサbに通知する通知手段1が
設けられている。この通知手段1は、当該CPUaに順
次実行させる命令を格納する命令レジスタ2と、この命
令レジスタ2から出力された命令をデコードするデコー
ダ3とからなる。
【0017】サービスプロセッサbには、制御回路4、
カウンタ5、障害処理部6及びログ記録部7とが設けら
れている。
【0018】上記命令レジスタ2からの命令には、サー
ビスプロセッサb内のカウンタ5によるカウントを開始
又は停止させるための専用命令が準備されている。
【0019】カウントを開始させる開始命令は、CPU
aを起動させるソフトウェア処理の中で発行される。そ
して、上記デコーダ3から出力された開始命令に対応す
る開始信号は、インターフェースを介してサービスプロ
セッサb内の制御回路4に入力されるようになってい
る。
【0020】すなわち、この開始信号がサービスプロセ
ッサbに出力されることで、CPUaが稼働停止状態か
ら稼働状態に遷移したこと、すなわち、CPUaが稼働
を開始したことを通知したことになる。
【0021】また、カウントを停止させる停止命令は、
CPUaの稼働を停止させるソフトウェア処理の中で発
行される。そして、上記デコーダ3から出力された停止
命令に対応する停止信号は、インターフェースを介して
制御回路4に入力されるようになっている。
【0022】すなわち、この停止信号がサービスプロセ
ッサbに出力されることで、CPUaが稼働状態から稼
働停止状態に遷移したこと、すなわち、CPUaの稼働
が停止したことを通知したことになる。
【0023】サービスプロセッサb内の制御回路4は、
前記稼働状態の変化の通知により、カウンタ5のカウン
ト開始及び停止を行わせるカウント制御手段としての機
能を有するものである。具体的には、上記CPUaから
開始信号が入力されると、カウンタ5に対してカウント
開始信号を出力し、該CPUaから停止信号が入力され
ると、カウンタ5に対してカウント停止信号を出力す
る。
【0024】カウンタ5は、CPUaが稼働している時
間をたとえば1時間単位毎に累積してカウントするよう
になっており、上記制御回路4から出力されたカウント
開始信号によってカウントを開始し、カウント停止信号
によってカウントを停止するようになっている。
【0025】障害処理部6は、CPUaに障害が発生し
た際、その障害情報を読み出すとともにカウンタ5のカ
ウントを停止させ、その障害情報と停止させたときのカ
ウント値をログ記録部7に記憶する障害処理手段として
の機能を有している。
【0026】ログ記録部7には、ログファイル8が格納
されている。このログファイル8は、主にCPUaに異
常が発生したときの情報を履歴として残すために用いら
れるもので、これには上記CPUaに発生した全障害情
報と、カウント値とが関連付けされて記録されるように
なっている。従って、このログファイル8の記録情報を
解析することにより、CPUaの障害箇所等を特定でき
る。
【0027】上述した構成からなる本システムの動作に
ついて、稼働状態の変化がサービスプロセッサbに通知
された場合(図2)と、CPUaに障害が発生した場合
(図3)に分けて説明する。
【0028】<CPUaの稼働状態に変化があった場合
>CPUaを起動させるソウトウェアが実行されると、
この処理の間に該CPUaの命令レジスタ2に、CPU
aが稼働を開始したことを示す開始命令が格納される。
【0029】この開始命令はデコーダ3によってデコー
ドされた後、インターフェースを介してサービスプロセ
ッサbに開始信号として出力される。この開始信号の入
力によって、制御回路4はカウンタ5にCPUaの稼働
状態の累積時間のカウントを開始させる。
【0030】CPUaを停止させるソウトウェアが実行
されると、この処理の間に該CPUaの命令レジスタ2
に、CPUaが稼働を停止したことを示す停止命令が格
納される。
【0031】この停止命令はデコーダ3によってデコー
ドされた後、インターフェースを介してサービスプロセ
ッサbに開始信号として出力される。この停止信号の入
力によって、制御回路4はカウンタ5によるカウントを
停止させる。
【0032】<CPUaに障害が発生した場合>CPU
aに障害が発生すると、インターフェースを介してCP
Uaの障害情報がサービスプロセッサb内の障害処理機
能部6へ通知される。
【0033】障害処理機能部6は、CPU障害処理とし
て上記CPUaから障害情報を読み出すとともに、カウ
ンタ5による稼働状態の累積時間のカウントを停止させ
る。そして、上記障害情報とカウンタのカウント値がロ
グ記録部7内のログファイル8に記録される。
【0034】なお、本発明は前述した実施例に限るもの
ではなく、その要旨の範囲内で様々に変形実施が可能で
ある。
【0035】
【発明の効果】請求項1〜3記載の発明によれば、CP
Uの稼働時間を直接測定することができるので、正確な
平均故障間隔や平均システムダウン間隔を算出できる。
【0036】請求項3記載の発明によれば、障害情報と
ともに障害が発生するまでのCPUの稼働の累積時間を
記録できるので、障害が発生するまでの稼働時間を知る
ことが可能となり、これによっても正確な平均故障間隔
と平均システムダウン間隔を知ることができる。さら
に、障害情報をログ記録部に記録しておけるので、その
障害情報から障害箇所を特定することもできる。
【図面の簡単な説明】
【図1】本発明のCPU保守システムの構成を示すブロ
ック図である。
【図2】その動作を示すもので、CPUからサービスプ
ロセッサに動作状態の変化の通知があったときの動作図
である。
【図3】その動作を示すもので、CPUに障害が発生し
た場合の動作図である。
【符号の説明】
1 通知手段 4 カウンタ制御手段
(制御回路) 5 カウンタ 6 障害処理手段(障害
処理機能部) 7 ログ記録部 a CPU b サービスプロセッサ

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 CPU及びその保守操作を行うサービス
    プロセッサを有するCPU保守システムにおいて、上記
    CPUに、その稼働状態の変化を上記サービスプロセッ
    サに通知する通知手段を設けるとともに、サービスプロ
    セッサに、CPUが稼働している時間を累積してカウン
    トするカウンタと、前記稼働状態の変化の通知により、
    カウンタのカウント開始及び停止を行わせるカウンタ制
    御手段とを設けたことを特徴とするCPU保守システ
    ム。
  2. 【請求項2】 稼働状態の変化は、CPUが稼働を開始
    したとき及び稼働を停止したときであり、カウンタ制御
    手段は、稼働を開始したことを示す通知を受けたときに
    カウンタのカウントを開始させ、稼働を停止したことを
    示す通知を受けたときにカウンタのカウントを停止させ
    る請求項1記載のCPU保守システム。
  3. 【請求項3】 ログ記録部と、CPUに障害が発生した
    際、その障害情報を読み出すとともにカウンタのカウン
    トを停止させ、かつ、該障害情報とともに上記停止させ
    たカウンタのカウント値をログ記録部に記録する障害処
    理手段とをサービスプロセッサに設けた請求項1記載の
    CPU保守システム。
JP7183236A 1995-06-28 1995-06-28 Cpu保守システム Expired - Lifetime JP2713250B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7183236A JP2713250B2 (ja) 1995-06-28 1995-06-28 Cpu保守システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7183236A JP2713250B2 (ja) 1995-06-28 1995-06-28 Cpu保守システム

Publications (2)

Publication Number Publication Date
JPH0916442A true JPH0916442A (ja) 1997-01-17
JP2713250B2 JP2713250B2 (ja) 1998-02-16

Family

ID=16132164

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7183236A Expired - Lifetime JP2713250B2 (ja) 1995-06-28 1995-06-28 Cpu保守システム

Country Status (1)

Country Link
JP (1) JP2713250B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009265711A (ja) * 2008-04-22 2009-11-12 Hitachi High-Technologies Corp 制御システム
JP2011013953A (ja) * 2009-07-02 2011-01-20 Nec Corp 情報処理装置及びそのプロセッサ管理方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5627745U (ja) * 1979-07-31 1981-03-14
JPS57109061A (en) * 1980-12-26 1982-07-07 Mitsubishi Electric Corp Forecasting method for equipment deterioration of computer system
JPS63253957A (ja) * 1987-04-11 1988-10-20 Ricoh Co Ltd データロギングシステム用画像形成装置
JPS63280346A (ja) * 1987-05-13 1988-11-17 Fujitsu Ltd ログ情報における計時情報付加方式
JPS63313261A (ja) * 1987-06-17 1988-12-21 Canon Inc 情報検索装置
JPS6414645A (en) * 1987-07-08 1989-01-18 Nippon Denki Field Service Automatic collecting system for reliability data
JPH027136A (ja) * 1988-06-27 1990-01-11 Toshiba Corp 稼働状況管理装置
JPH02231651A (ja) * 1989-03-06 1990-09-13 Toshiba Corp 計算機システムのメンテナンス装置
JPH02245835A (ja) * 1989-03-17 1990-10-01 Fujitsu Ltd パッケージ実稼動時間算出方式
JPH04105136A (ja) * 1990-08-24 1992-04-07 Murata Mach Ltd 電子機器
JPH05225210A (ja) * 1992-02-07 1993-09-03 Casio Comput Co Ltd データ処理装置
JPH06214835A (ja) * 1993-01-13 1994-08-05 Nec Corp 故障予防方式
JP3017838U (ja) * 1994-07-14 1995-11-07 株式会社ソウル保温 魔法瓶用栓

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5627745U (ja) * 1979-07-31 1981-03-14
JPS57109061A (en) * 1980-12-26 1982-07-07 Mitsubishi Electric Corp Forecasting method for equipment deterioration of computer system
JPS63253957A (ja) * 1987-04-11 1988-10-20 Ricoh Co Ltd データロギングシステム用画像形成装置
JPS63280346A (ja) * 1987-05-13 1988-11-17 Fujitsu Ltd ログ情報における計時情報付加方式
JPS63313261A (ja) * 1987-06-17 1988-12-21 Canon Inc 情報検索装置
JPS6414645A (en) * 1987-07-08 1989-01-18 Nippon Denki Field Service Automatic collecting system for reliability data
JPH027136A (ja) * 1988-06-27 1990-01-11 Toshiba Corp 稼働状況管理装置
JPH02231651A (ja) * 1989-03-06 1990-09-13 Toshiba Corp 計算機システムのメンテナンス装置
JPH02245835A (ja) * 1989-03-17 1990-10-01 Fujitsu Ltd パッケージ実稼動時間算出方式
JPH04105136A (ja) * 1990-08-24 1992-04-07 Murata Mach Ltd 電子機器
JPH05225210A (ja) * 1992-02-07 1993-09-03 Casio Comput Co Ltd データ処理装置
JPH06214835A (ja) * 1993-01-13 1994-08-05 Nec Corp 故障予防方式
JP3017838U (ja) * 1994-07-14 1995-11-07 株式会社ソウル保温 魔法瓶用栓

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009265711A (ja) * 2008-04-22 2009-11-12 Hitachi High-Technologies Corp 制御システム
JP2011013953A (ja) * 2009-07-02 2011-01-20 Nec Corp 情報処理装置及びそのプロセッサ管理方法

Also Published As

Publication number Publication date
JP2713250B2 (ja) 1998-02-16

Similar Documents

Publication Publication Date Title
CN109783262B (zh) 故障数据处理方法、装置、服务器及计算机可读存储介质
JPH0850557A (ja) マイクロプロセッサ故障記録装置
US4593391A (en) Machine check processing system
JP2003248600A (ja) ソフトウェアクラッシュ事象の分析方法とシステム
JP2713250B2 (ja) Cpu保守システム
JP3353745B2 (ja) 処理能力測定装置および処理能力測定方法
JP3060039B2 (ja) ディスク装置のオンライン診断における自動スケジュール方法
JPH0535542A (ja) 障害周辺装置検出方式
JPS61220048A (ja) チヤネルの障害処理方式
JPH10171546A (ja) 起動監視装置
KR100201940B1 (ko) 전전자 교환시스템에서 보조기억장치의 에러 검출방법
JPS6026588A (ja) エレベ−タのデ−タ収録装置
JPH06175939A (ja) 情報処理システム
JPH04213123A (ja) 電子計算機の故障予防保全方式
JP2004185318A (ja) Cpuシステムの障害監視装置
JPH09179835A (ja) 並列プロセッサシステム
JPS5918741B2 (ja) 自動診断方式
JPH076103A (ja) 入出力チャネルの障害処理システム
JPH11134261A (ja) 入出力制御装置
JP2001256081A (ja) 情報処理装置
JPH04352041A (ja) 情報処理システムのログ情報収集装置および方法
JP2005170661A (ja) 昇降機監視センター装置
JPH0434626A (ja) エラーロギング方法
JP2005250711A (ja) ストール監視システム、データ処理装置及びそれらに用いるストール監視方法
JPH05127951A (ja) 障害処理方式