JPH10320079A - コンピュータ・システムにおける環境障害を検出するための装置および方法 - Google Patents

コンピュータ・システムにおける環境障害を検出するための装置および方法

Info

Publication number
JPH10320079A
JPH10320079A JP10091397A JP9139798A JPH10320079A JP H10320079 A JPH10320079 A JP H10320079A JP 10091397 A JP10091397 A JP 10091397A JP 9139798 A JP9139798 A JP 9139798A JP H10320079 A JPH10320079 A JP H10320079A
Authority
JP
Japan
Prior art keywords
sensor
environmental
memory
type
fault condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10091397A
Other languages
English (en)
Other versions
JP3509055B2 (ja
Inventor
Allen Hamilton Ii Rick
リック・アレン・ハミルトン・セカンド
Steven Paul Hartman
スティーブン・ポール・ハートマン
Kitamoon Aronkoon
アロンコーン・キタモーン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH10320079A publication Critical patent/JPH10320079A/ja
Application granted granted Critical
Publication of JP3509055B2 publication Critical patent/JP3509055B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/004Error avoidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/006Identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Power Sources (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【課題】改善された環境および電源警告システムを提供
する。 【解決手段】本発明の一つの態様は、コンピュータ・シ
ステムにおける環境障害を検出するための装置に関す
る。本発明の一つの態様において、装置は、コンピュー
タ・システムに結合された、センサ・タイプおよび識別
コードに対するセンサによって物理的パラメータを計測
するための手段と、計測値に応答する信号をセンサから
コンピュータ・システムに伝送するための手段と、信号
を所定のしきい値と比較することによって環境障害状態
が存在するかどうかを判断するための手段と、エラー・
タイプ、識別コードおよびセンサ・タイプを決定するた
めの手段と、センサ・タイプ、識別コードおよびエラー
・タイプを含む障害データを環境警告レジスタに書き込
むための手段とを含む。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は一般にコンピュータ
・システムの分野に関し、より詳細には、コンピュータ
・システムの動作に対して悪影響を及ぼすおそれのある
環境および電源の問題を検出するための技術に関する。
さらに具体的には、本発明は、環境および電源の警告を
発し、この情報をコンピュータ修理サービス員に提供し
て、環境および電源のエラーの迅速かつ正確な診断およ
び修理を求めるための方法および装置に関する。
【0002】
【従来の技術】複雑なコンピュータ・システムは、正し
い動作を確保するために安定した環境および電源の状態
を必要とする。設置環境の問題、たとえば空調の誤作
動、コンピュータ・システム周囲の気流の制限、AC電
源故障などが起こると、コンピュータ・システムは正し
く動作することができず、その結果、論理的損傷、たと
えばディスク・セクタ・データ破壊または完全なハード
ウェア誤作動により、コンピュータに記録された重要な
データを損傷しかねない。
【0003】したがって、多くの複雑なシステムには、
このようなタイプの環境および電源の問題を検出し、適
切なエラー・メッセージを提供してそれらの問題をユー
ザに知らせるために種々のセンサが設けられている。ま
た、これらのエラー・メッセージは、コンピュータ修理
サービス員が問題を診断し、修理するのにも利用され
る。環境および電源警告システムの一例は、PowerPCの
CHRP(Common Hardware Reference Platform)
およびRS/6000システムにおいて、これらのタイ
プのイベントをオペレーティング・システムに知らせる
ために設けられている。CHRPは、IBM社から入手
可能な「PowerPC Microprocessor CommonReference
Platform: A System Architecture」ISBN 1-55860-
394-8に詳細に記載されている。
【0004】一般に、CHRPは、環境状態を検出し、
計測する多様なセンサを用いる。これらの状態の計測値
が特定のしきい値を超えるならば、それらの状態を反映
するデータがシステム中の環境および電源警告レジスタ
(EPOWレジスタ)に書き込まれる。CHRPアーキ
テクチャでは、EPOWレジスタに書き込まれたデータ
を「アクション・コード」と呼ぶ。しかし、アクション
・コードは、問題の原因に関する十分な情報を提供しな
い。たとえば、CHRPアーキテクチャでは、EPOW
レジスタに書き込むことができる7種の定義されたアク
ション・コードがある。アクション・コード0は環境障
害状態の不在を示す。アクション・コード1は冷却シス
テムの警告であり、アクション・コード2は電源の警告
であり、アクション・コード3はシステム・シャットダ
ウン警告である。アクション・コード4はシステム停止
警告である。システム停止警告は、システム・シャット
ダウンに類似しているが、より危急であり、システムが
20秒後にシャットダウンするかもしれないことを示
す。アクション・コード5は、システムが4ミリ秒以内
に電源を失うかもしれないことを示すEPOW「主筐
体」警告であり、アクション・コード7はEPOW電源
オフ指示である。
【0005】上記の情報は、システムに生じている問題
に関して何らかの指示を提供するが、診断の観点からは
不十分である。たとえば、アクション・コード1は、シ
ステムに冷却の問題が生じていることを示すが、どのセ
ンサがその警告を発したのか、何がその警告を生じさせ
たのか、あるいは、問題の深刻さはどの程度かを示して
はくれない。したがって、顧客は、設置環境の問題によ
って生じたエラーの場合に誤ってコンピュータ修理サー
ビスを呼んでしまうかもしれない。コンピュータ修理サ
ービス員もまた、問題の根本原因を究明するのに困難を
被り、誤ったまたは不完全な修理を施してしまうかもし
れない。
【0006】
【発明が解決しようとする課題】したがって、本発明の
一つの目的は、これらの難題に対処する改善された環境
および電源警告システムを提供することにある。本発明
のさらなる目的および利点は、以下の開示を考察するこ
とによって理解されよう。
【0007】
【課題を解決するための手段】本発明の一つの態様は、
コンピュータ・システムにおける環境障害を検出するた
めの装置に関する。一つの実施態様では、装置は、コン
ピュータ・システムに結合された、センサ・タイプおよ
び識別コードに対するセンサによって物理的パラメータ
を計測するための手段と、計測値に応答する信号をセン
サからコンピュータ・システムに伝送するための手段
と、信号を所定のしきい値と比較することによって環境
障害状態が存在するかどうかを判断するための手段と、
エラー・タイプ、識別コードおよびセンサ・タイプを決
定するための手段と、センサ・タイプ、識別コードおよ
びエラー・タイプを含む障害データを環境警告レジスタ
に書き込むための手段とを含む。
【0008】もう一つの態様では、本発明は、コンピュ
ータ・システムにおける環境障害を検出する方法に関す
る。一つの実施態様では、方法は、コンピュータ・シス
テムに結合された、センサ・タイプおよび識別コードに
対するセンサによって物理的パラメータを計測するステ
ップと、計測値に応答する信号をセンサからコンピュー
タ・システムに伝送するステップと、信号を所定のしき
い値と比較することによって環境障害状態が存在するか
どうかを判断するステップと、エラー・タイプ、識別コ
ードおよびセンサ・タイプを決定するステップと、セン
サ・タイプ、識別コードおよびエラー・タイプを含む障
害データを環境警告レジスタに書き込むステップとを含
む。
【0009】
【発明の実施の形態】例として示すCHRPアーキテク
チャに適合させた実施態様を参照しながら本発明を説明
する。他の実施態様では、本発明は、設計選択の問題と
して、広く多様なコンピュータ・アーキテクチャに容易
に適合させることができる。まず図1を参照して、CH
RP1.0に準拠するエラーおよびイベント通知を提供
する本発明の実施態様を説明する。図1は、本発明の実
施態様にしたがって環境および電源の警告を主プロセッ
サに発するのに使用することができる装置を示す。この
実施態様では、それ自体の搭載メモリおよびシステム・
サポート制御装置(SSC)12を有するサービス・プ
ロセッサ(SP)10が設けられている。SP10およ
びSSC12は、種々の他の装置、たとえばシステム特
定ゲート・アレイ16、操作盤制御カード48、入出力
論理18、RAM22および時刻論理20に結合されて
いる。これらのリソースは主としてコンピュータ・シス
テム中の他のリソースに対する通信を許すためにある。
たとえば、ゲート・アレイ16は、他のリソース、たと
えばさらなるプロセッサ62にアクセスするためのロー
カル・バス60への通信を許す。入出力論理18は、工
業規格アーキテクチャ(ISA)バス58にアクセス
し、直列ポート1および2にデータを通過させる。直列
ポート1および2は、サービス・プロセッサ10のUA
RT54および56とで多重化されて、サービス・プロ
セッサ10と、ポートに結合された他の装置との間の直
列通信を許す。これらのさらなるリソースの動作は本発
明の理解にとって重要ではなく、本明細書でこれ以上詳
細には説明しない。
【0010】図1に示すシステムの環境および電源情報
は、種々のセンサ、たとえばファン速度センサ14なら
びにアナログ・デジタル変換器32および34に結合さ
れた温度センサおよび電圧センサを介して提供される。
本発明に使用するための実際のセンサの選択は重要では
ない。コンピュータ・システムの許容作動範囲で温度、
電圧などに関して正確であり、適当なデジタル信号また
は適当な変換器によってデジタル化することができるア
ナログ信号を提供するいかなるセンサを使用してもよ
い。図示する実施態様では、温度および電圧センサがコ
ンピュータ・システム中で種々の物理的位置に配され、
このコンピュータ・システム中で、種々の入出力位置に
おける温度、CPU温度または種々のシステム電圧レー
ルを検出する。センサから伝送される信号は、AD変換
器32および34によってデジタル・データに変換され
たのち、I2Cバス26に提供される。I2Cバスの作動
のより詳細な理解は本発明の理解にとって重要ではな
い。I2Cバスはまた、他のシステム・リソース、たと
えばプロセッサ36、38、40および42からデータ
を運ぶことが注目されよう。
【0011】ファン速度センサ14からのデータは、シ
ステム・サポート制御装置12に提供されたのち、この
装置がこのデータをI2Cバス26に送る。サービス・
プロセッサ10がI2Cバスに結合されている。したが
って、センサによって提供されるすべてのデータがI2
Cバスによってサービス・プロセッサ10に利用でき
る。システム・サポート制御装置12だけでなく、サー
ビス・プロセッサ10も同様にサービス・プロセッサ・
バス30に結合されている。サービス・プロセッサ・バ
ス30は、本明細書でさらに詳細に説明するように、E
POWレジスタ24に対するアクセスを許す。
【0012】EPOWレジスタ24は、この特定の実現
態様では「MPIC割り込み」15と呼ぶ割り込みライ
ン25に結合されている。そして、この割り込みライン
25はマルチプレクサ50に送られ、最後には主プロセ
ッサ52に送られる。本明細書中、割り込み信号ライン
25に載せて伝送される割り込みを「EPOW割り込
み」とも呼ぶ。すべてのEPOW状態がEPOW割り込
みを介して主プロセッサ52のオペレーティング・シス
テムに報告される。一つの実施態様では、EPOW割り
込みは、本明細書でさらに詳細に説明するように、非ゼ
ロ値をEPOWレジスタ24に書き込むことによって生
成される。
【0013】図2は、本発明の実施態様のEPOWレジ
スタの例を示す。EPOWレジスタは、2個のバイト、
バイト0およびバイト1を含む。この具体例では、バイ
ト0はISAアドレス0x855に位置し、バイト1は
0x854に位置している。ISA入出力アドレス0x
855レジスタの下寄りニブルは、EPOW割り込み時
にEPOWアクション・コードを含む。値は、主プロセ
ッサによって実行される割り込みハンドラによってクリ
アされるまで維持される。このレジスタの下寄りニブル
に対しプラットフォームによって非ゼロ値が書き込まれ
ると、EPOW割り込みが主プロセッサに送り出され
る。
【0014】EPOWバイト0の上寄りニブルはエラー
・タイプを含む。EPOWバイト1の下寄りニブルは環
境センサ識別子(ID)コードを含み、その上寄りニブ
ルはセンサ・タイプを含む。一つの具体例として、各フ
ィールドを以下のように定義する。
【0015】EPOWコード:CHRPアーキテクチャ
定義と同じ。 エラー・タイプ:EPOWエラー状態の原因を識別する
4ビット16進値。このフィールドの値の定義は以下の
とおりである。 0=エラー原因識別不可能 1=ファン低速 2=温度過剰 3=電圧過剰 4=AC電源損失(電源ボタンOFF位置) 5=電圧不足 6=ファン回転翼ロック 7=最高温度超過 8=コンセントAC電源損失 9−F=予備
【0016】センサID:プラットフォーム内の各セン
サ・タイプの特定のインスタンスを識別する4ビット1
6進値。 センサ・タイプ:プラットフォーム内のセンサのタイプ
を識別する4ビット16進値。この実施態様では、分類
は以下のとおりである。 0=該当せずまたは定義なし 1=ファン速度センサ 2=電圧センサ 3=温度センサ 4−F=予備
【0017】図3は、サービス・プロセッサ10がI2
Cバス26上のセンサからデータを検索する際の動作を
説明するフロー・チャートである。ステップ300で、
サービス・プロセッサ10が、測定値に対する特定のセ
ンサのデータをI2Cバス26から検索することによ
り、コンピュータ・システムの環境状態の物理的パラメ
ータ、たとえば電源電圧、温度、ファン速度などを測定
する。次に、サービス・プロセッサ10はステップ30
2に進み、そこで、物理的パラメータが所定のしきい値
を超えるかどうかを決定する。一つの実施態様では、サ
ービス・プロセッサ10は、各センサに対する各物理的
パラメータに許容可能な限界を記憶するメモリにアクセ
スする。
【0018】多くの場合、ある特定の測定値に対して二
つ以上のしきい値がある。たとえば、温度測定値には、
最高温度および最低温度が設定されることがある。さら
には、最高および最低範囲内で、問題の深刻さを示す他
の範囲があるかもしれない。たとえば、温度超過状態に
対して二つの温度限界がありうる。最初の限界に達する
と、システムは、問題はまだ軽度であるという信号を発
し、ユーザに対し、システムの冷却を改善する何らかの
措置を実施するよう促すことができる。第二の限界に達
すると、システムは、それをオペレータに知らせ、温度
超過がコンピュータ・システムに物理的損傷を及ぼし
て、おそらくはシステムに記憶された重要なデータの損
失を招かないうちにシステムをシャットダウンする。当
然、そのような限界の選択は設計選択の問題であり、シ
ステム依存性である具体的なパラメータを考慮すること
は、当業者にとって明白である。
【0019】測定値が所定のしきい値の範囲内であるな
らば、主プロセッサに報告すべき環境状態は存在せず、
サービス・プロセッサ10はステップ316に進み、デ
ータを検索する次のセンサ、すなわち測定パラメータを
選択する。そして、前と同様にステップ300に戻る。
【0020】しかし、ステップ302で、サービス・プ
ロセッサ10が、特定の測定値に関してしきい値を超え
たと判断するならば、ステップ304に進み、そこで、
この実施態様では平滑化アルゴリズムを適用する。平滑
化アルゴリズムの目的は、冗長報告を回避することにあ
る。たとえば、サービス・プロセッサ10は、同時多発
イベントの場合、待機し、ある特定の問題がすでに報告
されているか、あるいは、測定値が正常値と異常値との
間で揺動しており、多数の冗長エラーを生じさせそうで
あるならば、その特定の問題を報告しない。換言するな
らば、特定のプラットフォーム環境状態がその設計しき
い値を超えるとしても、数値はサービス・プロセッサ1
0よって一度しか書き込まれない。サービス・プロセッ
サ10は、(1)先に報告されていた環境状態が正常値
に戻り、その後その設計しきい値を再び超えたとき、
(2)先に報告されていた環境状態が設計しきい値の次
の臨界レベルを超えたとき、または(3)新たな環境状
態がその設計しきい値を超えたとき、新たなEPOW値
をレジスタ24に書き込む。
【0021】平滑化アルゴリズムを適用したのち、サー
ビス・プロセッサ10はステップ306に進み、その状
態を報告する必要がまだあるかどうかを判断する。もう
その必要がないならば、以前と同様にステップ316に
戻る。しかし、報告が必要ならば、サービス・プロセッ
サはステップ308に進み、既存の値をEPOWレジス
タから読み出す。
【0022】ステップ310で、サービス・プロセッサ
10は、EPOWレジスタから検索したデータを検討し
て、現在、何らかのエラーが主プロセッサのオペレーテ
ィング・システムによる作動を待っているかどうかを判
断する。一つの実施態様では、本明細書でさらに詳細に
説明するように、オペレーティング・システムは、EP
OWレジスタに含まれるデータを読み出したのち、EP
OWレジスタをクリアする。したがって、この実施態様
では、EPOWレジスタが空ではないならば、システム
はステップ314に進み、そこで、一定期間後に報告す
べき問題をマークする。これが、現在修理されているエ
ラーの上書きを防ぐ。問題をマークしたのち、以前と同
様にステップ316に進む。
【0023】しかし、ステップ310で、サービス・プ
ロセッサ10が、オペレーティング・システムがその問
題を認知していないと判断するならば、ステップ312
に進み、そこで、先に説明したようにデータをEPOW
レジスタ24に書き込むことにより、その問題を主プロ
セッサ52に報告する。ひとたびステップ312でEP
OWレジスタに書き込まれたならば、割り込みライン2
5に割り込みが生成され、マルチプレクサ50を介して
主プロセッサ52に送られる。主プロセッサ52による
EPOW割り込みの処理は、本明細書でさらに詳細に説
明する。
【0024】当業者にとっては、割り込みを処理する数
多くの方法が考えられるであろう。しかし、例を示すた
め、前記CHRPアーキテクチャにしたがって割り込み
処理を実行する本発明の一つの態様を説明する。この実
施態様では、オペレーティング・システム、たとえばA
IXが主プロセッサ52の上で作動している。割り込み
処理ルーチンに対するアドレスがオペレーティング・シ
ステムに提供される。実際の割り込み処理ルーチンはシ
ステム上のファームウェアに記憶されている。これらの
ルーチンは、CHRPアーキテクチャによって定義され
る実行時抽象化サービス(RTAS)の一部として記憶
されている。主プロセッサ52は、EPOW割り込みを
受信すると、RTASルーチンを呼び出して必要な処理
を実行する。
【0025】一つの具体例では、RTASは、図4の疑
似コードに示すルーチンを含む。これを、EPOWレジ
スタ・バイト0および、必要ならば、EPOWレジスタ
・バイト1の読み出しをも実行する「検査例外」ルーチ
ンと呼ぶ。
【0026】RTAS関数ルーチンがオペレーティング
・システムによって呼び出されると、一般に、以下のよ
うに流れる。まず、EPOWレジスタ・バイト0が読み
出される。このデータはEPOWアクション・コードを
表す。EPOWアクション・コードおよびバイト1のデ
ータがオペレーティング・システムのエラー・ログ機能
によってエラー・ログに配置される。すると、オペレー
ティング・システムがエラー・ログ解析(ELA)ルー
チンを呼び出し、このルーチンが、エラー・ログ中の拡
張エラー情報に基づいて、EPOW状態の原因を解析す
る。ELAルーチンの疑似コードを図5および6に示
す。
【0027】再び図4を参照すると、EPOWコード・
フィールド、すなわちEPOWバイト0の下寄りニブル
の値が5であるならば、RTASは、CHRPアーキテ
クチャで指定された4ミリ秒の所要期間を満たすため、
その値を速やかにオペレーティング・システムに戻す。
【0028】より具体的には、再び図1を参照すると、
「AC電源損失」および「電源オフスイッチ」の分類5
アクション・コードが検出ソースから主プロセッサ52
に直結されている。これらは、サービス・プロセッサ1
0が作動する時間を許さない至急電源オフ警告である。
【0029】環境センサをポーリングすることによって
検出された状態の結果として、他のすべてのアクション
・コードがサービス・プロセッサ10によってEPOW
レジスタ24に書き込まれる。サービス・プロセッサ1
0は、新たなデータを書き込む前に、EPOWレジスタ
24の内容を読み出して、データが失われてはいないこ
とや、高い優先度のコードが低い優先度のコードによっ
て上書きされていないことを保証する。
【0030】図7は、分類5アクション・コードの動作
をさらに詳細に示す。具体的には、システム制御装置1
2がシステムにおける電源イベントに関連する他のリソ
ースから種々の信号を受ける。これらのタイプの信号に
関して、SSC12は、サービス・プロセッサ10によ
って後で読み出されるデータを、図1に示すI2Cバス
26に書き込まない。逆に、SSC12は、信号ライン
600を介してEPOWレジスタ24に直結されてい
る。当然、先に論じたように、ひとたびデータがEPO
Wレジスタ24に書き込まれるならば、主プロセッサ5
2に対する割り込みが生成される。
【0031】さらなる実施態様では、EPOWアクショ
ン・コード5は、電源制御装置ハードウェアによってレ
ジスタに書き込まれる。この環境状態が持続するなら
ば、電源制御装置ハードウェアはその数値を維持し、レ
ジスタ24に0x00を書き込んでもそれはクリアされ
ない。このレジスタは、環境状態が正常に戻り、後で別
のRTAS関数によって0x00が書き込まれた場合に
のみクリアされる。
【0032】EPOWコード・フィールドの値が5では
ないならば、RTASがEPOWレジスタ・バイト1
(ISA0x854)を読み出す。図8は、本発明の一
つの実施態様による、センサ・タイプ、センサID、エ
ラー・タイプおよびアクション・コードの選択を示す表
である。ひとたびこれらの値がRTASによって読み出
されたならば、それらの値はログ収集のためにオペレー
ティング・システムに送られる。図5および6に示す疑
似コードが具体例を示す。オペレーティング・システム
が割り込みに応答したのち、RTASが呼び出されて必
要なデータをEPOWレジスタから検索し、メモリ中に
エラー・ログを作成する。エラー・ログは、オペレーテ
ィング・システムによって使用される種々の情報を与え
られる所定数のバイトを含む。エラー・ログ・バイト1
5には、ELAルーチンにエラーの性質を知らせるため
の情報が提供される。オペレーティング・システムによ
ってエラー・ログが作成されたのち、ELAルーチンが
呼び出される。そして、ELAがエラー・ログ・バイト
15を検討し、適切な措置を実行する。たとえば、エラ
ー・ログ・バイト15が1を含むならば、主プロセッサ
は、EPOWレジスタに関連するデータを提供された表
からEPOWエラー定義を読み出す。EPOWエラー定
義が0x1n11(nはセンサ識別コードである)であ
るならば、ELAは、冷却の問題が検出されたことを示
す警告メッセージをシステム・コンソールに表示する。
メッセージはまた、問題を起こしていると思われるファ
ンおよび問題そのものの正確な性質(たとえば、ファン
の回転が予定よりも遅い)を特定する。当然、他にも、
環境状態を報告する数多くの方法、たとえばeメールを
システム・オペレータのメール・ボックスに生成する方
法またはプリントアウトによる方法がある。
【0033】最後に、EPOWレジスタは、RTASが
ISA0x855に0を書き込むことによってクリアさ
れる。本実施態様では、これが、EPOWレジスタの両
方のバイトをクリアする。そして、サービス・プロセッ
サ10がセンサのポーリングを続け、環境状態が検出さ
れた場合、上記に詳述したようにして、新たなデータを
EPOWレジスタに書き込む。
【0034】CHRPアーキテクチャを含む具体的な実
施態様にしたがって本発明を説明したが、本発明が、設
計選択の問題としてCHRPアーキテクチャに代えて用
いることができる他のアーキテクチャを含む他の多数の
実施態様をも受け入れるということが当業者に理解され
よう。したがって、形態および詳細における種々の変更
が本発明の範囲および趣旨に入るとみなされるため、上
記実施態様は限定的なものではない。本明細書で引用す
るすべての出版物は、それらの全内容を引用したものと
して本明細書に組み込む。
【0035】まとめとして、本発明の構成に関して以下
の事項を開示する。 (1)コンピュータ・システムにおける環境障害を検出
するための装置であって、前記コンピュータ・システム
に結合された、センサ・タイプおよび識別コードに対す
るセンサによって物理的パラメータを計測するための手
段と、計測値に応答する信号を前記センサから前記コン
ピュータ・システムに伝送するための手段と、前記信号
を所定のしきい値と比較することによって環境障害状態
が存在するかどうかを判断するための手段と、エラー・
タイプ、識別コードおよびセンサ・タイプを決定するた
めの手段と、前記センサ・タイプ、前記識別コードおよ
び前記エラー・タイプを含む障害データを環境警告レジ
スタに書き込むための手段と、を含むことを特徴とする
装置。 (2)前記センサからの前記信号が、前記計測値を表す
デジタル化されたセンサ値を含む上記(1)記載の装
置。 (3)前記信号を前記センサから前記コンピュータ・シ
ステムに伝送するための手段が、前記センサ値をデータ
・バスから検索するサービス・プロセッサを含む上記
(2)記載の装置。 (4)環境障害状態が存在するかどうかを判断するため
の前記手段が、センサ値の警告しきい値を表すデータを
記憶するメモリを含み、前記メモリが、前記センサ値を
前記警告しきい値を表す前記データと比較する前記サー
ビス・プロセッサによってアクセス可能である上記
(3)記載の装置。 (5)センサ・タイプを決定するための前記手段が、障
害状態を示しているセンサの分類を表すデータを記憶す
るメモリを含み、前記メモリが前記サービス・プロセッ
サによってアクセス可能である上記(3)記載の装置。 (6)エラー・タイプを決定するための前記手段が、前
記障害状態の原因を表すデータを記憶するメモリを含
み、前記メモリが、前記センサ値に応答して前記分類を
決定する前記サービス・プロセッサによってアクセス可
能である上記(3)記載の装置。 (7)前記障害データを環境警告レジスタに書き込むた
めの前記手段が、環境障害状態が存在するならば、前記
センサ・タイプ、前記識別コードおよび前記エラー・タ
イプをメモリから検索するサービス・プロセッサを含む
上記(1)記載の装置。 (8)環境障害状態が存在するならば、主プロセッサに
信号を発するための手段をさらに含む上記(1)記載の
装置。 (9)主プロセッサに信号を発するための前記手段が、
前記環境警告レジスタに書き込むサービス・プロセッサ
を含み、それによって前記主プロセッサに対する割り込
みが発生する上記(8)記載の装置。 (10)コンピュータ・システムにおける環境障害を検
出する方法であって、前記コンピュータ・システムに結
合された、センサ・タイプおよび識別コードに対するセ
ンサによって物理的パラメータを計測するステップと、
計測値に応答する信号を前記センサから前記コンピュー
タ・システムに伝送するステップと、前記信号を所定の
しきい値と比較することによって環境障害状態が存在す
るかどうかを判断するステップと、エラー・タイプ、識
別コードおよびセンサ・タイプを決定するステップと、
前記センサ・タイプ、前記識別コードおよび前記エラー
・タイプを含む障害データを環境警告レジスタに書き込
むステップと、を含むことを特徴とする方法。 (11)前記センサからの前記信号が、前記計測値を表
すデジタル化されたセンサ値を含む上記(10)記載の
方法。 (12)前記信号を前記センサから前記コンピュータ・
システムに伝送するステップが、サービス・プロセッサ
によって前記センサ値をデータ・バスから検索するステ
ップを含む上記(11)記載の方法。 (13)環境障害状態が存在するかどうかを判断する前
記ステップが、前記センサ値の警告しきい値を表すデー
タをメモリから検索するステップを含み、前記メモリ
が、前記センサ値を前記警告しきい値を表す前記データ
と比較する前記サービス・プロセッサによってアクセス
可能である上記(12)記載の方法。 (14)センサ・タイプを決定する前記ステップが、障
害状態を示しているセンサの前記分類を表すデータをメ
モリから検索するステップを含み、前記メモリが前記サ
ービス・プロセッサによってアクセス可能である上記
(12)記載の方法。 (15)エラー・タイプを決定する前記ステップが、前
記障害状態の分類を表すデータをメモリから検索するス
テップを含み、前記メモリが、前記センサ値に応答して
前記分類を決定する前記サービス・プロセッサによって
アクセス可能である上記(12)記載の方法。 (16)前記障害データを環境警告レジスタに書き込む
前記ステップが、環境障害状態が存在するならば、前記
センサ・タイプ、前記識別コードおよび前記エラー・タ
イプをメモリから検索するステップを含む上記(10)
記載の方法。 (17)環境障害状態が存在するならば、主プロセッサ
に信号を発するステップをさらに含む上記(10)記載
の方法。 (18)主プロセッサに信号を発する前記ステップが、
前記サービス・プロセッサから前記環境警告レジスタに
書き込むステップを含み、それによって前記主プロセッ
サに対する割り込みを発生させる上記(17)記載の方
法。
【図面の簡単な説明】
【図1】本発明の一つの実施態様に使用することができ
る処理システムのブロック図である。
【図2】本発明の実施態様のEPOWレジスタの内容を
示す図である。
【図3】本発明の実施態様の環境障害検出ルーチンのフ
ロー・チャートである。
【図4】本発明の実施態様のRTAS関数の疑似コード
例を示す図である。
【図5】本発明の実施態様のELAルーチンの疑似コー
ド例を示す図である。
【図6】本発明の実施態様のELAルーチンの疑似コー
ド例を示す図である。
【図7】本発明の実施態様のEPOW割り込みの動作を
示すブロック図である。
【図8】本発明のさらに別の実施態様に可能なEPOW
コードを示す表である。
【符号の説明】
10 サービス・プロセッサ 12 システム・サポート制御装置 14 ファン速度センサ 24 EPOWレジスタ 25 割り込みライン 26 I2Cバス 30 サービス・プロセッサ・バス 32、34 アナログ・デジタル変換器 52 主プロセッサ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 スティーブン・ポール・ハートマン アメリカ合衆国78681、 テキサス州ラウ ンド・ロック ブルー・スプリング・コー ブ 954 (72)発明者 アロンコーン・キタモーン アメリカ合衆国78717、 テキサス州オー スティン フリッチ・コーブ 16104

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】コンピュータ・システムにおける環境障害
    を検出するための装置であって、 前記コンピュータ・システムに結合された、センサ・タ
    イプおよび識別コードに対するセンサによって物理的パ
    ラメータを計測するための手段と、 計測値に応答する信号を前記センサから前記コンピュー
    タ・システムに伝送するための手段と、 前記信号を所定のしきい値と比較することによって環境
    障害状態が存在するかどうかを判断するための手段と、 エラー・タイプ、識別コードおよびセンサ・タイプを決
    定するための手段と、 前記センサ・タイプ、前記識別コードおよび前記エラー
    ・タイプを含む障害データを環境警告レジスタに書き込
    むための手段と、を含むことを特徴とする装置。
  2. 【請求項2】前記センサからの前記信号が、前記計測値
    を表すデジタル化されたセンサ値を含む請求項1記載の
    装置。
  3. 【請求項3】前記信号を前記センサから前記コンピュー
    タ・システムに伝送するための手段が、前記センサ値を
    データ・バスから検索するサービス・プロセッサを含む
    請求項2記載の装置。
  4. 【請求項4】環境障害状態が存在するかどうかを判断す
    るための前記手段が、センサ値の警告しきい値を表すデ
    ータを記憶するメモリを含み、前記メモリが、前記セン
    サ値を前記警告しきい値を表す前記データと比較する前
    記サービス・プロセッサによってアクセス可能である請
    求項3記載の装置。
  5. 【請求項5】センサ・タイプを決定するための前記手段
    が、障害状態を示しているセンサの分類を表すデータを
    記憶するメモリを含み、前記メモリが前記サービス・プ
    ロセッサによってアクセス可能である請求項3記載の装
    置。
  6. 【請求項6】エラー・タイプを決定するための前記手段
    が、前記障害状態の原因を表すデータを記憶するメモリ
    を含み、前記メモリが、前記センサ値に応答して前記分
    類を決定する前記サービス・プロセッサによってアクセ
    ス可能である請求項3記載の装置。
  7. 【請求項7】前記障害データを環境警告レジスタに書き
    込むための前記手段が、環境障害状態が存在するなら
    ば、前記センサ・タイプ、前記識別コードおよび前記エ
    ラー・タイプをメモリから検索するサービス・プロセッ
    サを含む請求項1記載の装置。
  8. 【請求項8】環境障害状態が存在するならば、主プロセ
    ッサに信号を発するための手段をさらに含む請求項1記
    載の装置。
  9. 【請求項9】主プロセッサに信号を発するための前記手
    段が、前記環境警告レジスタに書き込むサービス・プロ
    セッサを含み、それによって前記主プロセッサに対する
    割り込みが発生する請求項8記載の装置。
  10. 【請求項10】コンピュータ・システムにおける環境障
    害を検出する方法であって、 前記コンピュータ・システムに結合された、センサ・タ
    イプおよび識別コードに対するセンサによって物理的パ
    ラメータを計測するステップと、 計測値に応答する信号を前記センサから前記コンピュー
    タ・システムに伝送するステップと、 前記信号を所定のしきい値と比較することによって環境
    障害状態が存在するかどうかを判断するステップと、 エラー・タイプ、識別コードおよびセンサ・タイプを決
    定するステップと、 前記センサ・タイプ、前記識別コードおよび前記エラー
    ・タイプを含む障害データを環境警告レジスタに書き込
    むステップと、を含むことを特徴とする方法。
  11. 【請求項11】前記センサからの前記信号が、前記計測
    値を表すデジタル化されたセンサ値を含む請求項10記
    載の方法。
  12. 【請求項12】前記信号を前記センサから前記コンピュ
    ータ・システムに伝送するステップが、サービス・プロ
    セッサによって前記センサ値をデータ・バスから検索す
    るステップを含む請求項11記載の方法。
  13. 【請求項13】環境障害状態が存在するかどうかを判断
    する前記ステップが、前記センサ値の警告しきい値を表
    すデータをメモリから検索するステップを含み、前記メ
    モリが、前記センサ値を前記警告しきい値を表す前記デ
    ータと比較する前記サービス・プロセッサによってアク
    セス可能である請求項12記載の方法。
  14. 【請求項14】センサ・タイプを決定する前記ステップ
    が、障害状態を示しているセンサの前記分類を表すデー
    タをメモリから検索するステップを含み、前記メモリが
    前記サービス・プロセッサによってアクセス可能である
    請求項12記載の方法。
  15. 【請求項15】エラー・タイプを決定する前記ステップ
    が、前記障害状態の分類を表すデータをメモリから検索
    するステップを含み、前記メモリが、前記センサ値に応
    答して前記分類を決定する前記サービス・プロセッサに
    よってアクセス可能である請求項12記載の方法。
  16. 【請求項16】前記障害データを環境警告レジスタに書
    き込む前記ステップが、環境障害状態が存在するなら
    ば、前記センサ・タイプ、前記識別コードおよび前記エ
    ラー・タイプをメモリから検索するステップを含む請求
    項10記載の方法。
  17. 【請求項17】環境障害状態が存在するならば、主プロ
    セッサに信号を発するステップをさらに含む請求項10
    記載の方法。
  18. 【請求項18】主プロセッサに信号を発する前記ステッ
    プが、前記サービス・プロセッサから前記環境警告レジ
    スタに書き込むステップを含み、それによって前記主プ
    ロセッサに対する割り込みを発生させる請求項17記載
    の方法。
JP09139798A 1997-04-10 1998-04-03 コンピュータ・システムにおける環境障害を検出するための装置および方法 Expired - Fee Related JP3509055B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/826,852 US5878377A (en) 1997-04-10 1997-04-10 Environmental and power error handling extension and analysis
US08/826852 1997-04-10

Publications (2)

Publication Number Publication Date
JPH10320079A true JPH10320079A (ja) 1998-12-04
JP3509055B2 JP3509055B2 (ja) 2004-03-22

Family

ID=25247696

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09139798A Expired - Fee Related JP3509055B2 (ja) 1997-04-10 1998-04-03 コンピュータ・システムにおける環境障害を検出するための装置および方法

Country Status (2)

Country Link
US (1) US5878377A (ja)
JP (1) JP3509055B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100441672B1 (ko) * 2002-02-06 2004-07-27 플로우닉스 주식회사 신호계측 제어시스템
KR20150080867A (ko) * 2014-01-02 2015-07-10 한국전자통신연구원 오류 가능성 감지에 의한 오류 예방 장치
CN106407125A (zh) * 2016-11-15 2017-02-15 中国银行股份有限公司 大型主机环境检测方法和装置

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6345369B1 (en) * 1998-11-12 2002-02-05 International Business Machines Corporation Environmental and power error handling extension and analysis for systems with redundant components
US7233977B2 (en) * 1998-12-18 2007-06-19 Emc Corporation Messaging mechanism employing mailboxes for inter processor communications
DE19942430A1 (de) * 1999-09-06 2001-03-08 Sperling Axel Betriebsumgebungs-Kontrolleinrichtung für Computer mit Bauelementen-spezifischer Überwachung und Ansteuerung
US6684306B1 (en) * 1999-12-16 2004-01-27 Hitachi, Ltd. Data backup in presence of pending hazard
DE10011662C2 (de) * 2000-03-10 2002-11-21 Microtune Gmbh & Co Kg Temperaturerfassungseinrichtung
JP4774582B2 (ja) * 2000-06-30 2011-09-14 ソニー株式会社 コンテンツ管理装置、コンテンツ管理方法及びプログラム格納媒体
US6460005B1 (en) * 2000-08-10 2002-10-01 International Business Machines Corporation Apparatus and method for monitoring environmental conditions in a computing device
US7010991B2 (en) 2000-09-13 2006-03-14 Pentagon Technologies Group, Inc. Surface particle detector
US6725180B2 (en) * 2001-01-12 2004-04-20 Ingersoll-Rand Company Environmental monitoring system
US6888453B2 (en) * 2001-06-22 2005-05-03 Pentagon Technologies Group, Inc. Environmental monitoring system
US7463999B2 (en) 2004-07-13 2008-12-09 Qian Li Method and device for monitoring computer case and power supply unit
US7493235B2 (en) * 2007-01-09 2009-02-17 Dell Products, Lp System and method for dynamic generation of environmental operational models
US7705721B1 (en) * 2007-03-13 2010-04-27 Network Appliance, Inc. Apparatus and method for sensing and responding to environmental conditions of a computer system at non-uniform polling intervals
US9335183B2 (en) * 2011-04-12 2016-05-10 International Business Machines Corporation Method for reliably operating a sensor

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4600962A (en) * 1983-02-03 1986-07-15 Sentec Inc. Apparatus for monitoring and protecting a device against a plurality of fault conditions
JPS6382843A (ja) * 1986-09-25 1988-04-13 Mitsubishi Electric Corp 自動車用電子装置の故障診断装置
US5347476A (en) * 1992-11-25 1994-09-13 Mcbean Sr Ronald V Instrumentation system with multiple sensor modules
JPH07130080A (ja) * 1993-11-02 1995-05-19 Olympus Optical Co Ltd 情報記録装置
US5537538A (en) * 1993-12-15 1996-07-16 Silicon Graphics, Inc. Debug mode for a superscalar RISC processor
US5566346A (en) * 1993-12-21 1996-10-15 Taligent, Inc. System for constructing hardware device interface software systems independent of operating systems including capability of installing and removing interrupt handlers
US5574915A (en) * 1993-12-21 1996-11-12 Taligent Object-oriented booting framework
US5379431A (en) * 1993-12-21 1995-01-03 Taligent, Inc. Boot framework architecture for dynamic staged initial program load
US5623594A (en) * 1994-02-23 1997-04-22 Dell Usa, L.P. Embedded thermistor for on-board thermal monitoring of electrical components
US5533192A (en) * 1994-04-21 1996-07-02 Apple Computer, Inc. Computer program debugging system and method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100441672B1 (ko) * 2002-02-06 2004-07-27 플로우닉스 주식회사 신호계측 제어시스템
KR20150080867A (ko) * 2014-01-02 2015-07-10 한국전자통신연구원 오류 가능성 감지에 의한 오류 예방 장치
CN106407125A (zh) * 2016-11-15 2017-02-15 中国银行股份有限公司 大型主机环境检测方法和装置
CN106407125B (zh) * 2016-11-15 2019-02-05 中国银行股份有限公司 大型主机环境检测方法和装置

Also Published As

Publication number Publication date
JP3509055B2 (ja) 2004-03-22
US5878377A (en) 1999-03-02

Similar Documents

Publication Publication Date Title
US6345369B1 (en) Environmental and power error handling extension and analysis for systems with redundant components
JP3509055B2 (ja) コンピュータ・システムにおける環境障害を検出するための装置および方法
US6205547B1 (en) Computer system management apparatus and method
US7370242B2 (en) Thermal monitoring and response apparatus and method for computer unit
US6145102A (en) Transmission of an error message over a network by a computer which fails a self-test
US6532151B2 (en) Method and apparatus for clearing obstructions from computer system cooling fans
US7962793B2 (en) Self-diagnosing remote I/O enclosures with enhanced FRU callouts
CN100375960C (zh) 用于调试输入/输出故障的方法和系统
TWI310899B (en) Method, system, and product for utilizing a power subsystem to diagnose and recover from errors
WO2012157471A1 (ja) 複数の制御システムの異常を検知する異常検知システム
CN102253881A (zh) 服务器工作状态检测系统
US20020154131A1 (en) System status display control module
EP2615551B1 (en) Abnormality inspection device, central processing unit, and abnormality inspection method
JPH05225067A (ja) 重要メモリ情報保護装置
US9158646B2 (en) Abnormal information output system for a computer system
US8449173B1 (en) Method and system for thermal testing of computing system components
US8253588B2 (en) Facilitating power supply unit management using telemetry data analysis
US6098181A (en) Screening methodology for operating system error reporting
TWM532085U (zh) 硬碟控制晶片及含其的硬碟
JP3040186B2 (ja) 制御用ディジタルコントローラ
US11740790B2 (en) Electronic device and method for monitoring hard disks
Chung Optimal test-times for intermittent faults
KR100201940B1 (ko) 전전자 교환시스템에서 보조기억장치의 에러 검출방법
RU2073906C1 (ru) Устройство для оперативного контроля тепловых режимов электронной вычислительной машины
JP2713250B2 (ja) Cpu保守システム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20031216

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20031217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20031219

LAPS Cancellation because of no payment of annual fees