JP3824548B2 - 情報処理装置、電源制御装置、情報処理装置制御方法、プログラム、及び記録媒体 - Google Patents

情報処理装置、電源制御装置、情報処理装置制御方法、プログラム、及び記録媒体 Download PDF

Info

Publication number
JP3824548B2
JP3824548B2 JP2002054572A JP2002054572A JP3824548B2 JP 3824548 B2 JP3824548 B2 JP 3824548B2 JP 2002054572 A JP2002054572 A JP 2002054572A JP 2002054572 A JP2002054572 A JP 2002054572A JP 3824548 B2 JP3824548 B2 JP 3824548B2
Authority
JP
Japan
Prior art keywords
unit
failure
processing
power supply
main power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2002054572A
Other languages
English (en)
Other versions
JP2003248599A (ja
Inventor
稔 原
敏幸 白鳥
敦 安部
グレコ ポール
裕司 長徳
敬幸 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2002054572A priority Critical patent/JP3824548B2/ja
Priority to US10/317,323 priority patent/US20030154421A1/en
Publication of JP2003248599A publication Critical patent/JP2003248599A/ja
Application granted granted Critical
Publication of JP3824548B2 publication Critical patent/JP3824548B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/266Arrangements to supply power to external peripherals either directly from the computer or under computer control, e.g. supply of power through the communication port, computer controlled power-strips
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)
  • Retry When Errors Occur (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、情報処理装置、電源制御装置、情報処理装置制御方法、プログラム、及び記録媒体に関する。特に本発明は、通常処理及び障害処理を行う情報処理装置、電源制御装置、情報処理装置制御方法、プログラム、及び記録媒体に関する。
【0002】
【従来の技術】
従来、PC、ワークステーション、サーバ等のプロセッサを備える計算機や、制御用のプロセッサ等を含む制御回路等の各種の情報処理装置において、障害の発生によるハングアップを防止する技術として、プロセッサへの割り込みやリセットを用いるものが提案されている。例えば、実開平5−71924には、一定監視時間毎にプログラムに割り込みをかけてマイクロコンピュータの作動異常を検出するウォッチドッグタイマのリセット信号を、マイクロコンピュータのノンマスカブル割込端子に入力するリセット回路が開示されている。また、特開平11−249637には、ウォッチドッグタイマによってプログラムが暴走した時に発生するノンマスカブル割り込みにより、電源供給手段を制御するマイクロコンピュータを備えた画像表示装置が開示されている。
【0003】
【発明が解決しようとする課題】
以上に示した実開平5−71924及び特開平11−249637においては、ノンマスカブル割り込み(NMI:Non Maskable Interrupt)を用いて処理の再開ができない場合、ハングアップする可能性がある。情報処理装置の信頼性を更に高め、障害の要因の特定を容易にするためには、情報処理装置の各部に発生する障害の種類に応じて、適切な障害処理を行うことが要求される。
【0004】
そこで本発明は、上記の課題を解決することのできる情報処理装置、電源制御装置、情報処理装置制御方法、プログラム、及び記録媒体を提供することを目的とする。この目的は特許請求の範囲における独立項に記載の特徴の組み合わせにより達成される。また従属項は本発明の更なる有利な具体例を規定する。
【0005】
【課題を解決するための手段】
即ち、本発明の第1の形態によると、通常処理、第1の障害処理、及び第2の障害処理を含む処理のいずれかを実行する実行部と、前記通常処理中に、前記実行部が第1の期間正常に動作していないことを必要条件として、前記実行部に第1の障害処理を開始させ、前記第1の障害処理中に、前記実行部が第2の期間正常に動作していないことを必要条件として、前記実行部に第2の障害処理を開始させる障害処理部と、前記第1の障害処理の開始後における前記実行部の内部状態であって、前記第2の障害処理の開始後には取得できない内部状態を、障害情報として取得する障害情報取得部とを備えることを特徴とする情報処理装置を提供する。
また、前記情報処理装置は、機械的動作を行う駆動部を更に備え、前記障害処理部は、前記第1の障害処理の開始を前記実行部に指示する場合に、前記駆動部の動作を停止させてもよい。
【0006】
また、本発明の第2の形態によると、情報処理装置の入出力バスに接続される電源制御装置であって、前記情報処理装置の動作に使用する主電力を、前記情報処理装置から取得する電力取得部と、前記主電力の供給が停止していることを必要条件として、前記入出力バスを介して前記主電力の供給の開始を指示し、前記情報処理装置を起動させる電源制御部とを備えることを特徴とする電源制御装置を提供する。
【0007】
また、本発明の第3の形態によると、情報処理装置に処理を行わせる情報処理装置制御方法であって、前記情報処理装置に、通常処理、第1の障害処理、及び第2の障害処理を含む処理のいずれかを実行させ、前記通常処理が第1の期間正常に動作していないことを必要条件として、第1の障害処理を開始させ、前記第1の障害処理が第2の期間正常に動作していないことを必要条件として、第2の障害処理を開始させ、前記第1の障害処理の開始後における前記実行部の内部状態であって、前記第2の障害処理の開始後には取得できない内部状態を、障害情報として取得させることを特徴とする情報処理装置制御方法を提供する。
【0008】
また、本発明の第4の形態によると、情報処理装置に処理を行わせるプログラムであって、前記情報処理装置を、通常処理、第1の障害処理、及び第2の障害処理を含む処理のいずれかを実行する実行部と、前記通常処理中に、前記実行部が第1の期間正常に動作していないことを必要条件として、前記実行部に第1の障害処理を開始させ、前記第1の障害処理中に、前記実行部が第2の期間正常に動作していないことを必要条件として、前記実行部に第2の障害処理を開始させる障害処理部と、前記第1の障害処理の開始後における前記実行部の内部状態であって、前記第2の障害処理の開始後には取得できない内部状態を、障害情報として取得する障害情報取得部として動作させることを特徴とするプログラムを提供する。
【0009】
また、本発明の第5の形態によると、情報処理装置に処理を行わせるプログラムを記録した記録媒体であって、前記プログラムは、前記情報処理装置を、通常処理、第1の障害処理、及び第2の障害処理を含む処理のいずれかを実行する実行部と、前記通常処理中に、前記実行部が第1の期間正常に動作していないことを必要条件として、前記実行部に第1の障害処理を開始させ、前記第1の障害処理中に、前記実行部が第2の期間正常に動作していないことを必要条件として、前記実行部に第2の障害処理を開始させる障害処理部と、前記第1の障害処理の開始後における前記実行部の内部状態であって、前記第2の障害処理の開始後には取得できない内部状態を、障害情報として取得する障害情報取得部として動作させることを特徴とする記録媒体を提供する。
【0010】
なお上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの特徴群のサブコンビネーションも又発明となりうる。
【0011】
【発明の実施の形態】
以下、発明の実施形態を通じて本発明を説明するが、実施形態はクレームにかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0012】
図1は、本実施形態に係る計算機システム100の構成を示す。本実施形態に係る計算機システム100は、記憶装置110及び計算機120を備える。記憶装置110は、本発明に係る情報処理装置の一例である。
記憶装置110は、計算機120又はネットワークを介して計算機120に接続された計算機等の要求に応じて、ファイル等のデータを格納し、又は読み出す。本実施形態に係る記憶装置110は、例えば、ハードディスクドライブ、テープドライブ、光ディスクドライブ、光磁気ディスクドライブ等の、機械的動作を行う駆動部分を備える。記憶装置110は、制御用のプロセッサを内蔵し、これを用いて記憶装置110に要求される各種処理を行う。
【0013】
計算機120は、記憶装置110に接続され、記憶装置110に対してデータの読み出し又は書き込みを要求する。計算機120は、例えば、SCSIインターフェイス、IDEインターフェイス、ファイバーチャネルインターフェイス等の記憶装置向けのインターフェイスを用いて記憶装置110と接続される。これに代えて、計算機120は、WAN、LAN等の一般の装置向けのインターフェイスを用いて記憶装置110と接続されてもよい。
【0014】
図2は、本実施形態に係る記憶装置110の構成を示す。本実施形態に係る記憶装置110は、実行部200、障害処理部210、タイマ部220、及び障害情報取得部230を備える。
【0015】
実行部200は、記憶装置110内の各部を制御し、通常処理、第1の障害処理、第2の障害処理、及び第3の障害処理を含む処理のいずれかを実行する。実行部200は、プロセッサ240、通信ユニット245、入出力制御ユニット250、駆動部255、メモリ260、及びメモリ制御ユニット270を備える。
通常処理において、実行部200は、記憶装置110と計算機120との間のコマンド若しくはデータの送受信、計算機120からの要求に基づくファイル等のデータの格納及び/又は読み出し等の処理を行う。第1の障害処理、第2の障害処理、及び第3の障害処理において、実行部200は、障害の解析、特定、及び/又は復旧を行うために使用される情報である障害情報を取得する。実行部200は、通常処理、第1の障害処理、第2の障害処理、及び第3の障害処理において、実行部200が正常動作していることを示す正常動作情報を、例えば予め設定された期間未満の間隔でタイマ部220に送信する。
【0016】
障害処理部210は、設定された期間実行部200が正常に動作していないことを検出し、実行部200に障害処理を開始させる。具体的には、通常処理中に第1の期間実行部200が正常に動作していない場合、障害処理部210は、実行部200に第1の障害処理を開始させる。また、第1の障害処理中に第2の期間実行部200が正常に動作していない場合、障害処理部210は、実行部200に第2の障害処理を開始させる。また、第2の障害処理中に第3の期間実行部200が正常に動作していない場合、障害処理部210は、実行部200に第3の障害処理を開始させる。更に、第3の障害処理中に第4の期間実行部200が正常に動作していない場合、障害処理部210は、実行部200に第3の障害処理を再開させる。
【0017】
障害処理部210は、記憶装置110が通常処理、第1の障害処理、第2の障害処理、及び第3の障害処理のいずれを実行しているかを示す情報を格納する処理状態レジスタ212を含む。本実施形態に係る障害処理部210は、記憶装置110が通常処理中の場合”0”、記憶装置110が第1の障害処理中の場合”1”、記憶装置110が第2の障害処理中の場合”2”、記憶装置110が第3の障害処理中の場合”3”を、処理状態レジスタ212に格納する。
以上の処理に代えて、障害処理部210は、例えば、第1の障害処理中に実行部200が第2の期間正常に動作していない場合、実行部200に第1の障害処理の再開を規定の回数指示する等の処理を含めてもよい。この場合、障害処理部210は、第1の障害処理の再開を規定の回数指示した後、なお実行部200が第2の期間正常に動作しないことを検出した場合に、実行部200に第2の障害処理を開始させてもよい。
【0018】
障害処理部210は、実行部200、タイマ部220、及び障害情報取得部230に障害処理の開始を指示する信号として、NMI信号215、CPURESET信号216、SYSRESET信号217、及びPWROFF信号218を出力する。
NMI信号215は、プロセッサ240に対してノンマスカブル割り込みを行うために用いられる信号線である。障害処理部210は、第1の障害処理の開始時に、NMI信号215を用いてプロセッサ240に対してノンマスカブル割り込みを行い、プロセッサ240に第1の障害処理を開始させる。
CPURESET信号216は、プロセッサ240をリセットするために用いられる信号線である。障害処理部210は、第2の障害処理の開始時に、CPURESET信号216を用いてプロセッサ240をリセットし、プロセッサ240に第2の障害処理を開始させる。
【0019】
SYSRESET信号217は、タイマ部220、障害情報取得部230、通信ユニット245、入出力制御ユニット250、駆動部255、及びメモリ制御ユニット270を含む記憶装置110全体をリセットするために用いられる信号線である。障害処理部210は、第3の障害処理の開始時に、SYSRESET信号217を用いて記憶装置110全体をリセットすることにより、記憶装置110に第3の障害処理を開始させる。ここで、障害処理部210は、第3の障害処理の開始時において記憶装置110全体をリセットする際に、CPURESET信号216を用いてプロセッサ240をリセットすることにより、プロセッサ240に第3の障害処理を開始させる。
PWROFF信号218は、駆動部255の動作を停止させるために用いられる信号線である。障害処理部210は、第1の障害処理の開始時に、PWROFF信号218を用いて駆動部255の動作を停止させる。
【0020】
以上に代えて、障害処理部210は、以上に示した各障害処理の開始の指示を、例えばマスク可能な割り込みや、プロセッサ240及びメモリ制御ユニット270のみのリセット等の、本実施形態に係る指示方法と異なる方法で行ってもよい。また、障害処理部210は、以上に示した各障害処理の開始の指示の組合せを、例えば、第1の障害処理はプロセッサ240へのノンマスカブル割り込みで第2の障害処理はプロセッサ240のリセット、第1の障害処理はプロセッサ240のリセットで第2の障害処理は記憶装置110全体のリセット、又は第1の障害処理はプロセッサ240のリセットで第2の障害処理は記憶装置110全体のリセット等の、他の組合せを用いてもよい。
【0021】
タイマ部220は、設定された期間実行部200が正常動作していないことを検出し、障害処理部210に通知するウォッチドッグタイマである。タイマ部220は、設定された期間の測定を行うために使用するレジスタであるタイマレジスタ222を含む。
【0022】
タイマ部220は、設定された期間の測定を、次に示す方法で行う。まず、タイマ部220は、予め設定された期間を測定するためのタイマ値を障害処理部210から取得し、タイマレジスタ222に格納する。次に、タイマ部220は、タイマ用のクロックのサイクル毎にタイマレジスタ222内に格納したタイマ値をデクリメントする。次に、タイマ部220は、実行部200が正常動作していることを示す正常動作情報を実行部200から受信すると、予め設定された期間を測定するためのタイマ値をタイマレジスタ222に再度格納し、再び設定された期間の測定を開始する。一方、タイマ部220は、タイマレジスタ222内のタイマ値が0となった場合(タイムアウトとなった場合)に、タイマレジスタ222に設定された期間実行部200が正常動作していないことを検出する。
ここで、実行部200は、実行部200が正常動作していることを示す正常動作情報を、予め設定された期間未満の間隔でタイマ部220に送信する様プログラムされている。このため、タイマ部220は、実行部200から正常動作情報を予め設定された期間受信しない場合、実行部200のプログラム動作に異常が生じたと見なして、異常を検出することができる。
【0023】
実行部200は、正常動作情報として、設定された期間の計測を、タイマ部220に開始させることを示す情報を送信してもよい。この場合、タイマ部220は、タイマレジスタ222として、設定された期間に対応するタイマ値を格納するタイマ設定値レジスタ、及び現時点におけるタイマ値を格納するタイマ値レジスタを備える。そして、タイマ部220は、実行部200から正常動作情報を受信すると、タイマ設定値レジスタに格納された値をタイマ値レジスタにコピーし、タイマ設定値レジスタに設定された期間の計測を再度開始する。
また、実行部200は、正常動作情報として、タイマ部220内のタイマレジスタ222に、計測する期間を設定する情報を送信してもよい。この場合、タイマ部220は、タイマレジスタ222として、現時点におけるタイマ値を格納するタイマ値レジスタを備える。タイマ部220は、タイマ部220内のタイマ値レジスタに設定すべきタイマ値を正常動作情報として受信し、220内のタイマ値レジスタに格納し、タイマ値を用いて設定された期間の計測を再度開始する。
【0024】
障害処理部210は、通常処理中に第1の期間実行部200が正常に動作していないこと、第1の障害処理中に第2の期間実行部200が正常に動作していないこと、第2の障害処理中に第3の期間実行部200が正常に動作していないこと、及び第3の障害処理中に第4の期間実行部200が正常に動作していないことを、タイマ部220を用いて検出する。ここで、障害処理部210は、タイマ部220に設定する第1の期間、第2の期間、第3の期間、及び第4の期間を、全てが等しい長さの期間に設定してもよいし、通常処理、第1の障害処理、第2の障害処理、及び第3の障害処理の内容に対応して異なる長さの期間に設定してもよい。
【0025】
障害情報取得部230は、記憶装置110内で発生した障害についての障害情報を実行部200から取得し、記憶装置110全体をリセットした場合においても記録内容が失われない記憶領域である障害情報レジスタ232に格納する。そして、障害情報取得部230は、計算機120からの指示を受けて、障害情報レジスタ232に格納した障害情報を、通信ユニット245を介して計算機120に転送する。計算機120の使用者又は記憶装置110の管理者は、記憶装置110から転送された障害情報に基づき、記憶装置110の障害の解析、特定及び復旧を行う。
【0026】
次に、実行部200の構成を詳細に説明する。実行部200は、プロセッサ240、通信ユニット245、入出力制御ユニット250、駆動部255、メモリ260、及びメモリ制御ユニット270を有する。
プロセッサ240は、記憶装置110を制御する命令を実行する機能ユニットである。プロセッサ240は、プロセッサ240が命令を実行する際に用いるレジスタ242を含む。本実施形態に代えて、実行部200は、複数のプロセッサ240を有してもよい。
通信ユニット245は、計算機120との間でのコマンド又はデータの送受信を行う機能ユニットである。通信ユニット245は、計算機120との通信に関する設定情報や通信状態を示す情報等を保持するレジスタ247を含む。
入出力制御ユニット250は、通信ユニット245を介して計算機120から受信した要求コマンドに対応して駆動部255を制御し、データの読み出し又は書き込みを行わせる機能ユニットである。入出力制御ユニット250は、駆動部255におけるデータ格納形式の設定情報や駆動部255のアクセス状態等を保持するレジスタ252を含む。
【0027】
駆動部255は、入出力制御ユニット250からの指示に基づき、機械的動作によりデータの読み出し又は書込みを行う機能ユニットである。駆動部255は、通信ユニット245及び入出力制御ユニット250経由で外部から受けたデータを格納する記録媒体257と、記録媒体257のアクセスに用いるモータ部258及びヘッド部259とを含む。本実施形態に係る入出力制御ユニット250は、記録媒体257内のデータをアクセスする際に、まず、モータ部258を制御しヘッド部259を記録媒体257上の対象データの記録部分に位置させる。次に、入出力制御ユニット250は、モータ部258を制御し、ヘッド部259を用いて対象データをアクセスする。また、駆動部255は、障害処理部210が第1の障害処理の開始を指示した際にPWROFF信号218からの信号を受けて、モータ部258の動作及びヘッド部259による記録媒体257のアクセスを停止させる。
【0028】
メモリ260は、記憶装置110の制御に用いるプロセッサ240のプログラム及びデータ等を格納するROM及び/又はRAM等のメモリである。メモリ260は、記憶装置110の制御に関するプログラム及びデータを格納する通常使用領域262、及び記憶装置110内で発生した障害についての障害情報を格納する障害情報記録部264を含む。
メモリ制御ユニット270は、障害処理部210、タイマ部220、障害情報取得部230、プロセッサ240、通信ユニット245、入出力制御ユニット250、及びメモリ260を接続し、これらの間のデータ転送等を中継する。メモリ制御ユニット270は、障害処理部210、タイマ部220、障害情報取得部230、プロセッサ240、通信ユニット245、入出力制御ユニット250、及びメモリ260の間のデータ転送に関する設定情報等を保持するレジスタ272を含む。
I/Oバス280は、障害処理部210、タイマ部220、障害情報取得部230、通信ユニット245、入出力制御ユニット250、及びメモリ制御ユニット270を接続する。I/Oバス280は、プロセッサ240、メモリ260及びメモリ制御ユニット270等と、通信ユニット245及び入出力制御ユニット250等の周辺デバイスとを接続する、例えばPCI−SIG(PCI Special Interest Group)により規格化されるPCIバス等の入出力バスであってよい。
【0029】
本実施形態に係る実行部200は、レジスタ242、レジスタ247、レジスタ252、通常使用領域262、及びレジスタ272等に保持された内部状態を用いて処理を行う。レジスタ242は、本発明に係る第1の記録部の一例である。また、レジスタ247、レジスタ252、及びレジスタ272は、本発明に係る第2の記録部の一例である。
第2の障害処理を開始するために、障害処理部210がプロセッサ240をリセットすると、レジスタ242は初期化される。従って、第2の障害処理の開始後には、障害情報取得部230は、通常処理後又は第1の障害処理の開始直後におけるレジスタ242の内部状態を取得できない。また、第3の障害処理を開始させるために、障害処理部210が記憶装置110全体をリセットすると、レジスタ242、レジスタ247、レジスタ252、及びレジスタ272は初期化される。従って、第3の障害処理の開始後には、障害情報取得部230は、第2の障害処理の開始直後におけるレジスタ242、レジスタ247、レジスタ252、及びレジスタ272の内部状態を取得できない。一方、通常使用領域262及び障害情報記録部264は、障害処理部210が第2の障害処理又は第3の障害処理を開始させた場合においても初期化されない。
【0030】
障害情報取得部230は、第1の障害処理の開始後に、プロセッサ240に保持されている内部状態であって、第2の障害処理の開始後には取得できない内部状態を、障害情報としてレジスタ242から取得する。ここで、第1の障害処理において、プロセッサ240は、レジスタ242に保持された内部状態の一部又は全部を取得して、障害情報記録部264に格納してもよい。この場合、障害情報取得部230は、障害情報記録部264に格納されたプロセッサ240の内部状態を、障害情報として取得し障害情報レジスタ232に格納する。また、第1の障害処理の開始後に、プロセッサ240は、プロセッサ240内のレジスタ242以外の部分が保持する情報であって、第2の障害処理が開始された場合に初期化される情報を、障害情報記録部264に格納してもよい。
【0031】
同様に、障害情報取得部230は、第2の障害処理の開始後に、実行部200内に保持されている内部状態であって、第3の障害処理の開始後には取得できない内部状態を、障害情報としてレジスタ242、レジスタ247、レジスタ252、及びレジスタ272から取得する。ここで、第2の障害処理において、プロセッサ240は、レジスタ242、レジスタ247、レジスタ252、及びレジスタ272をアクセスし、これらに保持された内部状態の一部又は全部を取得して、障害情報記録部264に格納してもよい。この場合、障害情報取得部230は、障害情報記録部264に格納されたプロセッサ240の内部状態を、障害情報として取得し障害情報レジスタ232に格納する。また、第2の障害処理の開始後に、プロセッサ240は、プロセッサ240内のレジスタ242以外の部分、通信ユニット245内のレジスタ247以外の部分、入出力制御ユニット250内のレジスタ252以外の部分、メモリ制御ユニット270内のレジスタ272以外の部分が保持する情報であって、第3の障害処理が開始された場合に初期化される情報を、障害情報記録部264に格納してもよい。
【0032】
以上に加え、障害情報取得部230は、第3の障害処理の開始後に、障害情報レジスタ232に格納された記憶装置110各部の内部状態に加え、通常使用領域262が格納する情報を障害情報として更に取得してもよい。
【0033】
図3は、本実施形態に係る記憶装置110の処理の流れを示す。
まず、記憶装置110に電源が投入されると、記憶装置110が初期化される(S300)。記憶装置110の初期化の際に、障害処理部210は、処理状態レジスタ212を”0”とし、記憶装置110が通常処理中であることを設定する。次に、障害処理部210は、タイマ部220内のタイマレジスタ222を設定し、第1の期間の計測を開始させる(S305)。次に、記憶装置110は、通常処理を行う(S310)。ここで、プロセッサ240は、通常処理中において第1の期間未満の間隔でメモリ制御ユニット270及びI/Oバス280を介してタイマ部220に正常動作情報を送信し、S305に処理を進めて第1の期間の計測を再度開始させる(S315)。
【0034】
第1の期間プロセッサ240が正常に動作していないことを検出した場合、タイマ部220は、タイムアウトを障害処理部210に通知する(S315)。障害処理部210は、タイムアウトの通知を受けると、NMI信号215を用いてプロセッサ240にノンマスカブル割り込みを行う(S320)。次に、障害処理部210は、PWROFF信号218を用いて、駆動部255にモータ部258の動作及びヘッド部259による記録媒体257のアクセスを停止させる(S325)。次に、障害処理部210は、処理状態レジスタ212を”1”とし、記憶装置110が第1の障害処理中であることを設定すると共に、タイマ部220内のタイマレジスタ222を設定し、第2の期間の計測を開始させる(S330)。
【0035】
次に、記憶装置110は、第1の障害処理を行う(S335)。すなわち、プロセッサ240は、レジスタ242等に保持された内部状態を取得して障害情報記録部264に格納する。そして、障害情報取得部230は、障害情報記録部264に格納されたレジスタ242等の内部状態を、障害情報として取得し障害情報レジスタ232に格納する。第1の障害処理を完了すると、プロセッサ240は、S300へ処理を進め(S340)、障害処理部210に記憶装置110全体のリセットを指示させる(S300)。また、プロセッサ240は、第1の障害処理中において第2の期間未満の間隔でタイマ部220に正常動作情報を送信し、S330に処理を進めて第2の期間の計測を再度開始させる(S345)。
【0036】
第2の期間プロセッサ240が正常に動作していないことを検出した場合、タイマ部220は、タイムアウトを障害処理部210に通知する(S345)。障害処理部210は、タイムアウトの通知を受けると、CPURESET信号216を用いてプロセッサ240をリセットする(S350)。次に、障害処理部210は、処理状態レジスタ212を”2”とし、記憶装置110が第2の障害処理中であることを設定すると共に、タイマ部220内のタイマレジスタ222を設定し、第3の期間の計測を開始させる(S355)。
【0037】
次に、記憶装置110は、第2の障害処理を行う(S360)。すなわち、プロセッサ240は、レジスタ242、レジスタ247、レジスタ252、及びレジスタ272等に保持された内部状態を取得して障害情報記録部264に格納する。そして、障害情報取得部230は、障害情報記録部264に格納されたレジスタ242、レジスタ247、レジスタ252、及びレジスタ272等の内部状態を、障害情報として取得し障害情報レジスタ232に格納する。第2の障害処理を完了すると、プロセッサ240は、S300へ処理を進め(S365)、記憶装置110全体のリセットを障害処理部210に指示させる(S300)。また、プロセッサ240は、第2の障害処理中において第3の期間未満の間隔でタイマ部220に正常動作情報を送信し、S355に処理を進めて第3の期間の計測を再度開始させる(S370)。
【0038】
第3の期間プロセッサ240が正常に動作していないことを検出した場合、タイマ部220は、タイムアウトを障害処理部210に通知する(S370)。障害処理部210は、タイムアウトの通知を受けると、CPURESET信号216及びSYSRESET信号217を用いて記憶装置110全体をリセットする(S375)。次に、障害処理部210は、処理状態レジスタ212を”3”とし、記憶装置110が第3の障害処理中であることを設定すると共に、タイマ部220内のタイマレジスタ222を設定し、第4の期間の計測を開始させる(S380)。
【0039】
次に、記憶装置110は、第3の障害処理を行う(S385)。すなわち、障害情報取得部230は、通常使用領域262及び障害情報記録部264に格納された記憶装置110の内部状態を、障害情報として取得し障害情報レジスタ232に格納する。第3の障害処理を完了すると、プロセッサ240は、S300へ処理を進め(S390)、障害処理部210に記憶装置110全体のリセットを指示させる(S300)。また、プロセッサ240は、第3の障害処理中において第4の期間未満の間隔でタイマ部220に正常動作情報を送信し、S380に処理を進めて第3の期間の計測を再度開始させる(S395)。
【0040】
第4の期間プロセッサ240が正常に動作していないことを検出した場合、タイマ部220は、タイムアウトを障害処理部210に通知する(S395)。障害処理部210は、タイムアウトの通知を受けると、処理をS300に進め、記憶装置110を初期化させる。
【0041】
以上の処理に代えて、実行部200は、S335、S360、及び/又はS385の障害処理において、記憶装置110内の各部の障害復旧処理を行ってもよい。この場合、実行部200は、障害復旧が正しく行われた場合に処理をS305に進めてもよい。
【0042】
図4は、本実施形態に係る計算機120のハードウェア構成の一例を示す。本実施形態に係る計算機120は、CPU410、ROM420、RAM430、通信インターフェイス440、ハードディスクドライブ450、フロッピーディスクドライブ460、CD−ROMドライブ470、及びI/Oインターフェイス480を備える。CPU410は、ROM420及びRAM430に格納されたプログラムに基づいて動作し、各部の制御を行う。通信インターフェイス440は、ネットワークを介して他の装置と通信する。ハードディスクドライブ450は、計算機120が使用するプログラム及びデータを格納する。フロッピーディスクドライブ460は、フロッピーディスク490からプログラム又はデータを読み取りI/Oインターフェイス480に提供する。CD−ROMドライブ470は、CD−ROM495からプログラム又はデータを読み取りI/Oインターフェイス480に提供する。I/Oインターフェイス480は、フロッピーディスクドライブ460又はCD−ROMドライブ470から提供されたプログラム又はデータを記憶装置110に送信する。
【0043】
記憶装置110に提供されるプログラムは、フロッピーディスク490又はCD−ROM495等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、I/Oインターフェイス480を介して記憶装置110にインストールされ、記憶装置110において実行される。これに代えて、記憶装置110は、更にフロッピーディスクドライブ460又はCD−ROMドライブ470等を備え、プログラムを記録媒体から直接読み出して実行してもよい。
【0044】
記録媒体に格納されて記憶装置110に提供されるプログラムは、実行モジュールと、障害処理モジュールと、タイマモジュールと、障害情報取得モジュールとを備える。これらのモジュールは、記憶装置110を、実行部200、障害処理部210、タイマ部220、及び障害情報取得部230として動作させるプログラムである。
【0045】
以上に示したプログラム又はモジュールは、外部の記憶媒体に格納されてもよい。記憶媒体としては、フロッピーディスク490、CD−ROM495の他に、DVDやPD等の光学記録媒体、MD等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークやインターネットに接続されたサーバシステムに設けたハードディスク又はRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムを記憶装置110に提供してもよい。
【0046】
図5は、本実施形態の第1変形例に係る記憶装置110の構成を示す。図5における実行部200及び障害情報取得部230は、図2の対応する部材と同様であるため説明を省略する。
【0047】
本変形例において、I/Oバス280は、PCI−SIGによる仕様書「PCI Bus Power Management Interface 1.1」等により定義される、電源を制御するためのPME#信号(Power Management Event)を備えるPCIバスであることを前提として説明する。これに代えて、I/Oバス280は、電源を制御するためのインターフェイスを備える他の入出力バスであってもよい。
【0048】
電源ユニット500は、記憶装置110を動作させるために使用される主電力を、記憶装置110内の各部へ供給する。ここで、電源ユニット500は、I/Oバス280に接続される障害情報取得部230、通信ユニット245、及び電源制御装置510に対しては、I/Oバス280の電源ピンVccを介して主電力を供給する。
また、電源ユニット500は、I/Oバス280上のPME#信号を介して、記憶装置110の電源のONの指示を受ける。PME#信号が論理値1である場合、電源ユニット500は、主電力の供給を開始して、記憶装置110の電源をONとする。一方、電源ユニット500は、電源制御装置510からのPWRCTL信号を介して、記憶装置110の電源のOFFの指示を受ける。PWRCTL信号が論理値1である場合、電源ユニット500は、主電力の供給を停止して、記憶装置110の電源をOFFとする。
【0049】
また、電源ユニット500は、主電力の供給を行っている場合及び主電力の供給を停止している場合の両方において、電源ピンVccAUXを介して補助電力をI/Oバス280に供給する。すなわち、電源ユニット500は、外部の電源から電源ユニット500に電力が供給されている場合、常に補助電力をI/Oバス280に供給する。
【0050】
電源制御装置510は、実行部200と障害情報取得部230と電源ユニット500を備える記憶装置110本体のI/Oバス280に接続されるI/Oカードであり、電源ユニット500を制御する。電源制御装置510は、I/Oバス280を介して供給される補助電力VccAUXを用いて、主電力が供給されている場合及び主電力の供給が停止されている場合の両方で動作する。電源制御装置510は、障害処理部210、タイマ部220、電力取得部520、及び電源制御部530を有する。障害処理部210及びタイマ部220は、図2に示した障害処理部210とタイマ部220とほぼ同様であるため、以下相違点を中心に説明する。
【0051】
タイマ部220は、図3のS395において、第3の障害処理中に第4の期間実行部200が正常に動作していないことを検出し、障害処理部210に通知する。
障害処理部210は、第3の障害処理中における実行部200の異常の通知をタイマ部220から受けると、電源制御部530が電源ユニット500に供給するPWRCTL信号を論理値1とさせることにより、電源ユニット500に主電力の供給の停止を指示し、第4の障害処理を開始させる。
【0052】
電力取得部520は、記憶装置110の動作に使用する主電力であるVccを、記憶装置110内のI/Oバス280から取得する。
電源制御部530は、障害処理部210から主電力の供給を停止させる指示を受けると、PWRCTL信号を論理値1とする。これにより、電源制御部530は、I/Oバス280の指示に従い、電源ユニット500による主電力の供給を停止させる。
また、電源制御部530は、記憶装置110に対する電源ユニット500からの主電力の供給が停止していることを必要条件として、I/Oバス280のPME#信号を論理値1とし、I/Oバス280を介して主電力の供給の開始を指示する。これにより、電源制御部530は、記憶装置110の電源がOFFの場合に、記憶装置110の電源をONとし、記憶装置110を起動することができる。
【0053】
次に、図3のS395においてタイムアウトが発生した場合における、本変形例の記憶装置110の動作を説明する。S395においてタイムアウトが発生すると、電源制御装置510は、第4の障害処理を行う。具体的には、障害処理部210は、電源制御部530を介して電源ユニット500による主電力の供給を停止させる。主電力の供給が停止すると、電源制御部530は、電源ユニット500から主電力の供給を再開させる。電源ユニット500からの主電力の供給が再開されると、記憶装置110は、図3のS300から順に処理を進める。
これにより、電源ユニット500は、第4の障害処理として、記憶装置110の電源を一旦OFFとした後、再度電源をONとすることができる。従って、本変形例に係る電源制御装置510により、記憶装置110全体のリセットで回復できない障害においても、記憶装置110の動作を回復できる可能性を得ることができる。
【0054】
また、電源制御装置510は、停電により電源ユニット500からの主電力の供給が停止された場合においても、その後停電状態が解除された場合に記憶装置110を起動することができる。具体的には、記憶装置110は、この場合において以下に示す動作を行う。
【0055】
まず、電源ユニット500は、停電が発生すると主電力Vcc及び補助電力VccAUXの供給を停止する。停電状態が解除されると、電源ユニット500は、主電力の供給は停止した状態で、補助電力の供給を開始する。
補助電力の供給が開始されると、電源制御装置510は電源制御の動作を再開する。そして、電源制御部530は、主電力の供給が停止していることを検出し、PME#信号を用いて電源ユニット500に主電力の供給の開始を指示する。電源ユニット500は、電源制御部530からの指示を受けて、主電力の供給を再開する。
以上に示した通り、本変形例に係る電源制御装置510により、停電が復旧した後自動的に記憶装置110の主電力の供給を開始させることができ、停電の復旧後に記憶装置110を自動的に起動させることができる。
【0056】
以上に代えて、障害処理部210は、第1の障害処理乃至第4の障害処理の開始の指示の組合せとして、例えば、第1の障害処理は記憶装置110全体のリセットで第2の障害処理は記憶装置110の電源OFF/ON等の、他の組合せを用いてもよい。
また、電源制御部530は、主電力の供給が停止してから所定の時間(例えば10秒等)経過したことを必要条件として、I/Oバス280を介して主電力の供給の開始を指示してもよい。これにより、電源制御部530は、記憶装置110内のコンデンサ等の放電を待って、記憶装置110の電源をONとすることができる。また、電源制御部530は、障害処理部210が主電力の供給の停止を指示したことにより電源制御部530が主電力の供給を停止させ、この結果主電力の供給が停止していることを必要条件として、I/Oバス280を介して主電力の供給の開始を指示してもよい。これにより、電源制御部530は、記憶装置110の使用者が記憶装置110の電源をOFFとした場合に、使用者の意図に反して記憶装置110の電源をONとするのを防ぐことができる。
【0057】
図6は、本実施形態の第2変形例に係る電源制御装置510の電源制御部分を示す。本変形例に係る電源制御装置510は、障害処理部210、タイマ部220、電力取得部520、及び電源制御部530に加え、スイッチ610及びポリスイッチ620を有する。本変形例における障害処理部210、タイマ部220、電力取得部520及び電源制御部530は、図5の対応する部材と同様であるため説明を省略する。
【0058】
スイッチ610は、ポリスイッチ620を介して入力される主電力と、グランドとの間に位置する。そして、スイッチ610は、電源制御部530のPWRCTL信号が論理値1である場合に、記憶装置110の主電力Vccをグランドにショートさせる。
ポリスイッチ620は、電力取得部520から入力される主電力と、スイッチ610の間に位置する。そして、ポリスイッチ620は、スイッチ610が主電力をグランドにショートさせた場合において、主電力とグランドの間に過電流が流れると、主電力とグランド間の電流の流れを切断する。
【0059】
本変形例に係る電源制御装置510は、以下に示す動作により、電源ユニット500からの主電力の供給を停止させる。
まず、電源制御部530は、障害処理部210から主電力の供給を停止させる指示を受ける。次に、電源制御部530は、PWRCTL信号を論理値1とする。次に、スイッチ610は、PWRCTL信号が論理値1に変化したため、電流を通過させる状態として主電力をグランドにショートさせる。
主電力がグランドにショートされると、主電力とグランドの間に過電流が流れる。ポリスイッチ620は、主電力とグランドの間に過電流が流れると、主電力とグランド間の電流の流れを切断する。これにより、ポリスイッチ620は、主電力とグランドのショート状態を、短期間で終わらせる。一方、電源ユニット500は、ショート状態を検出して過電流保護機能(O.C.P:Over Current Protection)を動作させ、主電力の供給を停止する。
【0060】
以上に示した様に、本変形例に係る電源制御装置510は、電源ユニット500の過電流保護機能を利用して、主電力の供給を停止させる。このため、図5のPWRCTL信号に相当する信号を電源ユニット500に設けることなく、主電力の供給を停止させることができる。
【0061】
以上に示した様に、本実施形態に係る記憶装置110によれば、障害処理部210は、タイマ部220を用いて設定された期間実行部200が正常に動作していないことを検出し、実行部200に障害処理を開始させることができる。また、障害処理部210は、記憶装置110が通常処理、第1の障害処理、第2の障害処理のいずれを実行している際にプロセッサ240の異常を検出したかに応じて、異なる障害処理を開始させることができる。具体的には、第1の障害処理はプロセッサ240に対する割り込みを用いて、第2の障害処理はプロセッサ240のリセットを用いて、また第3の障害処理は記憶装置110全体のリセットを用いてそれぞれ障害処理を開始させることで、障害処理の段階を第1の障害処理、第2の障害処理、第3の障害処理と進める毎に、より重度の高い障害から回復させることができる。そして、本実施形態の変形例に係る電源制御装置510は、記憶装置110の電源を一旦OFFとした後に再度ONとする、第4の障害処理を提供する。従って、電源制御装置510を用いることにより、記憶装置110全体のリセットで回復できない障害においても、動作を回復できる可能性を備える記憶装置110を提供することができる。
【0062】
また、本実施形態に係る記憶装置110によれば、障害処理部210は、設定された期間プロセッサ240が正常に動作していないことを検出した際に、内部状態を初期化する範囲が小さい第1の障害処理から順に障害処理を段階的に進める。これにより、障害情報取得部230は、障害を解析、特定、及び/又は復旧するために用いる障害情報を、可能な限り多く取得することができる。一方、障害の重度が高い場合においても、障害処理部210は、最終的には第3の障害処理の開始時に記憶装置110全体をリセットする。従って、本実施形態に係る記憶装置110によれば、障害が発生した場合においても記憶装置110の動作を回復する可能性を高くすることができる。
【0063】
更に、本実施形態に係る記憶装置110によれば、障害処理部210は、第1の障害処理の開始時に駆動部255の動作を停止させる。このため、記憶装置110は、障害が発生した場合に記録媒体257自体又は記録媒体257に格納されたデータが、機械的又は電気的に破壊するのを防ぐことができる。
【0064】
以上、本発明を実施形態を用いて説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。上記実施形態に、多様な変更または改良を加えることができる。そのような変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0065】
例えば、駆動部255は、モータ部258及び/又はヘッド部259等の機械的動作を行う装置には限定されない。また、記憶装置110は、更に入力装置や表示装置等を備えるPC,ワークステーション、又はサーバ等の計算機であってもよい。この場合、記憶装置110は、記憶装置110上で実行されるアプリケーションソフトウェア及び/又はオペレーティングシステム等の動作がハングアップしたことを、タイムアウトにより検出することができる。従って、記憶装置110は、障害を解析、特定及び/又は復旧するために用いる障害情報を、可能な限り多く障害情報取得部230に取得させることができる。そして、本実施形態の変形例に係る電源制御装置510は、記憶装置110上で実行されるアプリケーションソフトウェア及び/又はオペレーティングシステムに障害が発生し、オペレーティングシステムが記憶装置110をシャットダウンして電源をOFFとした場合においても、記憶装置110を再起動させることができる。
【0066】
また、本実施形態に係る実行部200は、プロセッサ240に代えて通常処理、第1の障害処理、第2の障害処理、及び第3の障害処理をハードウェアのみで処理する制御回路により実現されてもよい。
【0067】
以上に説明した実施形態によれば、以下の各項目に示す情報処理装置、電源制御装置、情報処理装置制御方法、プログラム、及び記録媒体が実現される。
【0068】
(項目1) 通常処理、第1の障害処理、及び第2の障害処理を含む処理のいずれかを実行する実行部と、前記通常処理中に、前記実行部が第1の期間正常に動作していないことを必要条件として、前記実行部に第1の障害処理を開始させ、前記第1の障害処理中に、前記実行部が第2の期間正常に動作していないことを必要条件として、前記実行部に第2の障害処理を開始させる障害処理部と、前記第1の障害処理の開始後における前記実行部の内部状態であって、前記第2の障害処理の開始後には取得できない内部状態を、障害情報として取得する障害情報取得部とを備えることを特徴とする情報処理装置。
(項目2) 前記実行部は、前記障害処理部が前記第2の障害処理を開始させた場合に初期化される前記内部状態を保持する第1の記録部と、前記障害処理部が前記第2の障害処理を開始させた場合においても初期化されない障害情報記録部とを有し、前記第1の障害処理において、前記実行部は、前記第1の記録部に保持された前記内部状態を取得して、前記障害情報記録部に格納し、前記障害情報取得部は、前記障害情報記録部に格納された前記内部状態を、前記障害情報として取得することを特徴とする項目1記載の情報処理装置。
(項目3) 前記実行部は、前記障害処理部が前記第2の障害処理を開始させた場合においても初期化されない第2の記録部を有し、前記障害情報取得部は、前記障害情報記録部に格納された前記内部状態に加え、前記第2の記録部が格納する情報を前記障害情報として更に取得することを特徴とする項目2記載の情報処理装置。
【0069】
(項目4) 前記実行部は、前記障害処理部が前記第2の障害処理を開始させた場合に初期化される機能ユニットと、前記障害処理部が前記第2の障害処理を開始させた場合においても初期化されない障害情報記録部とを有し、前記第1の障害処理において、前記実行部は、前記機能ユニットが保持する情報を前記内部状態として前記障害情報記録部に格納し、前記障害情報取得部は、前記障害情報記録部に格納された前記内部状態を、前記障害情報として出力することを特徴とする項目1記載の情報処理装置。
(項目5) 前記実行部が正常動作していることを示す正常動作情報を、設定された期間前記実行部から受信しない場合に、前記実行部が設定された正常動作していないことを検出するタイマ部を更に備え、前記障害処理部は、前記実行部が前記通常処理中に前記第1の期間正常に動作していないこと、及び前記実行部が前記第1の障害処理中に前記第2の期間正常に動作していないことを、前記タイマ部を用いて検出することを特徴とする項目1記載の情報処理装置。
(項目6) 前記実行部は、設定された期間の計測を前記タイマ部に開始させることを示す情報を、前記正常動作情報として前記タイマ部に送信することを特徴とする項目5記載の情報処理装置。
【0070】
(項目7) 前記実行部は、前記情報処理装置を制御する命令を実行するプロセッサを有し、前記障害処理部は、前記プロセッサに対して割り込みを行うことにより前記第1の障害処理を開始させることを特徴とする項目1記載の情報処理装置。
(項目8) 前記障害処理部は、前記プロセッサをリセットすることにより前記第2の障害処理を開始させることを特徴とする項目7記載の情報処理装置。
(項目9) 前記障害処理部は、前記情報処理装置をリセットすることにより前記第2の障害処理を開始させることを特徴とする項目7記載の情報処理装置。
(項目10) 前記実行部は、前記情報処理装置を制御する命令を実行するプロセッサを有し、前記障害処理部は、前記プロセッサをリセットすることにより前記第1の障害処理を開始させ、前記情報処理装置をリセットすることにより前記第2の障害処理を開始させることを特徴とする項目1記載の情報処理装置。
【0071】
(項目11) 前記障害処理部は、前記第2の障害処理中に、前記実行部が第3の期間正常に動作していないことを必要条件として、前記実行部に第3の障害処理を更に開始させ、前記障害情報取得部は、前記第2の障害処理の開始後における前記実行部の内部状態であって、前記第3の障害処理の開始後には取得できない内部状態を、前記第3の障害処理における前記障害情報として取得することを特徴とする項目1記載の情報処理装置。
(項目12) 機械的動作を行う駆動部を更に備え、前記障害処理部は、前記第1の障害処理の開始を前記実行部に指示する場合に、前記駆動部の動作を停止させることを特徴とする項目1記載の情報処理装置。
(項目13) 前記情報処理装置は、外部から受けたデータを格納する記録媒体と、前記記録媒体のアクセスに用いるモーター部及びヘッド部とを更に備える記憶装置であって、前記障害処理部は、前記第1の障害処理の開始を前記実行部に指示する場合に、前記モーター部の動作及び前記ヘッド部による前記記録媒体のアクセスを停止させることを特徴とする項目1記載の情報処理装置。
【0072】
(項目14) 前記障害処理部は、前記第1の期間及び前記第2の期間として、同一の期間を用いることを特徴とする項目1記載の情報処理装置。
(項目15) 前記情報処理装置本体の入出力バスに接続され、前記情報処理装置を動作させるために使用される主電力を前記情報処理装置から入力する電源制御装置を更に備え、前記障害処理部は、前記入出力バスを介して前記主電力の供給の停止を指示することにより前記第2の障害処理を開始させ、前記第2の障害処理において、前記電源制御装置は、前記情報処理装置に対する前記主電力の供給が停止していることを必要条件として、前記入出力バスを介して主電力の供給の開始を指示し、前記情報処理装置を起動させることを特徴とする項目1記載の情報処理装置。
【0073】
(項目16) 情報処理装置の入出力バスに接続される電源制御装置であって、前記情報処理装置の動作に使用する主電力を、前記情報処理装置から取得する電力取得部と、前記主電力の供給が停止していることを必要条件として、前記入出力バスを介して前記主電力の供給の開始を指示し、前記情報処理装置を起動させる電源制御部とを備えることを特徴とする電源制御装置。
(項目17) 前記入出力バスは、PCIバスであり、前記電源制御部は、前記PCIバスのPME#(Power Management Event)信号を用いて前記主電力の供給の開始を指示することを特徴とする項目16記載の電源制御装置。
(項目18) 前記電源制御部は、前記主電力の供給が停止してから所定の時間経過したことを必要条件として、前記入出力バスを介して前記主電力の供給の開始を指示することを特徴とする項目16記載の電源制御装置。
【0074】
(項目19) 前記情報処理装置が正常に動作していないと判断した場合に、前記入出力バスを介して前記主電力の供給の停止を指示する障害処理部を更に備えることを特徴とする項目16記載の電源制御装置。
(項目20) 前記電源制御部は、前記情報処理装置が正常に動作していない場合に前記主電力をショートさせることにより、前記情報処理装置内に設けられ、前記主電力を供給する電源ユニットの過電流保護機能を動作させ、前記電源ユニットによる前記主電力の供給を停止させることを特徴とする項目16記載の電源制御装置。
(項目21) 前記電源制御部は、前記障害処理部が前記主電力の供給の停止を指示したこと、及び前記主電力の供給が停止していることを必要条件として、前記入出力バスを介して前記主電力の供給の開始を指示することを特徴とする項目16記載の電源制御装置。
(項目22) 停電により前記主電力の供給が停止され、その後停電状態が解除された場合に、前記電源制御部は、前記入出力バスを介して前記主電力の供給の開始を指示して、前記情報処理装置を起動させることを特徴とする請求項16記載の電源制御装置。
【0075】
(項目23) 情報処理装置に処理を行わせる情報処理装置制御方法であって、前記情報処理装置に、通常処理、第1の障害処理、及び第2の障害処理を含む処理のいずれかを実行させ、前記通常処理が第1の期間正常に動作していないことを必要条件として、第1の障害処理を開始させ、前記第1の障害処理が第2の期間正常に動作していないことを必要条件として、第2の障害処理を開始させ、前記第1の障害処理の開始後における前記実行部の内部状態であって、前記第2の障害処理の開始後には取得できない内部状態を、障害情報として取得させることを特徴とする情報処理装置制御方法。
(項目24) 情報処理装置に処理を行わせるプログラムであって、前記情報処理装置を、通常処理、第1の障害処理、及び第2の障害処理を含む処理のいずれかを実行する実行部と、前記通常処理中に、前記実行部が第1の期間正常に動作していないことを必要条件として、前記実行部に第1の障害処理を開始させ、前記第1の障害処理中に、前記実行部が第2の期間正常に動作していないことを必要条件として、前記実行部に第2の障害処理を開始させる障害処理部と、前記第1の障害処理の開始後における前記実行部の内部状態であって、前記第2の障害処理の開始後には取得できない内部状態を、障害情報として取得する障害情報取得部として動作させることを特徴とするプログラム。
(項目25) 前記情報処理装置を、前記実行部が正常動作していることを示す正常動作情報を、設定された期間前記実行部から受信しない場合に、前記実行部が設定された正常動作していないことを検出するタイマ部として更に動作させ、前記障害処理部は、前記実行部が前記通常処理中に前記第1の期間正常に動作していないこと、及び前記実行部が前記第1の障害処理中に前記第2の期間正常に動作していないことを、前記タイマ部を用いて検出することを特徴とする項目24記載のプログラム。
【0076】
(項目26) 情報処理装置に処理を行わせるプログラムを記録した記録媒体であって、前記プログラムは、前記情報処理装置を、通常処理、第1の障害処理、及び第2の障害処理を含む処理のいずれかを実行する実行部と、前記通常処理中に、前記実行部が第1の期間正常に動作していないことを必要条件として、前記実行部に第1の障害処理を開始させ、前記第1の障害処理中に、前記実行部が第2の期間正常に動作していないことを必要条件として、前記実行部に第2の障害処理を開始させる障害処理部と、前記第1の障害処理の開始後における前記実行部の内部状態であって、前記第2の障害処理の開始後には取得できない内部状態を、障害情報として取得する障害情報取得部として動作させることを特徴とする記録媒体。
(項目27) 前記プログラムは、前記情報処理装置を、前記実行部が正常動作していることを示す正常動作情報を、設定された期間前記実行部から受信しない場合に、前記実行部が設定された正常動作していないことを検出するタイマ部として更に動作させ、前記障害処理部は、前記実行部が前記通常処理中に前記第1の期間正常に動作していないこと、及び前記実行部が前記第1の障害処理中に前記第2の期間正常に動作していないことを、前記タイマ部を用いて検出することを特徴とする項目26記載の記録媒体。
【0077】
【発明の効果】
上記説明から明らかなように、本発明によれば、障害復旧の可能性を高めることにより情報処理装置の信頼性を更に高め、情報処理装置の各部に発生する障害の種類に応じて適切な障害処理を行う情報処理装置及び電源制御装置を提供することができる。
【図面の簡単な説明】
【図1】 本発明の実施形態に係る計算機システム100の構成を示す。
【図2】 本発明の実施形態に係る記憶装置110の構成を示す。
【図3】 本発明の実施形態に係る記憶装置110の処理の流れを示す。
【図4】 本発明の実施形態に係る計算機120のハードウェア構成の一例を示す。
【図5】 本発明の実施形態の第1変形例に係る記憶装置110の構成を示す。
【図6】 本発明の実施形態の第2変形例に係る電源制御装置510の電源制御部分を示す。
【符号の説明】
100 計算機システム
110 記憶装置
120 計算機
200 実行部
210 障害処理部
212 処理状態レジスタ
215 NMI信号
216 CPURESET信号
217 SYSRESET信号
218 PWROFF信号
220 タイマ部
222 タイマレジスタ
230 障害情報取得部
232 障害情報レジスタ
240 プロセッサ
242 レジスタ
245 通信ユニット
247 レジスタ
250 入出力制御ユニット
252 レジスタ
255 駆動部
257 記録媒体
258 モータ部
259 ヘッド部
260 メモリ
262 通常使用領域
264 障害情報記録部
270 メモリ制御ユニット
272 レジスタ
280 I/Oバス
410 CPU
420 ROM
430 RAM
440 通信インターフェイス
450 ハードディスクドライブ
460 フロッピーディスクドライブ
470 CD−ROMドライブ
480 I/Oインターフェイス
490 フロッピーディスク
495 CD−ROM
500 電源ユニット
510 電源制御装置
520 電力取得部
530 電源制御部
610 スイッチ
620 ポリスイッチ

Claims (7)

  1. 情報処理装置の入出力バスに接続されるI/Oカード型の電源制御装置であって、前記情報処理装置の動作に使用する主電力を、前記情報処理装置の前記入出力バスから取得する電力取得部と、前記主電力の供給が停止していることを必要条件として、前記入出力バスにおける電源を制御する信号を用いて前記主電力の供給の開始を指示し、前記情報処理装置を起動させる電源制御部とを備え、
    前記電源制御部は、前記情報処理装置が正常に動作していない場合に、前記入出力バスから供給される前記主電力をグランドにショートさせることにより、前記主電力とグランドの間に過電流を流し、前記情報処理装置内に設けられ、前記主電力を供給する電源ユニットの過電流保護機能を動作させ、前記電源ユニットによる前記主電力の供給を停止させることを特徴とする電源制御装置。
  2. 前記入出力バスは、PCIバスであり、前記電源制御部は、前記PCIバスのPME#(Power Management Event)信号を用いて前記主電力の供給の開始を指示することを特徴とする請求項1記載の電源制御装置。
  3. 前記電源制御部は、前記主電力の供給が停止してから所定の時間経過したことを必要条件として、前記入出力バスを介して前記主電力の供給の開始を指示することを特徴とする請求項1記載の電源制御装置。
  4. 前記情報処理装置が正常に動作していないと判断した場合に、前記入出力バスを介して前記主電力の供給の停止を指示する障害処理部を更に備えることを特徴とする請求項1記載の電源制御装置。
  5. 前記電源制御部は、前記障害処理部が前記主電力の供給の停止を指示したこと、及び前記主電力の供給が停止していることを必要条件として、前記入出力バスを介して前記主電力の供給の開始を指示することを特徴とする請求項1記載の電源制御装置。
  6. 停電により前記主電力の供給が停止され、その後停電状態が解除された場合に、前記電源制御部は、前記入出力バスを介して前記主電力の供給の開始を指示して、前記情報処理装置を起動させることを特徴とする請求項1記載の電源制御装置。
  7. 前記情報処理装置は、
    命令を実行するプロセッサと、前記プロセッサにより制御される機能ユニットとを有し、
    通常処理、第1の障害処理、第2の障害処理、及び第3の障害処理を含む処理のいずれかを実行する実行部と、
    前記第1の障害処理、前記第2の障害処理、及び前記第3の障害処理における障害情報を前記実行部から取得する障害情報取得部
    とを備えるものであり、
    当該電源制御装置は、前記実行部が前記通常処理中において、第1の期間正常に動作していないことを必要条件として前記プロセッサに割り込むことにより、前記実行部に前記第1の障害処理を開始させて前記第2の障害処理の開始後には取得できない前記プロセッサの内部状態を前記障害情報取得部により取得させ、前記実行部が前記第1の障害処理中において、第2の期間正常に動作していないことを必要条件として前記プロセッサをリセットすることにより、前記実行部に前記第2の障害処理を開始させて前記第3の障害処理の開始後には取得できない前記機能ユニットの内部状態を前記障害情報取得部により取得させ、前記実行部が前記第2の障害処理中において、第3の期間正常に動作していないことを必要条件として当該情報処理装置をリセットすることにより、前記実行部に前記第3の障害処理を開始させて前記主電源の供給を停止後には取得できない当該情報処理装置のメモリの内容を前記障害情報取得部により取得させ、前記実行部が前記第3の障害処理中において、第4の期間正常に動作していないことを必要条件として当該情報処理装置の前記主電力の供給の停止を指示する障害処理部を更に備える請求項1記載の電源制御装置。
JP2002054572A 2001-12-20 2002-02-28 情報処理装置、電源制御装置、情報処理装置制御方法、プログラム、及び記録媒体 Expired - Lifetime JP3824548B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002054572A JP3824548B2 (ja) 2001-12-20 2002-02-28 情報処理装置、電源制御装置、情報処理装置制御方法、プログラム、及び記録媒体
US10/317,323 US20030154421A1 (en) 2001-12-20 2002-12-12 Information processing device, power source control device, and method, program, and recording medium for controlling information processing device

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001388564 2001-12-20
JP2001-388564 2001-12-20
JP2002054572A JP3824548B2 (ja) 2001-12-20 2002-02-28 情報処理装置、電源制御装置、情報処理装置制御方法、プログラム、及び記録媒体

Publications (2)

Publication Number Publication Date
JP2003248599A JP2003248599A (ja) 2003-09-05
JP3824548B2 true JP3824548B2 (ja) 2006-09-20

Family

ID=27667380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002054572A Expired - Lifetime JP3824548B2 (ja) 2001-12-20 2002-02-28 情報処理装置、電源制御装置、情報処理装置制御方法、プログラム、及び記録媒体

Country Status (2)

Country Link
US (1) US20030154421A1 (ja)
JP (1) JP3824548B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005202549A (ja) 2004-01-14 2005-07-28 Nec Corp リセット回路およびリセット方法
GB2412190B (en) * 2004-03-17 2007-03-28 Ibm A recovery framework
JP2006285384A (ja) * 2005-03-31 2006-10-19 Nec Corp プロセッサ障害処理方式、管理プロセッサ及びプロセッサ障害処理方法
JP4780715B2 (ja) * 2006-08-01 2011-09-28 東京エレクトロン株式会社 サーバ装置およびプログラム
US7873068B2 (en) * 2009-03-31 2011-01-18 Intel Corporation Flexibly integrating endpoint logic into varied platforms
JP2011022833A (ja) * 2009-07-16 2011-02-03 Toshiba Tec Corp 情報処理装置
CN102081573B (zh) * 2010-02-01 2014-04-16 杭州华三通信技术有限公司 用于记录设备重启原因的装置及方法
JP2012069032A (ja) * 2010-09-27 2012-04-05 Hitachi Cable Ltd 情報処理装置
KR102296438B1 (ko) * 2014-07-16 2021-09-01 삼성전자 주식회사 전자 장치의 충전 제어 방법 및 장치, 및 전자 장치
CN105700965A (zh) * 2014-11-26 2016-06-22 英业达科技有限公司 系统错误排除方法
US11971789B2 (en) * 2020-06-16 2024-04-30 Samsung Electronics Co., Ltd. Systems, methods, and apparatus for crash recovery in storage devices
US11829770B2 (en) * 2022-01-13 2023-11-28 Dell Products, L.P. Clustered object storage platform rapid component reboot

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2692379B1 (fr) * 1991-10-04 1996-08-14 Aerospatiale Ste Nat Indle Procede de detection et de passivation de pannes dans un systeme de traitement de donnees, et systeme de traitement de donnees adapte a sa mise en oeuvre
JP2658697B2 (ja) * 1991-12-11 1997-09-30 富士通株式会社 ウォッチ・ドック・タイマ回路
KR960014382B1 (ko) * 1993-09-15 1996-10-15 삼성전자 주식회사 자동차의 파워 윈도우 제어 시스템
US5727514A (en) * 1995-11-09 1998-03-17 Sunden; Carl Remote controlled intermittent user activated anti-corrosion fogging device for infrequently used internal combustion marine engines
JP3241279B2 (ja) * 1996-11-14 2001-12-25 株式会社日立製作所 保護機能付きスイッチ回路
US6134678A (en) * 1997-05-13 2000-10-17 3Com Corporation Method of detecting network errors
US6202169B1 (en) * 1997-12-31 2001-03-13 Nortel Networks Corporation Transitioning between redundant computer systems on a network
US6548992B1 (en) * 2001-10-18 2003-04-15 Innoveta Technologies, Inc. Integrated power supply protection circuit

Also Published As

Publication number Publication date
JP2003248599A (ja) 2003-09-05
US20030154421A1 (en) 2003-08-14

Similar Documents

Publication Publication Date Title
US7447934B2 (en) System and method for using hot plug configuration for PCI error recovery
CN101126995B (zh) 处理严重硬件错误的方法及设备
US6742139B1 (en) Service processor reset/reload
JP3824548B2 (ja) 情報処理装置、電源制御装置、情報処理装置制御方法、プログラム、及び記録媒体
US20160261455A1 (en) Automatic debug information collection
US20150106660A1 (en) Controller access to host memory
US7103738B2 (en) Semiconductor integrated circuit having improving program recovery capabilities
US20140122421A1 (en) Information processing apparatus, information processing method and computer-readable storage medium
EP3349118A1 (en) Bus hang detection and find out
CN102880527B (zh) 一种基板管理控制器的数据恢复方法
CN114116280A (zh) 交互式bmc自恢复方法、系统、终端及存储介质
CN111488050B (zh) 一种电源监控方法、系统及服务器
CN116775141A (zh) 异常检测方法、装置、计算机设备及存储介质
JP2007156921A (ja) Usbデバイス装置の異常検出・回復システム、異常検出・回復プログラム、異常検出・回復プログラムを記録した記録媒体及び異常検出・回復方法。
JP2004302731A (ja) 情報処理装置および障害診断方法
JP4411160B2 (ja) 電源断サポートを有するデータ処理装置に診断操作を実行する装置と方法
JP2003256240A (ja) 情報処理装置及びその障害回復方法
CN114385405A (zh) 一种实现服务器重启原因记录的方法、装置、系统
JP2002140209A (ja) ウオッチドッグタイマ
WO2014112039A1 (ja) 情報処理装置、情報処理装置制御方法及び情報処理装置制御プログラム
JPH11259160A (ja) コンピュータの起動方法、コンピュータ、起動処理プログラムを記録した記録媒体
CN117411779A (zh) 一种电力交换机及其故障日志记录方法
JPH10228395A (ja) 制御用コントローラの異常診断装置
CN114327972A (zh) 基于固态硬盘的数据处理方法与装置
CN115061776A (zh) 一种虚拟机异常的处理方法、电子设备和存储介质

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050621

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20050715

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20050808

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20050808

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20050808

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050912

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060317

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060620

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060627

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090707

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S202 Request for registration of non-exclusive licence

Free format text: JAPANESE INTERMEDIATE CODE: R315201

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090707

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090707

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090707

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100707

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100707

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100707

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100707

Year of fee payment: 4