JP2008052382A - 2次記憶装置の故障検出方法 - Google Patents

2次記憶装置の故障検出方法 Download PDF

Info

Publication number
JP2008052382A
JP2008052382A JP2006225975A JP2006225975A JP2008052382A JP 2008052382 A JP2008052382 A JP 2008052382A JP 2006225975 A JP2006225975 A JP 2006225975A JP 2006225975 A JP2006225975 A JP 2006225975A JP 2008052382 A JP2008052382 A JP 2008052382A
Authority
JP
Japan
Prior art keywords
failure detection
failure
storage device
secondary storage
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006225975A
Other languages
English (en)
Inventor
Tsutomu Shima
努 志磨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP2006225975A priority Critical patent/JP2008052382A/ja
Publication of JP2008052382A publication Critical patent/JP2008052382A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】2次記憶装置の入出力インターフェースも含めた故障検出、アプリケーションの実行および格納箇所に依存しない故障検出、さらには磁気ディスク、ROMなどの記憶媒体に依存しない故障検出ができる。
【解決手段】監視プログラム6は、故障検出フラグ7をONし、故障検出用I/Oプログラム5に対して故障検出要求を行う。故障検出用I/Oプログラムは、故障検出要求されたときに、デバイスドライバ2に2次記憶装置3に対する入出力要求を行い、この要求に対してデバイスドライバから正常な応答が返ってきたか否かを判定し、正常な応答がある場合は故障検出フラグをOFFする。監視プログラムは、故障検出要求を行ってから一定時間後に故障検出フラグをチェックし、故障検出フラグがON状態であれば2次記憶装置の異常と判断し、故障検出フラグがOFF状態の場合は正常と判断する。
【選択図】図1

Description

本発明は、コンピュータシステムにおける2次記憶装置の故障検出方法に係り、特にソフトウェア的に故障を検出する方法に関するものである。
コンピュータシステムでは、磁気ディスク、ROMなどを記憶媒体とする2次記憶装置に重要なデータを保存しており、システムの信頼性を高めるためには2次記憶装置が正常に維持されているか否かのチェックを行う故障検出手段を設けている。
この故障検出方法としては、アプリケーションプログラムの実行に際してデバイスドライバに要求を出すことにより、以下の手順になる図3のような手順で故障検出を行う。
(S1)アプリケーションプログラム1がデバイスドライバ2に対して、入出力要求を行う。
(S2)デバイスドライバ2が、2次記憶装置3のコントローラ4に対して、入出力要求を行う。
(S3)コントローラ4内の故障検出回路で検出されたエラーをデバイスドライバ2に通知する。
(S4)デバイスドライバ2がアプリケーションプログラム1にエラーを通知する。
他の故障検出方法として、ディスク異常が1台の場合と複数台の場合を識別し、異常要因を通知する先を中央処理装置と管理マシンに切り換える方法がある(例えば、特許文献1参照)。
さらに他の故障検出方法として、磁気ディスクの故障をハードウェア的に行う方法もある(例えば、特許文献2参照)。この故障検出方法は、ヘッドとディスク表面との摩擦力の増大によってディスクの異常を検出する。
特開2004−133744号公報 特開平7−85575号公報
従来の故障検出メカニズムでは、コントローラ4内の故障検出回路の「故障」またはデバイスドライバ2のバグなどにより、図3の(S3)、(S4)のルートで、2次記憶装置の故障を検出できないことがある。すなわち、コントローラやデバイスドライバなどの2次記憶装置の入出力インターフェースの故障により、入出力要求(S1)に対する応答(S4)が返って来ないために、故障検出ができない場合がある。
また、図3のように、アプリケーションプログラムによる故障検出方法では、アプリケーションのアクセス時でしか故障を検出できない。さらに、アプリケーションが2次記憶装置に格納されている場合、当該アプリケーションが格納されるユニットの故障検出ができない可能性がある。
また、前記の特許文献1,2の方法は、磁気ディスクにおける異常検出方法であり、ROMなどの半導体メモリの故障検出には適用できない。
本発明の目的は、2次記憶装置の入出力インターフェースも含めた故障検出ができ、しかもアプリケーションの実行および格納箇所に依存しない故障検出ができ、さらには磁気ディスク、ROMなどの記憶媒体に依存しない故障検出ができる故障検出方法を提供することにある。
本発明は、前記の課題を解決するため、アプリケーションプログラムによる2次記憶装置の故障検出に代えて、故障検出用の専用のプログラムを用意し、このプログラムによる故障検出には任意時刻にデバイスドライバに対する2次記憶装置の入出力を要求し、この要求に対して一定時間内に正常な応答があるか否かによって正常/異常を判定するようにしたもので、以下の方法を特徴とする。
(1)デバイスドライバに対する2次記憶装置の入出力要求で、該デバイスドライバから2次記憶装置のコントローラに入出力を要求し、該コントローラが2次記憶装置に入出力を行い、この入出力時の故障をコントローラが検出したときに該デバイスドライバにエラーを通知する手段を備えたコンピュータシステムにおいて、
2次記憶装置の故障検出用I/Oプログラムおよび監視プログラムとして記述したソフトウェアを備え、
前記監視プログラムは、定期的または設定された時刻に故障検出フラグをONする手順と、前記故障検出用I/Oプログラムに対して故障検出要求を行う手順を有し、
前記故障検出用I/Oプログラムは、前記監視プログラムから故障検出要求されたときに、前記デバイスドライバに2次記憶装置に対する入出力要求を行う手順と、この要求に対して前記デバイスドライバから正常な応答が返ってきたか否かを判定する手順と、正常な応答がある場合は前記故障検出フラグをOFFする手順を有し、
前記監視プログラムは、前記故障検出要求を行ってから一定時間後に前記故障検出フラグをチェックする手順と、前記故障検出フラグがON状態であれば2次記憶装置の異常と判断する手順と、故障検出フラグがOFF状態の場合は正常と判断する手順を有することを特徴とする。
(2)前記故障検出用I/Oプログラムおよび監視プログラムは、コンピュータシステムの主記憶装置に常駐させたことを特徴とする。
以上のとおり、本発明によれば、従来の故障検出方法に代えて、故障検出用の専用のプログラムを用意し、このプログラムによる故障検出には任意時刻にデバイスドライバに対する2次記憶装置の入出力を要求し、この要求に対して一定時間内に正常な応答があるか否かによって正常/異常を判定するようにしたため、2次記憶装置の入出力インターフェースも含めた故障検出ができ、しかもアプリケーションの実行および格納箇所に依存しない故障検出ができ、さらには磁気ディスク、ROMなどの記憶媒体に依存しない故障検出ができる。
図1は、本発明の実施形態を示す故障検出方法のシステム構成図である。同図が図3と異なる部分は、2次記憶装置の故障を検出するための専用のプログラム5,6をソフトウェア構成として設けた点にある。5は故障検出用I/Oプログラム、6は監視プログラムであり、これらプログラムはコンピュータシステムの主記憶装置上に常駐させるのが好ましい。7は故障検出用のフラグであり、プログラム5および6の共有データとして確保される。
これら故障検出用のプログラム5,6およびフラグ7を使用した2次記憶装置3の故障検出は、図2に示すようになり、以下の手順とする。
監視プログラム6は、定期的または設定された時刻に故障検出フラグをONし(S11)、故障検出用I/Oプログラム5に対して故障検出要求を行う(S12)。
故障検出用I/Oプログラム5は、監視プログラム6から故障検出要求されたときに、デバイスドライバ2に2次記憶装置3に対する入出力要求を行う(S21)。この要求は、図3におけるアプリケーションプログラムからの入出力要求と同等のものであり、故障検出用I/Oプログラム5は(S1)〜(S4)の経路でデバイスドライバ2から正常な応答が返ってきたか否かを判定し(S22)、正常な応答がある場合は故障検出フラグをOFFし(S23)、正常な応答がない場合は故障検出フラグをOFFすることなく処理を終了する(S24)。
監視プログラム6は、故障検出要求を行ってから一定時間(N秒)待ち(S13)、この後に故障検出フラグ7をチェックし(S14)、故障検出フラグがON状態であれば、2次記憶装置の異常と判断する(S15)。OFF状態の場合は、正常と判断し、(S11)に戻って、次の故障検出要求時刻まで待機する(S16)。
したがって、2次記憶装置の故障検出には、デバイスドライバ2に対する入出力要求に対して、正常な応答がない場合は監視プログラムにより故障検出される。このことは、デバイスドライバ2やコントローラ4の不具合で正常な応答が得られない場合、すなわち2次記憶装置に対する入出力インターフェースの不具合時にも故障を検出することができる。
また、故障検出には監視プログラム6と故障検出用I/Oプログラム5によってなされ、アプリケーションプログラム1が実行されていない場合にも故障を検出できる。さらに、アプリケーションが2次記憶装置3に格納されている場合にも故障検出ができる。
また、故障検出は、全てがソフトウェア構成になり、従来のハードウェア的な故障検出による制約、つまり2次記憶装置が磁気ディスク、ROMなどの記憶媒体に依存することなく故障検出ができる。さらに、故障検出用I/Oプログラム5及び監視プログラム6はコンピュータシステムの負荷としては極めて軽いもので済む。
本発明の実施形態を示す故障検出方法のシステム構成図。 実施形態における故障検出処理手順図。 従来の故障検出方法のシステム構成図。
符号の説明
1 アプリケーションプログラム
2 デバイスドライバ
3 2次記憶装置
4 コントローラ
5 故障検出用I/Oプログラム
6 監視プログラム
7 故障検出フラグ

Claims (2)

  1. デバイスドライバに対する2次記憶装置の入出力要求で、該デバイスドライバから2次記憶装置のコントローラに入出力を要求し、該コントローラが2次記憶装置に入出力を行い、この入出力時の故障をコントローラが検出したときに該デバイスドライバにエラーを通知する手段を備えたコンピュータシステムにおいて、
    2次記憶装置の故障検出用I/Oプログラムおよび監視プログラムとして記述したソフトウェアを備え、
    前記監視プログラムは、定期的または設定された時刻に故障検出フラグをONする手順と、前記故障検出用I/Oプログラムに対して故障検出要求を行う手順を有し、
    前記故障検出用I/Oプログラムは、前記監視プログラムから故障検出要求されたときに、前記デバイスドライバに2次記憶装置に対する入出力要求を行う手順と、この要求に対して前記デバイスドライバから正常な応答が返ってきたか否かを判定する手順と、正常な応答がある場合は前記故障検出フラグをOFFする手順を有し、
    前記監視プログラムは、前記故障検出要求を行ってから一定時間後に前記故障検出フラグをチェックする手順と、前記故障検出フラグがON状態であれば2次記憶装置の異常と判断する手順と、故障検出フラグがOFF状態の場合は正常と判断する手順を有することを特徴とする2次記憶装置の故障検出方法。
  2. 前記故障検出用I/Oプログラムおよび監視プログラムは、コンピュータシステムの主記憶装置に常駐させたことを特徴とする請求項1に記載の2次記憶装置の故障検出方法。
JP2006225975A 2006-08-23 2006-08-23 2次記憶装置の故障検出方法 Pending JP2008052382A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006225975A JP2008052382A (ja) 2006-08-23 2006-08-23 2次記憶装置の故障検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006225975A JP2008052382A (ja) 2006-08-23 2006-08-23 2次記憶装置の故障検出方法

Publications (1)

Publication Number Publication Date
JP2008052382A true JP2008052382A (ja) 2008-03-06

Family

ID=39236400

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006225975A Pending JP2008052382A (ja) 2006-08-23 2006-08-23 2次記憶装置の故障検出方法

Country Status (1)

Country Link
JP (1) JP2008052382A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012018453A (ja) * 2010-07-06 2012-01-26 Fujitsu Ltd 計算機装置,障害復旧制御プログラムおよび障害復旧制御方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012018453A (ja) * 2010-07-06 2012-01-26 Fujitsu Ltd 計算機装置,障害復旧制御プログラムおよび障害復旧制御方法

Similar Documents

Publication Publication Date Title
JP5722426B2 (ja) 制御用コンピュータシステム、制御用コンピュータシステムを制御する方法、および制御用コンピュータシステムの使用
JP2004302632A (ja) コンピュータ処理方法及びその実施システム並びにその処理プログラム
CN102890647B (zh) 一种数据的存储与更新方法及装置
JP2018194336A (ja) 異常検知装置および異常検知方法
JP2007087558A (ja) ディスク制御装置、ディスク制御方法およびディスク制御プログラム
JP2007299213A (ja) Raid制御装置および障害監視方法
US8024604B2 (en) Information processing apparatus and error processing
JP2011076344A (ja) 情報処理装置,情報処理装置の制御方法および制御プログラム
JP2008052382A (ja) 2次記憶装置の故障検出方法
JP2011034219A (ja) 故障検出方法及び監視装置
JP2010066801A (ja) ログ記録システム、モジュール監視手段、トレースログ管理手段、記録方法、プログラム、及び記憶媒体
JP2006277079A (ja) 障害検出装置および障害検出方法
JPH02294739A (ja) 障害検出方式
JP2008003940A (ja) 保護制御装置、保護制御方法及び保護制御プログラム
JP2006172316A (ja) コンテキスト維持方法、情報処理装置及び割り込み発生装置
JP2006277690A (ja) クラスタシステム、クラスタ切り替え方法、クラスタ切り替え制御プログラム
JP4983806B2 (ja) 二重化タイマを用いたシステム監視装置、および監視方法
JP2010003132A (ja) 情報処理装置、その入出力装置の故障検出方法及びプログラム
JP5011159B2 (ja) システム監視回路を備えた計算機
JP2009015757A (ja) 信号処理装置における異常状態処理方式
JP4209866B2 (ja) 監視装置、監視方法および情報処理装置
JP5906807B2 (ja) 演算処理装置及びストール監視方法
JP2008152665A (ja) 半導体集積回路の動作解析方法
CN108415788B (zh) 用于对无响应处理电路作出响应的数据处理设备和方法
JP2008234385A (ja) 冗長システム、サーバ、情報処理装置、制御方法、及びプログラム