JP2009015472A - コンピュータシステムのデバイス監視方式 - Google Patents

コンピュータシステムのデバイス監視方式 Download PDF

Info

Publication number
JP2009015472A
JP2009015472A JP2007174685A JP2007174685A JP2009015472A JP 2009015472 A JP2009015472 A JP 2009015472A JP 2007174685 A JP2007174685 A JP 2007174685A JP 2007174685 A JP2007174685 A JP 2007174685A JP 2009015472 A JP2009015472 A JP 2009015472A
Authority
JP
Japan
Prior art keywords
ras
interface
status signal
monitoring
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007174685A
Other languages
English (en)
Inventor
Norihiro Kuwamoto
昇洋 桑本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP2007174685A priority Critical patent/JP2009015472A/ja
Publication of JP2009015472A publication Critical patent/JP2009015472A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】監視対象デバイスの増設や変更にも柔軟にかつ容易に対応できる。
【解決手段】RAS機能付きインタフェース4と監視対象デバイス3A、3B、5C〜5NとはRAS専用の1本のシリアル伝送路6で接続し、ホスト側になるインタフェースからは各デバイスに対するポーリングで各デバイスの異常の有無を監視する。
ポーリングにはホスト側から各デバイスにステータス信号をそれぞれ要求し、各デバイスからのステータス信号の応答の有無、及びステータス信号の正常/異常の判定で当該デバイスの異常の有無を判定する。
【選択図】図1

Description

本発明は、コンピュータに接続されるデバイスをRAS方式で監視するデバイス監視方式に関する。
コンピュータ構成の情報処理システムやFAシステムは、システム構成要素になるデバイス(バス接続ボードや外部入出力装置)の処理動作をシステムの稼働中に監視することで、システムの信頼性を向上させている。
この種の監視方式として、コンピュータの動作で主要な機能を監視し、異常が発生した場合に安全に停止させるRAS(Reliability Availability Serviceability)機能がある。
図4はRAS機能を搭載したコンピュータシステムの要部構成を示す。CPU1にはメインバス2を介してRAMやROMなどを内蔵するボード3A,3Bが接続され、さらに、バス2にRAS機能付きインタフェース(I/F)4が接続され、このインタフェース4を介して外部入出力装置5C〜5Nが接続される。この構成において、ボード3A,3Bおよび外部入出力装置5C〜5Nの動作異常の有無監視には、CPU1が適当な時期にRAS機能の起動プログラムを実行し、インタフェース4と監視対象デバイスとの間で監視信号や応答データを入出力し、CPU1がインタフェース4に記憶する応答データの読み取り、またはその判定結果から当該デバイスの正常/異常を判定、およびシステムの保護処理を行う。
例えば、システムの稼動中に、監視対象デバイスについて予め決められた「動作間隔」や「入出力動作」の状態を監視し、動作異常を検出した場合に当該デバイスのリカバリ処理や切り離し、異常警報などの保護処理を行う(例えば、特許文献1、特許文献2参照)。
特開平08−185343号公報 特開2006−221484号公報
RAS機能によるデバイス監視を実現するには、コンピュータシステムの構成によって、個々に異なる。一般的には、図4に示すように、RAS機能付きインタフェース4と監視対象デバイス3A、3B、5C〜5Dとの間を個別に信号線で配線し、この信号線を通したコマンドやデータの入出力で監視する。
このような個別の配線接続とする場合、監視対象デバイスの台数によって配線量が多くなり、またデバイスの増設や配置の違いによって配線構成を変更しければならない。また、RAS用インタフェースのハードウェアやソフトウェアの変更を必要とする場合が起きる。
また、その監視対象デバイスの異常発生状況によっては、異常を通知出来ない場合も考えられる。
本発明の目的は、監視対象デバイスの増設や変更にも柔軟にかつ容易に対応できるデバイス監視方式を提供することにある。
本発明は、前記の課題を解決するため、RAS機能付きインタフェースと監視対象デバイスとはRAS専用の1本のシリアル伝送路で接続し、ホスト側になるインタフェースからは各デバイスに対するポーリングで各デバイスの異常の有無を監視する方式とし、ポーリングにはホスト側から各デバイスにステータス信号をそれぞれ要求し、各デバイスからのステータス信号の応答の有無、及びステータス信号の正常/異常の判定で当該デバイスの異常の有無を判定するようにしたもので、以下の構成を特徴とする。
(1)コンピュータシステムにバス接続されRAS機能付きインタフェースによって、該コンピュータに接続される各デバイスの動作異常の有無をRAS方式で監視するデバイス監視方式であって、
前記インタフェースと各デバイスはRAS専用のシリアル伝送路によってコネクタ接続し、
前記インタフェースは、各デバイスに対するポーリングで各デバイスの異常の有無を監視する手段を備えたことを特徴とする。
(2)前記手段は、前記インタフェースから各デバイスにポーリングでステータス信号をそれぞれ要求し、各デバイスからのステータス信号の応答の有無、及びステータス信号の正常/異常の判定で当該デバイスの異常の有無を判定する手段を備えたことを特徴とする。
(3)前記手段は、各デバイスが応答したステータス信号が異常の場合、その詳細データを当該デバイスに要求し、該詳細データを保存する手段を備えたことを特徴とする。
以上のとおり、本発明によれば、RAS機能付きインタフェースと監視対象デバイスとはRAS専用の1本のシリアル伝送路で接続し、ホスト側になるインタフェースからは各デバイスに対するポーリングで各デバイスの異常の有無を監視する方式とし、ポーリングにはホスト側から各デバイスにステータス信号をそれぞれ要求し、各デバイスからのステータス信号の応答の有無、及びステータス信号の正常/異常の判定で当該デバイスの異常の有無を判定するようにしたため、監視対象デバイスの増設や変更にも柔軟にかつ容易に対応できる。
具体的には、
・システムのハードウェアの構成を大きく変更することなく、様々な仕様に対応することができる。
・ポーリングにはステータス信号の送受信のみで済み、監視プロトコルの開発を容易になる。
・常時ポーリングを行うことで動作不能に陥った場合、返信が無いことで異常と見なす事ができる。
・仕様変更等で監視対象の増加の際、RAS機能付きインタフェースの変更が必要ないため、大きなハードウェア変更が不要となる。
・予めRAS監視動作のIDパターンを組み込むことで、ソフトウェアの変更も容易になる。
図1は、本発明の実施形態を示すRAS機能を搭載したコンピュータシステムの要部構成図であり、図4と同等の部分は同一符号で示す。
RAS機能付きインタフェース4は、RAS専用のシリアル伝送路6によって監視対象デバイス3A、3B、5C〜5Nとの間をコネクタ接続可能とする。このシリアル伝送路6は、両端を終端し、その間に監視対象デバイスの台数よりも多い数の接続コネクタを設け、RAS機能付きインタフェースをホストとし、任意のコネクタ位置で監視対象デバイスとのネットワーク接続を可能とする。
この構成により、インタフェース4は、監視対象デバイスとの間を個々に配線することなく、RAS信号の入出力ピンを1つにして、監視対象デバイスとの間のRAS信号の相互伝送ができ、しかもCompactPCI等のオプションボードをシステムに追加実装する場合には当該ボードのユーザ開放ピンを伝送路6にコネクタ接続することで、RAS機能の入出力の必要な部分の追加ができる。また、伝送路6は、外部コネクタを用意しておき、外部コネクタに他のシステムのデバイスにコネクタ接続すれば、他のシステムも同時に監視する機能拡張ができる。
シリアル伝送路6を使用したRAS機能の実現には、ネットワークのホストになるインタフェース4が常にステータス(状態のみのデータ)の要求信号をポーリングによって全ての監視対象デバイスに順に伝送し、これに返信が無い場合に異常と判断する。また、監視対象デバイスが返信したスデータス中に異常が発見されると、ホストはより詳細な情報をデバイスに要求してその詳細データから正常/異常を判断する。
図2はホスト側になるインタフェースの処理手順例を示す。ホストは、監視動作開始時には、監視対象デバイス別に付したIDと、そのステータスの要求信号を送信し(S1)、当該デバイスからのステータス受信を一定時間だけ待つ(S2)。この一定時間内に当該デバイスからのステータス信号の応答があるとき、その受信処理を行い(S3)、受信したステータス信号が正常のものか否かをチェックする(S4)。このチェックで当該デバイスが正常である場合、ID番号をインクリメントし(S5)、このID番号が予め設定した最大値MAXでない限り、処理S1に戻って他の監視対象デバイスについての正常/異常判定を繰り返す(S6)。最大値MAXのIDを付したデバイスまでの判定を終了したときに、IDを初期化して次回の監視に待機する(S7)。
処理S2において、一定時間内のステータス受信が無い場合、ホストは当該デバイスの異常と判断して、当該デバイスのシャットダウン、システムからの切り離し、システムへの異常通知などの保護処理を実行する(S8)。
同様に、ホストは、受信したステータス信号が正常のものか否かのチェックでステータスが正常でない場合(S5)、当該デバイスにステータスの詳細データを要求し、この詳細データを受信して異常原因データとしてインタフェース4側に保存する(S9)。さらに、ホストは当該デバイスのシャットダウン、システムからの切り離し、システムへの異常通知などの保護動作を当該デバイスに送信する(S10)。
図3は監視対象デバイス側の処理手順例を示す。各監視対象デバイスは、ホストからのデータを受信したとき(S11)、この受信データがステータス要求か、動作要求か、詳細データ要求かを判定し(S12)、ステータス要求にはステータスを返信し(S13)、動作要求にはシャットダウン等の具体的な動作を実行し(S14)、詳細データ要求には詳細データを返信する(S15)。
したがって、上記の処理手順で済むRAS機能による監視では、ホストおよび各監視対象デバイスはID信号とステータス信号のポーリングのみで実現でき、RAS専用のネットワークにしたことで複雑な監視プロトコルが不要になる。また、常時ポーリングを行うことで動作不能に陥った場合、デバイスが返信できない異常状況の監視ができる。
また、仕様変更等で監視対象デバイスの増設の際、RAS機能付きインタフェースの変更が不要のため、大きなハードウェア変更が必要ないし、予め動作のパターンを組み込むことで、ソフトウェアの変更も容易になる。
本発明の実施形態を示すコンピュータシステムの要部構成図。 実施形態におけるインタフェースの処理手順例。 実施形態におけるデバイスの処理手順例。 従来のコンピュータシステムの要部構成図。
符号の説明
1 CPU
2 メインバス
3A、3B ボード
4 RAS機能付きインタフェース
5C〜5D 外部入出力装置(デバイス)
6 RAS専用のシリアル伝送路

Claims (3)

  1. コンピュータシステムにバス接続されRAS機能付きインタフェースによって、該コンピュータに接続される各デバイスの動作異常の有無をRAS方式で監視するデバイス監視方式であって、
    前記インタフェースと各デバイスはRAS専用のシリアル伝送路によってコネクタ接続し、
    前記インタフェースは、各デバイスに対するポーリングで各デバイスの異常の有無を監視する手段を備えたことを特徴とするコンピュータシステムのデバイス監視方式。
  2. 前記手段は、前記インタフェースから各デバイスにポーリングでステータス信号をそれぞれ要求し、各デバイスからのステータス信号の応答の有無、及びステータス信号の正常/異常の判定で当該デバイスの異常の有無を判定する手段を備えたことを特徴とする請求項1に記載のコンピュータシステムのデバイス監視方式。
  3. 前記手段は、各デバイスが応答したステータス信号が異常の場合、その詳細データを当該デバイスに要求し、該詳細データを保存する手段を備えたことを特徴とする請求項2に記載のコンピュータシステムのデバイス監視方式。
JP2007174685A 2007-07-03 2007-07-03 コンピュータシステムのデバイス監視方式 Pending JP2009015472A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007174685A JP2009015472A (ja) 2007-07-03 2007-07-03 コンピュータシステムのデバイス監視方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007174685A JP2009015472A (ja) 2007-07-03 2007-07-03 コンピュータシステムのデバイス監視方式

Publications (1)

Publication Number Publication Date
JP2009015472A true JP2009015472A (ja) 2009-01-22

Family

ID=40356324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007174685A Pending JP2009015472A (ja) 2007-07-03 2007-07-03 コンピュータシステムのデバイス監視方式

Country Status (1)

Country Link
JP (1) JP2009015472A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010087344A1 (ja) 2009-01-27 2010-08-05 旭硝子株式会社 シゾサッカロミセス・ポンベの形質転換方法および形質転換体、ならびに異種蛋白質の製造方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010087344A1 (ja) 2009-01-27 2010-08-05 旭硝子株式会社 シゾサッカロミセス・ポンベの形質転換方法および形質転換体、ならびに異種蛋白質の製造方法

Similar Documents

Publication Publication Date Title
JP4558519B2 (ja) 情報処理装置およびシステムバス制御方法
EP1857938A1 (en) Information processing apparatus and information processing method
JP2006191338A (ja) バス内のデバイスの故障診断を行うゲートウエイ装置
US20070058552A1 (en) Communication apparatus, communication state detection method and communication state detection program
US10691562B2 (en) Management node failover for high reliability systems
JP2009048522A (ja) データ転送装置の製造方法、試験方法、及びデータ転送装置
US8041993B2 (en) Distributed control system
JP4905165B2 (ja) 監視支援プログラム、監視方法および監視システム
CN109995597B (zh) 一种网络设备故障处理方法及装置
JP2021139820A (ja) ケーブル異常判定システム、スレーブ装置、及びケーブル異常判定方法
JP2009015472A (ja) コンピュータシステムのデバイス監視方式
JP6357879B2 (ja) システムおよび障害処理方法
JP2006172218A (ja) コンピュータシステム及びシステム監視プログラム
US9454452B2 (en) Information processing apparatus and method for monitoring device by use of first and second communication protocols
JP4926299B1 (ja) プログラマブルロジックコントローラ
TWI423638B (zh) 通訊系統、測試裝置、通訊裝置、通訊方法以及測試方法
JP2010238000A (ja) モジュールのバス接続/切り離し装置
JP4419094B2 (ja) 情報処理装置および方法、並びにプログラム
JP2019191942A (ja) 制御装置および機能検査方法
US7724642B2 (en) Method and apparatus for continuous operation of a point-of-sale system during a single point-of-failure
JP2007026038A (ja) パス監視システム,パス監視方法,およびパス監視プログラム
JP6234388B2 (ja) 2重系制御装置
JP2738788B2 (ja) データ通信装置
JP2002330191A (ja) 異常検出方式、及び、異常検出システム
KR20060002835A (ko) 네트워크 접속의 관리 방법 및 전자기기