JP5625605B2 - Os動作状態確認システム、確認対象装置、os動作状態確認装置、os動作状態確認方法およびプログラム - Google Patents
Os動作状態確認システム、確認対象装置、os動作状態確認装置、os動作状態確認方法およびプログラム Download PDFInfo
- Publication number
- JP5625605B2 JP5625605B2 JP2010180432A JP2010180432A JP5625605B2 JP 5625605 B2 JP5625605 B2 JP 5625605B2 JP 2010180432 A JP2010180432 A JP 2010180432A JP 2010180432 A JP2010180432 A JP 2010180432A JP 5625605 B2 JP5625605 B2 JP 5625605B2
- Authority
- JP
- Japan
- Prior art keywords
- confirmation
- target device
- operation state
- event
- control means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Description
以下、本発明の第1の実施形態の構成について添付図1〜3に基づいて説明する。
最初に、本実施形態の基本的な内容について説明し、その後でより具体的な内容について説明する。
本実施形態に係るOS動作状態確認システム1は、OS動作状態確認装置10と確認対象装置20とが相互に接続されることによって構成され、確認対象装置におけるオペレーティングシステムの動作が正常であるか否かをOS動作状態確認装置の側から確認するOS動作状態確認システムである。確認対象装置20は、オペレーティングシステムを動作させる主演算制御手段21と、この主演算制御手段とは別個に動作して確認対象装置の動作情報を収集してOS動作状態確認装置に送信する副演算制御手段(BMC24)と、主演算制御手段および副演算制御手段の双方が各々の動作内容をイベントとして付加するイベントログ(SEL210)を記憶した記憶手段22と、主演算制御手段が正常に動作している間はイベントログに新しく付加されたイベントに対して定期的に当該イベントの処理済み情報を追記すると同時にOS動作状態確認装置に対して当該動作状態の確認情報である第1の死活検出情報を送信する死活検出部201とを備えると共に、副演算制御手段(BMC24)が、OS動作状態確認装置からの命令に基づいてイベントログに新規イベントを付加すると共に予め定められた遅延時間が経過した後でこの新規イベントに処理済み情報が追記されているか否かを判断し、該処理済み情報が追記されていない場合にこの追記処理がされていない状態を示す第2の死活検出情報をOS動作状態確認装置に対して送信するIPMIコマンド通信機能241を備える。OS動作状態確認装置10は、確認対象装置と定期的に通信を行ってこの定期的な通信が途切れた場合に確認対象装置に不具合が生じたと判断する確認対象装置死活検出部101と、確認対象装置に対してネットワーク疎通確認用のピング(Ping)を送信するピング送信部103と、確認対象装置に不具合が生じたと判断された場合に確認対象装置の副演算制御手段に対してイベントログに新規イベントを付加する命令を送信するOEMイベント送信部102とを備えると共に、確認対象装置から第2の死活検出情報を受信した場合にピング送信部に対して第1のピングの送信を指令する死活検出情報判定部104と、第1のピングに対する返信が確認対象装置から返って来た場合に確認対象装置の主演算制御手段が過負荷状態であると判断し、そうでない場合に確認対象装置の主演算制御手段がハングアップしていると判断して、この判断結果を外部に出力する不具合原因判断部105とを有する。
以下、これをより詳細に説明する。
次に、上記の実施形態の全体的な動作について説明する。本実施形態に係るOS動作状態確認方法は、オペレーティングシステムを動作させる主演算制御手段21と、この主演算制御手段とは別個に動作して確認対象装置の動作情報を収集してOS動作状態確認装置に送信する副演算制御手段(BMC24)と、主演算制御手段および副演算制御手段の双方が各々の動作内容をイベントとして付加するイベントログ(SEL210)を記憶した記憶手段22とを備える確認対象装置20がOS動作状態確認装置10と相互に接続されることによって構成され、確認対象装置でのオペレーティングシステムの動作が正常であるか否かをOS動作状態確認装置の側から確認するOS動作状態確認システム1にあって、確認対象装置で主演算制御手段が正常に動作している間はイベントログに新しく付加されたイベントに対して定期的に当該イベントの処理済み情報を確認対象装置の死活検出部が追記すると同時にOS動作状態確認装置に対して当該動作状態の確認情報である第1の死活検出情報を死活検出部が送信し(図7・ステップS352〜354)、OS動作状態確認装置と確認対象装置との間の定期的な通信が途切れた場合に確認対象装置に不具合が生じたとOS動作状態確認装置の確認対象装置死活検出部が判断し(図5・ステップS301)、確認対象装置に不具合が生じたと判断された場合に確認対象装置の副演算制御手段に対してイベントログに新規イベントを付加する命令をOS動作状態確認装置のOEMイベント送信部が送信し(図5・ステップS302〜303)、OS動作状態確認装置からの命令に反応した確認対象装置の副演算制御手段がイベントログに新規イベントを付加し(図8・ステップS401〜402)、予め定められた遅延時間が経過した後で確認対象装置のイベントログに付加した新規イベントに対して処理済み情報が追記されているか否かを副演算制御手段が判断し(図8・ステップS403〜404)、確認対象装置のイベントログに処理済み情報が追記されていない場合にこの追記処理がされていない状態を示す第2の死活検出情報をOS動作状態確認装置に対して確認対象装置の副演算制御手段が送信し(図8・ステップS405)、OS動作状態確認装置が確認対象装置から第2の死活検出情報を受信した場合に死活検出情報判定部がピング送信部を介して確認対象装置にネットワーク疎通確認用のピング(Ping)を送信し(図5・ステップS304〜図6・ステップ305)、ピングに対する返信が確認対象装置から返って来た場合に確認対象装置のオペレーティングシステムが過負荷状態であると判断し(図6・ステップ311)、そうでない場合に確認対象装置のオペレーティングシステムがハングアップしているとOS動作状態確認装置の死活検出情報判定部が判断し(図6・ステップ312)、この判断結果をOS動作状態確認装置の死活検出情報判定部が外部に出力する(図6・ステップ316)。
この動作により、本実施形態は以下のような効果を奏する。
本発明の第2の実施形態は、第1の実施形態の構成に加えて、不具合原因判断部605が、OEMイベント送信部102が副演算制御手段(BMC24)に対してイベントログ(SEL210)にイベントを書き込む命令を送信した後に該命令に対する副演算制御手段の応答が無い場合にBMCに障害が発生したと判断する。
以下、これをより詳細に説明する。
前記確認対象装置が、
前記オペレーティングシステムを動作させる主演算制御手段と、この主演算制御手段とは別個に動作して前記確認対象装置の動作情報を収集して前記OS動作状態確認装置に送信する副演算制御手段と、前記主演算制御手段および前記副演算制御手段の双方が各々の動作内容をイベントとして付加するイベントログを記憶した記憶手段と、前記主演算制御手段が正常に動作している間は前記イベントログに新しく付加されたイベントに対して定期的に当該イベントの処理済み情報を追記すると同時に前記OS動作状態確認装置に対して当該動作状態の確認情報である第1の死活検出情報を送信する死活検出部とを備えると共に、
前記副演算制御手段が、前記OS動作状態確認装置からの命令に基づいて前記イベントログに新規イベントを付加すると共に予め定められた遅延時間が経過した後でこの新規イベントに前記処理済み情報が追記されているか否かを判断し、該処理済み情報が追記されていない場合にこの追記処理がされていない状態を示す第2の死活検出情報を前記OS動作状態確認装置に対して送信するIPMIコマンド通信機能を備え、
前記OS動作状態確認装置が、
前記確認対象装置と定期的に通信を行ってこの定期的な通信が途切れた場合に前記確認対象装置に不具合が生じたと判断する確認対象装置死活検出部と、前記確認対象装置に対してネットワーク疎通確認用のピング(Ping)を送信するピング送信部と、前記確認対象装置に不具合が生じたと判断された場合に前記確認対象装置の前記副演算制御手段に対して前記イベントログに前記新規イベントを付加する命令を送信するOEMイベント送信部とを備えると共に、
前記確認対象装置から前記第2の死活検出情報を受信した場合に前記ピング送信部に対して第1のピングの送信を指令する死活検出情報判定部と、
前記第1のピングに対する返信が前記確認対象装置から返って来た場合に前記確認対象装置の前記主演算制御手段が過負荷状態であると判断し、そうでない場合に前記確認対象装置の前記主演算制御手段がハングアップしていると判断して、この判断結果を外部に出力する不具合原因判断部とを有することを特徴とするOS動作状態確認システム。
前記不具合原因判断部が、前記第2のピングに対する返信が前記確認対象装置から返って来た場合に前記確認対象装置の前記主演算制御手段が過負荷状態であると判断し、そうでない場合に前記確認対象装置との間のネットワークに恒久的な障害が発生したと判断することを特徴とする、付記2に記載のOS動作状態確認システム。
前記OS動作状態確認装置と前記確認対象装置の前記副演算制御手段との間が前記第1のネットワークとは異なる系統である第2のネットワークによって接続されていることを特徴とする、付記1に記載のOS動作状態確認システム。
前記オペレーティングシステムを動作させる主演算制御手段と、
この主演算制御手段とは別個に動作して自らの動作情報を収集して前記OS動作状態確認装置に送信する副演算制御手段と、
前記主演算制御手段および前記副演算制御手段の双方が各々の動作内容をイベントとして付加するイベントログを記憶した記憶手段と、
前記主演算制御手段が正常に動作している間は前記イベントログに新しく付加されたイベントに対して定期的に当該イベントの処理済み情報を追記すると同時に前記OS動作状態確認装置に対して当該動作状態の確認情報である第1の死活検出情報を送信する死活検出部とを備えると共に、
前記副演算制御手段が、前記OS動作状態確認装置からの命令に基づいて前記イベントログに新規イベントを付加すると共に予め定められた遅延時間が経過した後でこの新規イベントに前記処理済み情報が追記されているか否かを判断し、該処理済み情報が追記されていない場合にこの追記処理がされていない状態を示す第2の死活検出情報を前記OS動作状態確認装置に対して送信するIPMIコマンド通信機能を備えることを特徴とする確認対象装置。
前記確認対象装置と定期的に通信を行ってこの定期的な通信が途切れた場合に前記確認対象装置に不具合が生じたと判断する確認対象装置死活検出部と、
前記確認対象装置に対してネットワーク疎通確認用のピング(Ping)を送信するピング送信部と、
前記確認対象装置に不具合が生じたと判断された場合に前記確認対象装置の前記副演算制御手段に対して前記イベントログに前記新規イベントを付加する命令を送信するOEMイベント送信部とを備えると共に、
前記確認対象装置から前記イベントログに書き込んだ前記新規イベントに対して予め定められた遅延時間が経過した後でも処理済み情報が書き込まれていないことを意味する死活検出情報を受信した場合に前記ピング送信部に対してピングの送信を指令する死活検出情報判定部と、
前記ピングに対する返信が前記確認対象装置から返って来た場合に前記確認対象装置の前記オペレーティングシステムが過負荷状態であると判断し、そうでない場合に前記確認対象装置の前記オペレーティングシステムがハングアップしていると判断して、この判断結果を外部に出力する不具合原因判断部を有することを特徴とするOS動作状態確認装置。
前記確認対象装置で主演算制御手段が正常に動作している間は前記イベントログに新しく付加されたイベントに対して定期的に当該イベントの処理済み情報を前記確認対象装置の死活検出部が追記すると同時に前記OS動作状態確認装置に対して当該動作状態の確認情報である第1の死活検出情報を前記死活検出部が送信し、
前記OS動作状態確認装置と前記確認対象装置との間の定期的な通信が途切れた場合に前記確認対象装置に不具合が生じたと前記OS動作状態確認装置の前記確認対象装置死活検出部が判断し、
前記確認対象装置に不具合が生じたと判断された場合に前記確認対象装置の前記副演算制御手段に対して前記イベントログに新規イベントを付加する命令を前記OS動作状態確認装置のOEMイベント送信部が送信し、
前記OS動作状態確認装置からの前記命令に反応した前記確認対象装置の前記副演算制御手段が前記イベントログに前記新規イベントを付加し、
予め定められた遅延時間が経過した後で前記確認対象装置の前記イベントログに付加した前記新規イベントに対して前記処理済み情報が追記されているか否かを前記副演算制御手段が判断し、
前記確認対象装置の前記イベントログに前記処理済み情報が追記されていない場合にこの追記処理がされていない状態を示す第2の死活検出情報を前記OS動作状態確認装置に対して前記確認対象装置の前記副演算制御手段が送信し、
前記OS動作状態確認装置が前記確認対象装置から前記第2の死活検出情報を受信した場合に死活検出情報判定部がピング送信部を介して前記確認対象装置にネットワーク疎通確認用のピング(Ping)を送信し、
前記ピングに対する返信が前記確認対象装置から返って来た場合に前記確認対象装置の前記オペレーティングシステムが過負荷状態であると判断し、そうでない場合に前記確認対象装置の前記オペレーティングシステムがハングアップしていると前記OS動作状態確認装置の死活検出情報判定部が判断し、
この判断結果を前記OS動作状態確認装置の前記死活検出情報判定部が外部に出力することを特徴とするOS動作状態確認方法。
前記OS動作状態確認装置が備えるコンピュータに、
前記OS動作状態確認装置と前記確認対象装置との間の定期的な通信が途切れた場合に前記確認対象装置に不具合が生じたと判断する手順、
前記確認対象装置に不具合が生じたと判断された場合に前記確認対象装置の前記副演算制御手段に対して前記イベントログに新規イベントを付加する命令を送信する手順、
前記確認対象装置から前記イベントログに付加した前記新規イベントに対して予め定められた遅延時間が経過した後でも処理済み情報が追記されていないことを意味する死活検出情報を受信した場合に前記確認対象装置にネットワーク疎通確認用のピング(Ping)を送信する手順、
前記ピングに対する返信が前記確認対象装置から返って来た場合に前記確認対象装置の前記オペレーティングシステムが過負荷状態であると判断し、そうでない場合に前記確認対象装置の前記オペレーティングシステムがハングアップしていると判断する手順、
およびこの判断結果を外部に出力する手順を、
実行させることを特徴とするOS動作状態確認プログラム。
前記確認対象装置の主演算制御手段に、
前記確認対象装置で前記オペレーティングシステムが動作している間は前記イベントログに新しく付加されたイベントに対して定期的に当該イベントの処理済み情報を追記する手順、
およびこれと同時に前記OS動作状態確認装置に対して当該動作状態の確認情報である死活検出情報を送信する手順、
を実行させることを特徴とするOS動作状態確認プログラム。
前記副演算制御手段に、
前記OS動作状態確認装置からの命令に反応して予め定められた遅延時間を設定する手順、
前記イベントログに新規イベントを書き込む手順、
前記遅延時間が経過した後で前記確認対象装置の前記イベントログに書き込んだ前記新規イベントに対して前記処理済み情報が追記されているか否かを判断する手順、
および前記イベントログに前記処理済み情報が追記されていない場合にこの追記処理がされていない状態を示す死活検出情報を前記OS動作状態確認装置に対して送信する手順、
を実行させることを特徴とするOS動作状態確認プログラム。
10、510 OS動作状態確認装置
11、21 主演算制御手段
12、22、24b 記憶手段
13a、13b、23a、23b 通信手段
14 表示手段
20、20a、20b、20c 確認対象装置
24 BMC(Baseboard Management Controller)
24a マイクロプロセッサ
30 ネットワーク
31 管理用ネットワーク
101 確認対象装置死活検出部
102 OEMイベント送信部
103 ピング送信部
104 死活検出情報判定部
105、605 不具合原因判断部
200 OS
201 死活検出部
201a IPMI命令機能
201b 管理通信機能
202 IPMIドライバ
210 SEL(System Event Log)
210a 処理済み情報
241 IPMIコマンド通信機能
242 SELアクセス機能
Claims (9)
- OS動作状態確認装置と確認対象装置とが相互に接続されることによって構成され、前記確認対象装置におけるオペレーティングシステムの動作が正常であるか否かを前記OS動作状態確認装置の側から確認するOS動作状態確認システムであって、
前記確認対象装置が、
前記オペレーティングシステムを動作させる主演算制御手段と、この主演算制御手段とは別個に動作して前記確認対象装置の動作情報を収集して前記OS動作状態確認装置に送信する副演算制御手段と、前記主演算制御手段および前記副演算制御手段の双方が各々の動作内容をイベントとして付加するイベントログを記憶した記憶手段と、前記主演算制御手段が正常に動作している間は前記イベントログに新しく付加されたイベントに対して定期的に当該イベントの処理済み情報を追記すると同時に前記OS動作状態確認装置に対して自らの動作状態の確認情報である第1の死活検出情報を送信する死活検出部とを備えると共に、
前記副演算制御手段が、前記OS動作状態確認装置からの命令に基づいて前記イベントログに新規イベントを付加すると共に予め定められた遅延時間が経過した後でこの新規イベントに前記処理済み情報が追記されているか否かを判断し、該処理済み情報が追記されていない場合にこの追記処理がされていない状態を示す第2の死活検出情報を前記OS動作状態確認装置に対して送信するIPMIコマンド通信機能を備え、
前記OS動作状態確認装置が、
前記確認対象装置と定期的に通信を行ってこの定期的な通信が途切れた場合に前記確認対象装置に不具合が生じたと判断する確認対象装置死活検出部と、前記確認対象装置に対してネットワーク疎通確認用のピング(Ping)を送信するピング送信部と、前記確認対象装置に不具合が生じたと判断された場合に前記確認対象装置の前記副演算制御手段に対して前記イベントログに前記新規イベントを付加する命令を送信するOEMイベント送信部とを備えると共に、
前記確認対象装置から前記第2の死活検出情報を受信した場合に前記ピング送信部に対して第1のピングの送信を指令する死活検出情報判定部と、
前記第1のピングに対する返信が前記確認対象装置から返って来た場合に前記確認対象装置の前記主演算制御手段が過負荷状態であると判断し、そうでない場合に前記確認対象装置の前記主演算制御手段がハングアップしていると判断して、この判断結果を外部に出力する不具合原因判断部とを有することを特徴とするOS動作状態確認システム。 - 前記不具合原因判断部が、前記確認対象装置から前記第2の死活検出情報を受信せずかつ前記第1の死活検出情報を受信した場合に前記確認対象装置の前記主演算制御手段の動作に特に問題はないと判断することを特徴とする、請求項1に記載のOS動作状態確認システム。
- 前記死活検出情報判定部が、前記確認対象装置から前記第1および第2の死活検出情報をいずれも受信しない場合に前記ピング送信部に対して第2のピングの送信を指令し、
前記不具合原因判断部が、前記第2のピングに対する返信が前記確認対象装置から返って来た場合に前記確認対象装置の前記主演算制御手段が過負荷状態であると判断し、そうでない場合に前記確認対象装置との間のネットワークに恒久的な障害が発生したと判断することを特徴とする、請求項2に記載のOS動作状態確認システム。 - 前記不具合原因判断部が、前記OEMイベント送信部が前記副演算制御手段に対して前記イベントログに前記新規イベントを付加する命令を送信した後に該命令に対する前記副演算制御手段からの応答が無い場合にこの副演算制御手段に障害が発生したと判断することを特徴とする、請求項1に記載のOS動作状態確認システム。
- 前記不具合原因判断部が、前記第1のピングに対する返信が前記確認対象装置から返って来た場合に前記OEMイベント送信部に前記副演算制御手段に対して前記イベントログに前記新規イベントを書き込む命令を送信する処理を繰り返させて同一の判断結果が出るか否かを判断し、同一の判断結果が出れば前記主演算制御手段のユーザーモードがハングアップしていると判断することを特徴とする、請求項1に記載のOS動作状態確認システム。
- OS動作状態確認装置と相互に接続されることによって、オペレーティングシステムの動作が正常であるか否かを前記OS動作状態確認装置の側から確認するOS動作状態確認システムを構成する確認対象装置であって、
前記オペレーティングシステムを動作させる主演算制御手段と、
この主演算制御手段とは別個に動作して自らの動作情報を収集して前記OS動作状態確認装置に送信する副演算制御手段と、
前記主演算制御手段および前記副演算制御手段の双方が各々の動作内容をイベントとして付加するイベントログを記憶した記憶手段と、
前記主演算制御手段が正常に動作している間は前記イベントログに新しく付加されたイベントに対して定期的に当該イベントの処理済み情報を追記すると同時に前記OS動作状態確認装置に対して自らの動作状態の確認情報である第1の死活検出情報を送信する死活検出部とを備えると共に、
前記副演算制御手段が、前記OS動作状態確認装置からの命令に基づいて前記イベントログに新規イベントを付加すると共に予め定められた遅延時間が経過した後でこの新規イベントに前記処理済み情報が追記されているか否かを判断し、該処理済み情報が追記されていない場合にこの追記処理がされていない状態を示す第2の死活検出情報を前記OS動作状態確認装置に対して送信するIPMIコマンド通信機能を備えることを特徴とする確認対象装置。 - オペレーティングシステムを動作させる主演算制御手段と、この主演算制御手段とは別個に動作して自らのハードウェアの動作についての情報を収集して外部装置に送信する副演算制御手段と、前記主演算制御手段および前記副演算制御手段の双方の動作内容を記録するイベントログを記憶した記憶手段とを備える確認対象装置と相互に接続されることによって、前記確認対象装置での前記オペレーティングシステムの動作が正常であるか否かを確認するOS動作状態確認システムを構成するOS動作状態確認装置であって、
前記確認対象装置と定期的に通信を行ってこの定期的な通信が途切れた場合に前記確認対象装置に不具合が生じたと判断する確認対象装置死活検出部と、
前記確認対象装置に対してネットワーク疎通確認用のピング(Ping)を送信するピング送信部と、
前記確認対象装置に不具合が生じたと判断された場合に前記確認対象装置の前記副演算制御手段に対して前記イベントログにその不具合を新規イベントとして付加する命令を送信するOEMイベント送信部とを備えると共に、
前記確認対象装置から前記イベントログに書き込んだ前記新規イベントに対して予め定められた遅延時間が経過した後でも処理済み情報が書き込まれていないことを意味する死活検出情報を受信した場合に前記ピング送信部に対してピングの送信を指令する死活検出情報判定部と、
前記ピングに対する返信が前記確認対象装置から返って来た場合に前記確認対象装置の前記オペレーティングシステムが過負荷状態であると判断し、そうでない場合に前記確認対象装置の前記オペレーティングシステムがハングアップしていると判断して、この判断結果を外部に出力する不具合原因判断部を有することを特徴とするOS動作状態確認装置。 - オペレーティングシステムを動作させる主演算制御手段と、この主演算制御手段とは別個に動作して自らの動作情報を収集してOS動作状態確認装置に送信する副演算制御手段と、前記主演算制御手段および前記副演算制御手段の双方が各々の動作内容をイベントとして付加するイベントログを記憶した記憶手段とを備える確認対象装置が前記OS動作状態確認装置と相互に接続されることによって構成され、前記確認対象装置での前記オペレーティングシステムの動作が正常であるか否かを前記OS動作状態確認装置の側から確認するOS動作状態確認システムにあって、
前記確認対象装置で主演算制御手段が正常に動作している間は前記イベントログに新しく付加されたイベントに対して定期的に当該イベントの処理済み情報を前記確認対象装置の死活検出部が追記すると同時に前記OS動作状態確認装置に対して自らの動作状態の確認情報である第1の死活検出情報を前記死活検出部が送信し、
前記OS動作状態確認装置と前記確認対象装置との間の定期的な通信が途切れた場合に前記確認対象装置に不具合が生じたと前記OS動作状態確認装置の前記確認対象装置死活検出部が判断し、
前記確認対象装置に不具合が生じたと判断された場合に前記確認対象装置の前記副演算制御手段に対して前記イベントログに新規イベントを付加する命令を前記OS動作状態確認装置のOEMイベント送信部が送信し、
前記OS動作状態確認装置からの前記命令に反応した前記確認対象装置の前記副演算制御手段が前記イベントログに前記新規イベントを付加し、
予め定められた遅延時間が経過した後で前記確認対象装置の前記イベントログに付加した前記新規イベントに対して前記処理済み情報が追記されているか否かを前記副演算制御手段が判断し、
前記確認対象装置の前記イベントログに前記処理済み情報が追記されていない場合にこの追記処理がされていない状態を示す第2の死活検出情報を前記OS動作状態確認装置に対して前記確認対象装置の前記副演算制御手段が送信し、
前記OS動作状態確認装置が前記確認対象装置から前記第2の死活検出情報を受信した場合に死活検出情報判定部がピング送信部を介して前記確認対象装置にネットワーク疎通確認用のピング(Ping)を送信し、
前記ピングに対する返信が前記確認対象装置から返って来た場合に前記確認対象装置の前記オペレーティングシステムが過負荷状態であると判断し、そうでない場合に前記確認対象装置の前記オペレーティングシステムがハングアップしていると前記OS動作状態確認装置の死活検出情報判定部が判断し、
この判断結果を前記OS動作状態確認装置の前記死活検出情報判定部が外部に出力することを特徴とするOS動作状態確認方法。 - オペレーティングシステムを動作させる主演算制御手段と、この主演算制御手段とは別個に動作して前記確認対象装置の動作情報を収集して前記OS動作状態確認装置に送信する副演算制御手段と、前記主演算制御手段および前記副演算制御手段の双方が各々の動作内容をイベントとして付加するイベントログを記憶した記憶手段とを備える確認対象装置がOS動作状態確認装置と相互に接続されることによって構成され、前記確認対象装置での前記オペレーティングシステムの動作が正常であるか否かを前記OS動作状態確認装置の側から確認するOS動作状態確認システムにあって、
前記OS動作状態確認装置が備えるコンピュータに、
前記OS動作状態確認装置と前記確認対象装置との間の定期的な通信が途切れた場合に前記確認対象装置に不具合が生じたと判断する手順、
前記確認対象装置に不具合が生じたと判断された場合に前記確認対象装置の前記副演算制御手段に対して前記イベントログに新規イベントを付加する命令を送信する手順、
前記確認対象装置から前記イベントログに付加した前記新規イベントに対して予め定められた遅延時間が経過した後でも処理済み情報が追記されていないことを意味する死活検出情報を受信した場合に前記確認対象装置にネットワーク疎通確認用のピング(Ping)を送信する手順、
前記ピングに対する返信が前記確認対象装置から返って来た場合に前記確認対象装置の前記オペレーティングシステムが過負荷状態であると判断し、そうでない場合に前記確認対象装置の前記オペレーティングシステムがハングアップしていると判断する手順、
およびこの判断結果を外部に出力する手順を、
実行させることを特徴とするOS動作状態確認プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010180432A JP5625605B2 (ja) | 2010-08-11 | 2010-08-11 | Os動作状態確認システム、確認対象装置、os動作状態確認装置、os動作状態確認方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010180432A JP5625605B2 (ja) | 2010-08-11 | 2010-08-11 | Os動作状態確認システム、確認対象装置、os動作状態確認装置、os動作状態確認方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012038257A JP2012038257A (ja) | 2012-02-23 |
JP5625605B2 true JP5625605B2 (ja) | 2014-11-19 |
Family
ID=45850153
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010180432A Expired - Fee Related JP5625605B2 (ja) | 2010-08-11 | 2010-08-11 | Os動作状態確認システム、確認対象装置、os動作状態確認装置、os動作状態確認方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5625605B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102736970A (zh) * | 2012-06-29 | 2012-10-17 | 浪潮电子信息产业股份有限公司 | 一种操作系统活动状态的监控方法 |
US9525608B2 (en) | 2015-02-25 | 2016-12-20 | Quanta Computer, Inc. | Out-of band network port status detection |
JP2019212046A (ja) * | 2018-06-05 | 2019-12-12 | 富士通株式会社 | 制御プログラム、制御方法及び情報処理装置 |
JP6958925B2 (ja) * | 2019-01-21 | 2021-11-02 | Necプラットフォームズ株式会社 | 障害通知装置、システム、方法及びプログラム |
JP6697102B1 (ja) * | 2019-01-23 | 2020-05-20 | Necプラットフォームズ株式会社 | 情報処理装置、情報処理装置の制御方法、及び、情報処理装置の制御プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000112790A (ja) * | 1998-10-02 | 2000-04-21 | Toshiba Corp | 障害情報収集機能付きコンピュータ |
JP2009205364A (ja) * | 2008-02-27 | 2009-09-10 | Nec Corp | 死活監視方法、被監視装置、監視装置、死活監視プログラム |
JP4659062B2 (ja) * | 2008-04-23 | 2011-03-30 | 株式会社日立製作所 | フェイルオーバ方法、プログラム、管理サーバおよびフェイルオーバシステム |
-
2010
- 2010-08-11 JP JP2010180432A patent/JP5625605B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012038257A (ja) | 2012-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107547589B (zh) | 一种数据采集处理方法以及装置 | |
CN110750480B (zh) | 一种双机热备系统 | |
US11706080B2 (en) | Providing dynamic serviceability for software-defined data centers | |
JP5625605B2 (ja) | Os動作状態確認システム、確認対象装置、os動作状態確認装置、os動作状態確認方法およびプログラム | |
US11157373B2 (en) | Prioritized transfer of failure event log data | |
JP2004021549A (ja) | ネットワーク監視システムおよびプログラム | |
WO2016197737A1 (zh) | 自检处理方法、装置及系统 | |
JP6183931B2 (ja) | クラスタシステム、サーバ装置、クラスタシステムの管理方法、及びプログラム。 | |
JP5425720B2 (ja) | 仮想化環境監視装置とその監視方法およびプログラム | |
US10721135B1 (en) | Edge computing system for monitoring and maintaining data center operations | |
JP2008172592A (ja) | クラスタシステム、コンピュータおよびその異常検出方法 | |
KR101574900B1 (ko) | 철강 플랜트 제어 시스템 | |
US8677323B2 (en) | Recording medium storing monitoring program, monitoring method, and monitoring system | |
JP2012168907A (ja) | 相互監視システム | |
JP4495248B2 (ja) | 情報処理装置、障害処理方法 | |
JP7328907B2 (ja) | 制御システム、制御方法 | |
JP2007334668A (ja) | メモリダンプ方法、クラスタシステム、それを構成するノードおよびプログラム | |
JP2006285453A (ja) | 情報処理装置、情報処理方法、および情報処理プログラム | |
JP2014532236A (ja) | 接続方法 | |
JP2014164628A (ja) | 情報処理装置、情報処理方法および情報処理プログラム並びに統合監視サーバ及び監視システム | |
JP2007272328A (ja) | コンピュータ・システム | |
JP4034436B2 (ja) | クライアント・サーバシステム及びクライアント稼働監視方法 | |
JP3190880B2 (ja) | スタンバイシステム、スタンバイ方法、および記録媒体 | |
CN102932196B (zh) | 一种主机系统状态的检测方法和装置 | |
JP4863984B2 (ja) | 監視処理プログラム、方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130711 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140319 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140408 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140523 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140902 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140915 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5625605 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |