JP2013206073A - ネットワーク管理システム、ネットワーク管理方法、ネットワーク監視システム、及び、ネットワーク管理プログラム - Google Patents

ネットワーク管理システム、ネットワーク管理方法、ネットワーク監視システム、及び、ネットワーク管理プログラム Download PDF

Info

Publication number
JP2013206073A
JP2013206073A JP2012073668A JP2012073668A JP2013206073A JP 2013206073 A JP2013206073 A JP 2013206073A JP 2012073668 A JP2012073668 A JP 2012073668A JP 2012073668 A JP2012073668 A JP 2012073668A JP 2013206073 A JP2013206073 A JP 2013206073A
Authority
JP
Japan
Prior art keywords
server
information
management
remote console
network management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012073668A
Other languages
English (en)
Inventor
Takayuki Okada
隆之 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2012073668A priority Critical patent/JP2013206073A/ja
Publication of JP2013206073A publication Critical patent/JP2013206073A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】サーバの運用管理において、サーバの高負荷等により管理情報の送信が一定時間以上遅延した場合や、ネットワークの輻輳等によりサーバからの管理情報が廃棄された場合に、サーバの障害を誤検出する可能性を低減させる。
【解決手段】ネットワーク管理システムは、管理対象サーバが備えるネットワーク管理エージェントから管理情報を取得する管理情報取得手段と、管理対象サーバが備える基板管理コントローラにサーバの制御を要求するリモートコンソール制御手段と、リモートコンソール制御手段に対してサーバの制御を指示し、リモートコンソール制御手段から取得したサーバの状態情報と、予め定義した障害情報のテンプレートとを比較して、サーバの障害発生を判定する、サーバ状態照合手段と、管理情報取得手段に管理情報の取得を指示し、リモートコンソール制御手段にサーバの制御を指示し、管理情報と障害発生の判定とからサーバの障害発生を表示する、サーバ状態情報収集・表示手段と、を備える。
【選択図】 図1

Description

本発明は、ネットワーク管理システム、ネットワーク管理方法、ネットワーク監視システム、及び、ネットワーク管理プログラムの技術分野に関する。
ネットワーク監視システムの一例が、例えば、特許文献1に記載されている。特許文献1の運用管理システムは、運用管理サーバと、監視対象である複数のサーバとから構成されており、以下のように動作する。
運用管理サーバは、パターン定義グループデータベースと、障害対策情報データベースとを備えている。パターン定義グループデータベースには、イベント情報の発生パターンがイベントグループとして予め定義されている。障害対策情報データベースには、各イベントグループに対する障害対策情報が予め格納されている。運用管理サーバは、監視対象のサーバから収集したイベント情報と、パターン定義グループデータベース中のイベントグループとして定義されたイベント情報の発生パターンとのパターンマッチングを行い、一致または類似するイベントグループを探す。運用管理サーバは、一致するイベントグループを発見すると、障害対策情報を抽出する。
ネットワーク監視システムにおけるイベント情報の収集には、ネットワーク管理プロトコルが使われる。ネットワーク管理プロトコルの一例として、SNMP(Simple Network Management Protocol)が知られている。ところが、SNMPは、パケット伝送の信頼性が低く、監視対象のネットワークノードからネットワーク管理システムにイベント情報が到達しないことがあるという問題点があった。
このような問題点を解決する技術の一例が、特許文献2に記載されている。特許文献2のネットワーク監視システムは、SNMPマネージャと、監視対象である複数のSNMP装置と、両者をつなぐネットワークのそれぞれSNMPマネージャ側とSNMP装置側とにある2台のSNMP中継装置とから構成されており、以下のように動作する。
SNMPマネージャ側のSNMP中継装置と、SNMP装置側のSNMP中継装置との間で、トンネリング用のTCPコネクションを確立する。SNMP装置とSNMPマネージャ間で送受信されるSNMPパケットは、SNMP中継装置間でTCPコネクションを介してトンネリングされる。これにより、SNMPパケットの伝送の信頼性を改善している。
一方、基板管理コントローラ(Baseboard Management Controller;BMC)は、コンピュータのハードウェアエラーを監視する機能を持った装置である。基板管理コントローラは、コンピュータ本体から独立した電源供給とネットワークインタフェースを持ち、コンピュータ本体の電源がオフであっても、コンピュータのハードウェアエラーの監視を継続できる。
基板管理コントローラを備えるコンピュータの一例が、特許文献3に記載されている。特許文献3のシステムは、基板管理コントローラ及び基本入出力システム(Basic Input/Output System;BIOS)を含むメモリユニットを含み、以下のように動作する。
システム管理割り込み(System Management Interrupt;SMI)は周期的に呼び出される。ステータスレジスタは、回復可能なエラーが発生したか否かを検出するためにスキャンされる。回復可能なエラーが検出された場合、システムは基板管理コントローラに関連付けられたメモリユニットにログする。システムは、回復可能なエラーのソース及びそのソースの場所を示す情報をログする。回復可能なエラーの検出がない場合には、システムは回復可能なエラーが発生していないことを示す通信を伝送する。これにより、情報ハンドリングシステムにおける回復可能なエラーのソース及びそのソースの場所を示す情報をログすることができる。
WO2004/061681号公報 特開2010−237964号公報 特開2007−109238号公報
しかし、特許文献2に開示されているネットワーク監視システムは、SNMP装置やSNMP中継装置の高負荷等によりSNMPパケットの送受信が一定時間以上遅延すると、SNMPマネージャにおけるSNMPパケット受信のタイムアウトが発生して、その結果、SNMPマネージャがSNMP装置の障害を誤検出する可能性が高いという問題がある。
本発明の目的は、上述した課題である、サーバの高負荷等により管理情報の送信が一定時間以上遅延した場合や、ネットワークの輻輳等によりサーバからの管理情報が廃棄された場合に、サーバの障害を誤検出する可能性を低減できるネットワーク管理システム、ネットワーク管理方法、ネットワーク監視システム、及び、ネットワーク管理プログラムを提供することにある。
本発明のネットワーク管理システムは、管理対象サーバが備えるネットワーク管理エージェントから管理情報を取得する管理情報取得手段と、前記管理対象サーバが備える基板管理コントローラにサーバの制御を要求するリモートコンソール制御手段と、前記リモートコンソール制御手段に対してサーバの制御を指示し、前記リモートコンソール制御手段から取得したサーバの状態情報と、予め定義した障害情報のテンプレートとを比較して、サーバの障害発生を判定する、サーバ状態照合手段と、前記管理情報取得手段に前記管理情報の取得を指示し、前記リモートコンソール制御手段に前記サーバの制御を指示し、前記管理情報と前記障害発生の判定とからサーバの障害発生を表示する、サーバ状態情報収集・表示手段と、を備えることを特徴とする。
本発明のネットワーク管理方法は、管理対象サーバが備えるネットワーク管理エージェントから管理情報を取得する管理情報取得ステップと、前記管理対象サーバが備える基板管理コントローラにサーバの制御を要求するリモートコンソール制御ステップと、前記リモートコンソール制御手段に対してサーバの制御を指示し、前記リモートコンソール制御手段から取得したサーバの状態情報と、予め定義した障害情報のテンプレートとを比較して、サーバの障害発生を判定する、サーバ障害照合ステップと、前記管理情報取得手段に前記管理情報の取得を指示し、前記リモートコンソール制御手段に前記サーバの制御を指示し、前記管理情報と前記障害発生の判定とからサーバの障害発生を表示する、ノード状態情報収集・表示ステップと、を備えることを特徴とする。
本発明のネットワーク管理プログラムは、管理対象サーバが備えるネットワーク管理エージェントから管理情報を取得する管理情報取得手順と、前記管理対象サーバが備える基板管理コントローラにサーバの制御を要求するリモートコンソール制御手順と、前記リモートコンソール制御手段に対してサーバの制御を指示し、前記リモートコンソール制御手段から取得したサーバの状態情報と、予め定義した障害情報のテンプレートとを比較して、サーバの障害発生を判定する、サーバ障害照合手順と、前記管理情報取得手段に前記管理情報の取得を指示し、前記リモートコンソール制御手段に前記サーバの制御を指示し、前記管理情報と前記障害発生の判定とからサーバの障害発生を表示する、ノード状態情報収集・表示手順と、をコンピュータに実行させることを特徴とする。
本発明のネットワーク監視システムは、管理対象サーバが備えるネットワーク管理エージェントから管理情報を取得する管理情報取得手段と、前記管理対象サーバが備える基板管理コントローラにサーバの制御を要求するリモートコンソール制御手段と、前記リモートコンソール制御手段に対してサーバの制御を指示し、前記リモートコンソール制御手段から取得したサーバの状態情報と、予め定義した障害情報のテンプレートとを比較して、サーバの障害発生を判定する、サーバ状態照合手段と、前記管理情報取得手段に前記管理情報の取得を指示し、前記リモートコンソール制御手段に前記サーバの制御を指示し、前記管理情報と前記障害発生の判定とからサーバの障害発生を表示する、サーバ状態情報収集・表示手段と、を備える1以上のネットワーク管理システムと、ネットワーク管理エージェントと、基板管理コントローラと、を備える1以上のサーバと、を備えることを特徴とする。
本発明によれば、サーバの運用管理において、サーバの高負荷等により管理情報の送信が一定時間以上遅延した場合や、ネットワークの輻輳等によりサーバからの管理情報が廃棄された場合に、サーバの障害を誤検出する可能性を低減することが可能になる。
本発明の第1の実施形態におけるネットワーク監視システムの概略の構成とネットワーク管理システム及びサーバの構成を示すブロック図である。 本発明の第1の実施形態におけるサーバ状態情報収集・表示手段の動作を説明するフローチャートである。 本発明の第1の実施形態におけるサーバ状態照合手段の動作を説明するフローチャートである。 本発明の第2の実施形態におけるサーバ状態照合手段の動作を説明するフローチャートである。 本発明の第3の実施形態におけるサーバ状態照合手段の動作を説明するフローチャートである。 本発明の第4の実施形態におけるサーバ状態照合手段の動作を説明するフローチャートである。 本発明の第5の実施形態におけるサーバ状態照合手段の動作を説明するフローチャートである。
以下、本発明の実施形態について図面を参照して詳細に説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
(第1の実施形態)
図1は、本発明の第1の実施形態におけるネットワーク監視システムの概略の構成とネットワーク管理システム及びサーバの構成を示すブロック図である。
第1の実施形態におけるネットワーク管理システム100は、サーバ状態情報収集・表示手段110と、管理情報要求送信手段120と、管理情報応答受信手段130と、リモートコンソール制御要求送信手段140と、リモートコンソール制御応答受信手段150と、サーバ状態照合手段160とを備えている。
ネットワーク管理システム100は、サーバ400のネットワークノードの状態監視等を行う装置である。サーバ状態情報収集・表示手段110は、サーバ400のネットワークノードの状態の収集及び表示を行う手段である。管理情報要求送信手段120は、サーバ400のネットワークノードへ管理情報の要求等を送信する手段である。管理情報応答受信手段130は、サーバ400のネットワークノードから管理情報の応答等を受信する手段である。リモートコンソール制御要求送信手段140は、サーバ400のネットワークノードへリモートコンソール制御の要求等を送信する手段である。リモートコンソール制御応答受信手段150は、サーバ400のネットワークノードからリモートコンソール制御の応答等を受信する手段である。サーバ状態照合手段160は、サーバ400のネットワークノードからリモートコンソール制御の応答等に基づき、そのサーバに障害が発生しているか否かを判定する手段である。図1において、サーバ400は、1つのみ図示し説明するが、これは複数あっても良い。
ここで、管理情報要求送信手段120と管理情報応答受信手段130とが、本願発明の「管理情報取得手段」に相当する。又、リモートコンソール制御要求送信手段140とリモートコンソール制御応答受信手段150とが、本願発明の「リモートコントロール制御手段」に相当する。
ここで、リモートコンソール制御要求送信手段140とリモートコンソール制御応答受信手段150とは、管理情報要求送信手段120と管理情報応答受信手段130とを含めたネットワーク管理システム100本体とは独立したネットワークインタフェースを備える。そのため、ネットワーク管理システム100は、本体のネットワークインタフェースの故障や、それのみに接続したネットワークの障害や輻輳等の発生に係らず、基板管理コントローラ300と通信できる。
第1の実施形態におけるサーバ400は、ネットワーク管理エージェント200と、基板管理コントローラ300とを備えている。
サーバ400は、コンピュータである。ネットワーク管理エージェント200は、サーバ400の管理情報を保持し、ネットワーク管理システム100からの要求等に応じて、その管理情報を送信する手段である。基板管理コントローラ300は、サーバ400のハードウェアやシステムを監視し、リモートコンピュータからのコマンド入力やマウス・キーボード入力を受け付け、リモートコンピュータにコマンド応答や画面表示を返す手段である。
ここで、基板管理コントローラ300は、ネットワーク管理エージェント200を含めたサーバ400本体とは独立した電源供給を受けており、本体の電源ON/OFFに係らず、常時、電源が供給されている。また、基板管理コントローラ300は、ネットワーク管理エージェント200を含めたサーバ400本体とは独立したネットワークインタフェースを備えている。基板管理コントローラ300は、リモートコンソール制御要求送信手段140及びリモートコンソール制御応答受信手段150に対するネットワーク接続を有している。そのため、基板管理コントローラ300は、サーバ本体のネットワークインタフェースの故障や、それのみに接続したネットワークの障害や輻輳等の発生に係らず、リモートコンソール制御要求送信手段140及びリモートコンソール制御応答受信手段150と通信ができる。
第1の実施形態におけるネットワーク管理エージェント200は、管理情報要求処理手段210と、管理情報要求受信手段220と、管理情報応答送信手段230とを備えている。
管理情報要求処理手段210は、サーバ400の管理情報を保持し、ネットワーク管理システム100からの管理情報要求を解析等して、その管理情報応答や通知を作成する手段である。管理情報要求受信手段220は、ネットワーク管理システム100からの管理情報要求を受信する手段である。管理情報応答送信手段230は、ネットワーク管理システム100への管理情報応答や通知を送信する手段である。
第1の実施形態における基板管理コントローラ300は、リモートコンソール制御手段310と、システムイベントログ制御手段320と、を備えている。第1の実施形態における基板管理コントローラ300は、更に、ステータスランプ制御手段330と、仮想LCD(Liquid Crystal Display)制御手段340と、UID(Unit Identifier)ランプ制御手段350と、入力・画面制御手段360と、を備えているが、これらの手段については、適宜これらの内の必要なものの組み合わせであっても良い。
リモートコンソール制御手段310は、ネットワーク管理システム100からの要求を受信して、システムイベントログ制御手段320と、ステータスランプ制御手段330と、仮想LCD制御手段340と、UIDランプ制御手段350と、入力・画面制御手段360との、いずれかの手段にその要求の処理をさせ、それらの手段からの応答等を送信する手段である。システムイベントログ制御手段320は、サーバのBIOS、OS、アプリケーションソフトウェア等の運用状態を表示するログ情報を制御する手段である。ステータスランプ制御手段330は、サーバの運用状態を示すステータスランプの表示状態及び表示色を制御する手段である。仮想LCD制御手段340は、サーバの基板管理コントローラ、BIOS等の運用状態を表示する情報を制御する手段である。UIDランプ制御手段350は、サーバの識別状態を表示するUIDランプの表示状態を制御する手段である。入力・画面制御手段360は、リモートコンピュータからのキーボードやマウス等の入力を受付け、サーバのBIOS、OS、アプリケーションソフトウェア等が出力する画面表示を制御し、画面情報を返す手段である。
次に、本実施形態の動作を説明する。図2は、本発明の第1の実施形態におけるサーバ状態情報収集・表示手段の動作を説明するフローチャートである。
サーバ状態情報収集・表示手段110は、管理情報要求送信手段120に、運用状態に関する管理情報要求の送信を依頼する(ステップA10)。管理情報要求送信手段120は、サーバ400にその運用状態に関する管理情報要求(例えば、SNMPのGetRequest)を送信する。
管理情報要求受信手段220は、管理情報要求を受信すると、それを管理情報要求処理手段210に渡す。管理情報要求処理手段210は、サーバ400の管理情報を保持しており、管理情報応答送信手段230に管理情報応答の送信を依頼する。管理情報応答送信手段230は、ネットワーク管理システム100に管理情報応答を送信する。
サーバ状態情報収集・表示手段110は、タイムアウト時間を設定した上で、管理情報応答受信手段130からの管理情報応答(例えば、SNMPのGetResponse)の受信を待つ(ステップA20)。
管理情報応答受信手段130は、サーバ400からの管理情報応答(例えば、SNMPのGetResponse)を受信すると、それをサーバ状態情報収集・表示手段110に渡す。サーバ状態情報収集・表示手段110は、管理情報応答を受信すると(ステップA20のYes)、管理情報に含まれるサーバの運用状態(例えば、SNMPのOpStatus)が正常(例えば、SNMPのnormal)であるか否かを調べる(ステップA40)。サーバ状態情報収集・表示手段110は、管理情報に含まれるサーバの運用状態が正常ならば(ステップA40のYes)、サーバに障害がないことをネットワーク管理システム100の画面に表示し(ステップA70)、管理情報に含まれるサーバの運用状態が正常でないならば(ステップA40のNo)、サーバに障害があることをネットワーク管理システム100の画面に表示する(ステップA60)。
一方、サーバ状態情報収集・表示手段110は、管理情報応答の受信でタイムアウトが発生すると(ステップA20のNo)、リモートコンソール情報に基づくサーバ状態判定をサーバ状態照合手段160に行わせる(ステップA30)。
サーバ状態情報収集・表示手段110は、サーバに障害がないと判定すると(ステップA50のNo)、サーバに障害がないことをネットワーク管理システム100の画面に表示し(ステップA70)、サーバに障害があると判定すると(ステップA50のYes)、サーバに障害があることをネットワーク管理システム100の画面に表示する(ステップA60)。
なお、ここでは、ネットワーク管理プロトコルとしてSNMPを用いた例を挙げたが、本実施の形態はこれに限らず、CMIP(Common Management Information Protocol)、WS−Management(Web Service for Management)等のネットワーク管理プロトコルを利用するネットワーク管理システムであっても良い。
図3は、本発明の第1の実施形態におけるサーバ状態照合手段の動作を説明するフローチャートである。
本実施形態におけるリモートコンソール情報は、システムイベントログ情報である。システムイベントログ情報は、サーバのBIOS、OS、アプリケーションソフトウェア等が出力するログ情報である。例えば、BIOSセットアップ情報の不正、システム情報を保持するための電池が切れている、Chip SetまたはConsoleの初期化でエラーが起きた、Flash ROMが故障した、未サポートのCPUを検出した、温度異常を検出した、電圧異常を検出した、メモリの情報が正しく取得できなかった、CPUの情報が正しく取得できなかった、等の場合にログにレコードが書き込まれる。
サーバ状態照合手段160は、リモートコンソール制御要求送信手段140を経由して、サーバ400にリモートコンソール制御要求(例えば、SSH(Secure Shell)上のコマンド入力、または、リモートKVM(Keyboard,Video,Mouse)上のキーボードやマウスの操作等)を送信する。例えば、SSH上で実行する場合について説明する。
サーバ状態照合手段160は、リモートコンソール制御要求送信手段140を経由して、システムイベントログ情報を表示するコマンドをサーバ400に送信する(ステップB10)。
リモートコンソール制御手段310は、システムイベントログ制御手段320に処理を依頼する。システムイベントログ制御手段320は、まず、システムイベントログ情報に含まれるすべてのレコードを表示するコマンドを実行する。リモートコンソール制御手段310は、コマンド応答として表示された文字列をネットワーク管理システム100に送信する。
サーバ状態照合手段160は、タイムアウト時間を設定した上で、リモートコンソール制御応答受信手段150を経由して、サーバ400からのシステムイベントログ情報の受信を待つ(ステップB20)。
サーバ状態照合手段160は、システムイベントログ情報を受信すると(ステップB20のYes)、システムイベントログ情報に対しサーバ障害を示す内容があるか照合する(ステップB30)。
サーバ状態照合手段160は、予め定義されたエラーメッセージパターンのうち、少なくとも1個のエラーメッセージパターンが、システムイベントログ情報に含まれる文字列とマッチした場合に、サーバ200で障害が発生していると判定し(ステップB95)、それ以外の場合には(ステップB40からステップB50のNo)、障害が発生していないと判定する(ステップB90)。ここでは、「BIOSセットアップ情報の不正」(ステップB40)、「システム情報を保持するための電池が切れている」(ステップB45)、「CPUの情報が正しく取得できなかった」(ステップB50)等に相当するエラーメッセージパターンとマッチした場合に障害があると判定する例を示した。
一方、サーバ状態照合手段160は、リモートコンソール制御応答の受信でタイムアウトが発生すると(ステップB20のNo)、サーバに障害があると判定する(ステップB95)。
なお、障害が発生していると判定された場合には、オペレータが、障害を取り除いた後に、システムイベントログのファイルを新規ファイルに切り替えるか、システムイベントログを初期化する。
エラーメッセージパターンは、サーバの障害を識別するためのパターンで、正規表現を使うことで記述性を高めることができる。例えば、エラーメッセージパターンとして、エラーメッセージ中に特定のエラーコードを含む場合に障害発生と判定する正規表現を用意しても良い。なお、文字列のテンプレートマッチング方法は、テキストエディタにおける正規表現の処理等で当業者に公知であり、したがってここでは詳細に説明しない。
サーバ400がリモートコンソール制御要求を受信すると、基板管理コントローラ300のリモートコンソール制御手段310がリモートコンソール制御要求を処理する。このリモートコンソール制御要求は、SSHやリモートKVM等の上で実行される。
SSHは、ローカルコンピュータからリモートコンピュータのコマンドを安全に実行するサービスである。一方、リモートKVMは、ローカルコンピュータのキーボード、マウス、ディスプレイ(ウィンドウ)を使って、リモートコンピュータのBIOS画面及びOS(Operating System)画面の上での操作及び画面表示を行うサービスである。
例えば、リモートコンソール制御要求がSSH上で受信された場合には、リモートコンソール制御手段310は、ネットワーク管理システム100のリモートコンソール制御要求送信手段140及びリモートコンソール制御応答受信手段150との間でSSHのセッションを確立し、リモートコンソール制御要求送信手段140からのコマンド入力を受理し、リモートコンソール制御応答受信手段150にコマンド応答を返却する。
一方、例えば、リモートコンソール制御要求がリモートKVM上で受信された場合には、リモートコンソール制御手段310は、ネットワーク管理システム100のリモートコンソール制御要求送信手段140及びリモートコンソール制御応答受信手段150との間でリモートKVMのセッションを確立し、リモートコンソール制御要求送信手段140からのキーボードやマウスの操作を受理し、リモートコンソール制御応答受信手段150に画面表示を返却する。
なお、本実施の形態はこれに限らず、リモートコンソール制御要求は、telnet、rlogin、RDP(Remote Desktop Protocol)、VNC(Virtual Network Computing)等の上で実行しても良い。
以上説明したように、本発明の第1の実施形態におけるネットワーク管理システムは、サーバの運用管理を行うネットワーク管理システムにおいて、サーバの高負荷等により管理情報の送信が一定時間以上遅延した場合や、ネットワークの輻輳等によりサーバからの管理情報が廃棄された場合に、ネットワーク管理システムがサーバの障害を誤検出する可能性を低減することが可能になる。
なぜなら、ネットワーク管理システム100本体とサーバ400本体とをつなぐネットワークの輻輳等によりサーバからの管理情報が廃棄された場合や、サーバ400本体の高負荷等により管理情報の送信が一定時間以上遅延した場合にも、ネットワーク管理システム100と基板管理コントローラ300は通信できるので、基板管理コントローラ300から得たシステムイベントログ情報に基づきサーバの障害の有無を判定することにより、ネットワーク管理システム100がサーバ200の障害を誤検出する可能性を低減できるからである。
(第2の実施形態)
上述した第1の実施形態においては、リモートコンソール情報として、システムイベントログ情報の場合を説明したが、その代わりに、例えば、ステータスランプ情報を用いてもよい。
本発明の第1の実施形態におけるネットワーク監視システムの概略の構成とネットワーク管理システム及びサーバの構成を示す図1のブロック図を流用して、第2の実施形態におけるネットワーク監視システムの概略の構成とネットワーク管理システム及びサーバの構成との違いについて説明する。
第2の実施形態における基板管理コントローラ300は、リモートコンソール制御手段310と、ステータスランプ制御手段330と、を備えている。第2の実施形態における基板管理コントローラ300は、更に、システムイベントログ制御手段320と、仮想LCD制御手段340と、UIDランプ制御手段350と、入力・画面制御手段360と、を備えているが、これらの手段については、適宜これらの内の必要なものの組み合わせであっても良い。
なお、その他の構成は、第1の実施形態で示した構成と同様であるため、説明は省略する。
図4は、本発明の第2の実施形態におけるサーバ状態照合手段の動作を説明するフローチャートである。
本実施形態におけるリモートコンソール情報は、ステータスランプ情報である。ステータスランプ情報は、サーバのハードウェア、基板管理コントローラ等が出力するランプの表示状態(点灯、消灯、点滅等)及び表示色(緑、アンバー等)の情報である。例えば、緑色での点灯状態が正常状態を表し、その他の状態は故障状態を表す。
サーバ状態照合手段160は、リモートコンソール制御要求送信手段140を経由して、サーバ400にリモートコンソール制御要求(例えば、SSH上のコマンド入力、または、リモートKVM上のキーボードやマウスの操作等)を送信する。例えば、SSH上で実行する場合について説明する。
サーバ状態照合手段160は、リモートコンソール制御要求送信手段140を経由して、ステータスランプ情報を表示するコマンドをサーバ400に送信する(ステップC10)。
リモートコンソール制御手段310は、ステータスランプ制御手段330に処理を依頼する。ステータスランプ制御手段330は、まず、ステータスランプ情報を表示するコマンドを実行する。リモートコンソール制御手段310は、コマンド応答として表示された文字列をネットワーク管理システム100に送信する。
サーバ状態照合手段160は、タイムアウト時間を設定した上で、リモートコンソール制御応答受信手段150を経由して、サーバ400からのステータスランプ情報の受信を待つ(ステップC20)。
サーバ状態照合手段160は、ステータスランプ情報を受信すると(ステップC20のYes)、ステータスランプ情報に対しサーバ障害を示す内容があるか照合する(ステップC30)。
サーバ状態照合手段160は、予め定義されたエラーメッセージパターンのうち、少なくとも1個のエラーメッセージパターンが、ステータスランプ情報に含まれる文字列とマッチした場合に(ステップC40からステップC50のYes)、サーバ200で障害が発生していると判定し(ステップC95)、それ以外の場合には(ステップC40からステップC50のNo)、障害が発生していないと判定する(ステップC90)。ここでは、「ステータスランプが消灯」(ステップC40)、「ステータスランプが点滅」(ステップC45)、「ステータスランプがアンバー色」(ステップC50)等に相当するエラーメッセージパターンとマッチした場合に障害があると判定する例を示した。
一方、サーバ状態照合手段160は、リモートコンソール制御応答の受信でタイムアウトが発生すると(ステップC20のNo)、サーバに障害があると判定する(ステップC95)。
なお、その他の動作は、第1の実施形態で示した動作と同様であるため、説明は省略する。
以上説明したように、本発明の第2の実施形態におけるネットワーク管理システムは、サーバの運用管理を行うネットワーク管理システムにおいて、サーバの高負荷等により管理情報の送信が一定時間以上遅延した場合や、ネットワークの輻輳等によりサーバからの管理情報が廃棄された場合に、ネットワーク管理システムがサーバの障害を誤検出する可能性を低減することが可能になる。
(第3の実施形態)
上述した第1の実施形態においては、リモートコンソール情報として、システムイベントログ情報の場合を説明したが、その代わりに、例えば、仮想LCD情報を用いてもよい。
本発明の第1の実施形態におけるネットワーク監視システムの概略の構成とネットワーク管理システム及びサーバの構成を示す図1のブロック図を流用して、第3の実施形態におけるネットワーク監視システムの概略の構成とネットワーク管理システム及びサーバの構成との違いについて説明する。
第3の実施形態における基板管理コントローラ300は、リモートコンソール制御手段310と、仮想LCD制御手段340と、を備えている。第3の実施形態における基板管理コントローラ300は、更に、システムイベントログ制御手段320と、ステータスランプ制御手段330と、UIDランプ制御手段350と、入力・画面制御手段360と、を備えているが、これらの手段については、適宜これらの内の必要なものの組み合わせであっても良い。
なお、その他の構成は、第1の実施形態で示した構成と同様であるため、説明は省略する。
図5は、本発明の第3の実施形態におけるサーバ状態照合手段の動作を説明するフローチャートである。
本実施形態におけるリモートコンソール情報は、仮想LCD情報である。仮想LCD情報は、サーバの基板管理コントローラ、BIOS等が出力する文字列のエラーメッセージである。例えば、電圧異常を検出した、温度異常を検出した、OSのSTOPエラーが起きた、電源ユニットで異常が起きた、CPUが実装されていない、CPUの温度異常により強制的に電源をOFFにした、メモリで修復不能エラーが起きた、CPUの内部エラーが起きた、等の場合にエラーメッセージが更新される。
サーバ状態照合手段160は、リモートコンソール制御要求送信手段140を経由して、サーバ400にリモートコンソール制御要求(例えば、SSH上のコマンド入力、または、リモートKVM上のキーボードやマウスの操作等)を送信する。例えば、SSH上で実行する場合について説明する。
サーバ状態照合手段160は、リモートコンソール制御要求送信手段140を経由して、仮想LCD情報を表示するコマンドをサーバ400に送信する(ステップD10)。
リモートコンソール制御手段310は、仮想LCD制御手段340に処理を依頼する。仮想LCD制御手段340は、まず、仮想LCD情報を表示するコマンドを実行する。リモートコンソール制御手段310は、コマンド応答として表示された文字列をネットワーク管理システム100に送信する。
サーバ状態照合手段160は、タイムアウト時間を設定した上で、リモートコンソール制御応答受信手段150を経由して、サーバ400からの仮想LCD情報の受信を待つ(ステップD20)。
サーバ状態照合手段160は、仮想LCD情報を受信すると(ステップD20のYes)、仮想LCD情報に対しサーバ障害を示す内容があるか照合する(ステップD30)。
サーバ状態照合手段160は、予め定義されたエラーメッセージパターンのうち、少なくとも1個のエラーメッセージパターンが、仮想LCD情報に含まれる文字列とマッチした場合に(ステップD40からステップD50のYes)、サーバ200で障害が発生していると判定し(ステップD95)、それ以外の場合には(ステップD40からステップD50のNo)、障害が発生していないと判定する(ステップD90)。ここでは、「電圧異常を検出した」(ステップD40)、「温度異常を検出した」(ステップD45)、「CPUの内部エラーが起きた」(ステップD50)等に相当するエラーメッセージパターンとマッチした場合に障害があると判定する例を示した。
一方、サーバ状態照合手段160は、リモートコンソール制御応答の受信でタイムアウトが発生すると(ステップD20のNo)、サーバに障害があると判定する(ステップD95)。
なお、その他の動作は、第1の実施形態で示した動作と同様であるため、説明は省略する。
以上説明したように、本発明の第3の実施形態におけるネットワーク管理システムは、サーバの運用管理を行うネットワーク管理システムにおいて、サーバの高負荷等により管理情報の送信が一定時間以上遅延した場合や、ネットワークの輻輳等によりサーバからの管理情報が廃棄された場合に、ネットワーク管理システムがサーバの障害を誤検出する可能性を低減することが可能になる。
(第4の実施形態)
上述した第1の実施形態においては、リモートコンソール情報として、システムイベントログ情報の場合を説明したが、その代わりに、例えば、UIDランプ情報を用いてもよい。
本発明の第1の実施形態におけるネットワーク監視システムの概略の構成とネットワーク管理システム及びサーバの構成を示す図1のブロック図を流用して、第4の実施形態におけるネットワーク監視システムの概略の構成とネットワーク管理システム及びサーバの構成との違いについて説明する。
第4の実施形態における基板管理コントローラ300は、リモートコンソール制御手段310と、UIDランプ制御手段350と、を備えている。第4の実施形態における基板管理コントローラ300は、更に、システムイベントログ制御手段320と、ステータスランプ制御手段330と、仮想LCD制御手段340と、入力・画面制御手段360と、を備えているが、これらの手段については、適宜これらの内の必要なものの組み合わせであっても良い。
なお、その他の構成は、第1の実施形態で示した構成と同様であるため、説明は省略する。
図6は、本発明の第4の実施形態におけるサーバ状態照合手段の動作を説明するフローチャートである。
本実施形態におけるリモートコンソール情報は、UIDランプ情報である。UIDランプ情報は、ハードウェア、サーバの基板管理コントローラ、アプリケーションソフトウェア等が出力するランプの表示状態(オン、オフ等)の情報である。例えば、特定のサーバの筐体における実装位置をオペレータに知らせるために、アプリケーションソフトウェアから点灯させる。この操作ができなくなった場合には、サーバに障害が発生していると判断できる。
サーバ状態照合手段160は、リモートコンソール制御要求送信手段140を経由して、サーバ400にリモートコンソール制御要求(例えば、SSH上のコマンド入力、または、リモートKVM上のキーボードやマウスの操作等)を送信する。例えば、SSH上で実行する場合について説明する。
サーバ状態照合手段160は、リモートコンソール制御要求送信手段140を経由して、UIDランプを点灯し、UIDランプ情報を表示するコマンドをサーバ400に送信する(ステップE10)。
リモートコンソール制御手段310は、UIDランプ制御手段350に処理を依頼する。UIDランプ制御手段350は、まず、UIDランプの点灯を要求し、UIDランプ情報を表示する。リモートコンソール制御手段310は、コマンド応答として表示された文字列をネットワーク管理システム100に送信する。
サーバ状態照合手段160は、タイムアウト時間を設定した上で、リモートコンソール制御応答受信手段150を経由して、サーバ400からのUIDランプ情報の受信を待つ(ステップE20)。
サーバ状態照合手段160は、UIDランプ情報を受信すると(ステップE20のYes)、UIDランプ情報に対しサーバ障害を示す内容があるか照合する(ステップE30)。サーバ状態照合手段160は、予め定義されたエラーメッセージパターンのうち、少なくとも1個のエラーメッセージパターンが、UIDランプ情報に含まれる文字列とマッチした場合に(ステップE40のYes)、サーバ200で障害が発生していると判定し(ステップE95)、それ以外の場合には(ステップE40のNo)、ステップE60以降の処理を継続する。ここでは、「点灯状態ではない」(ステップE40)等に相当するエラーメッセージパターンとマッチした場合に障害があると判定する例を示した。
次に、サーバ状態照合手段160は、リモートコンソール制御要求送信手段140を経由して、UIDランプを消灯し、UIDランプ情報を表示するコマンドをサーバ400に送信する(ステップE60)。
リモートコンソール制御手段310は、UIDランプ制御手段350に処理を依頼する。UIDランプ制御手段350は、まず、UIDランプの消灯を要求し、UIDランプ情報を表示する。リモートコンソール制御手段310は、コマンド応答として表示された文字列をネットワーク管理システム100に送信する。
サーバ状態照合手段160は、タイムアウト時間を設定した上で、リモートコンソール制御応答受信手段150を経由して、サーバ400からのUIDランプ情報の受信を待つ(ステップE65)。
サーバ状態照合手段160は、UIDランプ情報を受信すると(ステップE65のYes)、UIDランプ情報に対しサーバ障害を示す内容があるか照合する(ステップE70)。サーバ状態照合手段160は、予め定義されたエラーメッセージパターンのうち、少なくとも1個のエラーメッセージパターンが、UIDランプ情報に含まれる文字列とマッチした場合に(ステップE75のYes)、サーバ200で障害が発生していると判定し(ステップE95)、それ以外の場合には(ステップE75のNo)、障害が発生していないと判定する(ステップE90)。ここでは、「消灯状態ではない」(ステップE75)等に相当するエラーメッセージパターンとマッチした場合に障害があると判定する例を示した。
一方、サーバ状態照合手段160は、リモートコンソール制御応答の受信でタイムアウトが発生すると(ステップE20のNo、ステップE65のNo)、サーバに障害があると判定する(ステップE95)。
なお、その他の動作は、第1の実施形態で示した動作と同様であるため、説明は省略する。
以上説明したように、本発明の第4の実施形態におけるネットワーク管理システムは、サーバの運用管理を行うネットワーク管理システムにおいて、サーバの高負荷等により管理情報の送信が一定時間以上遅延した場合や、ネットワークの輻輳等によりサーバからの管理情報が廃棄された場合に、ネットワーク管理システムがサーバの障害を誤検出する可能性を低減することが可能になる。
(第5の実施形態)
上述した第1の実施形態においては、リモートコンソール情報として、システムイベントログ情報の場合を説明したが、その代わりに、例えば、画面情報を用いてもよい。
本発明の第1の実施形態におけるネットワーク監視システムの概略の構成とネットワーク管理システム及びサーバの構成を示す図1のブロック図を流用して、第5の実施形態におけるネットワーク監視システムの概略の構成とネットワーク管理システム及びサーバの構成との違いについて説明する。
第5の実施形態における基板管理コントローラ300は、リモートコンソール制御手段310と、入力・画面制御手段360と、を備えている。第5の実施形態における基板管理コントローラ300は、更に、システムイベントログ制御手段320と、ステータスランプ制御手段330と、仮想LCD制御手段340と、UIDランプ制御手段350と、入力・画面制御手段360と、を備えているが、これらの手段については、適宜これらの内の必要なものの組み合わせであっても良い。
なお、その他の構成は、第1の実施形態で示した構成と同様であるため、説明は省略する。
図7は、本発明の第5の実施形態におけるサーバ状態照合手段の動作を説明するフローチャートである。
本実施形態におけるリモートコンソール情報は、画面情報である。画面情報は、サーバのBIOS、OS、ミドルウェア、アプリケーションソフトウェア等が出力する画面表示の画像情報である。OSがGUI(Graphical User Interface)上で表示するエラーダイアログ等が含まれる。
サーバ状態照合手段160は、リモートコンソール制御要求送信手段140を経由して、サーバ400にリモートコンソール制御要求(例えば、SSH上のコマンド入力、または、リモートKVM上のキーボードやマウスの操作等)を送信する。例えば、リモートKVM上で実行する場合について説明する。
サーバ200は、起動中には常時、時刻(時分秒)を画面表示するように予め設定されているものとする。サーバがフリーズして、画面が更新されない場合を検出可能にするためである。
サーバ状態照合手段160は、リモートコンソール制御要求送信手段140を経由して、画面情報要求(又は、画面表示操作)をサーバ400に送信する(ステップF10)。
リモートコンソール制御手段310は、入力・画面制御手段360に処理を依頼する。入力・画面制御手段360は、現在表示されている画面の情報を取得し、リモートコンソール制御手段310に渡す。リモートコンソール制御手段310は、その画面情報をネットワーク管理システム100に送信する。
サーバ状態照合手段160は、タイムアウト時間を設定した上で、リモートコンソール制御応答受信手段150を経由して、サーバ400からの画面情報の受信を待つ(ステップF20)。
サーバ状態照合手段160は、画面情報を受信すると(ステップF20のYes)、画面情報に対しサーバ障害を示す内容があるか照合する(ステップF30)。
サーバ状態照合手段160は、予め定義されたエラーメッセージパターンのうち、少なくとも1個のエラーメッセージパターンが画面情報に含まれる画像の一部とマッチした場合に(ステップF40からステップF45のYes)、サーバ200で障害が発生していると判定し(ステップF95)、それ以外の場合には(ステップF40からステップF45のNo)、ステップF80以降の処理を継続する。ここでは、「重大なOSエラー発生を示すアイコンあり」(ステップF40)、「重大なアプリケーションエラー発生を示すアイコンあり」(ステップF45)等に相当するエラーメッセージパターンとマッチした場合に障害があると判定する例を示した。
ステップF45以前の処理でエラーが見つからなかった場合には、サーバ状態照合手段160は、もし前回受信した画面情報が保存されていれば、それは残したままで、今回受信した画面情報を保存する(ステップF80)。
サーバ状態照合手段160は、前回受信した画面情報があり、その画像と今回受信した画面情報に差分がないならば(ステップF85のYes)、サーバ200で障害が発生していると判定し(ステップF95)、そうでなければ(ステップF85のNo)、障害が発生していないと判定する(ステップF90)。
なぜなら、前回受信した画面情報の画像と、今回受信した画面情報の画像とは、少なくとも時刻表示の差分があるはずであり、差分が検出されないことは、画面がフリーズしていることを意味するからである。
一方、サーバ状態照合手段160は、リモートコンソール制御応答の受信でタイムアウトが発生すると(ステップF20のNo)、サーバに障害があると判定する(ステップF95)。
なお、エラーメッセージパターンは、サーバの障害を識別できる部分画像である。ここでは、エラーメッセージパターンとして、重大なエラーが発生した際にOSや診断ツールが画面表示するダイアログウィンドウに共通に含まれるアイコン画像等を想定している。
また、画像マッチング方法には、画像間の類似度として正規化相互相関を用いる方法等があるが、当業者に公知であり、したがってここでは詳細に説明しない。また、本実施の形態はこれに限らず、画像テンプレートマッチングの代わりに、画像から抽出した文字列と文字列のテンプレートマッチングを行っても良い。画像から文字列を抽出する方法は、OCR(Optical Character Recognition)等で当業者に公知であり、したがってここでは詳細に説明しない。
なお、その他の動作は、第1の実施形態で示した動作と同様であるため、説明は省略する。
以上説明したように、本発明の第5の実施形態におけるネットワーク管理システムは、サーバの運用管理を行うネットワーク管理システムにおいて、サーバの高負荷等により管理情報の送信が一定時間以上遅延した場合や、ネットワークの輻輳等によりサーバからの管理情報が廃棄された場合に、ネットワーク管理システムがサーバの障害を誤検出する可能性を低減することが可能になる。
尚、本願発明は、上述の実施形態に限定されるものではなく、本願発明の要旨を逸脱しない範囲で種々変更、変形して実施することが出来る。
100 ネットワーク管理システム
110 サーバ状態情報収集・表示手段
120 管理情報要求送信手段
130 管理情報応答受信手段
140 リモートコンソール制御要求送信手段
150 リモートコンソール制御応答受信手段
160 サーバ状態照合手段
200 ネットワーク管理エージェント
210 管理情報要求処理手段
220 管理情報要求受信手段
230 管理情報応答送信手段
300 基板管理コントローラ
310 リモートコンソール制御手段
320 システムイベントログ制御手段
330 ステータスランプ制御手段
340 仮想LCD制御手段
350 UIDランプ制御手段
360 入力・画面制御手段
400 サーバ

Claims (10)

  1. 管理対象サーバが備えるネットワーク管理エージェントから管理情報を取得する管理情報取得手段と、
    前記管理対象サーバが備える基板管理コントローラにサーバの制御を要求するリモートコンソール制御手段と、
    前記リモートコンソール制御手段に対してサーバの制御を指示し、前記リモートコンソール制御手段から取得したサーバの状態情報と、予め定義した障害情報のテンプレートとを比較して、サーバの障害発生を判定する、サーバ状態照合手段と、
    前記管理情報取得手段に前記管理情報の取得を指示し、前記リモートコンソール制御手段に前記サーバの制御を指示し、前記管理情報と前記障害発生の判定とからサーバの障害発生を表示する、サーバ状態情報収集・表示手段と、
    を備えることを特徴とするネットワーク管理システム。
  2. 請求項1記載のネットワーク管理システムにおいて、前記リモートコンソール制御手段から得たサーバの状態情報が、システムイベントログ情報であることを特徴とするネットワーク管理システム。
  3. 請求項1記載のネットワーク管理システムにおいて、前記リモートコンソール制御手段から得たサーバの状態情報が、ステータスランプ情報であることを特徴とするネットワーク管理システム。
  4. 請求項1記載のネットワーク管理システムにおいて、前記リモートコンソール制御手段から得たサーバの状態情報が、仮想LCD情報であることを特徴とするネットワーク管理システム。
  5. 請求項1記載のネットワーク管理システムにおいて、前記リモートコンソール制御手段から得たサーバの状態情報が、UIDランプ情報であることを特徴とするネットワーク管理システム。
  6. 請求項1記載のネットワーク管理システムにおいて、前記リモートコンソール制御手段から得たサーバの状態情報が、画面情報であることを特徴とするネットワーク管理システム。
  7. 請求項1記載のネットワーク管理システムにおいて、前記リモートコンソール制御手段から得たサーバの状態情報が、システムイベントログ情報、ステータスランプ情報、仮想LCD情報、UIDランプ情報、または、画面情報、の内の複数個の組み合わせであることを特徴とするネットワーク管理システム。
  8. 管理対象サーバが備えるネットワーク管理エージェントから管理情報を取得する管理情報取得ステップと、
    前記管理対象サーバが備える基板管理コントローラにサーバの制御を要求するリモートコンソール制御ステップと、
    前記リモートコンソール制御手段に対してサーバの制御を指示し、前記リモートコンソール制御手段から取得したサーバの状態情報と、予め定義した障害情報のテンプレートとを比較して、サーバの障害発生を判定する、サーバ障害照合ステップと、
    前記管理情報取得手段に前記管理情報の取得を指示し、前記リモートコンソール制御手段に前記サーバの制御を指示し、前記管理情報と前記障害発生の判定とからサーバの障害発生を表示する、ノード状態情報収集・表示ステップと、
    を含むことを特徴とするネットワーク管理方法。
  9. 管理対象サーバが備えるネットワーク管理エージェントから管理情報を取得する管理情報取得手順と、
    前記管理対象サーバが備える基板管理コントローラにサーバの制御を要求するリモートコンソール制御手順と、
    前記リモートコンソール制御手段に対してサーバの制御を指示し、前記リモートコンソール制御手段から取得したサーバの状態情報と、予め定義した障害情報のテンプレートとを比較して、サーバの障害発生を判定する、サーバ障害照合手順と、
    前記管理情報取得手段に前記管理情報の取得を指示し、前記リモートコンソール制御手段に前記サーバの制御を指示し、前記管理情報と前記障害発生の判定とからサーバの障害発生を表示する、ノード状態情報収集・表示手順と、
    をコンピュータに実行させることを特徴とするネットワーク管理プログラム。
  10. 1以上の請求項1記載のネットワーク管理システムと、
    サーバの管理情報を保持し、前記ネットワーク管理システムに管理情報を提供するネットワーク管理エージェントと、サーバの制御を受け付け、前記ネットワーク管理システムにサーバの状態情報を提供する基板管理コントローラとを備えることを特徴とする1以上のサーバと、
    を備えることを特徴とするネットワーク監視システム。
JP2012073668A 2012-03-28 2012-03-28 ネットワーク管理システム、ネットワーク管理方法、ネットワーク監視システム、及び、ネットワーク管理プログラム Pending JP2013206073A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012073668A JP2013206073A (ja) 2012-03-28 2012-03-28 ネットワーク管理システム、ネットワーク管理方法、ネットワーク監視システム、及び、ネットワーク管理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012073668A JP2013206073A (ja) 2012-03-28 2012-03-28 ネットワーク管理システム、ネットワーク管理方法、ネットワーク監視システム、及び、ネットワーク管理プログラム

Publications (1)

Publication Number Publication Date
JP2013206073A true JP2013206073A (ja) 2013-10-07

Family

ID=49525100

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012073668A Pending JP2013206073A (ja) 2012-03-28 2012-03-28 ネットワーク管理システム、ネットワーク管理方法、ネットワーク監視システム、及び、ネットワーク管理プログラム

Country Status (1)

Country Link
JP (1) JP2013206073A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015194651A1 (ja) * 2014-06-20 2015-12-23 Necフィールディング株式会社 障害通知装置、障害通知方法及びプログラム
CN106227642A (zh) * 2016-08-04 2016-12-14 浪潮(北京)电子信息产业有限公司 一种Rack管理控制器及整机柜服务器
CN106250291A (zh) * 2016-08-04 2016-12-21 浪潮(北京)电子信息产业有限公司 一种整机柜服务器的管理装置及整机柜服务器
WO2017104284A1 (ja) * 2015-12-18 2017-06-22 三菱電機株式会社 データ処理装置、データ処理方法及びデータ処理プログラム
JP2017199368A (ja) * 2016-04-27 2017-11-02 廣達電腦股▲ふん▼有限公司 マルチノード筐体システムの管理ポートを減少させるためのコンピュータ読み取り可能な記憶装置、システム及び方法
JP2019117456A (ja) * 2017-12-26 2019-07-18 株式会社日本総合研究所 コンピュータプログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015194651A1 (ja) * 2014-06-20 2015-12-23 Necフィールディング株式会社 障害通知装置、障害通知方法及びプログラム
JPWO2015194651A1 (ja) * 2014-06-20 2017-04-27 Necフィールディング株式会社 障害通知装置、障害通知方法及びプログラム
WO2017104284A1 (ja) * 2015-12-18 2017-06-22 三菱電機株式会社 データ処理装置、データ処理方法及びデータ処理プログラム
JPWO2017104284A1 (ja) * 2015-12-18 2018-05-24 三菱電機株式会社 データ処理装置、データ処理方法及びデータ処理プログラム
JP2017199368A (ja) * 2016-04-27 2017-11-02 廣達電腦股▲ふん▼有限公司 マルチノード筐体システムの管理ポートを減少させるためのコンピュータ読み取り可能な記憶装置、システム及び方法
CN106227642A (zh) * 2016-08-04 2016-12-14 浪潮(北京)电子信息产业有限公司 一种Rack管理控制器及整机柜服务器
CN106250291A (zh) * 2016-08-04 2016-12-21 浪潮(北京)电子信息产业有限公司 一种整机柜服务器的管理装置及整机柜服务器
CN106227642B (zh) * 2016-08-04 2018-12-21 浪潮(北京)电子信息产业有限公司 一种Rack管理控制器及整机柜服务器
JP2019117456A (ja) * 2017-12-26 2019-07-18 株式会社日本総合研究所 コンピュータプログラム
JP7041511B2 (ja) 2017-12-26 2022-03-24 株式会社日本総合研究所 コンピュータプログラム

Similar Documents

Publication Publication Date Title
JP2013206073A (ja) ネットワーク管理システム、ネットワーク管理方法、ネットワーク監視システム、及び、ネットワーク管理プログラム
US8719410B2 (en) Native bi-directional communication for hardware management
US11231944B2 (en) Alerting, diagnosing, and transmitting computer issues to a technical resource in response to a dedicated physical button or trigger
US20140082142A1 (en) System and method for accessing operating system and hypervisors via a service processor of a server
CN105323113B (zh) 一种基于可视化技术的系统故障应急处置方法
CN104021054A (zh) 服务器故障可视化侦测及处理方法、系统及可编程芯片
US20150109470A1 (en) Pan-Tilt-Zoom Device Identification Method, Pan-Tilt-Zoom Device, Camera, and Pan-Tilt-Zoom Device Control System
WO2018198733A1 (ja) セキュリティ監視システム及びセキュリティ監視方法
CN103607296A (zh) 一种虚拟机故障处理方法和设备
CN107896172A (zh) 监听故障处理方法及装置、存储介质和电子设备
JP4616020B2 (ja) ネットワーク監視プログラム及びネットワークシステム
JP2013130901A (ja) 監視サーバおよびそれを用いたネットワーク機器復旧システム
EP2975524B1 (en) Information processing device
CN111090518A (zh) 边缘计算设备控制方法、装置及存储介质
JP5625605B2 (ja) Os動作状態確認システム、確認対象装置、os動作状態確認装置、os動作状態確認方法およびプログラム
KR101433045B1 (ko) 사전 장애 탐지 시스템 및 방법
CN114296995B (zh) 一种服务器自主修复bmc的方法、系统、设备及存储介质
US11032109B2 (en) Communication processing system, communication processing method, communication processing apparatus, communication managing apparatus, and control methods and control programs of communication processing apparatus and communication managing apparatus
KR101143922B1 (ko) 네트워크 자동복구장치
CN109510725B (zh) 通信设备故障检测系统及方法
WO2015194651A1 (ja) 障害通知装置、障害通知方法及びプログラム
CN109450712A (zh) 一种通信设备的故障检测方法
JP2006246122A (ja) ネットワーク管理システムおよびネットワーク管理プログラム
JP5987983B2 (ja) ネットワーク装置及びその制御方法
US20070050666A1 (en) Computer Network System and Related Method for Monitoring a Server