JP2016009400A - 監視装置、情報処理システム及び監視方法 - Google Patents

監視装置、情報処理システム及び監視方法 Download PDF

Info

Publication number
JP2016009400A
JP2016009400A JP2014130669A JP2014130669A JP2016009400A JP 2016009400 A JP2016009400 A JP 2016009400A JP 2014130669 A JP2014130669 A JP 2014130669A JP 2014130669 A JP2014130669 A JP 2014130669A JP 2016009400 A JP2016009400 A JP 2016009400A
Authority
JP
Japan
Prior art keywords
communication
information processing
phase
unit
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014130669A
Other languages
English (en)
Other versions
JP6369162B2 (ja
Inventor
小林 卓
Taku Kobayashi
卓 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014130669A priority Critical patent/JP6369162B2/ja
Priority to US14/688,403 priority patent/US9582369B2/en
Publication of JP2016009400A publication Critical patent/JP2016009400A/ja
Application granted granted Critical
Publication of JP6369162B2 publication Critical patent/JP6369162B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0787Storage of error reports, e.g. persistent data storage, storage using memory protection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)

Abstract

【課題】KVMスイッチの接続互換性の検証作業に要する期間を短縮すること。【解決手段】分析テーブル64にサーバ1とKVMスイッチ2との間の通信について既知問題に対する復旧処理を記憶する。そして、検出部65がサーバ1とKVMスイッチ2との間の通信を検出し、分析部66が通信が正常に行われているか否かを判定する。そして、通信に異常がある場合に、第1命令部67又は第2命令部68が分析テーブル64に基づいて復旧処理を行う。【選択図】図1

Description

本発明は、監視装置、情報処理システム及び監視方法に関する。
1組のモニター、キーボード及びマウスを用いて複数のサーバの監視及び操作を可能とするKVMスイッチがある。ここで、サーバとは、情報処理サービスを提供するコンピュータであり、KVMは、KeyboardのKとVisual UnitのVとMouseのMを表す。
図9は、KVMスイッチを説明するための図である。図9に示すように、KVMスイッチ2には、サーバ#1〜サーバ#8として示される8台のサーバ1とキーボード3とマウス4とモニター5が接続される。KVMスイッチ2は、キーボード3、マウス4及びモニター5と、8台のサーバ1のうちの1台のサーバ1との接続を切り替える。
各サーバ1とKVMスイッチ2とはKVMスイッチケーブルで接続される。KVMスイッチケーブルには、キーボード3、マウス4及びモニター5の信号ケーブルが含まれる。キーボード3及びマウス4とKVMスイッチ2とはUSB(Universal Serial Bus)で接続され、モニター5とKVMスイッチ2とはVGA(Video Graphics Array)で接続される。
なお、KVMスイッチを周辺機器共有スイッチと組み合わせた信号スイッチにより、信号スイッチに接続される全てのコンピュータが信号スイッチに接続される全てのUSB周辺デバイスを共有する従来技術がある。
特表2005−509947号公報
新規のKVMスイッチ開発では、既存のサーバ機種との接続互換性の検証が行われる。接続互換性の検証では、問題が発生するとKVMスイッチのファームウェアをチューニングする作業が行われるため、作業の間、検証作業が停止される。したがって、検証中に接続問題が発生すると、作業が停止され、検証期間が長くなるという問題がある。
なお、USBでは、どのように通信を行うかを定めるプロトコルについては規格で規定されているが、プロトコル以外の点でメーカーが独自の仕様を定めている部分がある。このため、USB規格に準拠したキーボードやマウスを使用する場合にも、接続互換性の検証が行われる。また、接続互換性の検証では、多様な状況下において問題が発生しないことを確認するために、一定の検証動作が繰り返し行われる。このため、検証作業が停止されると、検証動作を最初から繰り返し行う必要があり、検証期間が長くなる。
本発明は、1つの側面では、新規のKVMスイッチ開発における接続互換性の検証作業にかかる期間の短縮を図ることを目的とする。
本願の開示する監視装置は、1つの態様において、検出部と、分析部と、復旧部とを備える。前記検出部は、複数の情報処理装置のうちの1つの情報処理装置に周辺装置との接続を切り替える切替装置と1つの情報処理装置との通信を検出する。前記分析部は、前記検出部により検出された通信を分析して通信が正常に行われているか否かを判定する。前記復旧部は、前記分析部により通信が正常に行われていないと判定された場合に復旧動作を行う。
1実施態様によれば、接続互換性の検証作業にかかる期間を短縮することができる。
図1は、実施例に係る情報処理システムの構成を示す図である。 図2Aは、コマンドバッファの一例を示す図である。 図2Bは、履歴テーブルの一例を示す図である。 図2Cは、分析テーブルの一例を示す図である。 図3は、サーバとKVMスイッチとの間の接続互換性の検証処理のフローを示すフローチャートである。 図4は、監視装置の処理のフローを示すフローチャートである。 図5Aは、フェーズ判定処理のフローを示すフローチャートである。 図5Bは、対応処理のフローを示すフローチャートである。 図6Aは、省電力フェーズの問題検出処理のフローを示すフローチャートである。 図6Bは、省電力フェーズの復旧処理のフローを示すフローチャートである。 図7Aは、デバイス認識フェーズの問題検出処理のフローを示すフローチャートである。 図7Bは、デバイス認識フェーズの復旧処理のフローを示すフローチャートである。 図8は、記録部及び分析部が有する機能をソフトウェアで実現する監視装置の構成を示す図である。 図9は、KVMスイッチを説明するための図である。
以下に、本願の開示する監視装置、情報処理システム及び監視方法の実施例を図面に基づいて詳細に説明する。なお、この実施例は開示の技術を限定するものではない。
まず、実施例に係る情報処理システムの構成について説明する。図1は、実施例に係る情報処理システムの構成を示す図である。図1に示すように、情報処理システム10は、サーバ#1〜サーバ#8として示される8台のサーバ1と、KVMスイッチ2と、キーボード3と、マウス4と、モニター5と、監視装置6とを有する。なお、ここでは説明の便宜上、8台のサーバ1を示したが、情報処理システム10は、例えば、4台、16台、32台など任意の台数のサーバ1を有してよい。
サーバ1は、情報処理サービスを提供するコンピュータである。サーバ1は、KVMスイッチ2との接続互換性の検証の際に、再起動スクリプト11を用いて、自身を所定の回数だけ再起動する。
KVMスイッチ2は、キーボード3、マウス4及びモニター5と、8台のサーバ1のうちの1台のサーバ1との接続を切り替えるスイッチである。KVMスイッチ2を用いることによって情報処理システム10は、1組のキーボード3、マウス4及びモニター5を8台のサーバ1で共有することができる。
KVMスイッチ2は、サーバ#1〜サーバ#8にそれぞれ対応付けられたポートコントローラ#1〜ポートコントローラ#8で示される8つのポートコントローラ21と、メインコントローラ22とを有する。ポートコントローラ21は、対応するサーバ1とKVMスイッチケーブルで接続される。
メインコントローラ22は、キーボード3、マウス4及びモニター5とポートコントローラ21のいずれかとの接続を切り替える。メインコントローラ22の切り替えにより、キーボード3、マウス4及びモニター5がいずれかのサーバ1に接続される。なお、ここでは、説明の便宜上、8台のサーバ1をKVMスイッチ2で切り替える場合を示したが、KVMスイッチ2はより多くの、あるいはより少ないサーバ1を切り替えてもよい。
キーボード3は、KVMスイッチ2により接続されたサーバ1への文字等の入力に用いられる入力装置である。マウス4は、モニター5に表示された項目の選択、画面のスクロール等に用いられる指示装置である。モニター5は、KVMスイッチ2により接続されたサーバ1が出力する画面を表示する表示装置である。
監視装置6は、サーバ1とKVMスイッチ2との接続互換性の検証の際に、監視用ケーブルAを用いてサーバ1とKVMスイッチ2との通信すなわちKVMスイッチケーブルにおける通信を監視し、通信が正常に行われているか否かを判定する。なお、監視用ケーブルAは、KVMスイッチケーブルとT分岐するように接続される。
そして、監視装置6は、通信が正常に行われていないと判定すると、監視用ケーブルAを用いてサーバ1又はポートコントローラ21に復旧のための指示を出す。あるいは、監視装置6は、通信が正常に行われていないと判定すると、監視用ケーブルBを用いてメインコントローラ22に復旧のための指示を出す。
監視装置6は、記録部61と、検出部65と、分析部66と、第1命令部67と、第2命令部68とを有する。記録部61は、監視結果を記録するとともに、監視及び復旧に用いる情報を記憶する。記録部61は、コマンドバッファ62と、履歴テーブル63と、分析テーブル64とを有する。
コマンドバッファ62は、サーバ1とKVMスイッチ2との間で送受信されたコマンドを記憶する。図2Aは、コマンドバッファ62の一例を示す図である。図2Aに示すように、コマンドバッファ62は、ポート番号と、パケットIDと、受信後の時間とをコマンド毎に対応付けて記憶する。
ポート番号は、KVMスイッチ2でコマンドを送受信したポートの番号である。パケットIDは、送受信したコマンドのパケットを識別する識別子である。受信後の時間は、監視装置6がコマンドを受信してからの経過時間である。例えば、ポートコントローラ#1で受信されたコマンドは、パケットの識別子が「128」であり、受信されてから「200ms(ミリ秒)」が経過している。
履歴テーブル63は、サーバ1とKVMスイッチ2との通信で発生した異常及び復旧に関する情報を記憶する。図2Bは、履歴テーブル63の一例を示す図である。図2Bに示すように、履歴テーブル63は、発生した異常毎に、発生KVMポートと、発生フェーズと、発生問題と、復旧処理結果とを記憶する。
発生KVMポートは、KVMスイッチ2で通信異常が発生したポートの番号である。発生フェーズは、通信異常が発生したフェーズである。フェーズとしては、接続確認フェーズ、デバイス認識フェーズ、通常使用フェーズ及び省電力フェーズがある。
接続確認フェーズでは、サーバ1は、USBポートの状態を確認し、空きポートであるのかUSB機器がつながっているかを確認する。接続確認フェーズにおいて接続が確認されると、サーバ1とKVMスイッチ2との通信は、デバイス認識フェーズに移行する。デバイス認識フェーズでは、サーバ1は、接続確認フェーズで接続を確認したUSB機器に対し、どのような機能を有するかの問合せ及び必要な設定を行う。
通常使用フェーズでは、サーバ1は、デバイス認識フェーズで行った設定に基づいてデバイス固有の動作を行う。サーバ1は、つながっているUSB機器はKVMスイッチ2として認識しているので、KVMスイッチ2との間で、主に、ポーリング(一定間隔での状態問合せ)コマンドと、その応答のコマンドのやりとりを行う。
省電力フェーズは、USB機器においては、KVMスイッチ2、キーボード3、マウス4等、人が操作する機器にのみ存在するフェーズである。サーバ1は、通常使用フェーズでのポーリングにおいて3msの間「機器の状態に変化がない」という応答のみ返ってくる場合には、KVMスイッチ2に省電力フェーズに移行するように指示する。
発生問題は、通信中に発生した問題である。復旧処理結果は、発生した問題に対して行った復旧処理の結果であり、復旧した場合には「正常」が記録され、復旧に失敗した場合には「異常」が記録される。
例えば、図2Bにおいて最初のエントリは、ポートコントローラ#1において通常使用フェーズでコマンド応答タイムアウトが発生し、復旧処理を行った結果、復旧したことを示す。
分析テーブル64は、通信の分析及び異常発生時の復旧処理に用いられる情報を記憶する。分析テーブル64は、過去の検証時に発生した異常及び復旧処理に基づいて作成される。図2Cは、分析テーブル64の一例を示す図である。図2Cに示すように、分析テーブル64は、対象フェーズと、フェーズ判定条件と、問題判定基準と、復旧処理とを記憶する。
対象フェーズは、分析の対象となるフェーズである。フェーズ判定条件は、対象フェーズであることを判定するために使用される条件である。問題判定基準は、通信に異常が発生したか否かを判定するために使用される基準である。復旧処理は、通信に異常が発生した場合に復旧のために行われる処理である。
例えば、図2Cにおいて最初のエントリは、ポート電源を投入後のフェーズである接続確認フェーズに移行後、1分経過してもサーバ1からConfigコマンドが発行されないと受信タイムアウトという異常が発生し、復旧処理が行われることを示す。復旧処理としては、ポートコントローラ21のUSB信号を、100ms間Pull-Downし、未初期化状態をつくることが行われる。なお、Configコマンドはサーバ1からUSB機器に送信されるコマンドで、USB機器の情報の問合せ、USB機器の設定などに用いられるコマンドである。
2番目のエントリは、サーバ1からの初期化コマンド発行後のフェーズであるデバイス認識フェーズで、3分経過してもサーバ1からIntコマンドが発行されないとタイムアウトの異常が発生し、復旧処理が行われることを示す。復旧処理としては、ポートコントローラ21のUSB信号を、100ms間Pull-Downし、未初期化状態をつくることが行われる。
3番目のエントリは、サーバ1からのポーリングコマンド発行後のフェーズである通常使用フェーズで、サーバ1のポーリングから500ms経過するとKVMスイッチ2のACK/NACK発行タイムアウトという異常が発生し、復旧処理が行われることを示す。復旧処理としては、サーバ1に対しKVMスイッチ2の代わりに、NACKを発行することが行われる。ここで、NACKは、Busyにつき応答できないことを示す。
4番目のエントリは、サーバ1からKVMスイッチ2へ、Configコマンド「省電力フェーズ移行」発行後のフェーズである省電力フェーズにおける異常の発生と復旧処理を示す。KVMスイッチ2からの応答が「省電力フェーズ終了」の時、サーバ1の応答が「省電力フェーズ移行」の再発行という異常が発生すると、KVMスイッチ2のメインコントローラ22に500ms間「省電力モード終了」の応答を抑止させる復旧処理が行われる。
図1に戻って、検出部65は、サーバ1とKVMスイッチ2との間の通信を受信し、受信内容を分析部66に渡す。分析部66は、受信内容を分析テーブル64の問題判定基準に基づいて分析し、通信に異常があるか否かを判定する。そして、分析部66は、通信に異常があると判定すると、異常に対して分析テーブル64が記憶する復旧処理の実行を第1命令部67又は第2命令部68に指示する。
また、分析部66は、復旧が成功したか否かを判定し、成功した場合には監視装置6が監視を継続するように制御し、成功しなかった場合には監視装置6が動作を停止するように制御する。また、分析部66は、発生した異常、復旧処理結果等を履歴テーブル63に記録するように記録部61に指示する。
第1命令部67は、分析部66の指示に基づいて、監視用ケーブルAを介してKVMスイッチ2の代わりにサーバ1に応答する。あるいは、第1命令部67は、分析部66の指示に基づいて、監視用ケーブルAを介してポートコントローラ21に指示を出す。第2命令部68は、分析部66の指示に基づいて、監視用ケーブルBを介してメインコントローラ22に指示を出す。
次に、サーバ1とKVMスイッチ2との間の接続互換性の検証処理のフローについて説明する。図3は、サーバ1とKVMスイッチ2との間の接続互換性の検証処理のフローを示すフローチャートである。図3に示すように、サーバ1は、一定回数再起動を繰り返し、再起動毎にステップS1とステップS9で挟まれた処理を行う。
再起動毎に行う処理として、まず接続確認フェーズにおいて、サーバ1は、サーバ1のUSBポートにUSB機器が接続されている否かを判定する(ステップS2)。その結果、USB機器が接続されていない場合には、サーバ1は、通信制御上の問題発生と判定し(ステップS10)、処理を終了する。
一方、サーバ1のUSBポートにUSB機器が接続されている場合には、デバイス認識フェーズに移行し、デバイス認識フェーズにおいて、サーバ1は、接続されたUSB機器をKVMスイッチ2と認識できたか否かを判定する(ステップS3)。その結果、KVMスイッチ2と認識できなかった場合には、サーバ1は、通信制御上の問題発生と判定し(ステップS10)、処理を終了する。
一方、接続されたUSB機器をKVMスイッチ2と認識できた場合には、サーバ1は、サーバ1−KVMスイッチ2間の通信を初期化し、コマンド通信を開始する(ステップS4)。そして、通常使用フェーズにおいて、サーバ1は、サーバ1−KVMスイッチ2間で一定間隔でコマンドの送信と応答の受信を実行する(ステップS5)。
そして、サーバ1は、省電力フェーズへ移行する条件として、3ms間KVMスイッチ2の状態に変化なしであるかを判定する(ステップS6)。その結果、3ms間KVMスイッチ2の状態に変化なしでない場合には、サーバ1は、ステップS5に戻る。
一方、3ms間KVMスイッチ2の状態に変化なしである場合には、サーバ1は、KVMスイッチ2に省電力状態になるように指示する(ステップS7)。そして、サーバ1は、再起動する条件として、初回の通常使用フェーズ移行から3分経過したか否かを判定し(ステップS8)、3分経過した場合には再起動し、3分経過していない場合にはステップS7へ戻る。
このように、サーバ1は、再起動を繰り返しながらKVMスイッチ2との間で通信を行う。その間、監視装置6は、サーバ1とKVMスイッチ2との間の通信を監視する。図4は、監視装置6の処理のフローを示すフローチャートである。
図4に示すように、監視装置6の検出部65は、サーバ1とKVMスイッチ2間の通信を受信し(ステップS11)、分析部66に渡す。分析部66は、検出部65の受信した通信が正常か否かを判定する(ステップS12)。その結果、正常である場合には、監視装置6は、ステップS11に戻る。
一方、異常である場合には、第1命令部67又は第2命令部68は、調整方法が確立している既知問題については復旧を試行し(ステップS13)、分析部66は、復旧したか否かを判定する(ステップS14)。その結果、復旧した場合には、記録部61は、正常動作に復旧したことを記録し(ステップS15)、監視装置6は、ステップS11に戻る。一方、復旧しなかった場合には、記録部61は、正常動作に復旧しなかったことを記録し(ステップS16)、監視装置6は動作を停止する(ステップS17)。
このように、監視装置6が、サーバ1とKVMスイッチ2間の通信に異常が発生した場合に、調整方法が確立している既知問題については復旧を試行することによって、復旧が成功した場合に、サーバ1は、接続互換性の検証処理を継続することができる。
次に、監視装置6の処理のフローの詳細について説明する。図5Aは、フェーズ判定処理のフローを示すフローチャートであり、図5Bは、対応処理のフローを示すフローチャートである。なお、ここでは、監視装置6がポートコントローラ#1に対応するポート#1とサーバ#1との間の通信を監視する場合について説明する。
図5Aに示すように、監視装置6はポート#1の監視を開始し(ステップS21)、監視装置6の検出部65はポート#1の信号を取得する(ステップS22)。そして、検出部65は、Configコマンドを受信したか否かを判定し(ステップS23)、Configコマンドを受信した場合には、Configコマンドの内容がSet Feature(Remote Wake Up)であるか否かを判定する(ステップS24)。ここで、Set Feature(Remote Wake Up)は、USB機器に省電力フェーズ移行を指示する。
そして、Configコマンドの内容がSet Feature(Remote Wake Up)である場合には、分析部66はKVMスイッチ2の状態を「省電力フェーズ」と判定する(ステップS25)。一方、Configコマンドの内容がSet Feature(Remote Wake Up)でない場合には、分析部66はKVMスイッチ2の状態を「デバイス認識フェーズ」と判定する(ステップS26)。
また、Configコマンドを受信していない場合には、検出部65は、Intコマンドを受信したか否かを判定し(ステップS27)、受信した場合には、分析部66は、KVMスイッチ2の状態を「通常使用フェーズ」と判定する(ステップS28)。
一方、Intコマンドを受信していない場合には、検出部65は、USB電源は入ったか否かを判定する(ステップS29)。その結果、分析部66は、USB電源が入った場合には、KVMスイッチ2の状態を「接続確認フェーズ」と判定し(ステップS30)、入っていない場合には、図5Bに示すように、KVMスイッチ2の状態を「無接続」と判定する(ステップS44)。そして、記録部61が履歴テーブル63にポート#1、接続なしと記録し(ステップS45)、監視装置6は処理を終了する。
また、分析部66は、図5Bに示すように、「接続確認フェーズ」と判定した場合には、「接続確認フェーズ」の問題を監視し(ステップS31)、接続確認フェーズで固有の問題は発生したか否かを判定する(ステップS32)。その結果、問題が発生しなかった場合には、監視装置6は、ステップS21に戻る。一方、問題が発生した場合には、監視装置6は、分析テーブル63に記憶された「接続確認フェーズ」の復旧処理を試行し(ステップS33)、分析部66は、復旧したか否かを判定する(ステップS34)。
その結果、復旧した場合には、監視装置6はステップS51に進み、復旧しなかった場合には、監視装置6は、分析テーブル63に記憶された「接続確認フェーズ」の復旧処理を再試行し(ステップS46)、分析部66は、復旧したか否かを判定する(ステップS47)。その結果、復旧した場合には、監視装置6はステップS51に進み、復旧しなかった場合には、分析部66は故障の可能性ありと判定し(ステップS48)、記録部61が履歴テーブル63に記録する(ステップS49)。そして、監視装置6は処理を終了する。
また、分析部66は、「デバイス認識フェーズ」と判定した場合には、「デバイス認識フェーズ」の問題を監視し(ステップS35)、デバイス認識フェーズで固有の問題は発生したか否かを判定する(ステップS36)。その結果、問題が発生しなかった場合には、監視装置6は、ステップS21に戻る。一方、問題が発生した場合には、監視装置6は、分析テーブル63に記憶された「デバイス認識フェーズ」の復旧処理を試行し(ステップS37)、分析部66は、復旧したか否かを判定する(ステップS50)。
その結果、復旧した場合には、分析部66は、既知問題と判定し(ステップS51)、記録部61が履歴テーブル63に記録する(ステップS52)。そして、監視装置6はステップS21に戻る。一方、復旧しなかった場合には、分析部66は未知問題と判定し(ステップS53)、記録部61が履歴テーブル63に記録する(ステップS54)。そして、監視装置6は処理を終了する。
また、分析部66は、「通常使用フェーズ」と判定した場合には、「通常使用フェーズ」の問題を監視し(ステップS38)、通常使用フェーズで固有の問題は発生したか否かを判定する(ステップS39)。その結果、問題が発生しなかった場合には、監視装置6は、ステップS21に戻る。一方、問題が発生した場合には、監視装置6は、分析テーブル63に記憶された「通常使用フェーズ」の復旧処理を試行する(ステップS40)。そして、監視装置6は、ステップS50へ進む。
また、分析部66は、「省電力フェーズ」と判定した場合には、「省電力フェーズ」の問題を監視し(ステップS41)、省電力フェーズで固有の問題は発生したか否かを判定する(ステップS42)。その結果、問題が発生しなかった場合には、監視装置6は、ステップS21に戻る。一方、問題が発生した場合には、監視装置6は、分析テーブル63に記憶された「省電力フェーズ」の復旧処理を試行する(ステップS43)。そして、監視装置6は、ステップS50へ進む。
このように、監視装置6は、サーバ1とKVMスイッチ2との間の通信のフェーズ特定し、問題が発生すると、特定したフェーズ及び分析テーブル63に基づいて復旧処理を行うことによって、既知問題に対して復旧処理を行うことができる。
次に、省電力フェーズの問題検出処理のフローについて説明する。図6Aは、省電力フェーズの問題検出処理のフローを示すフローチャートである。なお、図6Aの処理は、図5Bに示したステップS42の処理に対応する。
図6Aに示すように、分析部66は、KVMスイッチ2からサーバ1へのResume要求を検出しているか否かを判定する(ステップS61)。ここで、Resume要求とは、KVMスイッチ2からサーバ1への省電力フェーズ終了の要求である。そして、Resume要求を検出していない場合には、分析部66は、Resume要求の検出を繰り返す。
一方、Resume要求を検出している場合には、分析部66は、サーバ1からKVMスイッチ2へのConfigコマンドはSet Feature(Resume)か否かを判定する(ステップS62)。ここで、Set Feature(Resume)は、サーバ1からKVMスイッチ2へのResume指示すなわち省電力フェーズ終了許可である。そして、ConfigコマンドがSet Feature(Resume)である場合には、分析部66は、問題発生なしと判定し(ステップS63)、処理を終了する。
KVMスイッチ2は、サーバ1から省電力フェーズの終了許可が来ることを期待するが、サーバ1はすぐにResume指示を出せない場合もある。このとき、KVMスイッチ2の動作によっては、即座に(図6Aでは10ms)再度サーバ1へ省電力フェーズ終了を要求する場合がある。このような場合、KVMスイッチ2及びサーバ1によっては、このKVMスイッチ2からのResume要求(通常使用フェーズへの復帰要求)とサーバ1からのRemote Wake Up要求(省電力モード維持の要求)が繰り返される。その結果、KVMスイッチ2はサーバ1と通信ができなくなる。
そこで、ConfigコマンドがSet Feature(Resume)でない場合には、分析部66は、サーバ1からKVMスイッチ2へのConfigコマンドはSet Feature(Remote Wake Up)か否かを判定する(ステップS64)。その結果、Set Feature(Remote Wake Up)でない場合には、分析部66は、ステップS61に戻る。
一方、Set Feature(Remote Wake Up)である場合には、分析部66は、KVMスイッチ2からサーバ1へのResume要求を10ms以内に再度検出しているか否かを判定する(ステップS65)。その結果、分析部66は、Resume要求を10ms以内に再度検出している場合には、問題発生と判定し(ステップS66)、Resume要求を10ms以内に再度検出していない場合には、問題発生なしと判定する(ステップS63)。
このように、分析部66は、KVMスイッチ2からサーバ1へのResume要求とサーバ1からKVMスイッチ2への省電力フェーズ終了許可に基づいて、省電力フェーズで発生する問題を検出することができる。
次に、省電力フェーズの復旧処理のフローについて説明する。図6Bは、省電力フェーズの復旧処理のフローを示すフローチャートである。なお、図6Bの処理は、図5Bに示したステップS43の処理に対応する。
図6Bに示すように、分析部66は分析テーブル64の復旧処理を第2命令部68へ通知し(ステップS71)、第2命令部68はKVMスイッチ2のメインコントローラ22へ、Resume要求を500ms間発行しない様に命令する(ステップS72)。そして、分析部66は、KVMスイッチ2からサーバ1へのResume要求を検出しているか否かを判定し(ステップS73)、検出していない場合には、検出を繰り返す。
一方、Resume要求を検出している場合には、分析部66は、サーバ1からKVMスイッチ2へのConfigコマンドはSet Feature(Resume)か否かを判定する(ステップS74)。その結果、ConfigコマンドがSet Feature(Resume)である場合には、分析部66は、問題は復旧したと判定する(ステップS75)。そして、記録部61が、履歴テーブル63へ、ポート番号、問題発生フェーズすなわち「省電力フェーズ」、発生問題、「正常」を記録する(ステップS76)。
一方、ConfigコマンドがSet Feature(Resume)でない場合には、分析部66は、問題は復旧していないと判定する(ステップS77)。そして、記録部61が、履歴テーブル63へ、ポート番号、問題発生フェーズすなわち「省電力フェーズ」、発生問題、「異常」を記録し(ステップS78)、監視装置6は動作を停止する(ステップS79)。
このように、第2命令部68が分析テーブル64に記憶された復旧処理を実行することによって、復旧が成功した場合には、サーバ1は接続互換性の検証処理を継続することができる。
次に、デバイス認識フェーズの問題検出処理のフローについて説明する。図7Aは、デバイス認識フェーズの問題検出処理のフローを示すフローチャートである。なお、図7Aの処理は、図5Bに示したステップS36の処理に対応する。
図7Aに示すように、分析部66は、サーバ1からIntコマンドが発行されたか否かを判定し(ステップS81)、Intコマンドが発行された場合には、通常使用フェーズへ移行するので、問題なしと判定する(ステップS82)。
一方、Intコマンドが発行されない場合には、分析部66は、デバイス認識フェーズに入って、3分間経過したか否かを判定し(ステップS83)、3分間経過していない場合には、ステップS81に戻る。
一方、デバイス認識フェーズに入って3分間経過した場合には、3分間経過しても通常使用フェーズへ移行しないので、分析部66は、問題発生と判定する(ステップS84)。
このように、分析部66は、デバイス認識フェーズに入って3分間経過する前にIntコマンドが発行されたか否かを判定することによって、デバイス認識フェーズでの問題発生を検出することができる。
次に、デバイス認識フェーズの復旧処理のフローについて説明する。図7Bは、デバイス認識フェーズの復旧処理のフローを示すフローチャートである。なお、図7Bの処理は、図5Bに示したステップS37の処理に対応する。
図7Bに示すように、分析部66は分析テーブル64の復旧処理を第1命令部67へ通知し(ステップS91)、第1命令部67は復旧処理を指示する(ステップS92)。具体的には、第1命令部67は、サーバ1−KVMスイッチ2間の信号(D+,D−)を100ms間、Lowとするように指示することによって、再初期化を促し、再度デバイス認識フェーズを最初から実行させる。
そして、分析部66は、サーバ1からConfigコマンドは発行されたか否かを判定し(ステップS93)、Configコマンドが発行された場合には、サーバ1からIntコマンドが発行されたか否かを判定する(ステップS94)。その結果、サーバ1からIntコマンドが発行された場合には、分析部66は、問題は復旧したと判定する(ステップS95)。そして、記録部61が、履歴テーブル63へ、ポート番号、問題発生フェーズすなわち「デバイス認識フェーズ」、発生問題、「正常」を記録する(ステップS96)。
一方、Intコマンドが発行されない場合には、分析部66は、デバイス認識フェーズに入って、3分間経過したか否かを判定し(ステップS97)、3分間経過していない場合には、ステップS94に戻る。
一方、デバイス認識フェーズに入って3分間経過した場合には、3分間経過しても通常使用フェーズへ移行しないので、分析部66は、ステップS99へ進む。また、サーバ1からConfigコマンドが発行されていない場合には、分析部66は、復旧処理の実行から1分経過したか否かを判定し(ステップS98)、1分経過していない場合には、ステップS93に戻る。
一方、1分経過した場合には、分析部66は、問題は復旧していないと判定する(ステップS99)。そして、記録部61が、履歴テーブル63へ、ポート番号、問題発生フェーズすなわち「デバイス認識フェーズ」、発生問題、「異常」を記録し(ステップS100)、監視装置6は動作を停止する(ステップS101)。
このように、第1命令部67が分析テーブル64に記憶された復旧処理を実行することによって、復旧が成功した場合には、サーバ1は接続互換性の検証処理を継続することができる。
上述してきたように、実施例では、分析テーブル64にサーバ1とKVMスイッチ2との間の通信について既知問題に対する復旧処理を記憶する。そして、検出部65がサーバ1とKVMスイッチ2との間の通信を検出し、分析部66が通信が正常に行われているか否かを判定する。そして、通信に異常がある場合に、第1命令部67又は第2命令部68が分析テーブル64に基づいて復旧処理を行う。したがって、復旧処理が成功した場合には、サーバ1は接続互換性の検証を継続して行うことができ、検証の作業期間を短縮することができる。
また、実施例では、分析部66は、通信のフェーズ毎に異常検出と復旧処理を行う。したがって、監視装置6は、正確な異常検出と適切な復旧処理を行うことができる。
なお、実施例では、記録部61及び分析部66について説明したが、記録部61及び分析部66が有する機能をソフトウェアで実現することもできる。そこで、記録部61及び分析部66が有する機能をソフトウェアで実現する監視装置について説明する。
図8は、記録部61及び分析部66が有する機能をソフトウェアで実現する監視装置7の構成を示す図である。図8に示すように、監視装置7は、起動用ROM(Read Only Memory)71と、CPU(Central Processing Unit)72と、RAM(Random Access Memory)73と、Flashメモリ74と、検出部75と、第1命令部76と、第2命令部77とを有する。
起動用ROM71は、記録部61及び分析部66が有する機能を実現する監視プログラムを記憶する読出し専用メモリである。CPU72は、起動用ROM71から監視プログラムを読み出して実行する中央処理装置である。RAM73は、監視プログラムの実行途中結果などを記憶するメモリである。RAM73は、コマンドバッファ62としても用いられる。
Flashメモリ74は、分析テーブル64及び履歴テーブル63を記憶する不揮発性メモリである。検出部75、第1命令部76及び第2命令部77は、それぞれ図1に示した検出部65、第1命令部67及び第2命令部68に対応する。起動用ROM71、CPU72、RAM73、Flashメモリ74、検出部75、第1命令部76及び第2命令部77はバス78で接続される。
また、実施例では、KVMスイッチ2にキーボード3、マウス4及びモニター5を接続する場合について説明したが、本発明はこれに限定されるものではなく、同様のスイッチに録画装置など他の周辺装置を接続する場合にも同様に適用することができる。
また、実施例では、KVMスイッチ2でサーバ1を切り替える場合について説明したが、本発明はこれに限定されるものではなく、KVMスイッチ2で他のコンピュータを切り替える場合にも同様に適用することができる。
1 サーバ
2 KVMスイッチ
3 キーボード
4 マウス
5 モニター
6,7 監視装置
10 情報処理システム
11 再起動スクリプト
21 ポートコントローラ
22 メインコントローラ
61 記録部
62 コマンドバッファ
63 履歴テーブル
64 分析テーブル
65,75 検出部
66 分析部
67,76 第1命令部
68,77 第2命令部
71 起動用ROM
72 CPU
73 RAM
74 Flashメモリ
78 バス

Claims (9)

  1. 複数の情報処理装置のうちの1つの情報処理装置に周辺装置との接続を切り替える切替装置と1つの情報処理装置との通信を検出する検出部と、
    前記検出部により検出された通信を分析して通信が正常に行われているか否かを判定する分析部と、
    前記分析部により通信が正常に行われていないと判定された場合に復旧動作を行う復旧部と
    を備えたことを特徴とする監視装置。
  2. 前記分析部は、前記復旧部による復旧動作が成功したか否かを判定し、成功した場合には前記通信の監視を継続し、成功しなかった場合には当該装置の動作を停止するように制御することを特徴とする請求項1に記載の監視装置。
  3. 前記通信のフェーズ毎に復旧動作を記憶する分析情報記憶部をさらに備え、
    前記分析部は、前記通信のフェーズ毎に通信が正常に行われているか否かを判定し、
    前記復旧部は、前記分析情報記憶部に基づいて復旧動作を行うことを特徴とする請求項2に記載の監視装置。
  4. 前記分析部により通信が正常に行われていないと判定された場合に、発生した問題と復旧動作の結果を記録する記録部をさらに備えたことを特徴とする請求項2又は3に記載の監視装置。
  5. 前記検出部は、前記切替装置と前記情報処理装置との接続互換性の検証の際に行われる通信を検出することを特徴とする請求項1〜4のいずれか1つに記載の監視装置。
  6. 前記フェーズは、前記切替装置が省電力の状態にある省電力フェーズを含み、
    前記分析部は、前記省電力フェーズにおいて、前記切替装置から前記情報処理装置への省電力状態の解除要求、及び、前記情報処理装置から前記切替装置への省電力状態の解除指示に基づいて、前記通信が正常に行われているか否か及び前記復旧動作が成功したか否かを判定することを特徴とする請求項3に記載の監視装置。
  7. 前記フェーズは、前記情報処理装置が接続デバイスを認識する状態にあるデバイス認識フェーズと、前記情報処理装置と前記切替装置との間で通常の通信が行われている状態である通常使用フェーズとを含み、
    前記分析部は、前記デバイス認識フェーズにおいて、前記情報処理装置から前記切替装置への前記通常使用フェーズへの移行指示、及び、前記デバイス認識フェーズに移行してからの経過時間基づいて、前記通信が正常に行われているか否か及び前記復旧動作が成功したか否かを判定することを特徴とする請求項3に記載の監視装置。
  8. 複数の情報処理装置、周辺装置、及び、前記複数の情報処理装置のうちの1つの情報処理装置に前記周辺装置との接続を切り替える切替装置を有する情報処理システムにおいて、
    前記切替装置と1つの情報処理装置との間の通信を監視する監視装置をさらに備え、
    前記監視装置は、
    前記通信を検出する検出部と、
    前記検出部により検出された通信を分析して通信が正常に行われているか否かを判定する分析部と、
    前記分析部により通信が正常に行われていないと判定された場合に復旧動作を行う復旧部と
    を備えたことを特徴とする情報処理システム。
  9. 複数の情報処理装置のうちの1つの情報処理装置に周辺装置との接続を切り替える切替装置と1つの情報処理装置との通信を監視する監視装置が、
    前記通信を検出し、
    検出した通信を分析して通信が正常に行われているか否かを判定し、
    通信が正常に行われていないと判定した場合に復旧動作を行う
    ことを特徴とする監視方法。
JP2014130669A 2014-06-25 2014-06-25 監視装置、情報処理システム及び監視方法 Active JP6369162B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014130669A JP6369162B2 (ja) 2014-06-25 2014-06-25 監視装置、情報処理システム及び監視方法
US14/688,403 US9582369B2 (en) 2014-06-25 2015-04-16 Monitoring method, monitoring device, and information processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014130669A JP6369162B2 (ja) 2014-06-25 2014-06-25 監視装置、情報処理システム及び監視方法

Publications (2)

Publication Number Publication Date
JP2016009400A true JP2016009400A (ja) 2016-01-18
JP6369162B2 JP6369162B2 (ja) 2018-08-08

Family

ID=54930626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014130669A Active JP6369162B2 (ja) 2014-06-25 2014-06-25 監視装置、情報処理システム及び監視方法

Country Status (2)

Country Link
US (1) US9582369B2 (ja)
JP (1) JP6369162B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105893206A (zh) * 2016-03-29 2016-08-24 江苏木盟智能科技有限公司 终端设备使用情况监控处理方法和终端设备
EP3232326B1 (en) * 2016-04-14 2019-06-05 High Sec Labs Ltd. Keyboard video mouse (kvm) device and method for detecting host failure using the same
US11334173B2 (en) 2020-07-13 2022-05-17 High Sec Labs Ltd. System and method of polychromatic identification for a KVM switch
US10922246B1 (en) 2020-07-13 2021-02-16 High Sec Labs Ltd. System and method of polychromatic identification for a KVM switch
CN114050965A (zh) * 2020-07-22 2022-02-15 中兴通讯股份有限公司 查找中断设备的方法、从设备、主设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000215115A (ja) * 1999-01-19 2000-08-04 Sun Microsyst Inc ユニバ―サル・シリアル・バス検査システム
JP2006309404A (ja) * 2005-04-27 2006-11-09 Nec Infrontia Corp 情報処理装置、情報処理システムおよびプログラム
JP2007058310A (ja) * 2005-08-22 2007-03-08 Fujitsu Component Ltd Usb切替器およびkvmスイッチ
JP2007102419A (ja) * 2005-10-03 2007-04-19 Sharp Corp 情報処理装置
JP2007156921A (ja) * 2005-12-06 2007-06-21 Y E Data Inc Usbデバイス装置の異常検出・回復システム、異常検出・回復プログラム、異常検出・回復プログラムを記録した記録媒体及び異常検出・回復方法。
JP2011008819A (ja) * 2010-08-24 2011-01-13 Hitachi Omron Terminal Solutions Corp Usb機器、及びusb接続システム
JP2011154549A (ja) * 2010-01-27 2011-08-11 Toshiba Tec Corp ユニバーサルシリアルバスホスト装置およびプログラム
JP2013200593A (ja) * 2012-03-23 2013-10-03 Fujitsu Ltd 試験装置,試験方法および試験プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7315826B1 (en) * 1999-05-27 2008-01-01 Accenture, Llp Comparatively analyzing vendors of components required for a web-based architecture
US6957287B2 (en) 2001-11-09 2005-10-18 Aten International Co., Ltd. Asynchronous/synchronous KVMP switch for console and peripheral devices
US7487395B2 (en) * 2004-09-09 2009-02-03 Microsoft Corporation Method, system, and apparatus for creating an architectural model for generating robust and easy to manage data protection applications in a data protection system
US7502961B2 (en) * 2004-09-09 2009-03-10 Microsoft Corporation Method, system, and apparatus for providing alert synthesis in a data protection system
US7865470B2 (en) * 2004-09-09 2011-01-04 Microsoft Corporation Method, system, and apparatus for translating logical information representative of physical data in a data protection system
US9361190B2 (en) * 2014-04-24 2016-06-07 International Business Machines Corporation Recovery of a transaction after XA end

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000215115A (ja) * 1999-01-19 2000-08-04 Sun Microsyst Inc ユニバ―サル・シリアル・バス検査システム
JP2006309404A (ja) * 2005-04-27 2006-11-09 Nec Infrontia Corp 情報処理装置、情報処理システムおよびプログラム
JP2007058310A (ja) * 2005-08-22 2007-03-08 Fujitsu Component Ltd Usb切替器およびkvmスイッチ
JP2007102419A (ja) * 2005-10-03 2007-04-19 Sharp Corp 情報処理装置
JP2007156921A (ja) * 2005-12-06 2007-06-21 Y E Data Inc Usbデバイス装置の異常検出・回復システム、異常検出・回復プログラム、異常検出・回復プログラムを記録した記録媒体及び異常検出・回復方法。
JP2011154549A (ja) * 2010-01-27 2011-08-11 Toshiba Tec Corp ユニバーサルシリアルバスホスト装置およびプログラム
JP2011008819A (ja) * 2010-08-24 2011-01-13 Hitachi Omron Terminal Solutions Corp Usb機器、及びusb接続システム
JP2013200593A (ja) * 2012-03-23 2013-10-03 Fujitsu Ltd 試験装置,試験方法および試験プログラム

Also Published As

Publication number Publication date
JP6369162B2 (ja) 2018-08-08
US20150378851A1 (en) 2015-12-31
US9582369B2 (en) 2017-02-28

Similar Documents

Publication Publication Date Title
JP6369162B2 (ja) 監視装置、情報処理システム及び監視方法
JP4924514B2 (ja) 仮想マシン管理プログラム、管理サーバ装置及び仮想マシン管理方法
TWI616758B (zh) 遠端多電腦切換技術之儲存裝置、系統及方法
JP5245869B2 (ja) 情報処理装置、情報処理方法及びコンピュータプログラム
US20130031275A1 (en) Peripheral device identification for pairing
JP4337056B2 (ja) 通信装置、通信状態検出方法及び通信状態検出プログラム
US7558702B2 (en) Computer apparatus, start-up controlling method, and storage medium
US20180210783A1 (en) Information processing apparatus, control method of the same, and storage medium
US20100042710A1 (en) Remote management of computer system
US10069988B2 (en) Image forming apparatus, computer readable recording medium stored with computer program for controlling image forming apparatus, and method for controlling image forming apparatus
JP4646859B2 (ja) Usb機器、およびusb接続システム
JP6749072B2 (ja) ストレージ管理装置及びストレージ管理プログラム
JP2007200103A (ja) クライアントサーバシステムおよびリソース制御方法
CN115168146A (zh) 一种异常检测方法和装置
KR101056759B1 (ko) 정보 처리 시스템, 정보 처리 시스템의 제어 방법, 및 정보 처리 시스템의 제어 프로그램을 기록한 기록 매체
JP6331505B2 (ja) 起動制御装置、起動制御方法、及び起動制御プログラム
JP2014049005A (ja) 情報処理装置
JP6079153B2 (ja) 管理コントローラ、情報処理装置、集積回路の管理方法およびそのプログラム
JP6164046B2 (ja) 情報処理システム、管理装置、管理方法
JP6883196B2 (ja) 処理装置、情報処理装置、処理システム、処理プログラム及び情報処理プログラム
JP5954353B2 (ja) コントローラーの制御方法
JP5682007B2 (ja) 電子機器装置
JP2008171139A (ja) ストレージシステムの試験装置及び同試験方法
JP2006235909A (ja) 入出力実行時間監視方法
CN112272955B (zh) 控制装置及信号控制方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170309

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180403

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180612

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180625

R150 Certificate of patent or registration of utility model

Ref document number: 6369162

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150